Новости IT

Жизнь после теста Тюринга: языковым моделям пора делать ошибки и учиться на своём опыте — Tproger

От

19.04.2025

Содержание

1 Что не так с сегодняшними ИИ
2 Потоки опыта — как это должно работать
3 ИИ, который не просто говорит, а делает
4 Новая парадигма — новые риски

Учёные DeepMind предлагают заменить тест Тьюринга на «эпоху опыта» — ИИ должен действовать, ошибаться и учиться на своём прошлом

ИИ уже справляется с тестом Тьюринга, пишет стихи и код, побеждает в шахматах. Но, по мнению учёных из DeepMind, это не прогресс, а его имитация.

Модели просто научились «играть» в бенчмарки, не становясь при этом умнее в человеческом смысле. Их проблема — в отсутствии опыта, а не данных.

В новой работе, подготовленной для MIT Press, Дэвид Сильвер (создатель AlphaZero) и Ричард Саттон (один из отцов обучения с подкреплением) предлагают переосмыслить весь подход к ИИ. Они называют это «эпохой опыта».

Что не так с сегодняшними ИИ

Современные языковые модели вроде ChatGPT и Gemini умеют отвечать на вопросы, но не умеют ставить цели, запоминать прошлое или адаптироваться.

Всё их поведение — это реакция на вход, заданный человеком. Они не делают открытий, не учатся на ошибках и не развиваются между сессиями.

Навигация в React Native: Искусство перемещения по экранам с помощью React Navigationtproger.ru

Сильвер и Саттон считают, что это тупик. По их мнению, ИИ должен жить во времени, а не в одной команде. Он должен действовать, ошибаться, получать обратную связь и улучшаться — как это делает человек или обучаемый агент в играх.

Читать также:

Какие новые ИИ-фишки принесет iOS 18.2 на iPhone, iPad и Mac — Tproger

Потоки опыта — как это должно работать

Вместо разрозненных запросов — непрерывный поток взаимодействий. ИИ должен иметь доступ к окружающему миру, работать с симуляциями, браузером, системами, метриками. Он должен сам находить сигналы: лайки, здоровье, расходы, прогресс — и на их основе учиться.

Пользователь в таком подходе задаёт лишь цель: «Помоги мне выучить испанский» или «Оптимизируй мой график тренировок». Всё остальное — поиск методов, обучение, корректировка — ИИ делает сам, как агент с долгосрочной памятью и личной историей.

ИИ, который не просто говорит, а делает

Некоторые шаги к этому уже сделаны: браузерные агенты, инструменты планирования, симуляторы. Но следующий этап — это автономные ИИ, которые действуют годами, а не минутами.

Они могут следить за здоровьем, карьерой, обучением, экономить деньги или даже заниматься научными исследованиями.

Именно этот подход, считают авторы, позволит моделям стать по-настоящему умными — не повторять человеческие ошибки, а учиться на собственных.

Новая парадигма — новые риски

DeepMind признаёт: у такого подхода есть риски. Агент, который может действовать без постоянного надзора человека, должен уметь распознавать вред и корректировать поведение. И здесь критично важна правильная постановка целей.

«Умнейший ИИ в истории» Grok 3 представлен официально — Маск обещает революциюtproger.ru

Но потенциал огромен: данные из «потока жизни» ИИ могут в тысячи раз превзойти Википедию или Reddit по объёму и полезности. Это не просто эволюция языковых моделей. Это шаг в сторону искусственного субъекта, способного видеть, запоминать и меняться.

Что не так с сегодняшними ИИ

Потоки опыта — как это должно работать

ИИ, который не просто говорит, а делает

Новая парадигма — новые риски

ЭТО МОЖЕТ БЫТЬ ИНТЕРЕСНОЕЩЕ ОТ АВТОРА

«Детализация просто сумасшедшая»: 16-летний аниматор воссоздал второй трейлер GTA VI в стиле Lego, и фанаты в восторге

Энтузиаст создал браузерного «убийцу GTA» за 10 минут с помощью ИИ Grok — Tproger

Intel прекратила платить клиентам, чтобы те покупали её процессоры

ЭТО МОЖЕТ БЫТЬ ИНТЕРЕСНО ЕЩЕ ОТ АВТОРА