Содержание
Учёные DeepMind предлагают заменить тест Тьюринга на «эпоху опыта» — ИИ должен действовать, ошибаться и учиться на своём прошлом
ИИ уже справляется с тестом Тьюринга, пишет стихи и код, побеждает в шахматах. Но, по мнению учёных из DeepMind, это не прогресс, а его имитация.
Модели просто научились «играть» в бенчмарки, не становясь при этом умнее в человеческом смысле. Их проблема — в отсутствии опыта, а не данных.
В новой работе, подготовленной для MIT Press, Дэвид Сильвер (создатель AlphaZero) и Ричард Саттон (один из отцов обучения с подкреплением) предлагают переосмыслить весь подход к ИИ. Они называют это «эпохой опыта».
Что не так с сегодняшними ИИ
Современные языковые модели вроде ChatGPT и Gemini умеют отвечать на вопросы, но не умеют ставить цели, запоминать прошлое или адаптироваться.
Всё их поведение — это реакция на вход, заданный человеком. Они не делают открытий, не учатся на ошибках и не развиваются между сессиями.
Навигация в React Native: Искусство перемещения по экранам с помощью React Navigationtproger.ru
Сильвер и Саттон считают, что это тупик. По их мнению, ИИ должен жить во времени, а не в одной команде. Он должен действовать, ошибаться, получать обратную связь и улучшаться — как это делает человек или обучаемый агент в играх.
Потоки опыта — как это должно работать
Вместо разрозненных запросов — непрерывный поток взаимодействий. ИИ должен иметь доступ к окружающему миру, работать с симуляциями, браузером, системами, метриками. Он должен сам находить сигналы: лайки, здоровье, расходы, прогресс — и на их основе учиться.
Пользователь в таком подходе задаёт лишь цель: «Помоги мне выучить испанский» или «Оптимизируй мой график тренировок». Всё остальное — поиск методов, обучение, корректировка — ИИ делает сам, как агент с долгосрочной памятью и личной историей.
ИИ, который не просто говорит, а делает
Некоторые шаги к этому уже сделаны: браузерные агенты, инструменты планирования, симуляторы. Но следующий этап — это автономные ИИ, которые действуют годами, а не минутами.
Они могут следить за здоровьем, карьерой, обучением, экономить деньги или даже заниматься научными исследованиями.
Именно этот подход, считают авторы, позволит моделям стать по-настоящему умными — не повторять человеческие ошибки, а учиться на собственных.
Новая парадигма — новые риски
DeepMind признаёт: у такого подхода есть риски. Агент, который может действовать без постоянного надзора человека, должен уметь распознавать вред и корректировать поведение. И здесь критично важна правильная постановка целей.
«Умнейший ИИ в истории» Grok 3 представлен официально — Маск обещает революциюtproger.ru
Но потенциал огромен: данные из «потока жизни» ИИ могут в тысячи раз превзойти Википедию или Reddit по объёму и полезности. Это не просто эволюция языковых моделей. Это шаг в сторону искусственного субъекта, способного видеть, запоминать и меняться.