24.1 C
Москва
Суббота, 19 апреля, 2025

Жизнь после теста Тюринга: языковым моделям пора делать ошибки и учиться на своём опыте — Tproger

Учёные DeepMind предлагают заменить тест Тьюринга на «эпоху опыта» — ИИ должен действовать, ошибаться и учиться на своём прошлом

ИИ уже справляется с тестом Тьюринга, пишет стихи и код, побеждает в шахматах. Но, по мнению учёных из DeepMind, это не прогресс, а его имитация.

Модели просто научились «играть» в бенчмарки, не становясь при этом умнее в человеческом смысле. Их проблема — в отсутствии опыта, а не данных.

В новой работе, подготовленной для MIT Press, Дэвид Сильвер (создатель AlphaZero) и Ричард Саттон (один из отцов обучения с подкреплением) предлагают переосмыслить весь подход к ИИ. Они называют это «эпохой опыта».

Что не так с сегодняшними ИИ

Современные языковые модели вроде ChatGPT и Gemini умеют отвечать на вопросы, но не умеют ставить цели, запоминать прошлое или адаптироваться.

Всё их поведение — это реакция на вход, заданный человеком. Они не делают открытий, не учатся на ошибках и не развиваются между сессиями.

Навигация в React Native: Искусство перемещения по экранам с помощью React Navigationtproger.ru

Сильвер и Саттон считают, что это тупик. По их мнению, ИИ должен жить во времени, а не в одной команде. Он должен действовать, ошибаться, получать обратную связь и улучшаться — как это делает человек или обучаемый агент в играх.

Читать также:
VR-гарнитуры Quest массово ломаются из-за «проблемы с обновлением ПО» — Meta✴ пообещала всё исправить

Потоки опыта — как это должно работать

Вместо разрозненных запросов — непрерывный поток взаимодействий. ИИ должен иметь доступ к окружающему миру, работать с симуляциями, браузером, системами, метриками. Он должен сам находить сигналы: лайки, здоровье, расходы, прогресс — и на их основе учиться.

Пользователь в таком подходе задаёт лишь цель: «Помоги мне выучить испанский» или «Оптимизируй мой график тренировок». Всё остальное — поиск методов, обучение, корректировка — ИИ делает сам, как агент с долгосрочной памятью и личной историей.

ИИ, который не просто говорит, а делает

Некоторые шаги к этому уже сделаны: браузерные агенты, инструменты планирования, симуляторы. Но следующий этап — это автономные ИИ, которые действуют годами, а не минутами.

Они могут следить за здоровьем, карьерой, обучением, экономить деньги или даже заниматься научными исследованиями.

Именно этот подход, считают авторы, позволит моделям стать по-настоящему умными — не повторять человеческие ошибки, а учиться на собственных.

Новая парадигма — новые риски

DeepMind признаёт: у такого подхода есть риски. Агент, который может действовать без постоянного надзора человека, должен уметь распознавать вред и корректировать поведение. И здесь критично важна правильная постановка целей.

«Умнейший ИИ в истории» Grok 3 представлен официально — Маск обещает революциюtproger.ru

Но потенциал огромен: данные из «потока жизни» ИИ могут в тысячи раз превзойти Википедию или Reddit по объёму и полезности. Это не просто эволюция языковых моделей. Это шаг в сторону искусственного субъекта, способного видеть, запоминать и меняться.

НОВОЕ НА САЙТЕ