Софт

OpenAI представила модель искусственного интеллекта o1 с уровнем рассуждений доктора наук

От

16.09.2024

296

Ещё один шаг к тому самому будущему, про которое писали в книгах.

Компания OpenAI представила новую серию языковых моделей искусственного интеллекта под названием o1, разработанных специально для улучшения возможностей рассуждения, особенно в сложных вопросах науки, программирования и математики. Компания настолько уверена в этих достижениях, что обнулила счётчик версий модели до единицы, начав заново после GPT-4o, и заметно отошла от бренда GPT.

Первая модель серии o1, получившая название o1-preview, доступна как в ChatGPT, так и в API OpenAI. Несмотря на статус предварительной версии, компания обещает регулярные обновления и улучшения.

Модели o1 были обучены улучшать свой подход к решению задач, тратя больше времени на анализ проблемы, прежде чем предложить ответ. Этот метод позволяет моделям экспериментировать с различными стратегиями, выявлять собственные ошибки и решать сложные задачи более систематичным, человекоподобным способом.

Результаты, представленные OpenAI, свидетельствуют о значительном прогрессе новых моделей o1. По данным компании, эти модели демонстрируют уровень производительности, сравнимый с аспирантами в сложных тестах по физике, химии и биологии.

Например, модель достигла 83% точности в тесте, который позволяет студентам пройти квалификацию на Международную математическую олимпиаду, что является заметным улучшением по сравнению с 13% точностью GPT-4o.

Читать также:

VK поддержит начинающих авторов ежемесячными выплатами в размере 30 тыс. рублей

Конечно, тесты искусственного интеллекта иногда могут быть ненадёжными, поэтому истинная производительность моделей o1 станет яснее, когда больше пользователей протестируют их в различных сценариях.

Кроме того, новые модели, похоже, разрешают некоторые давние вопросы, например, количество букв «р» в слове «strawberry» (клубника), наконец-то положив конец мемам. OpenAI также продемонстрировала пример, где модель успешно сгенерировала код Python для аркадной игры, подчеркнув свои передовые возможности.

Помимо повышения возможностей рассуждения, OpenAI также сосредоточилась на усилении защиты от «взлома», метода, используемого для обхода механизмов безопасности. По данным компании, так называемая o1-preview набрала 84 балла из 100 в одном из самых сложных тестов на взлом, по сравнению с 22 баллами у GPT-4o.

Чтобы сделать эти модели более доступными, особенно для разработчиков, OpenAI также выпускает облегчённую версию o1-mini, предназначенную для задач программирования.

Доступ к o1-mini и o1-preview в настоящее время открывается для платных подписок ChatGPT Plus и Teams.

ЭТО МОЖЕТ БЫТЬ ИНТЕРЕСНОЕЩЕ ОТ АВТОРА

Дождались, но не «бету»: российский MMO-шутер Pioner скоро получит мультиплеерную демоверсию

Wizards of the Coast анонсировала грандиозный боевик по Dungeons & Dragons от новой студии режиссёра God of War III и Star Wars Jedi: Survivor

Telegram, подвинься: Маск представил мессенджер XChat с шифрованием в стиле биткоина

ЭТО МОЖЕТ БЫТЬ ИНТЕРЕСНО ЕЩЕ ОТ АВТОРА