Новости IT

OpenAI представила GPT-4.1 — она пишет код лучше GPT-4o и стоит в разы дешевле — Tproger

От

15.04.2025

Содержание

1 Дешевле, быстрее, умнее
2 Код без лишнего
3 Понимает инструкции и контекст
4 1 000 000 токенов — теперь реально
5 Новый стандарт для разработчиков

OpenAI представила GPT-4.1 — модель точнее GPT-4o, лучше пишет код, поддерживает до 1 млн токенов и стоит в разы дешевле для разработчиков

OpenAI анонсировала три новых модели: GPT‑4.1, GPT‑4.1 mini и GPT‑4.1 nano. Все они превосходят GPT‑4o по ключевым метрикам: написанию кода, пониманию инструкций и работе с длинными контекстами.

При этом они дешевле и быстрее, а старшая модель поддерживает до миллиона токенов в одном запросе — это эквивалент восьми копий исходников React.

GPT‑4.1 особенно выделяется в программировании: она справляется с задачами SWE-bench Verified на 54,6%, тогда как GPT‑4o — только на 33,2%. Это значит, что модель уверенно генерирует работающий код, проходит тесты и понимает архитектуру больших репозиториев.

Дешевле, быстрее, умнее

Цены на GPT‑4.1 порадовали разработчиков: модель стоит на 26% дешевле GPT‑4o при типичных запросах, а её младшие версии — mini и nano — позволяют снизить затраты на генерацию до 83%.

ТОП-23 нейросетей для написания диплома: ИИ для онлайн-создания дипломной работыtproger.ru

GPT‑4.1 nano — самая быстрая и лёгкая из новых моделей. Она показывает точность 80,1% на MMLU и даже опережает GPT‑4o mini в кодинге. А GPT‑4.1 mini бьёт GPT‑4o в большинстве бенчмарков, несмотря на меньший размер.

Код без лишнего

Модель не только точнее, но и аккуратнее: GPT‑4.1 делает в 4 раза меньше лишних изменений в коде, чем GPT‑4o. Она лучше соблюдает форматирование, работает с диффами и генерирует интерфейсы, которые пользователи предпочитают в 8 случаев из 10.

Читать также:

«Руссофт» озвучил главные IT-тренды 2025 года: новые инвест-инструменты, аккуратность с ИИ и популярность облаков

По данным стартапов Windsurf и Qodo, GPT‑4.1 эффективнее вызывает инструменты, реже ошибается и быстрее доходит до рабочих решений.

Понимает инструкции и контекст

GPT‑4.1 лучше следует даже сложным многошаговым инструкциям. Она значительно обгоняет GPT‑4o в задачах, где требуется соблюдать порядок, избегать лишнего, выдавать структурированный ответ или сохранять контекст нескольких сообщений.

Внутренние тесты OpenAI показывают: точность следования сложным инструкциям у GPT‑4.1 — 49%, у GPT‑4o — 29%. На бенчмарке MultiChallenge результат — 38,3% против 27,8%. Улучшилась и способность модели говорить «не знаю», если информации нет — важный шаг к надёжности.

1 000 000 токенов — теперь реально

GPT‑4.1 и её мини-версии могут обрабатывать контекст до миллиона токенов. Это открывает путь к анализу больших кодовых баз, юридических документов и комплексных бизнес-отчетов. Более того, модель не просто «читает» большие данные, но и умеет находить в них нужную информацию, отличать похожие фрагменты и делать логические выводы.

Лучшие практики для работы с командной строкойtproger.ru

В новых тестах OpenAI модель уверенно справляется с поиском нужного ответа даже в условиях, когда запросов много, они похожи и разбросаны по тексту. Подобные возможности важны для агентов, которые должны работать без постоянного участия человека.

Новый стандарт для разработчиков

GPT‑4.1 уже доступна через API. В ChatGPT часть улучшений внедрена в GPT‑4o и будет дорабатываться. А GPT‑4.5 Preview компания начнёт отключать — он просто стал неактуален на фоне новой модели.

Будете использовать новую модель?ДаНет

Дешевле, быстрее, умнее

Код без лишнего

Понимает инструкции и контекст

1 000 000 токенов — теперь реально

Новый стандарт для разработчиков

ЭТО МОЖЕТ БЫТЬ ИНТЕРЕСНОЕЩЕ ОТ АВТОРА

Intel прекратила платить клиентам, чтобы те покупали её процессоры

Meta* и Яндекс годами собирали данные о вас через локальные порты Android. Даже в режиме инкогнито

Epic Games Store устроил первую в истории магазина раздачу боевика Deathloop от создателей Dishonored

ЭТО МОЖЕТ БЫТЬ ИНТЕРЕСНО ЕЩЕ ОТ АВТОРА