Содержание
OpenAI представила GPT-4.1 — модель точнее GPT-4o, лучше пишет код, поддерживает до 1 млн токенов и стоит в разы дешевле для разработчиков
OpenAI анонсировала три новых модели: GPT‑4.1, GPT‑4.1 mini и GPT‑4.1 nano. Все они превосходят GPT‑4o по ключевым метрикам: написанию кода, пониманию инструкций и работе с длинными контекстами.
При этом они дешевле и быстрее, а старшая модель поддерживает до миллиона токенов в одном запросе — это эквивалент восьми копий исходников React.
GPT‑4.1 особенно выделяется в программировании: она справляется с задачами SWE-bench Verified на 54,6%, тогда как GPT‑4o — только на 33,2%. Это значит, что модель уверенно генерирует работающий код, проходит тесты и понимает архитектуру больших репозиториев.
Дешевле, быстрее, умнее
Цены на GPT‑4.1 порадовали разработчиков: модель стоит на 26% дешевле GPT‑4o при типичных запросах, а её младшие версии — mini и nano — позволяют снизить затраты на генерацию до 83%.
ТОП-23 нейросетей для написания диплома: ИИ для онлайн-создания дипломной работыtproger.ru
GPT‑4.1 nano — самая быстрая и лёгкая из новых моделей. Она показывает точность 80,1% на MMLU и даже опережает GPT‑4o mini в кодинге. А GPT‑4.1 mini бьёт GPT‑4o в большинстве бенчмарков, несмотря на меньший размер.
Код без лишнего
Модель не только точнее, но и аккуратнее: GPT‑4.1 делает в 4 раза меньше лишних изменений в коде, чем GPT‑4o. Она лучше соблюдает форматирование, работает с диффами и генерирует интерфейсы, которые пользователи предпочитают в 8 случаев из 10.
По данным стартапов Windsurf и Qodo, GPT‑4.1 эффективнее вызывает инструменты, реже ошибается и быстрее доходит до рабочих решений.
Понимает инструкции и контекст
GPT‑4.1 лучше следует даже сложным многошаговым инструкциям. Она значительно обгоняет GPT‑4o в задачах, где требуется соблюдать порядок, избегать лишнего, выдавать структурированный ответ или сохранять контекст нескольких сообщений.
Внутренние тесты OpenAI показывают: точность следования сложным инструкциям у GPT‑4.1 — 49%, у GPT‑4o — 29%. На бенчмарке MultiChallenge результат — 38,3% против 27,8%. Улучшилась и способность модели говорить «не знаю», если информации нет — важный шаг к надёжности.
1 000 000 токенов — теперь реально
GPT‑4.1 и её мини-версии могут обрабатывать контекст до миллиона токенов. Это открывает путь к анализу больших кодовых баз, юридических документов и комплексных бизнес-отчетов. Более того, модель не просто «читает» большие данные, но и умеет находить в них нужную информацию, отличать похожие фрагменты и делать логические выводы.
Лучшие практики для работы с командной строкойtproger.ru
В новых тестах OpenAI модель уверенно справляется с поиском нужного ответа даже в условиях, когда запросов много, они похожи и разбросаны по тексту. Подобные возможности важны для агентов, которые должны работать без постоянного участия человека.
Новый стандарт для разработчиков
GPT‑4.1 уже доступна через API. В ChatGPT часть улучшений внедрена в GPT‑4o и будет дорабатываться. А GPT‑4.5 Preview компания начнёт отключать — он просто стал неактуален на фоне новой модели.
Будете использовать новую модель?ДаНет