Новости IT

OpenAI научила ChatGPT редактировать фото и улучшила генерацию картинок в чат-боте

От

27.03.2025

ChatGPT научился редактировать фото и генерировать изображения через GPT-4o — теперь доступно в Pro-версии и скоро в API

OpenAI впервые за год обновила возможности ChatGPT по работе с изображениями.

Теперь нейросеть может не только генерировать, но и редактировать картинки — включая фотографии с людьми. Новая функция построена на основе модели GPT-4o, которая ранее использовалась исключительно для работы с текстом.

Генерация и «инпейнтинг» через GPT-4o

Как сообщил Сэм Альтман во время прямого эфира, поддержка изображений в GPT-4o уже доступна пользователям ChatGPT и видеогенератора Sora — пока только в рамках Pro-подписки за $200 в месяц.

В ближайшее время она появится и у пользователей Plus- и бесплатной версии, а также у разработчиков через API.

GPT-4o генерирует изображения чуть медленнее, чем DALL·E 3, но, по словам OpenAI, создает более детальные и точные картинки. Модель поддерживает редактирование уже существующих изображений, включая трансформацию объектов на переднем или заднем плане и «дорисовку» недостающих фрагментов.

На чём обучали модель

Компания подтвердила в разговоре с Wall Street Journal, что GPT-4o обучалась на открытых источниках и партнёрских наборах данных, включая изображения от Shutterstock.

Читать также:

Брошенная на Марсе земная техника послужит людям даже после выхода из строя

Microsoft представила Muse — ИИ для замены не только разработчиков, но и игроковtproger.ru

Подробности не раскрываются: как и другие игроки на рынке, OpenAI рассматривает тренировочные датасеты как конкурентное преимущество, но в то же время — как возможный юридический риск.

OpenAI утверждает, что уважает права художников. По словам операционного директора Брэда Лайткапа, политика компании запрещает генерировать изображения, копирующие стиль живых авторов.

Также есть форма для удаления работ из тренировочной выборки и возможность запретить сбор данных через веб-краулеры OpenAI.

Конкуренция с Google и риски генеративной графики

Выход новой функции в ChatGPT происходит на фоне аналогичных экспериментов от Google. Напомним, недавно Gemini 2.0 Flash получил поддержку редактирования изображений, но столкнулся с критикой — в том числе за возможность удалять водяные знаки и генерировать изображения с нарушением авторских прав.

Генерация и «инпейнтинг» через GPT-4o

На чём обучали модель

Конкуренция с Google и риски генеративной графики

ЭТО МОЖЕТ БЫТЬ ИНТЕРЕСНОЕЩЕ ОТ АВТОРА

CD Projekt Red объяснила, что произошло с лицом Цири в техническом демо The Witcher 4

Разработчики Go окончательно отказались от изменений синтаксиса обработки ошибок — Tproger

«Поводов для беспокойства нет»: чем для игроков грозит признание создателей «Мира танков» и «Мира кораблей» экстремистами

ЭТО МОЖЕТ БЫТЬ ИНТЕРЕСНО ЕЩЕ ОТ АВТОРА