ChatGPT научился редактировать фото и генерировать изображения через GPT-4o — теперь доступно в Pro-версии и скоро в API
OpenAI впервые за год обновила возможности ChatGPT по работе с изображениями.
Теперь нейросеть может не только генерировать, но и редактировать картинки — включая фотографии с людьми. Новая функция построена на основе модели GPT-4o, которая ранее использовалась исключительно для работы с текстом.
Генерация и «инпейнтинг» через GPT-4o
Как сообщил Сэм Альтман во время прямого эфира, поддержка изображений в GPT-4o уже доступна пользователям ChatGPT и видеогенератора Sora — пока только в рамках Pro-подписки за $200 в месяц.
В ближайшее время она появится и у пользователей Plus- и бесплатной версии, а также у разработчиков через API.
GPT-4o генерирует изображения чуть медленнее, чем DALL·E 3, но, по словам OpenAI, создает более детальные и точные картинки. Модель поддерживает редактирование уже существующих изображений, включая трансформацию объектов на переднем или заднем плане и «дорисовку» недостающих фрагментов.
На чём обучали модель
Компания подтвердила в разговоре с Wall Street Journal, что GPT-4o обучалась на открытых источниках и партнёрских наборах данных, включая изображения от Shutterstock.
Microsoft представила Muse — ИИ для замены не только разработчиков, но и игроковtproger.ru
Подробности не раскрываются: как и другие игроки на рынке, OpenAI рассматривает тренировочные датасеты как конкурентное преимущество, но в то же время — как возможный юридический риск.
OpenAI утверждает, что уважает права художников. По словам операционного директора Брэда Лайткапа, политика компании запрещает генерировать изображения, копирующие стиль живых авторов.
Также есть форма для удаления работ из тренировочной выборки и возможность запретить сбор данных через веб-краулеры OpenAI.
Конкуренция с Google и риски генеративной графики
Выход новой функции в ChatGPT происходит на фоне аналогичных экспериментов от Google. Напомним, недавно Gemini 2.0 Flash получил поддержку редактирования изображений, но столкнулся с критикой — в том числе за возможность удалять водяные знаки и генерировать изображения с нарушением авторских прав.