8.2 C
Москва
Четверг, 3 апреля, 2025

OpenAI научила ChatGPT редактировать фото и улучшила генерацию картинок в чат-боте

ChatGPT научился редактировать фото и генерировать изображения через GPT-4o — теперь доступно в Pro-версии и скоро в API

OpenAI впервые за год обновила возможности ChatGPT по работе с изображениями.

Теперь нейросеть может не только генерировать, но и редактировать картинки — включая фотографии с людьми. Новая функция построена на основе модели GPT-4o, которая ранее использовалась исключительно для работы с текстом.

Генерация и «инпейнтинг» через GPT-4o

Как сообщил Сэм Альтман во время прямого эфира, поддержка изображений в GPT-4o уже доступна пользователям ChatGPT и видеогенератора Sora — пока только в рамках Pro-подписки за $200 в месяц.

В ближайшее время она появится и у пользователей Plus- и бесплатной версии, а также у разработчиков через API.

GPT-4o генерирует изображения чуть медленнее, чем DALL·E 3, но, по словам OpenAI, создает более детальные и точные картинки. Модель поддерживает редактирование уже существующих изображений, включая трансформацию объектов на переднем или заднем плане и «дорисовку» недостающих фрагментов.

На чём обучали модель

Компания подтвердила в разговоре с Wall Street Journal, что GPT-4o обучалась на открытых источниках и партнёрских наборах данных, включая изображения от Shutterstock.

Читать также:
Пайплайн CI/CD: что это такое, как применяется в разработке

Microsoft представила Muse — ИИ для замены не только разработчиков, но и игроковtproger.ru

Подробности не раскрываются: как и другие игроки на рынке, OpenAI рассматривает тренировочные датасеты как конкурентное преимущество, но в то же время — как возможный юридический риск.

OpenAI утверждает, что уважает права художников. По словам операционного директора Брэда Лайткапа, политика компании запрещает генерировать изображения, копирующие стиль живых авторов.

Также есть форма для удаления работ из тренировочной выборки и возможность запретить сбор данных через веб-краулеры OpenAI.

Конкуренция с Google и риски генеративной графики

Выход новой функции в ChatGPT происходит на фоне аналогичных экспериментов от Google. Напомним, недавно Gemini 2.0 Flash получил поддержку редактирования изображений, но столкнулся с критикой — в том числе за возможность удалять водяные знаки и генерировать изображения с нарушением авторских прав.

НОВОЕ НА САЙТЕ