OpenAI анонсировала Operator — самостоятельного ИИ-агента за $200 в месяц, способного выполнять задачи в интернете, включая бронирование, заказы и автоматизацию рутинных действий
OpenAI представила Operator — ИИ-агента, который способен самостоятельно выполнять задачи в интернете.
Используя встроенный браузер, он может взаимодействовать с веб-страницами: заполнять формы, делать заказы, создавать мемы и многое другое. Сервис доступен по подписке за $200 в месяц и пока работает только для Pro-пользователей в США.
Что умеет Operator?
Operator работает на базе модели Computer-Using Agent (CUA), которая сочетает возможности GPT-4o с обучением на основе взаимодействия с графическим интерфейсом (кнопками, меню и текстовыми полями).
Ключевые функции:
- Видит интерфейсы через скриншоты.
- Взаимодействует с веб-страницами, используя действия, доступные пользователям (нажатия, ввод текста).
- Исправляет ошибки самостоятельно или передаёт управление пользователю, если сталкивается с трудностями.
Примеры задач включают заказ продуктов, бронирование путешествий и автоматизацию рутинных операций.
Безопасность на первом месте
OpenAI внедрила три уровня защиты:
- Контроль пользователя: Operator запрашивает подтверждение перед выполнением критически важных действий, таких как ввод паролей или отправка заказов.
- Ограничения задач: Агент отказывается выполнять чувствительные операции, например банковские переводы.
- Прозрачность данных: Пользователи могут удалить всю историю активности и запретить использование данных для обучения моделей.
Operator также защищён от атак, таких как скрытые команды или фишинг, благодаря встроенному мониторингу подозрительных действий.
Будущее Operator
OpenAI планирует расширить доступ для пользователей Plus, Team и Enterprise, а также интегрировать возможности агента в ChatGPT.
Кроме того, компания собирается предоставить модель CUA через API, чтобы разработчики могли создавать собственных ИИ-агентов.