Инструмент агента OpenAI, возможно, близок к выпуску

OpenAI может быть близка к выпуску инструмента искусственного интеллекта, который сможет контролировать ваш компьютер и выполнять действия от вашего имени.

Тибор Блахо, инженер-программист с репутацией специалиста по точной утечке информации о будущих продуктах искусственного интеллекта, утверждает, что обнаружил доказательства существования инструмента оператора OpenAI, о котором давно ходят слухи. Публикации, в том числе Bloomberg, ранее сообщали об Операторе, который, как говорят, представляет собой «агентскую» систему, способную автономно выполнять такие задачи, как написание кода и бронирование поездок.

Согласно информации, OpenAI планирует сделать январь месяцем выпуска оператора. Код, обнаруженный Блахо на этих выходных, добавляет достоверности этому сообщению.

Клиент OpenAI ChatGPT для macOS получил пока скрытые опции для определения ярлыков для «Переключить оператора» и «Оператора принудительного выхода», по словам Блахо. По словам Блахо, OpenAI добавила ссылки на Оператора на свой веб-сайт, хотя ссылки пока не являются общедоступными.

По словам Блахо, сайт OpenAI также содержит еще не опубликованные таблицы, сравнивающие производительность Оператора с другими компьютерными системами искусственного интеллекта. Таблицы вполне могут быть заполнителями. Но если цифры точны, они предполагают, что Оператор не на 100% надежен, в зависимости от задачи.

В OSWorld, тесте, который пытается имитировать реальную компьютерную среду, «Агент использования компьютера OpenAI (CUA)» — возможно, модель искусственного интеллекта, лежащая в основе оператора — набирает 38,1%, опережая модель управления компьютером Anthropic, но значительно уступая 72,4% людей. счет. OpenAI CUA превосходит человеческие возможности в WebVoyager, который оценивает способность ИИ перемещаться по веб-сайтам и взаимодействовать с ними. Но согласно утечкам тестов, модель не дотягивает до показателей человеческого уровня в другом веб-тесте, WebArena.

Оператор также с трудом справляется с задачами, которые человек мог бы легко выполнить, если верить утечке. В тесте, в котором Оператору было поручено зарегистрироваться у поставщика облачных услуг и запустить виртуальную машину, Оператор добился успеха только в 60% случаев. Оператору, которому было поручено создать биткойн-кошелек, удалось это только в 10% случаев.

Неизбежное вхождение OpenAI в пространство агентов искусственного интеллекта связано с тем, что конкуренты, в том числе вышеупомянутые Anthropic, Google и другие, начинают борьбу за зарождающийся сегмент. Агенты ИИ могут быть рискованными и спекулятивными, но технологические гиганты уже рекламируют их как следующее большое достижение в области ИИ. По данным аналитической компании Markets and Markets, к 2030 году рынок ИИ-агентов может составить $47,1 млрд.

Агенты сегодня довольно примитивны. Но некоторые эксперты выразили обеспокоенность по поводу их безопасности, если технология быстро улучшится.

Одна из просочившихся диаграмм показывает, что Оператор хорошо справляется с некоторыми оценками безопасности, включая тесты, которые пытаются заставить систему выполнять «незаконные действия» и искать «конфиденциальные персональные данные». Как сообщается, тестирование безопасности является одной из причин длительного цикла разработки Оператора. В недавнем посте соучредитель OpenAI Войцех Заремба раскритиковал Anthropic за выпуск агента, который, по его словам, не имеет мер по обеспечению безопасности.

«Я могу только представить себе негативную реакцию, если OpenAI выпустит аналогичный релиз», — написал Заремба.

Стоит отметить, что OpenAI подверглась критике со стороны исследователей ИИ, в том числе бывших сотрудников, за то, что они якобы преуменьшают значение работы по обеспечению безопасности в пользу быстрого внедрения своих технологий.

Previous post Разделенный ЕС получил облегчение, чтобы избежать пошлин Дональда Трампа
Next post Футбольные сплетни: Гарначо, Доргу, Айт-Нури, Анчелотти, Эллиот, Керкез