Инструмент агента OpenAI, возможно, близок к выпуску

RU News — Служба новостей на русском языке

Актуальная информация и анализ событий на русском языке. Широкий спектр тем, включая политику, экономику, культуру, спорт и другие важные области. Новости предлагаются в текстовом и мультимедийном формате, включая видео и аналитические материалы.

Дмитрий Павлов21.01.2025

OpenAI может быть близка к выпуску инструмента искусственного интеллекта, который сможет контролировать ваш компьютер и выполнять действия от вашего имени.

Тибор Блахо, инженер-программист с репутацией специалиста по точной утечке информации о будущих продуктах искусственного интеллекта, утверждает, что обнаружил доказательства существования инструмента оператора OpenAI, о котором давно ходят слухи. Публикации, в том числе Bloomberg, ранее сообщали об Операторе, который, как говорят, представляет собой «агентскую» систему, способную автономно выполнять такие задачи, как написание кода и бронирование поездок.

Согласно информации, OpenAI планирует сделать январь месяцем выпуска оператора. Код, обнаруженный Блахо на этих выходных, добавляет достоверности этому сообщению.

Клиент OpenAI ChatGPT для macOS получил пока скрытые опции для определения ярлыков для «Переключить оператора» и «Оператора принудительного выхода», по словам Блахо. По словам Блахо, OpenAI добавила ссылки на Оператора на свой веб-сайт, хотя ссылки пока не являются общедоступными.

На веб-сайте OpenAI уже есть ссылки на Оператора/OpenAI CUA (Агент использования компьютера) — «Таблица карточек операторской системы», «Таблица оценки исследований операторов» и «Таблица частоты отказов операторов».

Включая сравнение с использованием компьютера Claude 3.5 Sonnet, Google Mariner и т. д.

(предварительный просмотр таблиц… pic.twitter.com/OOBgC3ddkU

— Тибор Блахо (@btibor91) 20 января 2025 г.

По словам Блахо, сайт OpenAI также содержит еще не опубликованные таблицы, сравнивающие производительность Оператора с другими компьютерными системами искусственного интеллекта. Таблицы вполне могут быть заполнителями. Но если цифры точны, они предполагают, что Оператор не на 100% надежен, в зависимости от задачи.

На веб-сайте OpenAI уже есть ссылки на Оператора/OpenAI CUA (Агент использования компьютера) — «Таблица карточек операторской системы», «Таблица оценки исследований операторов» и «Таблица частоты отказов операторов».

Включая сравнение с использованием компьютера Claude 3.5 Sonnet, Google Mariner и т. д.

(предварительный просмотр таблиц… pic.twitter.com/OOBgC3ddkU

— Тибор Блахо (@btibor91) 20 января 2025 г.

В OSWorld, тесте, который пытается имитировать реальную компьютерную среду, «Агент использования компьютера OpenAI (CUA)» — возможно, модель искусственного интеллекта, лежащая в основе оператора — набирает 38,1%, опережая модель управления компьютером Anthropic, но значительно уступая 72,4% людей. счет. OpenAI CUA превосходит человеческие возможности в WebVoyager, который оценивает способность ИИ перемещаться по веб-сайтам и взаимодействовать с ними. Но согласно утечкам тестов, модель не дотягивает до показателей человеческого уровня в другом веб-тесте, WebArena.

Оператор также с трудом справляется с задачами, которые человек мог бы легко выполнить, если верить утечке. В тесте, в котором Оператору было поручено зарегистрироваться у поставщика облачных услуг и запустить виртуальную машину, Оператор добился успеха только в 60% случаев. Оператору, которому было поручено создать биткойн-кошелек, удалось это только в 10% случаев.

Неизбежное вхождение OpenAI в пространство агентов искусственного интеллекта связано с тем, что конкуренты, в том числе вышеупомянутые Anthropic, Google и другие, начинают борьбу за зарождающийся сегмент. Агенты ИИ могут быть рискованными и спекулятивными, но технологические гиганты уже рекламируют их как следующее большое достижение в области ИИ. По данным аналитической компании Markets and Markets, к 2030 году рынок ИИ-агентов может составить $47,1 млрд.

Агенты сегодня довольно примитивны. Но некоторые эксперты выразили обеспокоенность по поводу их безопасности, если технология быстро улучшится.

Одна из просочившихся диаграмм показывает, что Оператор хорошо справляется с некоторыми оценками безопасности, включая тесты, которые пытаются заставить систему выполнять «незаконные действия» и искать «конфиденциальные персональные данные». Как сообщается, тестирование безопасности является одной из причин длительного цикла разработки Оператора. В недавнем посте соучредитель OpenAI Войцех Заремба раскритиковал Anthropic за выпуск агента, который, по его словам, не имеет мер по обеспечению безопасности.

«Я могу только представить себе негативную реакцию, если OpenAI выпустит аналогичный релиз», — написал Заремба.

Стоит отметить, что OpenAI подверглась критике со стороны исследователей ИИ, в том числе бывших сотрудников, за то, что они якобы преуменьшают значение работы по обеспечению безопасности в пользу быстрого внедрения своих технологий.

Уимблдон 2025: Джанник Синнер говорит, что он будет «на 100%» для Новака Джоковича Полуфинал

Социалисты, чтобы поддержать фон Дер Лейн в безвыплативном голосовании после того, как она отступит по бюджету ЕС-Politico

Man Utd Stadium News: Клуб стремится провести финал чемпионата мира по футболу 2035 года.

А рекламный бизнес x улучшился под руководством генерального директора Линды Яккарино, но это все еще тяжелые времена впереди

Kyiv Spurns предложил руководителю от Бюро по экономическим преступлениям, создав Clash с западными партнерами — Politico

T20 Blast: Медведи победили Ланкашир как Суррей, Кент и Хэмпшир

Секретная служба приостановила 6 человек без оплаты или пособий после попытки убийства Трампа

Англия против Индии: Туристы завоевывают победу в серии T20 с удобной победой на Олд Траффорд

Грок написал фантазии изнасилования о пользователе x, прежде чем он был отключен

Стив Дэвис покинул Дож в мае, но чиновники говорят, что он все еще управляет шоу

Уимблдон 2025: Belinda Bencic Dreaming Up Game Plan, чтобы победить Iga Swiatek

Калифорнийский законодатель за SB 1047 Reignites стремится к обязательным отчетам о безопасности ИИ