OpenAI запускает пару моделей рассуждений с ИИ, O3 и O4-Mini

В среду Openai объявил о запуске O3 и O4-Mini, новых моделей рассуждений с искусственным интеллектом, предназначенными для паузы и работы с помощью вопросов, прежде чем отвечать.

Компания называет O3 своей самой продвинутой моделью рассуждений, опережая предыдущие модели компании по тестированию, измеряющих математику, кодирование, рассуждения, науку и визуальные возможности понимания. Между тем, O4-Mini предлагает то, что OpenAI говорит, что является конкурентным компромиссом между ценой, скоростью и производительностью-три фактора, которые разработчики часто рассматривают при выборе модели ИИ для питания своих приложений.

В отличие от предыдущих моделей рассуждений, O3 и O4-Mini могут генерировать ответы, используя инструменты в CHATGPT, такие как просмотр веб-страниц, выполнение кода Python, обработка изображений и генерация изображений. Начиная с сегодняшнего дня, модели, плюс вариант O4-Mini, называемые «O4-Mini-High», который тратит больше времени на создание ответов на повышение его надежности, доступны для подписчиков для Pro, Plus Pro Pro, а также планов команды.

Новые модели являются частью усилий Openai по избавлению Google, Meta, Xai, Anpropic и Deepseek в гонке Глобальной ИИ. В то время как Openai был первым, чтобы выпустить модель рассуждения AI, O1, конкуренты быстро последовали собственными версиями, которые соответствуют или превышают производительность линейки Openai. Фактически, модели рассуждений начали доминировать в области, поскольку лаборатории ИИ идут на то, чтобы сделать больше производительности из их систем.

O3 почти не был выпущен в Chatgpt. Генеральный директор Openai Сэм Альтман в феврале дал представление о том, что компания намеревалась посвятить больше ресурсов сложной альтернативе, которая включала технологию O3. Но конкурентное давление, по -видимому, подстегнуло Openai, чтобы в конце концов обратить вспять.

OpenAI говорит, что O3 достигает современной производительности на проверке SWE-Bench (без пользовательских каркасов), тестовых измерений кодирующих способностей, набрав 69,1%. Модель O4-Mini достигает аналогичной производительности, набрав 68,1%. Следующая лучшая модель Openai, O3-Mini, набрала 49,3% в тесте, в то время как Claude 3,7 Sonnet набрал 62,3%.

Openai утверждает, что O3 и O4-Mini-его первые модели, которые могут «думать с изображениями». На практике пользователи могут загружать изображения в CHATGPT, такие как эскизы белой доски или диаграммы от PDF, и модели будут анализировать изображения на этапе их «цепочка размышлений» перед ответом. Благодаря этой вновь обретенной способности O3 и O4-Mini могут понимать размытые и низкокачественные изображения и могут выполнять такие задачи, как масштабирование или вращающиеся изображения, как они рассуждают.

Помимо возможностей обработки изображений, O3 и O4-Mini могут запускать и выполнять код Python непосредственно в вашем браузере через функцию Catgpt's Canvas, и искать в Интернете, когда его спрашивают о текущих событиях.

В дополнение к CHATGPT, все три модели-O3, O4-Mini и O4-Mini-High-будут доступны через конечные точки Openai, обращенные к разработчикам, API API и ответы в чате, что позволяет инженерам создавать приложения с моделями компании по ставкам на основе использования.

OpenAI взимает с разработчиков относительно низкую цену за O3, учитывая его улучшенную производительность, на 10 долларов США за миллион входных токенов (примерно 750 000 слов, дольше, чем серия «Властелин колец») и 40 долларов за миллион токенов. Для O4-Mini OpenAI взимает то же самое, что и O3-Mini, 1,10 долл. США за миллион входных токенов и 4,40 долл. США за миллион токенов.

В ближайшие недели Openai заявляет, что планирует выпустить O3-Pro, версию O3, которая использует больше компьютерных ресурсов для получения своих ответов, исключительно для подписчиков CHATGPT Pro.

Генеральный директор OpenAI Сэм Альтман указал, что O3 и O4-Mini могут быть его последними автономными моделями рассуждений AI в CHATGPT до GPT-5, модель, которая, по словам компании, будет объединять традиционные модели, такие как GPT-4.1 с моделями рассуждений.

Previous post Правда, ложь и предательство Украины
Next post Шотландский Кубок: Джимми Телин оценивает абердин