
Стремясь более агрессивно конкурировать с конкурирующими компаниями ИИ, такими как Google, OpenAI запускает Flex Processing, опцию API, которая обеспечивает более низкие цены на использование модели искусственного интеллекта в обмен на более медленное время отклика и «случайные ресурсы».
Обработка Flex, которая доступна в бета-версии для недавно выпущенных моделей A3 и O4-Mini, предназначена для более низких приоритетных и «непроизводных» задач, таких как оценки моделей, обогащение данных и асинхронные рабочие нагрузки.
Это снижает затраты API ровно наполовину. Для O3 обработка Flex составляет $ 5/м входных токенов (~ 750 000 слов) и токенов $ 20/M вывода по сравнению с стандартными входными токенами в размере 10/м и токенами $ 40/M. Для O4-Mini Flex снижает цену до 0,55 долл. США/м токенов в 2,20 долл. США/м токенов от входных токенов $ 1,10/м и токенов вывода $ 4,40/м.
Запуск обработки Flex поступает, поскольку цена Frontier AI продолжает подниматься, и когда конкуренты выпускают более дешевые, более эффективные модели, ориентированные на бюджет. В четверг Google выпустил Gemini 2.5 Flash, модель рассуждений, которая соответствует или поддерживает R1 Deepseek с точки зрения производительности при более низкой стоимости токена входных данных.
В электронном письме клиентам, объявляющим о выпуске Plex Pricing, OpenAI также указал, что разработчики в уровне 1-3 иерархии уровней использования должны будут завершить недавно введенный процесс проверки идентификации, чтобы получить доступ к O3. (Установки определяются суммой денег, потраченных на услуги OpenAI.) Сводка рассуждений O3 и поддержка потоковой передачи API также отстранены от проверки.
Ранее OpenAI заявил, что проверка удостоверения личности предназначена для того, чтобы помешать плохим актерам нарушать политику использования.