Openai Запуск программы для разработки новых «тестов AI-специфических для доменов»

RU News — Служба новостей на русском языке

Актуальная информация и анализ событий на русском языке. Широкий спектр тем, включая политику, экономику, культуру, спорт и другие важные области. Новости предлагаются в текстовом и мультимедийном формате, включая видео и аналитические материалы.

Дмитрий Павлов09.04.2025

Openai, как и многие лаборатории ИИ, думает, что тесты ИИ сломаны. Он говорит, что хочет исправить их с помощью новой программы.

Программа, называемая программой Poneers Openai, будет сосредоточена на создании оценок для моделей искусственного интеллекта, которые «устанавливают планку на то, как выглядит хорошо», как это было в сообщении Openai в сообщении в блоге.

«Поскольку темпы принятия ИИ ускоряются в разных отраслях, необходимо понимать и улучшать его влияние на мир», — продолжила компания в своем посте. «Создание эвал, специфичных для домена, является одним из способов, чтобы лучше отражать реальные варианты использования, помогая группам оценить производительность модели в практических средах с высокими ставками».

Как показывает недавнее противоречие с краудсорсинговой эталоной LM Arena и Meta Maverick Model, в наши дни трудно узнать, что именно отличает одну модель от другой. Многие широко используемые показатели ИИ измеряют эффективность по эзотерическим задачам, таким как решение математических задач на уровне доктора. Другие могут быть гамед или плохо соответствовать предпочтениям большинства людей.

В рамках программы Pioneers OpenAI надеется создать ориентиры для конкретных доменов, таких как юридические, финансы, страхование, здравоохранение и бухгалтерский учет. В лаборатории говорится, что в ближайшие месяцы она будет работать с «несколькими компаниями» для разработки индивидуальных тестов и в конечном итоге публично разделять эти критерии, а также «отраслевые» оценки.

«Первая когорта будет сосредоточена на стартапах, которые помогут заложить основы программы Pionai Pioneers», — написал Openai в сообщении в блоге. «Мы выбираем несколько стартапов для этой первоначальной когорты, каждая из которых работает над высокими ценами, применяемыми вариантами использования, когда ИИ может оказать реальное воздействие».

По словам Openai, компании в программе также будут иметь возможность работать с командой Openai для создания улучшений моделей с помощью подкрепления Fine Tuning, метода, которая оптимизирует модели для узкого набора задач.

Большой вопрос заключается в том, будет ли сообщество ИИ охватить тесты, чье создание финансировалось OpenAI. OpenAI поддержал финансовые усилия в финансовом отношении и разработала свои собственные оценки. Но партнерство с клиентами для выпуска тестов искусственного интеллекта может рассматриваться как этический мост слишком далеко.

Судья управляет исполнительным постановлением Трампа, ориентированная на юридическую фирму Perkins Coie неконституционна

Гран -при Майами: Джордж Рассел говорит, что «неплохо» видеть, как Льюис Гамильтон борется с Ferrari

После того, как Трамп увольняет сотни ученых, работающих над отчетом о климате, две группы говорят, что опубликуют свою работу

Ирландское премьерство: восемь отстранений отказались после драки Larne-Glentoran

Кто может победить кандидата в президенты Румынского националиста Джорджа Симиона? — Политик

Как вечеринка закончилась для эксперимента Málaga на Уолл -стрит Банк.

Белый дом предъявляет иск штату Колорадо, город Денвер, местные лидеры по политике «святилища»

Чистый капитал семьи Трампа увеличился на 2,9 миллиарда долларов благодаря крипто -инвестициям, говорится в новом отчете

Лондонский марафон 2026 года: стал ли Великобритания народом бегунов?

Австралийцы голосуют на национальных выборах, поскольку влияние Трампа намекает

Путешествие Фолкерка из лиги 1 до премьерства за два сезона

Man City 1-0 волков: Кевин де Брюйн уходит слишком рано?