AI2 говорит, что его новая модель искусственного интеллекта побеждает одну из лучших Deepseek

RU News — Служба новостей на русском языке

Актуальная информация и анализ событий на русском языке. Широкий спектр тем, включая политику, экономику, культуру, спорт и другие важные области. Новости предлагаются в текстовом и мультимедийном формате, включая видео и аналитические материалы.

Дмитрий Павлов30.01.2025

Переезд, DeepSeek. В городе появился новый чемпион ИИ — и они американцы.

В четверг, AI2, некоммерческий исследовательский институт искусственного интеллекта, базирующийся в Сиэтле, выпустил модель, которую, по его утверждению, опередивает Deepseek V3, одну из ведущих систем китайской компании AI Deepseek.

Модель AI2, называемая Tulu3-405B, также превосходит GPT-4O Openai по определенным тестам AI, согласно внутреннему тестированию AI2. Более того, в отличие от GPT-4O (и даже Deepseek V3), Tulu3-405b является открытым исходным кодом, что означает, что все компоненты, необходимые для воспроизведения с нуля, свободно доступны и допустимо лицензированы.

Представитель AI2 сказал TechCrunch, что лаборатория считает, что TULU3-405B «подчеркивает потенциал США, чтобы возглавить глобальное развитие лучших в своем классе генеративных моделей ИИ».

«Эта веха является ключевым моментом для будущего открытого ИИ, усиливающего позицию США в качестве лидера в конкурентных моделях с открытым исходным кодом»,-сказал представитель. «С этим запуском AI2 представляет мощную, разработанную США альтернативу моделям Deepseek-отмечает ключевой момент не только в разработке ИИ, но и в демонстрации, что США могут руководить конкурентоспособным ИИ с открытым исходным кодом независимо от технических гигантов. ”

TULU3-405B-довольно большая модель. Содержит 405 миллиардов параметров, он требовал 256 графических процессоров, работающих параллельно для обучения, согласно AI2. Параметры примерно соответствуют навыкам решения проблем, и модели с большим количеством параметров, как правило, работают лучше, чем с меньшим количеством параметров.

AI2 TULU3-405B — AI2 протестировал Tulu3-405B на ряде критериев, включая математические и общие тесты знаний. **Кредиты изображения:**Ai2

Согласно AI2, одним из ключей к достижению конкурентной работы с Tulu3-405B была метод, называемый подкреплением обучения с подтверждаемыми вознаграждениями. Подкрепление обучения с проверкой вознаграждений, или RLVR, обучает модели по задачам с «проверяемыми» результатами, такими как решение математических задач и следующие инструкции.

AI2 утверждает, что на эталоне Popqa набор из 14 000 специализированных вопросов знаний, полученных из Википедии, Tulu3-405B Beat не только Deepseek V3 и GPT-4O, но и модель Meta Llama 3.1 405b. Tulu3-405b также имел самые высокие показатели в своем классе в классе на GSM8K, тесте, содержащем проблемы математического уровня на уровне начальной школы.

Tulu3-405b доступен для тестирования через веб-приложение AI2 Chatbot, а код для обучения и точной настройки модели на GitHub. Получите его в то время, когда появится горячая-до того, как появится следующая флагманская модель искусственного интеллекта.

Wyndham Clark: бывший чемпион США по открытому.

Приложение Beeper's All-in-One Message Message останавливается с моделью настройки и обновлениями премиум-класса

7.3 Землетрясение величины вызывает предупреждение о цунами вдоль южного побережья Аляски

Starmer и Merz находят свое счастливое место: война — Politico

Британский торговый руководитель нажал Белый дом на тарифах Трампа в Вашингтонском путешествии — Politico

Король и ИИ: гуманоидный робот нарисовал картину Чарльза. Как это было? | Великобритания новости

План многомиллиардов лейбористов по сокращению счетов за энергетику-Politico

Источники сообщают, что напряжение над антимонопольным подразделением вырос в администрации Трампа

Несмотря на обещание убрать худших правонарушителей, данные ICE показывают, что менее 1% депортированных имели обвинения в убийстве

Эксперты говорят, что рейды на рабочем месте демонстрируют уязвимость федеральной системы E-Verify System

20 штатов Сью DHS, FEMA за программу смягчения бедствий до стихийных бедствий

Майк Пенс говорит, что «пришло время» выпустить файлы Epstein