DeepSeek утверждает, что модель «рассуждения» бьет Operai's O1 на определенных тестах

Китайская AI Lab Deepseek выпустила открытую версию Deepseek-R1, ее так называемой модели рассуждений, которую, по его утверждениям, работает так же, как и O1 Openai на определенных критериях ИИ.

R1 доступен на платформе AI DEV, обнимающего лицо по лицензии MIT, что означает, что его можно использовать в коммерческом порядке без ограничений. Согласно Deepseek, R1 побеждает O1 на тестах AIME, Math-500 и SWE-Bench подтверждена. AIME использует другие модели для оценки производительности модели, в то время как Math-500-это набор задач слов. Swe-Bench Verified, тем временем, фокусируется на задачах программирования.

Будучи моделью рассуждений, R1 эффективно проверяет факты, что помогает ему избежать некоторых ловушек, которые обычно отключают модели. Модели рассуждений занимают немного больше времени — обычно до минуты дольше — чтобы получить решения по сравнению с типичной нерезонной моделью. Плюсом является то, что они, как правило, более надежны в таких областях, как физика, наука и математика.

R1 содержит 671 миллиард параметров, сообщил Deepseek в техническом отчете. Параметры примерно соответствуют навыкам решения проблем, и модели с большим количеством параметров, как правило, работают лучше, чем с меньшим количеством параметров.

Действительно, 671 миллиард параметров является массивным, но Deepseek также выпустил «дистиллированные» версии R1 в диапазоне от 1,5 миллиарда параметров до 70 миллиардов параметров. Самый маленький может работать на ноутбуке. Что касается полного R1, это требует более мягкого оборудования, но это является Доступно через API DeepSeek по ценам на 90% -95% дешевле, чем Openai's O1.

Клем ДеЛангю, генеральный директор Hugging Face, заявил в посте в понедельник, что разработчики на платформе создали более 500 «деривативных» моделей R1, которые собрали 2,5 миллиона загрузок — в пять раз больше загрузки официальных R1 получил.

Он был выпущен всего несколько дней назад и уже более 500 производных моделей @deepseek_ai были созданы по всему миру на @huggingface с 2,5 миллионами загрузок (в 5 раз оригинальные веса).

Сила децентрализованного ИИ с открытым исходным кодом!

— Клем (@ClementDelangue) 27 января 2025 года

Есть недостаток R1. Будучи китайской моделью, она подлежит сравнению интернет -регулятора Китая, чтобы гарантировать, что его ответы «воплощают основные социалистические ценности». Например, R1 не будет отвечать на вопросы о площади Тяньаньмэнь или автономии Тайваня.

DeepSeek R1 отказ — Фильтрация R1 в действии. **Кредиты изображения:**DeepSeek

Многие китайские системы ИИ, в том числе другие модели рассуждений, отказываются от реагирования на темы, которые могут поднять гнев регуляторов в стране, такие как спекуляции о режиме Си Цзиньпин.

R1 прибывает через несколько дней после того, как уходящая администрация Байдена предложила более жесткие правила экспорта и ограничения на технологии искусственного интеллекта для китайских предприятий. Компании в Китае уже не могли купить передовые чипы ИИ, но если новые правила вступают в силу, как написано, компании столкнутся с более строгими ограничениями как для полупроводниковых технологий, так и для моделей, необходимых для начала сложных систем ИИ.

В политическом документе на прошлой неделе Openai призвал правительство США поддержать развитие ИИ, чтобы китайские модели не соответствовали или не превзошли их в способности. В интервью с этой информацией вице -президент по политике Openai Крис Лехан выделил High Flyer Capital Management, корпоративный родитель Deepseek, в качестве организации, представляющей особую озабоченность.

До сих пор, по крайней мере, три китайские лаборатории — Deepseek, Alibaba и Kimi, которые принадлежат AI китайского Moonshot Unicorn Moonshot — создали модели, которые, по их мнению, соперничают O1. (Следует отметить, что DeedSeek был первым — он объявил о предварительном просмотре R1 в конце ноября.) В посте о X, Dean Ball, исследователе ИИ в Университете Джорджа Мейсона, заявил, что эта тенденция предполагает, что китайские лаборатории ИИ будут продолжать оставаться ». быстрые последователи ».

«Впечатляющая производительность дистиллированных моделей Deepseek (…) означает, что очень способные разумные средства будут продолжать широко распространены и работать на местном оборудовании»,-пишет Болл,-«далеко от глаз любого режима контроля нисходящего вниз».

Эта история первоначально опубликована 20 января и была обновлена 27 января с дополнительной информацией.

У TechCrunch есть информационный бюллетень, ориентированный на AI! Зарегистрируйтесь здесь Чтобы получить его в своем почтовом ящике каждую среду.

Администрация Трампа может держать Махмуд Халил, заключенный в тюрьму за якобы лежа в заявлении на грин -карту, говорит судья

Источники сообщают, что глина обеспечивает новый раунд в оценке за 3 млрд долларов США.

Super League: Hull KR 68-6 каталонских драконов

Super League: Hull FC 14-22 Castleford Tigers

Финал чемпионата World Test: победа в Южной Африке была бы «массивной для страны»

Футбольные сплетни: Педро, Нуньес, Макати, Родригес, Мбемо, Висса, Танганга

Список наград на день рождения Кинга 2025: Литтлер, Хамфрис, Уэйд и Бекхэм среди спортивных названий

T20 Blast: Джеймс Андерсон звезд в Ланкашире, Нортанцы страдают первой потерей

Апелляционный суд не будет репетировать апелляцию Трампа Э. Жана Кэрролла Диффамации, Дело о сексуальном насилии

Нью-Йорк принимает законопроект о предотвращении стихийных бедствий, созданных в области искусственного интеллекта

Устройства потребителей растут впервые в 2025 году, так как инфляция остается ручной

Шотландское регби: женщины -игроки сталкиваются с безработицей на фоне контрактных проблем