
Китайская AI Lab Deepseek выпустила открытую версию Deepseek-R1, ее так называемой модели рассуждений, которую, по его утверждениям, работает так же, как и O1 Openai на определенных критериях ИИ.
R1 доступен на платформе AI DEV, обнимающего лицо по лицензии MIT, что означает, что его можно использовать в коммерческом порядке без ограничений. Согласно Deepseek, R1 побеждает O1 на тестах AIME, Math-500 и SWE-Bench подтверждена. AIME использует другие модели для оценки производительности модели, в то время как Math-500-это набор задач слов. Swe-Bench Verified, тем временем, фокусируется на задачах программирования.
Будучи моделью рассуждений, R1 эффективно проверяет факты, что помогает ему избежать некоторых ловушек, которые обычно отключают модели. Модели рассуждений занимают немного больше времени — обычно до минуты дольше — чтобы получить решения по сравнению с типичной нерезонной моделью. Плюсом является то, что они, как правило, более надежны в таких областях, как физика, наука и математика.
R1 содержит 671 миллиард параметров, сообщил Deepseek в техническом отчете. Параметры примерно соответствуют навыкам решения проблем, и модели с большим количеством параметров, как правило, работают лучше, чем с меньшим количеством параметров.
Действительно, 671 миллиард параметров является массивным, но Deepseek также выпустил «дистиллированные» версии R1 в диапазоне от 1,5 миллиарда параметров до 70 миллиардов параметров. Самый маленький может работать на ноутбуке. Что касается полного R1, это требует более мягкого оборудования, но это является Доступно через API DeepSeek по ценам на 90% -95% дешевле, чем Openai's O1.
Клем ДеЛангю, генеральный директор Hugging Face, заявил в посте в понедельник, что разработчики на платформе создали более 500 «деривативных» моделей R1, которые собрали 2,5 миллиона загрузок — в пять раз больше загрузки официальных R1 получил.
Есть недостаток R1. Будучи китайской моделью, она подлежит сравнению интернет -регулятора Китая, чтобы гарантировать, что его ответы «воплощают основные социалистические ценности». Например, R1 не будет отвечать на вопросы о площади Тяньаньмэнь или автономии Тайваня.

Многие китайские системы ИИ, в том числе другие модели рассуждений, отказываются от реагирования на темы, которые могут поднять гнев регуляторов в стране, такие как спекуляции о режиме Си Цзиньпин.
R1 прибывает через несколько дней после того, как уходящая администрация Байдена предложила более жесткие правила экспорта и ограничения на технологии искусственного интеллекта для китайских предприятий. Компании в Китае уже не могли купить передовые чипы ИИ, но если новые правила вступают в силу, как написано, компании столкнутся с более строгими ограничениями как для полупроводниковых технологий, так и для моделей, необходимых для начала сложных систем ИИ.
В политическом документе на прошлой неделе Openai призвал правительство США поддержать развитие ИИ, чтобы китайские модели не соответствовали или не превзошли их в способности. В интервью с этой информацией вице -президент по политике Openai Крис Лехан выделил High Flyer Capital Management, корпоративный родитель Deepseek, в качестве организации, представляющей особую озабоченность.
До сих пор, по крайней мере, три китайские лаборатории — Deepseek, Alibaba и Kimi, которые принадлежат AI китайского Moonshot Unicorn Moonshot — создали модели, которые, по их мнению, соперничают O1. (Следует отметить, что DeedSeek был первым — он объявил о предварительном просмотре R1 в конце ноября.) В посте о X, Dean Ball, исследователе ИИ в Университете Джорджа Мейсона, заявил, что эта тенденция предполагает, что китайские лаборатории ИИ будут продолжать оставаться ». быстрые последователи ».
«Впечатляющая производительность дистиллированных моделей Deepseek (…) означает, что очень способные разумные средства будут продолжать широко распространены и работать на местном оборудовании»,-пишет Болл,-«далеко от глаз любого режима контроля нисходящего вниз».
Эта история первоначально опубликована 20 января и была обновлена 27 января с дополнительной информацией.
У TechCrunch есть информационный бюллетень, ориентированный на AI! Зарегистрируйтесь здесь Чтобы получить его в своем почтовом ящике каждую среду.