Китайская компания DeepSeek, занимающаяся искусственным интеллектом, стала потенциальным соперником лидеров искусственного интеллекта в США, продемонстрировав революционные модели, которые, как утверждают, предлагают производительность, сравнимую с ведущими чат-ботами, за небольшую часть стоимости. Мобильное приложение компании, выпущенное в начале января, также возглавило чарты iPhone на основных рынках, включая США, Великобританию и Китай.
Основанная в 2023 году Ляном Вэньфэном, бывшим главой квантового хедж-фонда High-Flyer, управляемого искусственным интеллектом, DeepSeek делает свои модели открытыми и включает в себя функцию рассуждения, которая формулирует свои мысли, прежде чем давать ответы.
Реакция Уолл-стрит была неоднозначной. Хотя Джеффрис предупреждает, что эффективный подход DeepSeek «подрывает часть эйфории по поводу капиталовложений» после недавних обязательств по расходам со стороны Meta и Microsoft (каждый из которых в этом году превышает 60 миллиардов долларов), Citi задается вопросом, были ли такие результаты достигнуты без передовых графических процессоров. Goldman Sachs видит более широкие последствия, предполагая, что это событие может изменить конкуренцию между признанными технологическими гигантами и стартапами за счет снижения барьеров для входа.
Вот как аналитики Уолл-стрит реагируют на DeepSeek, по их собственным словам (выделено мной):
Джеффрис
Влияние DeepSeek на обучение ИИ пробивает часть эйфории от капитальных вложений это последовало за крупными обязательствами Stargate и Meta на прошлой неделе. Поскольку DeepSeek обеспечивает производительность, сравнимую с GPT-4o, при незначительной вычислительной мощности, существует возможные негативные последствия для строителейпоскольку давление на игроков в сфере ИИ с целью оправдать постоянно растущие планы капвложений может в конечном итоге привести к снижению траектории роста доходов и прибыли центров обработки данных.
Если модели меньшего размера могут работать хорошо, то это потенциально положительный для смартфона. Мы настроены по-медвежьи в отношении смартфонов с искусственным интеллектом, поскольку искусственный интеллект не пользуется популярностью у потребителей. Для запуска более крупных моделей на телефоне необходимо дополнительное обновление оборудования (adv pkg+fast DRAM), что приведет к увеличению затрат. Модель AAPL фактически основана на MoE, но 3 миллиарда параметров данных все еще слишком малы, чтобы сделать услуги полезными для потребителей. Таким образом, успех DeepSeek вселяет некоторую надежду, но не оказывает никакого влияния на ближайшие перспективы смартфонов с искусственным интеллектом.
Китай – это единственный рынок, который стремится к эффективности LLM из-за ограничения чипа. Трамп/Маск, вероятно, осознают, что риск дальнейших ограничений заключается в том, чтобы заставить Китай быстрее внедрять инновации. Поэтому мы считаем, что Трамп, скорее всего, ослабит политику распространения ИИ.
Сити
Хотя достижение DeepSeek может быть революционным, мы подвергнуть сомнению эту идею что его подвиги были совершены без использования передовых графических процессоров для его точной настройки и/или создания базовых LLM, на которых основана окончательная модель, с помощью метода дистилляции. Хотя доминирование американских компаний в производстве самых передовых моделей искусственного интеллекта потенциально может быть поставлено под сомнение, тем не менее, мы считаем, что в неизбежно более ограничительной среде доступ США к более совершенным чипам является преимуществом. Таким образом, мы не ожидаем, что ведущие компании, занимающиеся искусственным интеллектом, отойдут от более совершенных графических процессоров, которые обеспечивают более привлекательные показатели $/TFLOP в масштабе. Мы рассматриваем недавние объявления о капиталовложениях в области искусственного интеллекта, такие как Stargate, как намек на необходимость в передовых чипах.
Бернштейн
Короче говоря, мы считаем, что 1) DeepSeek НЕ «создал OpenAI за 5 миллионов долларов»; 2) модели выглядят фантастически, но мы не думай, что это чудеса; и 3) полученный Twitterverse паника на выходных кажется преувеличенной.
Наша собственная первоначальная реакция не включает в себя панику (отнюдь нет). Если мы признаем, что DeepSeek, возможно, сократил затраты на достижение эквивалентной производительности модели, скажем, в 10 раз, мы также отметим, что текущие траектории стоимости модели в любом случае увеличиваются примерно на эту же величину каждый год (печально известные «законы масштабирования…»), что не может продолжаться вечно. В этом контексте нам НУЖНЫ подобные инновации (МЭ, дистилляция, смешанная точность и т. д.), если ИИ хочет продолжать развиваться. А для тех, кто ищет внедрения ИИ, мы, полуаналитики, твердо верим в парадокс Джевонса (т. е. в то, что повышение эффективности приводит к чистому увеличению спроса) и считаем, что любые новые разблокированные вычислительные мощности с гораздо большей вероятностью будут поглощены из-за использования и Увеличение спроса и влияние на долгосрочные перспективы расходов на данный момент, поскольку мы не считаем, что потребности в вычислительных ресурсах хоть сколько-нибудь близки к достижению своего предела в сфере ИИ. Также кажется натяжкой думать, что инновации, внедряемые DeepSeek, совершенно неизвестны огромному числу ведущих исследователей ИИ в других многочисленных лабораториях ИИ в мире (откровенно говоря, мы не знаем, что крупные закрытые лаборатории использовали для разработки и развертывают свои собственные модели, но мы просто не можем поверить, что они сами не рассматривали или даже, возможно, не использовали подобные стратегии).
Морган Стэнли
Мы не подтвердили правдивость этих отчетов, но если они точны и продвинутое LLM действительно можно разработать за небольшую часть предыдущих инвестиций, мы могли бы увидеть, как генеративный ИИ со временем будет работать на компьютерах все меньшего и меньшего размера. (сокращение от суперкомпьютеров к рабочим станциям, офисным компьютерам и, наконец, персональным компьютерам), а отрасль SPE может извлечь выгоду из сопутствующего увеличения спроса на сопутствующие продукты (чипы и SPE) по мере роста спроса на генеративный ИИ.
Голдман Сакс
С последними разработками мы также видим 1) потенциальная конкуренция между богатыми капиталом интернет-гигантами и стартапамиучитывая снижение барьеров для входа, особенно с учетом недавних новых моделей, разработанных за небольшую часть стоимости существующих; 2) от обучения к дальнейшим выводамс повышенным упором на пост-обучение (включая способности рассуждения и возможности подкрепления), которое требует значительно меньших вычислительных ресурсов по сравнению с предварительным обучением; и 3) потенциал дальнейшей глобальной экспансии китайских игроков, учитывая их производительность и конкурентоспособность по соотношению цена-качество.
Мы по-прежнему ожидаем, что гонка за приложениями ИИ/агентами ИИ продолжится в Китае, особенно среди приложений To-C, где китайские компании были пионерами мобильных приложений в эпоху Интернета, например, создание Tencent супер-Weixin (WeChat) приложение. Среди приложений To-C лидирует ByteDance, запустив за последний год 32 приложения AI. Среди них Doubao на данный момент является самым популярным чат-ботом с искусственным интеллектом в Китае с самым высоким MAU (около 70 млн), который недавно был обновлен моделью Doubao 1.5 Pro. Мы считаем, что ключевыми факторами будут дополнительные потоки доходов (подписка, реклама) и возможный/устойчивый путь к монетизации/положительная юнит-экономика среди приложений/агентов.
На инфраструктурном уровне внимание инвесторов сосредоточено на том, возникнет ли в краткосрочной перспективе несоответствие между рыночными ожиданиями в отношении капитальных вложений в ИИ и спросом на вычисления в случае значительного улучшения затрат/эффективности вычислений модели. Мы по-прежнему считаем, что китайские игроки в сфере облачных технологий и центров обработки данных в 2025 году будут сосредоточены на доступности чипов и способности CSP (поставщиков облачных услуг) обеспечивать увеличение доходов от роста доходов от облачных технологий на основе искусственного интеллекта, а также за рамки аренды инфраструктуры и графических процессоров. , как рабочие нагрузки ИИ и связанные с ним услуги могут способствовать росту и прибыли в будущем. Мы по-прежнему позитивно оцениваем долгосрочный рост спроса на ИИ-вычисления, поскольку дальнейшее снижение затрат на вычисления, обучение и логические выводы может привести к более широкому внедрению ИИ. См. также тему №5 нашего отчета по ключевым темам для наших базовых/медвежьих сценариев для оценки капвложений BBAT в зависимости от доступности чипов, где мы ожидаем, что совокупный рост капвложений BBAT продолжится в 2025П в нашем базовом сценарии (GSe: +38% по сравнению с предыдущим годом), хотя и немного более умеренными темпами по сравнению с сильным 2024 годом (GSe: +61% г/г), что обусловлено продолжающимися инвестициями в инфраструктуру искусственного интеллекта.
Дж.П.Морган
Прежде всего, много внимания уделяется исследовательским работам DeepSeek и эффективности их моделей. Неясно, в какой степени DeepSeek использует ~50 тыс. графических процессоров High-Flyer (аналогичных по размеру кластеру, на котором OpenAI, как предполагается, обучает GPT-5), но кажется вероятным, что они значительно сокращают затраты (затраты на вывод). например, для их модели V2 они составляют 1/7 от GPT-4 Turbo). Их подрывное (хотя и не новое) утверждение, которое на этой неделе начало звучать в именах американских ИИ, заключается в том, что «больше инвестиций не равно большему количеству инноваций». Лян: «Сейчас я не вижу никаких новых подходов, но крупные фирмы не имеют явного преимущества. У крупных фирм есть существующие клиенты, но их бизнес, связанный с денежными потоками, также является их бременем, и это делает их уязвимыми для сбоев в любой момент». А когда его спросили о том, что GPT5 до сих пор не вышел: «OpenAI — не бог, они не обязательно всегда будут в авангарде».
ЮБС
В течение 2024 года, первого года, когда мы наблюдали массовую рабочую нагрузку по обучению искусственному интеллекту в Китае, более 80–90% спроса на IDC было обусловлено обучением искусственному интеллекту и концентрировалось у 1–2 клиентов-гиперскейлеров, что привело к оптовому спросу на гипермасштабируемые IDC в относительно отдаленных районах (например, энергозатратное обучение ИИ чувствительно к стоимости коммунальных услуг, а не к задержке пользователя).
Если стоимость обучения и вывода ИИ значительно ниже, мы ожидаем, что больше конечных пользователей будут использовать ИИ для улучшения своего бизнеса или разработки новых вариантов использования.особенно розничных покупателей. Такой спрос со стороны IDC означает большее внимание к местоположению (поскольку задержка пользователя более важна, чем стоимость коммунальных услуг) и, следовательно, большую ценовую политику для операторов IDC, которые располагают обильными ресурсами в городах первого уровня и городах-спутниках. Между тем, более диверсифицированный клиентский портфель также будет подразумевать большую ценовую власть.
Мы будем обновлять эту историю по мере того, как отреагируют новые аналитики.