Мета должна победить разработчиков ИИ в своем первом ламаконе

Во вторник Meta проводит свою первую в истории конференцию Lmamacon AI Developer в штаб-квартире Menlo Park, где компания попытается разместить разработчиков на строительство применения с открытыми моделями Llama AI. Всего год назад это не было тяжелой продажей.

Однако в последние месяцы Meta изо всех сил пыталась не отставать от «открытых» лабораторий ИИ, таких как DeepSeek, и закрытые коммерческие конкуренты, такие как Openai, в быстро развивающейся гонке ИИ. Llamacon приходит в критический момент для Meta в своем стремлении построить обширную экосистему ламы.

Победившие разработчики могут быть такими же простыми, как доставка лучших открытых моделей. Но это может быть сложнее достичь, чем кажется.

Многообещающий ранний старт

Запуск Meta LlaMa 4 в начале этого месяца понизил разработчиков, с несколькими эталонными показателями, представленными ниже моделей, таких как R1 и V3 Deepseek. Это было далеко от того, что когда-то была Llama: модельная модельная линейка.

Когда Meta запустила свою модель Llama 3.1 405B прошлым летом, генеральный директор Марк Цукерберг рекламировал ее как большую победу. В сообщении в блоге Meta под названием Llama 3.1 405b «наиболее способной открыто доступной моделью фундамента», с лучшей моделью Openai в то время, GPT-4O.

Конечно, это была впечатляющая модель — как и другие модели в семье Meta Llama 3. Джереми Никсон, который в течение последних нескольких лет принимал хакатоны в House в Сан -Франциско, назвал Llama 3 запусках «Исторические моменты».

Llama 3, возможно, сделала Meta милой среди разработчиков ИИ, обеспечив передовые результаты с свободой размещать модели, где бы они ни выбрали. Сегодня модель Meta Llama 3.3 загружается чаще, чем Llama 4, сказал, что глава продукта и роста Hugging Face, Джефф Бодье, в интервью.

Сравните это с приемом семейства Meta Llama 4, и разница резко. Но лама 4 была спорной с самого начала.

Брингеринг махинации

Meta оптимизировала версию одной из своих моделей Llama 4, Llama 4 Maverick, для «Conternationality», которая помогла ему занять первое место на краудсорсинговой эталонной арене LM. Однако Meta никогда не выпускала эту модель — версия Maverick, которая в целом выпустила гораздо хуже на LM Arena.

Группа, стоящая за LM Arena, сказала, что Meta должна была быть «яснее» о несоответствии. Ион Стоика, соучредитель LM Arena и профессор UC Berkeley, который также соучредил компании, включая Antscale и Databricks, заявил TechCrunch, что инцидент нанесла ущерб доверию сообщества разработчиков к Meta.

«(Meta) должен был быть более явным, что модель Maverick, которая была на (LM Arena), отличалась от выпущенной модели», — сказала Стоика TechCrunch в интервью. «Когда это происходит, это немного потери доверия к сообществу. Конечно, они могут восстановить это, выпустив лучшие модели».

Нет рассуждений

Яркое упущение от семьи Llama 4 было моделью рассуждений искусственного интеллекта. Модели рассуждений могут осторожно работать через вопросы, прежде чем отвечать на них. В прошлом году большая часть индустрии искусственного интеллекта выпустила модели рассуждений, которые, как правило, лучше работают по конкретным критериям.

Мета дразнит модель рассуждения Llama 4, но компания не указала, когда ожидать ее.

Натан Ламберт, исследователь из AI2, говорит, что тот факт, что Meta не выпустила модель рассуждений с Llama 4, предполагает, что компания, возможно, бросила запуск.

«Все выпускают модель рассуждений, и это заставляет их модели выглядеть так хорошо», — сказал Ламберт. «Почему (мета) не может подождать, чтобы сделать это? У меня нет ответа на этот вопрос. Это похоже на обычную компанию странность».

Ламберт отметил, что конкурирующие открытые модели находятся ближе к границе, чем когда -либо прежде, и что теперь они поставляются в большем количестве форм и размерах — значительно увеличивая давление на мета. Например, в понедельник Alibaba выпустила коллекцию моделей, QWEN 3, которые якобы превосходят некоторые из лучших моделей кодирования OpenAI и Google на CodeForces, эталоне программирования.

По словам Равида Шварца-Зива, исследователя искусственного интеллекта в Центре науки о данных NYU, для восстановления открытой модели Model Lead Meta просто необходимо обеспечить превосходные модели. Это может включать в себя больше рисков, таких как использование новых методов, сказал он TechCrunch.

Неясно, находится ли Meta в состоянии взять на себя большие риски, неясно. Нынешние и бывшие сотрудники ранее говорили, что исследовательская лаборатория Fortune Meta «Умирает медленной смертью». Вице -президент компании по исследованию искусственного интеллекта Джоэл Пино объявила в этом месяце, что она уезжает.

Llamacon — это шанс Meta показать, что готовит, чтобы избить предстоящие выпуски из лабораторий искусственного интеллекта, таких как Openai, Google, Xai и другие. Если он не сможет доставить, компания может отставать еще дальше в ультраконкурентном пространстве.

Previous post Белый дом набрасывается в «Враждебном и политическом акте Amazon»
Next post Трамп, чтобы расслабить некоторые из его 25 -процентных тарифов на автомобили и запчасти, после опасений, что они могут навредить американским фабрикам