
Meta выпустила новую коллекцию моделей искусственного интеллекта Llama 4 в своей семье лама — в субботу не меньше.
Всего есть четыре новых моделя: Llama 4 Scout, Llama 4 Maverick и Llama 4 Behemoth. Все были обучены «большим объемам немеченых текста, изображения и видеодантеров», чтобы дать им «широкое визуальное понимание», говорит Мета.
Успех открытых моделей из китайской лаборатории AI Deepseek, которые работают на номинале или лучше, чем предыдущие флагманские модели Meta Llama, по сообщениям, начал развитие Llama в Overdrive. Говорят, что Meta имеет запасные военные комнаты, чтобы расшифровать, как DeepSeek снизил стоимость бега и развертывания моделей, таких как R1 и V3.
Scout и Maverick открыто доступны на Llama.com и от партнеров Meta, в том числе платформу AI Dev, в то время как Бегемот все еще тренируется. Meta говорит, что Meta AI, его ассистент, работающий на AI, в том числе WhatsApp, Messenger и Instagram, был обновлен, чтобы использовать Llama 4 в 40 странах. Мультимодальные функции пока ограничены США на английском языке.
Некоторые разработчики могут рассмотреть вопрос о лицензии Llama 4. Пользователям в ЕС запрещено использовать или распространять модели, что, вероятно, результат требований к управлению, налагаемым в соответствии с законами о конфиденциальности ИИ региона и данных. (В прошлом Meta осудила эти законы как чрезмерно обременительные.) Кроме того, как и в предыдущих выпусках Llama, компании с более чем 700 миллионами ежемесячных активных пользователей должны запросить специальную лицензию от Meta, которая может предоставить — или отрицать — по своему усмотрению.
«Эти модели Llama 4 отмечают начало новой эры для экосистемы Llama», — написала Meta в посте в блоге. «Это только начало коллекции Llama 4».
Meta говорит, что Llama 4 является ее первой группой моделей для использования смеси архитектуры экспертов (MOE), которая более эффективна для обучения и ответа на запросы. Архитектуры MOE в основном разбивают задачи обработки данных в подзадачи, а затем делегируют их более мелким, специализированным «экспертным» моделям.
Например, у Maverick есть 400 миллиардов общего количества параметров, но только 17 миллиардов активный Параметры по 128 «Эксперты». (Параметры примерно соответствуют навыкам решения проблем.) Скаут имеет 17 миллиардов активных параметров, 16 экспертов и 109 миллиардов общих параметров.
Согласно внутреннему тестированию Meta, Maverick, который, по словам компании, лучше всего подходит для «Общего помощника и вариантов использования чата», таких как Creative Writing, превышает такие модели, как GPT-4O Openai и Google Gemini 2.0 по определенным кодированию, рассуждениям, многоязычным, длительным контексту и изображению. Тем не менее, Maverick не совсем соответствует более способным недавним моделям, таким как Google Gemini 2.5 Pro, Anpropic Claude 3.7 Sonnet и GPT-4.5 Openai.
Сильные стороны скаута заключаются в таких задачах, как суммирование документов и рассуждения над большими кодовыми базами. Уникально, у него очень большое контекстное окно: 10 миллионов жетонов. («Токены» представляют собой кусочки необработанного текста — например, слово «фантастическое», разделенное на «фанат», «TAS» и «tic».) На простом английском языке разведчика может принимать изображения и до миллионов слов, что позволяет обрабатывать и работать с чрезвычайно большими документами.
Scout может работать на одном графическом процессоре NVIDIA H100, в то время как Maverick требует системы NVIDIA H100 DGX, согласно Meta.
Невыпущенный бегемот Meta понадобится еще более мягкое оборудование. По данным компании, Behemoth имеет 288 миллиардов активных параметров, 16 экспертов и почти два триллиона общего объема параметров. Внутренний сравнительный анализ Meta опережает GPT-4.5, Claude 3.7 Sonnet и Gemini 2.0 Pro (но не 2,5 Pro) на нескольких оценках, измеряющих навыки STEM, такие как решение математики.
Следует отметить, что ни одна из моделей Llama 4 не является правильной моделью «рассуждений» в духе O1 и O3-Mini от Openai. Рассудить модели проверьте факты их ответы и, как правило, отвечают на вопросы более надежно, но, как следствие, занимает больше времени, чем традиционные, «нездоровые» модели для предоставления ответов.
Интересно, что Meta говорит, что он настроил все свои модели Llama 4, чтобы отказаться от «спорных» вопросов реже отвечать на «спорные» вопросы. По словам компании, Llama 4 отвечает на «обсуждаемые» политические и социальные темы, которые не станет предыдущий урожай моделей Llama. Кроме того, говорит компания, Llama 4 «значительно более сбалансирована», с которой побуждает его, не будет развлекать.
«(Y) вы можете рассчитывать на (Lllama 4), чтобы предоставить полезные, фактические ответы без суждения», — сказал представитель Meta Meta. «(W) E're продолжает делать ламу более отзывчивой, чтобы она отвечала на большее количество вопросов, мог ответить на различные точки зрения (…) и не предпочитает некоторые взгляды на другие».
Эти изменения приходят в качестве союзников Белого дома, обвиняющих искусственного искусства в политической пустоте.
Многие из близких доверенных лиц президента Дональда Трампа, в том числе Элон Маск и Crypto и AI «царь» Дэвид Сакс, утверждают, что многие чат -боты подвергают консервативной точки зрения. Sacks исторически выделял CHATGPT Openai, в частности, как «запрограммирован, чтобы разбудить» и неверно относиться к политически чувствительным предметам.
По правде говоря, предвзятость в ИИ является неразрешимой технической проблемой. Собственная компания Musk's AI, Xai, изо всех сил пыталась создать чат -бот, который не поддерживает некоторые политические взгляды на других.
Это не помешало компаниям, включая OpenAI, корректировать свои модели искусственного интеллекта, чтобы ответить на большее количество вопросов, чем они были бы ранее, в частности, вопросы по спорным политическим предметам.