Meta Exec отрицает, что компания искусственно увеличила баллы Llama 4

RU News — Служба новостей на русском языке

Актуальная информация и анализ событий на русском языке. Широкий спектр тем, включая политику, экономику, культуру, спорт и другие важные области. Новости предлагаются в текстовом и мультимедийном формате, включая видео и аналитические материалы.

Дмитрий Павлов07.04.2025

В понедельник Meta Exec отрицал слух, что компания обучила свои новые модели искусственного интеллекта хорошо представить конкретные тесты, скрывая слабые стороны моделей.

Исполнительный директор Ахмад Аль-Дал, вице-президент по генеративному ИИ в Meta, сказал в посте на X, что «просто не правда», что мета-модели Llama 4 Maverick и Llama 4 на «Тестовых наборах». В критериях ИИ тестовые наборы представляют собой коллекции данных, используемых для оценки производительности модели после обучения. Обучение на тестовом наборе может ввести в заблуждение результаты эталонных баллов модели, что сделало модель более способной, чем на самом деле.

На выходных необоснованные слухи о том, что вы искусственно увеличили результаты своих новых моделей, начали циркулировать на X и Reddit. Похоже, что слухи возникли из поста на сайте китайской социальной сети от пользователя, утверждая, что он подал в отставку с Meta в знак протеста против методов сравнительного анализа компании.

Отчеты о том, что Maverick и Scout плохо выполняют определенные задачи, подпитывали слухи, как и решение Meta использовать экспериментальную, не выпущенную версию Maverick для достижения лучших результатов на эталонном LM Arena. Исследователи на X наблюдали резкие различия в поведении публичного загружаемого Maverick по сравнению с моделью, размещенной на LM Arena.

Аль-Дале признал, что некоторые пользователи видят «смешанное качество» от Maverick и Scout в разных облачных провайдерах, размещающих модели.

«Поскольку мы сбросили модели, как только они будут готовы, мы ожидаем, что для всех общественных реализаций займет несколько дней»,-сказал Аль-Дал. «Мы будем продолжать работать над нашими исправлениями ошибок и партнеров по борьбе с адаптацией».

Онлайн -туристический агент Loveholidays Mulls Focal Market Excursion | Денежные новости

Джорджия против Ирландии: Выступление в Тбилиси не будет идеальным — Пол О'Коннелл

Трамп говорит, что сегодня он разговаривает с Путином

Работодатели США добавили 147 000 рабочих мест в прошлом месяце, несмотря на неопределенность в отношении экономической политики

Канцлер Рэйчел Ривз говорит, что она «полностью» для работы канцлера в первых комментариях со времен слез в PMQ | Политические новости

Верховный суд придерживается государственных запретов на трансгендерных спортсменов в детских и женских спорте

«Silent Killer» Heatwave, как полагал, оставил по крайней мере 9 мертвых в Европе | Наука, климат и технические новости

Все, что вам нужно знать о Flashes, альтернатива Instagram на основе Bluesky

Место резней Джонстаун, где погибли более 900 человек, открывается для туризма

Tour de France 2025: Tadej Pogacar преследует четвертую победу — кто его основные конкуренты?

Джеффрис задерживает потенциальное голосование по дому по законопроекту о бюджете Трампа

Греция: Слезы лесных пожаров через южный Крит — заставляя более 1500 человек бежать дома и отели | Мировые новости