Китайская компания MiniMax, занимающаяся искусственным интеллектом, выпускает новые модели, которые, по ее утверждению, могут конкурировать с лучшими в отрасли

Китайские фирмы продолжают выпускать модели искусственного интеллекта, которые могут конкурировать с возможностями систем, разработанных OpenAI и другими американскими компаниями, занимающимися искусственным интеллектом.

На этой неделе MiniMax, стартап, поддерживаемый Alibaba и Tencent, который привлек около $850 млн венчурного капитала и оценивается более чем в $2,5 млрд, представил три новые модели: MiniMax-Text-01, MiniMax-VL-01 и T2A. -01-HD. MiniMax-Text-01 — это текстовая модель, а MiniMax-VL-01 может понимать как изображения, так и текст. Тем временем T2A-01-HD генерирует звук, в частности речь.

MiniMax утверждает, что MiniMax-Text-01, размер которого составляет 456 миллиардов параметров, работает лучше, чем такие модели, как недавно представленный Google Gemini 2.0 Flash, в таких тестах, как MATH и SimpleQA, которые измеряют способность модели решать математические задачи и факты. основанные вопросы. Параметры примерно соответствуют способностям модели решать проблемы, а модели с большим количеством параметров обычно работают лучше, чем модели с меньшим количеством параметров.

Что касается MiniMax-VL-01, MiniMax заявляет, что он конкурирует с Claude 3.5 Sonnet от Anthropic в оценках, требующих мультимодального понимания, например ChartQA, который ставит перед моделями задачу ответить на запросы, связанные с графиками и диаграммами (например, «Каково пиковое значение оранжевого цвета?»). линию на этом графике?»). Конечно, MiniMax-VL-01 не совсем превосходит Gemini 2.0 Flash во многих из этих тестов. GPT-4o от OpenAI и Llama 3.1 от Meta также превзошли его по нескольким показателям.

Следует отметить, что MiniMax-Text-01 имеет чрезвычайно большое контекстное окно. Контекст модели или контекстное окно относится к входным данным (например, тексту), которые модель рассматривает перед созданием выходных данных (дополнительного текста). Благодаря контекстному окну из 4 миллионов токенов MiniMax-Text-01 может анализировать около 3 миллионов слов за один раз — или чуть более пяти копий «Войны и мира».

Что касается контекста (без каламбура), контекстное окно MiniMax-Text-01 примерно в 31 раз больше, чем у GPT-4o и Llama 3.1.

Последняя из моделей MiniMax, выпущенная на этой неделе, T2A-01-HD, представляет собой аудиогенератор, оптимизированный для речи. T2A-01-HD может генерировать синтетический голос с регулируемой частотой, тоном и тенором примерно на 17 различных языках, включая английский и китайский, а также клонировать голос всего из 10 секунд аудиозаписи.

MiniMax не опубликовал результаты тестов, сравнивающих T2A-01-HD с другими моделями, генерирующими звук. Но, по мнению репортера, звук T2A-01-HD находится на одном уровне с аудиомоделями от Meta и таких стартапов, как PlayAI.

За исключением T2A-01-HD, который доступен исключительно через API MiniMax и платформу AI Hailuo, новые модели MiniMax можно загрузить с GitHub и платформы разработки искусственного интеллекта Hugging Face.

Однако тот факт, что модели доступны «открыто», не означает, что они не закрыты в определенных аспектах. MiniMax-Text-01 и MiniMax-VL-01 не являются полностью открытым исходным кодом в том смысле, что MiniMax не выпустил компоненты (например, обучающие данные), необходимые для их воссоздания с нуля. Более того, на них распространяется ограничительная лицензия MiniMax, которая запрещает разработчикам использовать эти модели для улучшения конкурирующих моделей искусственного интеллекта и требует, чтобы платформы с более чем 100 миллионами активных пользователей в месяц запрашивали у MiniMax специальную лицензию.

MiniMax была основана в 2021 году бывшими сотрудниками SenseTime, одной из крупнейших китайских компаний в области искусственного интеллекта. Проекты компании включают в себя такие приложения, как Talkie, ролевую платформу на базе искусственного интеллекта, аналогичную ИИ персонажей, а также модели преобразования текста в видео, которые MiniMax выпустила в Hailuo.

Некоторые продукты MiniMax стали предметом незначительных споров.

Talkie, который был удален из Apple App Store в декабре по неустановленным «техническим» причинам, содержит искусственные аватары таких общественных деятелей, как Дональд Трамп, Тейлор Свифт, Илон Маск и Леброн Джеймс, ни один из которых, судя по всему, не согласился на показ в программе. приложение.

В декабре журнал Broadcast сообщил, что видеогенераторы MiniMax могут воспроизводить логотипы британских телеканалов, предполагая, что модели MiniMax были обучены на контенте этих каналов. Сообщается, что на MiniMax подан иск со стороны iQIYI, китайской службы потокового видео, которая утверждает, что MiniMax незаконно обучался на записях iQIYI, защищенных авторским правом.

Новые модели MiniMax появились через несколько дней после того, как уходящая администрация Байдена предложила ужесточить правила экспорта и ограничения на технологии искусственного интеллекта для китайских предприятий. Компаниям в Китае уже запретили покупать передовые чипы искусственного интеллекта, но если новые правила вступят в силу в том виде, в котором они написаны, компании столкнутся с более строгими ограничениями как на полупроводниковые технологии, так и на модели, необходимые для запуска сложных систем искусственного интеллекта.

В среду администрация Байдена объявила о дополнительных мерах, направленных на недопущение попадания сложных чипов в Китай. К предприятиям по производству и упаковке чипов, которые хотят экспортировать определенные чипы, будут предъявляться более широкие лицензионные требования, если они не проведут более тщательный контроль и должную осмотрительность, чтобы не допустить попадания своей продукции в руки китайских клиентов.

Previous post На Конора МакГрегора подали в суд за предполагаемое сексуальное насилие на финале НБА 2023 года
Next post Спикер Джонсон отстранил Тернера от должности председателя Палаты представителей по разведке