Стабильность AI выпускает модель, генерирующую аудио, которая может работать на смартфонах

AI Startup Stability Ai выпустила стабильный Audio Open Small, «стерео» модель искусственного интеллекта, которая, как утверждает компания, является самой быстрой на рынке-и достаточно эффективна для работы на смартфонах.

Стабильный звук Open Small — это плод сотрудничества между AI и ARM, который производит чипов, который производит многие процессоры внутри таблеток, телефонов и других мобильных устройств. В то время как ряд приложений с AI может генерировать аудио, например Suno и Udio, наиболее полагаются на облачную обработку, что означает, что их нельзя использовать в автономном режиме.

Стабильность также утверждает, что тренировочный набор Audio Open Small полностью состоит из песен из бесплатного музыкального архива и Freesound. Это в отличие от учебных наборов вышеупомянутых Suno и Udio, которые, как сообщается, содержат защищенное авторским правом контент, создавая риск IP.

Стабильный звук Open Small составляет 341 миллион параметров по размеру и оптимизирован для запуска на процессорах ARM. (Параметры, иногда называемые весами, являются внутренними компонентами модели, которая направляет ее поведение.) Предназначен для быстрого генерации коротких аудио -образцов и звуковых эффектов (например, барабанных и приборных риффов), стабильный звук открытый малый может производить до 11 секунд аудио на смартфоне менее чем за 8 секунд.

Вот образец, сгенерированный стабильным аудио Open Small:

А вот еще один:

Модель не без ограничений. Стабильный звук Open Small поддерживает только подсказки, написанные на английском языке, и примечания к стабильности в своей документации, что модель не может генерировать реалистичный вокал или высококачественные песни. Модель также не работает одинаково хорошо в музыкальных стилях, предупреждает стабильность-следствие его данных обучения в западном отношении.

В другом потенциальном морщине для разработчиков стабильный Audio Open Small имеет несколько ограничительных условий использования. Он бесплатно использовать для исследователей, любителей и предприятий с годовым доходом менее 1 миллиона долларов, но застройщики и организации, получающие более 1 миллиона долларов США, должны платить за лицензию на предприятие стабильности.

Стабильность, осажденная фирма, стоящая за популярной стабильной диффузией генерации изображений, в прошлом году собрала новые денежные средства в качестве инвесторов, включая Эрика Шмидта и основателя Napster Шона Паркера, стремились изменить бизнес. Эмад Мостак, соучредитель и бывший директор Stability, по сообщениям, неправильно управлял стабильностью в финансовом разрушении, в результате чего сотрудники ушли в отставку, партнерство с Canva, и инвесторов, чтобы расти, связаны с перспективами компании.

В последние несколько месяцев стабильность наняла нового генерального директора, назначенного директором Titanic Джеймсом Кэмероном в совет директоров и выпустила несколько новых моделей генерации изображений.

Previous post СМОТРЕТЬ: министр здравоохранения RFK Jr. говорит, что он не думает, что люди должны получать у него медицинские советы
Next post Delap, Dibling & Co — 10 пониженных игроков, которые команды Премьер -лиги могли подписать это лето