
AI Startup Stability Ai выпустила стабильный Audio Open Small, «стерео» модель искусственного интеллекта, которая, как утверждает компания, является самой быстрой на рынке-и достаточно эффективна для работы на смартфонах.
Стабильный звук Open Small — это плод сотрудничества между AI и ARM, который производит чипов, который производит многие процессоры внутри таблеток, телефонов и других мобильных устройств. В то время как ряд приложений с AI может генерировать аудио, например Suno и Udio, наиболее полагаются на облачную обработку, что означает, что их нельзя использовать в автономном режиме.
Стабильность также утверждает, что тренировочный набор Audio Open Small полностью состоит из песен из бесплатного музыкального архива и Freesound. Это в отличие от учебных наборов вышеупомянутых Suno и Udio, которые, как сообщается, содержат защищенное авторским правом контент, создавая риск IP.
Стабильный звук Open Small составляет 341 миллион параметров по размеру и оптимизирован для запуска на процессорах ARM. (Параметры, иногда называемые весами, являются внутренними компонентами модели, которая направляет ее поведение.) Предназначен для быстрого генерации коротких аудио -образцов и звуковых эффектов (например, барабанных и приборных риффов), стабильный звук открытый малый может производить до 11 секунд аудио на смартфоне менее чем за 8 секунд.
Вот образец, сгенерированный стабильным аудио Open Small:
А вот еще один:
Модель не без ограничений. Стабильный звук Open Small поддерживает только подсказки, написанные на английском языке, и примечания к стабильности в своей документации, что модель не может генерировать реалистичный вокал или высококачественные песни. Модель также не работает одинаково хорошо в музыкальных стилях, предупреждает стабильность-следствие его данных обучения в западном отношении.
В другом потенциальном морщине для разработчиков стабильный Audio Open Small имеет несколько ограничительных условий использования. Он бесплатно использовать для исследователей, любителей и предприятий с годовым доходом менее 1 миллиона долларов, но застройщики и организации, получающие более 1 миллиона долларов США, должны платить за лицензию на предприятие стабильности.
Стабильность, осажденная фирма, стоящая за популярной стабильной диффузией генерации изображений, в прошлом году собрала новые денежные средства в качестве инвесторов, включая Эрика Шмидта и основателя Napster Шона Паркера, стремились изменить бизнес. Эмад Мостак, соучредитель и бывший директор Stability, по сообщениям, неправильно управлял стабильностью в финансовом разрушении, в результате чего сотрудники ушли в отставку, партнерство с Canva, и инвесторов, чтобы расти, связаны с перспективами компании.
В последние несколько месяцев стабильность наняла нового генерального директора, назначенного директором Titanic Джеймсом Кэмероном в совет директоров и выпустила несколько новых моделей генерации изображений.