Google Enterprise Cloud получает модель искусственного интеллекта для создания музыки

В среду Google развернул обновления в несколько своих первых, генерирующих медиа-модели, доступные через облачную платформу Vertex AI.

Lyra, модель Text-Music от Google, теперь доступна в предварительном просмотре для избранных клиентов, а модель создания видео Veo 2 Veo 2 была улучшена с помощью новых параметров редактирования и настройки визуальных эффектов. Компания также запустила функцию голосового клонирования, основанную на CHIRP 3, модели «Понимание аудио» Google, для пользователей «разрешить в списке». И генератор изображений Imagen 3 теперь обеспечивает то, что компания описывает как «значительно лучшую» производительность.

Обновления, приуроченные для Cloud Next, являются последним толчком Google, чтобы угнать рынок корпоративного предприятия для генеративного ИИ. Компания конкурирует, пожалуй, наиболее непосредственно с Amazon, которая предлагает сопоставимую платформу облачного искусственного интеллекта под названием Bedrock со своим собственным набором проприетарных генеративных моделей искусственного интеллекта.

Google представляет лирию в качестве альтернативы музыкальным библиотекам без роялти. Используя модель, клиенты могут создавать песни в ряде стилей и жанров, от Jazzy Piano Solos до Lo-Fi-треков, сообщила компания.

Чирп 3, тем временем, может синтезировать речь на 35 языках. Впервые предварительно просмотрел ранее в этом году, CHIRP 3 управляет мгновенным пользовательским голосом, который, предположительно, может клонировать голос с 10 секундами звука. Теперь он обычно доступен. Эта модель также лежит в основе нового инструмента, запускающегося в предварительном просмотре, называемой транскрипцией с дневником, который разделяет и идентифицирует динамики в записях с несколькими участниками.

Чтобы предотвратить злоупотребление, мгновенный пользовательский голос подчиняется «усердие» процесса для проверки «правильных разрешений на использование голоса», говорит Google.

Что касается VEO 2, модель теперь может удалять фоновые изображения, логотипы и объекты из существующих видео и расширять кадр видеозаписей (например, преобразование видео в «Портрет»). Теперь он также может отрегулировать углы камеры и стимулировать в сцены с AI, чтобы создать Timelapses, зажимы в стиле беспилотников и многое другое, и он может интерполировать между указанными начальными и конечными рамами.

Эти функции VEO на данный момент доступны в предварительном просмотре.

Что касается вышеупомянутых обновлений Imagen 3, Google сказал, что они улучшают способность модели удалять объекты и реконструировать отсутствующие или поврежденные части изображений.

Все средства массовой информации, генерируемые Imagen, Veo и Lyria (но не ChiRP), оснащены водяными знаками с использованием технологии синтеда Google. Компания заявила, что все его генеративные модели ИИ имеют «встроенные гарантии» для защиты от создания вредного содержания.

Google исторически не указал, какие конкретные данные он использует для обучения своих моделей, и технический гигант застрял сегодня с этим прецедентом. Данные обучения, как правило, являются спорным предметом по причинам, связанным с IP. Некоторые фирмы обучают свои модели на защищенных авторских правах, не получив первого получения разрешения от правообладателей. В то время как эти компании утверждают, что доктрина справедливого использования США защищает практику, некоторые создатели по понятным причинам не согласны. Многие сражаются с продавцами в суде.

Ранее Google сообщал TechCrunch, что предлагает механизмы отказа для обучения моделям, а также политику возмещения, чтобы защитить клиентов Google Cloud и AI Vertex от споров об авторских правах, связанных с искусственным интеллектом.

Previous post Стивен Нейсмит колонка на психических и тактических сторонах рейнджеров
Next post Евровидение 2025: Список участников, вход в Великобританию, даты и как смотреть