Veo 3 может генерировать видео — и саундтреки, чтобы согласиться с ними

Последняя модель ИИ, сгенерирующая видео, VEO 3, может создавать аудио для соглашения с клипами, которые он генерирует.

Во вторник, во время конференции разработчиков Google I/O 2025, Google представила VEO 3, которая, как утверждает компания, может генерировать звуковые эффекты, фоновые шумы и даже диалог для сопровождения видео, которые он создает. Google говорит, что VEO 3 также улучшается на своем предшественнике VEO 2 с точки зрения качества отснятого материала.

VEO 3 доступен начиная с во вторник в приложении Google Gemini Chatbot для подписчиков для AI Ultra Plan Google $ 249,99 в месяц, где его можно подать с текстом или изображением.

«Впервые мы выходим из эпохи поколения видео», — сказал Демис Хассабис, генеральный директор Google DeepMind, Google AI R & D R & D, во время брифинга для прессы. «(Вы можете дать VEO 3) подсказку, описывающую персонажей и среду, и предложить диалог с описанием того, как вы хотите, чтобы он звучал».

Широкая доступность инструментов для создания видео генераторов привела к такому взрыву поставщиков, что пространство становится насыщенным. Стартапы, включая взлетно -посадочную полосу, Lightricks, Genmo, Pika, Higgsfield, Kling и Luma, а также технологические гиганты, такие как Openai и Alibaba, выпускают модели в быстром клипе. Во многих случаях мало отличает одну модель от другой.

Аудио вывод станет большим отличием для VEO 3, если Google может выполнить свои обещания. Инструменты, способствующие созданию звуков, не являются AI, не являются новыми и не являются моделями для создания видео звуковых эффектов. Но Veo 3 уникально может понять необработанные пиксели из своих видео и синхронизированные звуки автоматически с клипами, согласно Google.

Вот образец клипа из модели:

VEO 3, вероятно, стал возможным благодаря более ранней работе DeepMind в области «Видео-видео». В июне прошлого года DeepMind сообщил, что разработка технологий ИИ для создания саундтреков для видео, обучая модель по сочетанию звуков и диалогового транскриптов, а также видеоклипов.

DeepMind не скажет, где именно он поставляет контент для обучения VEO 3, но YouTube — это сильная возможность. Google владеет YouTube, и DeepMind ранее сообщал TechCrunch, что модели Google, такие как VEO «могут» быть обучены некоторым материалу на YouTube.

Чтобы смягчить риск DeepFakes, DeepMind говорит, что использует свою запатентованную технологию для водяных знаков, синтид, для встраивания невидимых маркеров в кадры VEO 3 генерирует.

В то время как такие компании, как Google Pitch Veo 3 как мощные творческие инструменты, многие художники по понятным причинам опасаются их — они угрожают обновлять целые отрасли. Исследование 2024 года, проведенное в эксплуатации Гильдии анимации, профсоюзом, представляющим голливудских аниматоров и карикатуристов, оценивается, что более 100 000 американских фильмов, телевизионных и анимационных рабочих мест будут разрушены к 2026 году.

Google также сегодня выпустил новые возможности для VEO 2, включая функцию, которая позволяет пользователям давать модели изображения символов, сцен, объектов и стилей для лучшей последовательности. Последний VEO 2 может понимать движения камеры, такие как вращения, куколки и масштабирование, и позволяет пользователям добавлять или стирать объекты из видео или расширять рамы клипов, например, превратить их из портрета в ландшафт.

Google говорит, что все эти новые возможности VEO 2 придут на свою платформу API Vertex AI в ближайшие недели.

Previous post Luminar начинает еще один раунд увольнений среди внезапной отставки генерального директора
Next post По крайней мере 2 морских комолетов, сталкивающихся с дисциплиной по сравнению с расистскими мемами, разделенными по сигналу