Veo 3 может генерировать видео - и саундтреки, чтобы согласиться с ними - RU News

RU News — Служба новостей на русском языке

Актуальная информация и анализ событий на русском языке. Широкий спектр тем, включая политику, экономику, культуру, спорт и другие важные области. Новости предлагаются в текстовом и мультимедийном формате, включая видео и аналитические материалы.

Дмитрий Павлов21.05.2025

Последняя модель ИИ, сгенерирующая видео, VEO 3, может создавать аудио для соглашения с клипами, которые он генерирует.

Во вторник, во время конференции разработчиков Google I/O 2025, Google представила VEO 3, которая, как утверждает компания, может генерировать звуковые эффекты, фоновые шумы и даже диалог для сопровождения видео, которые он создает. Google говорит, что VEO 3 также улучшается на своем предшественнике VEO 2 с точки зрения качества отснятого материала.

VEO 3 доступен начиная с во вторник в приложении Google Gemini Chatbot для подписчиков для AI Ultra Plan Google $ 249,99 в месяц, где его можно подать с текстом или изображением.

«Впервые мы выходим из эпохи поколения видео», — сказал Демис Хассабис, генеральный директор Google DeepMind, Google AI R & D R & D, во время брифинга для прессы. «(Вы можете дать VEO 3) подсказку, описывающую персонажей и среду, и предложить диалог с описанием того, как вы хотите, чтобы он звучал».

Широкая доступность инструментов для создания видео генераторов привела к такому взрыву поставщиков, что пространство становится насыщенным. Стартапы, включая взлетно -посадочную полосу, Lightricks, Genmo, Pika, Higgsfield, Kling и Luma, а также технологические гиганты, такие как Openai и Alibaba, выпускают модели в быстром клипе. Во многих случаях мало отличает одну модель от другой.

Аудио вывод станет большим отличием для VEO 3, если Google может выполнить свои обещания. Инструменты, способствующие созданию звуков, не являются AI, не являются новыми и не являются моделями для создания видео звуковых эффектов. Но Veo 3 уникально может понять необработанные пиксели из своих видео и синхронизированные звуки автоматически с клипами, согласно Google.

Вот образец клипа из модели:

VEO 3, вероятно, стал возможным благодаря более ранней работе DeepMind в области «Видео-видео». В июне прошлого года DeepMind сообщил, что разработка технологий ИИ для создания саундтреков для видео, обучая модель по сочетанию звуков и диалогового транскриптов, а также видеоклипов.

DeepMind не скажет, где именно он поставляет контент для обучения VEO 3, но YouTube — это сильная возможность. Google владеет YouTube, и DeepMind ранее сообщал TechCrunch, что модели Google, такие как VEO «могут» быть обучены некоторым материалу на YouTube.

Чтобы смягчить риск DeepFakes, DeepMind говорит, что использует свою запатентованную технологию для водяных знаков, синтид, для встраивания невидимых маркеров в кадры VEO 3 генерирует.

В то время как такие компании, как Google Pitch Veo 3 как мощные творческие инструменты, многие художники по понятным причинам опасаются их — они угрожают обновлять целые отрасли. Исследование 2024 года, проведенное в эксплуатации Гильдии анимации, профсоюзом, представляющим голливудских аниматоров и карикатуристов, оценивается, что более 100 000 американских фильмов, телевизионных и анимационных рабочих мест будут разрушены к 2026 году.

Google также сегодня выпустил новые возможности для VEO 2, включая функцию, которая позволяет пользователям давать модели изображения символов, сцен, объектов и стилей для лучшей последовательности. Последний VEO 2 может понимать движения камеры, такие как вращения, куколки и масштабирование, и позволяет пользователям добавлять или стирать объекты из видео или расширять рамы клипов, например, превратить их из портрета в ландшафт.

Google говорит, что все эти новые возможности VEO 2 придут на свою платформу API Vertex AI в ближайшие недели.

Veo 3 может генерировать видео — и саундтреки, чтобы согласиться с ними

Трамп взвешивает присоединение к Израилю в результате ударов по Фордо, видной иранской ядерной мишени

Дональд Трамп планирует отложить запрет Tiktok в третий раз

Афганский союзник задержан ICE после посещения слушания по иммиграционному суду

Полиция закрыла вечеринку Клюили, «Чит во всем».

«Левша Адвокат» Кейр Стармер подтолкнуть к реформе ECHR — Politico

G7 обнимает «RealPolitik», чтобы работать вокруг разрушительного Трампа — Politico

ЕС Глаза Более высокие сборы на нас, британских туристов, чтобы погасить пост-ковидские долги-Politico

HSBC рассматривает заказ всего персонала обратно в офис 3 дня в неделю

Пентагон говорит, что еще 2000 войск национальной гвардии, которые развернуты в Лос -Анджелесе

Судья блокирует административную политику администрации Трампа, нацеленная на трансгендерных людей

Вэнс говорит, что Трамп «может» предпринять дальнейшие действия, чтобы положить конец ядерному обогащению Ирана

Алессия Руссо: «Социальные сети могут быть действительно разрушительными во время евро»