Генератор видео Google стал доступен большему количеству клиентов

Видеогенератор Google появится еще у нескольких клиентов — точнее, у клиентов Google Cloud.

Во вторник Google объявила, что Veo, ее модель искусственного интеллекта, которая может генерировать короткие видеоклипы из изображений и подсказок, будет доступна в частной предварительной версии для клиентов, использующих Vertex AI, платформу разработки искусственного интеллекта Google Cloud.

Google заявляет, что запуск позволит одному клиенту, Quora, подключить Veo к своей платформе чат-ботов Poe, а другому, владельцу Oreo, Mondelez International, создавать маркетинговый контент вместе со своими партнерами-агентствами.

«Мы создали Poe, чтобы демократизировать доступ к лучшим в мире моделям генеративного искусственного интеллекта», — заявил в своем заявлении руководитель продукта Poe Спенсер Чан. «Благодаря партнерству с такими лидерами, как Google, мы расширяем творческие возможности во всех формах искусственного интеллекта».

Флагманский генератор

Представленный в апреле, Veo может генерировать клипы с животными, объектами и людьми в разрешении 1080p продолжительностью до шести секунд со скоростью 24 или 30 кадров в секунду. Google утверждает, что Veo может захватывать различные визуальные и кинематографические стили, включая снимки пейзажей и замедленной съемки, а также редактировать уже созданные кадры.

Почему долго ждать API? «Готовность предприятия», — говорит Уоррен Баркли, старший директор по управлению продуктами Google Cloud.

Гугл Вео
Некоторые из творений Veo.Кредиты изображений:Google

«С момента анонса Veo наши команды дополнили, укрепили и улучшили модель Vertex AI для корпоративных клиентов», — сказал он. «На сегодняшний день вы можете создавать видео высокой четкости в формате 720p, с соотношением сторон 16:9 в альбомной или портретной ориентации 9:16. Подобно тому, как мы улучшили возможности других моделей, таких как Gemini, на Vertex AI, мы продолжим делать это и для Veo».

По словам Google, Вео достаточно хорошо разбирается в визуальных эффектах по подсказкам (например, в подписях типа «огромный взрыв») и имеет некоторое представление о физике, включая гидродинамику. Модель также поддерживает редактирование по маске для изменений в определенных областях видео и технически способна объединять отснятый материал в более длинные проекты.

В этом отношении Veo конкурирует с ведущими сегодня моделями видеогенерации — не только с Sora OpenAI, но и с моделями Adobe, Runway, Luma, Meta и других.

Гугл Вео
Предоставление эталонного изображения с подсказкой позволяет Veo создать видео, соответствующее стилю изображения и инструкциям подсказки. Кредиты изображений:Google

Это не значит, что Veo идеален. Отражая ограничения сегодняшнего ИИ, объекты в видеороликах Veo исчезают и появляются снова без особых объяснений и последовательности. И Veo часто ошибается в своей физике. Например, автомобили необъяснимо, невозможно развернуться в мгновение ока.

Обучение и риски

Вео обучался на большом количестве отснятого материала. Обычно именно так это работает с генеративными моделями ИИ: снабжая пример за примером той или иной формы данных, модели улавливают закономерности в данных, которые позволяют им генерировать новые данные — видео, в случае Veo.

Google, как и многие его конкуренты в сфере ИИ, не раскрывает точно, откуда он берет данные для обучения своих генеративных моделей. Отвечая на вопрос конкретно о Veo, Баркли лишь ответил, что модель «может» обучаться на «некотором» контенте YouTube «в соответствии с соглашением (Google) с создателями YouTube». (Алфабет, материнская компания Google, владеет YouTube.)

«Veo прошел обучение на различных высококачественных наборах данных с видеоописаниями, которые тщательно контролируются с точки зрения безопасности», — добавил он. «Основные модели Google обучаются в основном на общедоступных источниках».

В апрельском отчете The New York Times выяснилось, что в прошлом году Google расширила свои условия обслуживания отчасти для того, чтобы позволить компании использовать больше данных для обучения своих моделей искусственного интеллекта. В соответствии со старыми Условиями обслуживания не было ясно, может ли Google использовать данные YouTube для создания продуктов, выходящих за рамки видеоплатформы. Иначе обстоит дело с новыми условиями, которые значительно ослабляют бразды правления.

Вео
Еще один образец от Veo. Кредиты изображений:Google

Хотя в Google есть инструменты, позволяющие веб-мастерам блокировать ботами компании сбор обучающих данных с их веб-сайтов, он не предлагает механизма, позволяющего создателям удалять свои работы из существующих обучающих наборов. Google утверждает, что модели обучения с использованием общедоступных данных являются добросовестным использованием. Это означает, что компания считает, что не обязана спрашивать разрешение у владельцев данных или выплачивать им компенсацию. (Однако Google заявляет, что не использует данные о клиентах для обучения своих моделей.)

Благодаря тому, как сегодняшние генеративные модели ведут себя при обучении, они несут определенные риски, например, срыгивание, когда модель генерирует зеркальную копию обучающих данных. Было обнаружено, что такие инструменты, как Runway, создают кадры, по существу похожие на кадры из видео, защищенных авторским правом, создавая возможное легальное минное поле для пользователей этих инструментов.

Решение Google — это фильтры на уровне подсказок для Veo, в том числе для агрессивного и откровенного контента. В случае неудачи компания заявляет, что ее политика возмещения ущерба обеспечивает защиту правомочных пользователей Veo от обвинений в нарушении авторских прав.

«Мы планируем возместить убытки Veo за результаты Vertex AI, когда они станут общедоступными», — сказал Баркли.

Вео везде

За последние несколько месяцев Google постепенно встраивал Veo в большее количество своих приложений и сервисов, работая над совершенствованием модели.

В мае Google представил Veo в Google Labs, своей программе раннего доступа для избранных тестировщиков. А в сентябре Google объявил об интеграции Veo с YouTube Shorts, форматом коротких видео YouTube, чтобы позволить создателям создавать фоны и шестисекундные видеоклипы.

А как насчет рисков дипфейков, связанных со всем этим, возможно, вам интересно? Google заявляет, что использует свою запатентованную технологию создания водяных знаков SynthID для встраивания невидимых маркеров в кадры, генерируемые Veo. Конечно, SynthID не защищен от изменений, и Google не предоставил часть идентификатора контента третьим лицам.

Вео
Очередной образец от Veo. Кредиты изображений:Google

Это могут быть спорные вопросы, если Veo не получит значимой поддержки. Что касается партнерских отношений, Google уступила позиции конкурентам в области генеративного искусственного интеллекта, которые быстро перешли к привлечению продюсеров, студий и креативных агентств с помощью своих инструментов. Недавно Runway подписала соглашение с Lionsgate на обучение специальной модели для каталога фильмов студии, а OpenAI объединилась с брендами и независимыми режиссерами, чтобы продемонстрировать потенциал Соры.

В какой-то момент Google заявила, что изучает приложения Veo в сотрудничестве с артистами, включая Дональда Гловера (AKA Childish Gambino). Сегодня компания не предоставила обновленной информации об этих информационно-просветительских усилиях.

Предложение Google Veo — способа сократить расходы и быстро обновлять видеоконтент — рискует оттолкнуть креативщиков. По оценкам исследования 2024 года, проведенного по заказу Гильдии анимации, союза, представляющего голливудских аниматоров и карикатуристов, к 2026 году более 100 000 рабочих мест в кино, на телевидении и в анимации в США будут сокращены из-за искусственного интеллекта.

Это может объяснить осторожный, «медленный и устойчивый» подход Google. Когда его спросили, Баркли не назвал примерное время доступности Veo в Vertex и не сказал, когда Veo может появиться на дополнительных платформах и сервисах Google.

Вео
Кредиты изображений:Google

«Обычно мы сначала выпускаем продукты в предварительной версии, поскольку это позволяет нам получить реальные отзывы от избранной группы наших корпоративных клиентов, прежде чем они станут общедоступными для более широкого использования», — сказал он. «Это помогает улучшить функциональность и обеспечить соответствие продукта потребностям наших клиентов».

В сегодняшнем соответствующем объявлении Google сообщила, что ее флагманский генератор изображений Imagen 3 теперь доступен всем клиентам Vertex AI без списка ожидания. Он получил новые функции настройки и редактирования изображений, но на данный момент они находятся в отдельном списке ожидания.

Previous post Президент Южной Кореи объявляет военное положение
Next post Верховный суд рассмотрит спор по поводу гендерно-подтверждающего ухода за несовершеннолетними трансгендерами