Новые потоковые потоки Odyssey Model Streams 3D Interactive Worlds

Odyssey, стартап, основанный пионерами самостоятельного вождения Оливером Кэмероном и Джеффом Хоуком, разработал модель ИИ, которая позволяет пользователям «взаимодействовать» с потоковым видео.

Доступная в Интернете в «ранней демонстрации», модель генерирует и транслирует видео кадры каждые 40 миллисекунд. Через базовые элементы управления зрители могут исследовать области в видео, похожих на 3D-рендерированную видеоигра.

«Учитывая текущее состояние мира, входящее действие и историю государств и действий, модель пытается предсказать следующее состояние мира», — объясняет Одиссея в посте в блоге. «Питание это модель нового мира, демонстрируя такие возможности, как генерирование пикселей, которые чувствуют себя реалистичными, поддержание пространственной последовательности, учебные действия из видео и вывод последовательных видеопотоков в течение 5 минут или более».

Ряд стартапов и крупных технологических компаний гоняются за мировыми моделями, в том числе DeepMind, влиятельным исследователем искусственного интеллекта Фей-Фей Ли Ley's World Labs, Microsoft и Decart. Они считают, что мировые модели могут однажды использоваться для создания интерактивных средств массовой информации, таких как игры и фильмы, а также за управление реалистичными симуляциями, такими как учебные среды для роботов.

Но креативщики испытывают смешанные чувства по поводу технологий. Недавнее проводное исследование показало, что игровые студии, такие как Activision Blizzard, которая уволяла множество работников, используют ИИ для сокращения углов и борьбы с истощением. И исследование 2024 года, проведенное по заказу Гильдии анимации, профсоюзом, представляющим голливудских аниматоров и карикатуристов, подсчитано, что более 100 000 американских фильмов, телевизионных и анимационных рабочих мест будут нарушены ИИ в ближайшие месяцы.

Со своей стороны, Odyssey обещает сотрудничать с творческими профессионалами, а не заменить их.

«Интерактивное видео (…) открывает дверь для совершенно новых форм развлечений, где истории можно создать и исследовать по требованию, свободные от ограничений и затрат на традиционное производство», — пишет компанию в своем блоге. «Со временем мы верим, что все, что является видео сегодня — развлечения, реклама, образование, обучение, путешествия и многое другое — превратится в интерактивное видео, которое приносит в действие Odyssey».

Демонстрация Одиссея немного грубо по краям, что компания признает в своем посте. Среда, которую генерирует модель, размыта и искажена и нестабильна в том смысле, что их макеты не всегда остаются прежними. Идите вперед в одном направлении какое -то время или развернитесь, и окружение может внезапно выглядеть по -разному.

Но обещание компании быстро улучшить модель, которая в настоящее время может транслировать видео со скоростью до 30 кадров в секунду из кластеров NVIDIA H100 графических процессоров по цене 1-2 долл. США за «чай пользователя».

«Заглядывая в будущее, мы исследуем более богатые представления мира, которые гораздо более добросовестно отражают динамику, одновременно увеличивая временную стабильность и постоянное состояние», — пишет Odyssey в своем посте. «Параллельно мы расширяем пространство действий от движения к мировому взаимодействию, изучая открытые действия из крупномасштабного видео».

Odyssey использует другой подход, чем многие лаборатории ИИ в мире моделирования. Он разработал 360-градусную систему камер, установленную на рюкзаке для захвата реальных ландшафтов, которые, как считает Одиссея, может служить основой для более качественных моделей, чем модели, обученные исключительно общедоступным данным.

На сегодняшний день Odyssey собрала 27 миллионов долларов у инвесторов, включая EQT Ventures, GV и Air Street Capital. Эд Кэтмулл, один из соучредителей Pixar и бывшего президента Walt Disney Animation Studios, входит в совет директоров стартапа.

В декабре прошлого года Odyssey заявила, что работает над программным обеспечением, которое позволяет создателям загружать сцены, сгенерированные его моделями в такие инструменты, как нереальный двигатель, блендер и Adobe после эффектов, чтобы их можно было отредактировать вручную.

Previous post Musk's Xai подписывает Telegram
Next post Телефон Шеф Хитроу был на молчании, когда разворачивается огонь, когда раскрывает время, рассказано | Великобритания новости