World Labs, стартап, основанный пионером искусственного интеллекта Фей-Фей Ли, представил свой первый проект: систему искусственного интеллекта, которая может генерировать 3D-сцены, похожие на видеоигры, из одного изображения.
Сцены, созданные искусственным интеллектом, которые каждый, у кого есть клавиатура и мышь, может изучить в демо-версии на веб-сайте World Labs, выглядят впечатляюще, хотя и немного мультяшно. Они визуализируются в браузере и оснащены управляемой камерой с регулируемой имитируемой глубиной резкости (DoF). Чем сильнее эффект глубины резкости, тем более размытыми кажутся объекты фона.
Система World Labs является частью новой категории ИИ, называемой «мировыми моделями». Многие из этих моделей могут имитировать игры и трехмерную среду, но с проблемами артефактов и согласованности. Например, модель мира Oasis, имитирующая Minecraft от стартапа Decart, имеет низкое разрешение и быстро «забывает» расположение уровней.
Напротив, подход World Labs гарантирует, что сцены после создания остаются неизменными и подчиняются основным законам физики, а это означает, что они обладают ощущением прочности и глубины.
Система World Labs также может применять к сценам интерактивные эффекты и анимацию, например изменение цвета объектов и динамическое освещение фона.
«Большинство инструментов генеративного искусственного интеллекта создают 2D-контент, например изображения или видео», — пишет World Labs в своем блоге. «Вместо этого 3D-генерация улучшает контроль и согласованность. Это изменит то, как мы создаем фильмы, игры, симуляторы и другие цифровые проявления нашего физического мира».
Теперь, безусловно, есть куда совершенствоваться. Сцены World Labs не полностью доступны для исследования — ваши перемещения ограничены небольшой областью. (Попробуйте выйти за его пределы, и вы упретесь в границу.) Иногда возникают ошибки рендеринга, например, объекты, которые сливаются друг с другом неестественным образом.
Но World Labs заявляет, что это всего лишь «ранний предварительный просмотр».
«Мы усердно работаем над улучшением размера и точности наших генерируемых миров, а также экспериментируем с новыми способами взаимодействия пользователей с ними», — написали они в блоге.
World Labs, запущенная ранее в этом году, привлекла $230 млн венчурного капитала от таких инвесторов, как Андриссен Горовиц (a16z), Эштон Катчер, Intel Capital, AMD Ventures и Эрик Шмидт. Компания, стоимость которой превышает 1 миллиард долларов, надеется выпустить свой первый продукт в 2025 году.
Помимо интерактивных сцен, World Labs планирует создать инструменты, которые могут быть полезны таким профессионалам, как художники, дизайнеры, разработчики, режиссеры и инженеры. Он ориентирован на самых разных клиентов: от разработчиков видеоигр до киностудий.
«У нас уже есть возможность создавать виртуальные интерактивные миры, но это стоит сотни и сотни миллионов долларов и массу времени на разработку», — сказал соучредитель World Labs Джастин Джонсон в недавнем выпуске подкаста a16z. «(Модели мира) позволят вам не просто получить изображение или клип, но и полностью смоделированный, яркий и интерактивный трехмерный мир».