Google формирует новую команду для работы над моделями искусственного интеллекта, которые смогут имитировать физический мир.
Тим Брукс, один из соруководителей видеогенератора OpenAI Sora, который в октябре прошлого года ушел в исследовательскую лабораторию искусственного интеллекта Google DeepMind, возглавит новую команду, объявил он в сообщении на X. Google DeepMind.
«У DeepMind есть амбициозные планы по созданию массивных генеративных моделей, моделирующих мир», — написал Брукс в понедельник утром. «Я набираю новую команду для этой миссии».
Согласно спискам вакансий, на которые Брукс ссылается в своем посте, новая команда моделирования будет сотрудничать и опираться на работу команд Google Gemini, Veo и Genie для решения «новых критических проблем» и масштабирования моделей «до самых высоких уровней вычислений». Gemini — это флагманская серия моделей искусственного интеллекта Google для таких задач, как анализ изображений и генерация текста, а Veo — собственная модель генерации видео Google.
Что касается Genie, то это взгляд Google на модель мира — искусственный интеллект, который может моделировать игры и трехмерную среду в реальном времени. Последняя модель Genie от Google, анонсированная в декабре прошлого года, может создавать огромное количество игровых 3D-миров.
«Мы считаем, что масштабирование (обучение ИИ) на видео и мультимодальных данных находится на важнейшем пути к общему искусственному интеллекту», — говорится в одном из описаний вакансий. Общий искусственный интеллект, или AGI, обычно относится к ИИ, который может выполнить любую задачу, которую может выполнить человек. «Модели мира будут использоваться во многих областях, таких как визуальное мышление и моделирование, планирование воплощенных агентов и интерактивные развлечения в реальном времени».
Согласно описанию, новая команда Брукса будет стремиться разработать инструменты «интерактивной генерации в реальном времени» на основе моделей, которые они создают, и изучить, как интегрировать свои модели с существующими мультимодальными моделями, такими как Gemini.
Ряд стартапов и крупных технологических компаний гоняются за мировыми моделями, в том числе World Labs влиятельного исследователя искусственного интеллекта Фей-Фей Ли, израильский выскочка Decart и Odyssey. Они верят, что однажды модели мира можно будет использовать для создания интерактивных медиа, таких как видеоигры и фильмы, а также для запуска реалистичных симуляций, например, для обучения роботов.
Приходите работать с Тимом и командой Deepmind над масштабными симуляционными моделями мира 🙂
На критическом пути к AGI.
— Логан Килпатрик (@OfficialLoganK) 6 января 2025 г.
Но у креативщиков смешанные чувства по поводу этой технологии.
Недавнее расследование Wired показало, что игровые студии, такие как Activision Blizzard, которая уволила множество сотрудников, используют ИИ, чтобы срезать углы, повысить производительность и компенсировать истощение. А исследование, проведенное в 2024 году по заказу Гильдии анимации, союза, представляющего голливудских аниматоров и карикатуристов, показало, что к 2026 году более 100 000 рабочих мест в кино, на телевидении и в анимации в США будут сокращены из-за искусственного интеллекта.
Некоторые стартапы в зарождающемся мире модельного бизнеса, такие как Odyssey, пообещали сотрудничать с творческими профессионалами, а не заменять их. Посмотрим, последует ли Google этому примеру.
Есть также нерешенный вопрос авторских прав. Некоторые модели мира, судя по всему, обучаются на видеороликах с видеоиграми, что может сделать компании, разрабатывающие эти модели, объектом судебных исков в тех случаях, когда видео были нелицензионными.
Компания Google, владеющая YouTube, утверждает, что имеет разрешение обучать своих моделей на видеороликах YouTube в соответствии с условиями обслуживания платформы. Но компания не сообщила, какие именно видео она использует для обучения.