
Meta в среду представила свою новую модель V-JEPA 2 AI, «мировую модель», которая предназначена для того, чтобы помочь агентам искусственного интеллекта понять мир вокруг них.
V-JEPA 2-это расширение модели V-JEPA, которую Meta опубликовала в прошлом году, которая была обучена более миллионам часов видео. Предполагается, что эти учебные данные помогают роботам или другим агентам искусственного интеллекта работать в физическом мире, понимая и предсказывая, как такие понятия, как гравитация, повлияют на то, что происходит дальше в последовательности.
Это те виды здравомыслящих связей, которые маленькие дети и животные устанавливают по мере развития их мозгов — например, когда вы играете с собакой, собака (надежда) поймет, как подпрыгивание мяча на земле заставит его отскочить вверх, или как он должен бежать к тому, где он думает, что мяч приземлится, а не в том, где мяч находится в этот точный момент.
Meta изображает примеры, в которых робот может столкнуться, например, с точкой зрения удерживать тарелку и шпатель и идти к плите с приготовленными яйцами. ИИ может предсказать, что очень вероятным следующим действием будет использование шпателя для перемещения яиц на тарелку.
Согласно Meta, V-JEPA 2 в 30 раз быстрее, чем модель Cosmos Nvidia, которая также пытается улучшить интеллект, связанный с физическим миром. Тем не менее, Meta может оценивать свои собственные модели в соответствии с различными критериями, чем Nvidia.
«Мы считаем, что мировые модели будут открывать новую эру для робототехники, что позволит реальным агентам ИИ реального мира помогать с домашними делами и физическими задачами без необходимости астрономического количества данных о роботизированном обучении», — пояснил главный ученый из Meta YI Yank Lecun в видео.