
Самая дорогая модель ИИ Google, похоже, пересекла основную веху: победив 29-летнюю видеоигру.
Прошлой ночью генеральный директор Google Sundar Pichai триумфально опубликовал на X: «Что за финиш! Gemini 2.5 Pro только что закончил Pokémon Blue!»
Чтобы быть ясным, Близнецы играют в Pokemon Livestream были созданы (по его собственным словам) «30 -летний инженер -программист, не связанный с Google», который идет на Джоэл З. Но руководители Google подбадривали усилия.
Например, Logan Kilpatrick, лидер продукта для Google AI Studio, опубликованный в прошлом месяце, что Gemini «добился большого прогресса в завершении покемонов» и «заработал свой 5 -й значок (в следующей лучшей модели только 3, хотя с другим жгутом агента)», «Ведущий Пичай шутить», «Мы работаем над API, искусственным с разведкой агента») »,« Ведущий Пичай, чтобы шутить, «мы работаем над API, искусственным с разведкой агента»
Почему покемон? Еще в феврале Антропик подчеркнул прогресс, который его модели Claude AI делали в «Pokémon Red», написав этот «расширенное мышление и агент» Клода, дает ему «крупный импульс» в «более неожиданных» задачах, таких как игра в классическую игру. («Pokémon Red» и «Blue»-это разные версии титула Gameboy, впервые выпущенного в 1996 году и привязанной к долгосрочной франшизе Pokémon). Есть даже Клод, играющий в Pokemon Twitch Channel, который Джоэл Зил назвал вдохновением.
Несмотря на свой прогресс, Клод, похоже, еще не победил «Pokémon Red». Значит ли это, что Близнецы объективно лучше в игре? На своей странице Twitch Джоэл Z призвал зрителей: «Пожалуйста, не считайте это эталоном для того, насколько хорошо LLM может воспроизводить покемонов. Вы не можете сделать прямые сравнения — Близнецы и Клод имеют разные инструменты и получать другую информацию».
И обе модели ИИ нужна помощь в игре в игру — именно здесь появляются вышеупомянутые жгуты агента, предоставляя модели игровыми скриншотами, наложенными на дополнительную информацию, позволяя модели решать, как ответить (что может включать в себя вызов специализированных агентов), а затем нажимать кнопку, которая соответствует инструкции ИИ.
Мероприятие TechCrunch
Беркли, Калифорния
|
5 июня
Забронируйте сейчас
Джоэл Z признал, что были другие «разработчики», чтобы помочь Близнецам завершить игру, но настаивал на том, что это не обманывает.
«Мои вмешательства улучшают общие способности Близнецов в принятии решений и рассуждениях»,-говорит он. «Я не даю определенных подсказок — нет никаких пошагового режима или прямых инструкций по определенным проблемам, таким как Mt. Moon. Единственное, что приближается даже близко, — это дать Близнецам знать, что ему нужно дважды поговорить с ракетным ворчанием, чтобы получить ключ подъема, который был позже фиксированным в покемон -желтом».
Кроме того, он сказал: «Близнецы играют покемонов, все еще активно развивается, и структура продолжает развиваться».