Близнецы Google победили Pokémon Blue (с небольшой помощью)

Самая дорогая модель ИИ Google, похоже, пересекла основную веху: победив 29-летнюю видеоигру.

Прошлой ночью генеральный директор Google Sundar Pichai триумфально опубликовал на X: «Что за финиш! Gemini 2.5 Pro только что закончил Pokémon Blue!»

Чтобы быть ясным, Близнецы играют в Pokemon Livestream были созданы (по его собственным словам) «30 -летний инженер -программист, не связанный с Google», который идет на Джоэл З. Но руководители Google подбадривали усилия.

Например, Logan Kilpatrick, лидер продукта для Google AI Studio, опубликованный в прошлом месяце, что Gemini «добился большого прогресса в завершении покемонов» и «заработал свой 5 -й значок (в следующей лучшей модели только 3, хотя с другим жгутом агента)», «Ведущий Пичай шутить», «Мы работаем над API, искусственным с разведкой агента») »,« Ведущий Пичай, чтобы шутить, «мы работаем над API, искусственным с разведкой агента» 🙂

Почему покемон? Еще в феврале Антропик подчеркнул прогресс, который его модели Claude AI делали в «Pokémon Red», написав этот «расширенное мышление и агент» Клода, дает ему «крупный импульс» в «более неожиданных» задачах, таких как игра в классическую игру. («Pokémon Red» и «Blue»-это разные версии титула Gameboy, впервые выпущенного в 1996 году и привязанной к долгосрочной франшизе Pokémon). Есть даже Клод, играющий в Pokemon Twitch Channel, который Джоэл Зил назвал вдохновением.

Несмотря на свой прогресс, Клод, похоже, еще не победил «Pokémon Red». Значит ли это, что Близнецы объективно лучше в игре? На своей странице Twitch Джоэл Z призвал зрителей: «Пожалуйста, не считайте это эталоном для того, насколько хорошо LLM может воспроизводить покемонов. Вы не можете сделать прямые сравнения — Близнецы и Клод имеют разные инструменты и получать другую информацию».

И обе модели ИИ нужна помощь в игре в игру — именно здесь появляются вышеупомянутые жгуты агента, предоставляя модели игровыми скриншотами, наложенными на дополнительную информацию, позволяя модели решать, как ответить (что может включать в себя вызов специализированных агентов), а затем нажимать кнопку, которая соответствует инструкции ИИ.

Мероприятие TechCrunch

Беркли, Калифорния
|
5 июня

Забронируйте сейчас

Джоэл Z признал, что были другие «разработчики», чтобы помочь Близнецам завершить игру, но настаивал на том, что это не обманывает.

«Мои вмешательства улучшают общие способности Близнецов в принятии решений и рассуждениях»,-говорит он. «Я не даю определенных подсказок — нет никаких пошагового режима или прямых инструкций по определенным проблемам, таким как Mt. Moon. Единственное, что приближается даже близко, — это дать Близнецам знать, что ему нужно дважды поговорить с ракетным ворчанием, чтобы получить ключ подъема, который был позже фиксированным в покемон -желтом».

Кроме того, он сказал: «Близнецы играют покемонов, все еще активно развивается, и структура продолжает развиваться».

Previous post Эдинбург 24-39: Посетители достигают финала Кубка европейского вызова регби
Next post Кубок Ирландии: Dungannon Swifts победил Cliftonville по штрафам, чтобы выиграть первый ирландский кубок