Антропический использовал покемона для сравнения своей новейшей модели искусственного интеллекта

Антропик использовал покемона для сравнения своей новейшей модели ИИ. Да, правда.

В сообщении в блоге, опубликованном в понедельник, Anpropic сказал, что он проверил свою последнюю модель Claude 3.7 Sonnet, на Game Boy Classic Pokémon Red. Компания оснастила модель базовой памятью, вводом пикселей экрана и вызовами функций, чтобы нажать кнопки и перемещаться по экрану, что позволило ей непрерывно воспроизводить покемонов.

Уникальной особенностью Claude 3.7 Sonnet является его способность участвовать в «расширенном мышлении». Подобно O3-Mini и R1 Deepseek R1, Claude 3.7 Sonnet может «рассуждать» через сложные проблемы, применяя больше вычислений-и занимая больше времени.

По -видимому, это пригодилось в Pokémon Red.

По сравнению с предыдущей версией Claude, Claude 3.0 Sonnet, который не смог покинуть дом в Палле -Таун, где начинается история, Claude 3.7 Сонет успешно сражался с тремя лидерами спортзал покемонов и выиграл свои значки.

Антропный покемон красный
Кредиты изображения:Антроп

Теперь неясно, сколько вычислителей потребовалось для Claude 3.7 Sonnet, чтобы достичь этих вех — и сколько времени каждый занял. Антропик только сказал, что модель выполнила 35 000 действий, чтобы охватить последнего лидера спортзала, Surge.

Конечно, не будет много времени, прежде чем какой -то предприимчивый разработчик узнает.

Pokémon Red — это скорее игрушечный эталон, чем все. Однако там является Долгая история игр, используемых в сфере сравнительного анализа. Только за последние несколько месяцев несколько новых приложений и платформ появились на тестировании игровых способностей моделей на названиях, начиная от уличного истребителя до Pictionary.

Previous post Трамп изменил разговор на Украине «к лучшему», говорит Великобритания
Next post Лига женских наций: Республика Ирландия босс Уорд нацелена на Кубок Наций, победа над «верхней стороной» Словения