
Google AI R & D Lab DeepMind заявляет, что разработала новую систему искусственного интеллекта для решения проблем с «машинными» решениями.
По словам DeepMind, в экспериментах система, называемая AlphaEv Компания заявляет, что создает пользовательский интерфейс для взаимодействия с Alphaevolve, и планирует запустить программу раннего доступа для выбранных ученых перед возможным более широким развертыванием.
Большинство моделей ИИ галлюцинируют. Благодаря своей вероятностной архитектуре они иногда уверенно делают вещи. На самом деле, более новые модели искусственного интеллекта, такие как Openai's O3 Hallucinate более чем их предшественники, иллюстрируя сложную природу проблемы.
Alphaevolve вводит умный механизм для сокращения галлюцинаций: автоматическая система оценки. Система использует модели для создания, критики и получения пула возможных ответов на вопрос, а также автоматически оценивает и оценивает ответы на точность.

Alphaevolve не первая система, которая взяла эту привязку. Исследователи, в том числе команда в DeepMind несколько лет назад, применяли аналогичные методы в различных математических областях. Но DeepMind утверждает, что использование «современных» моделей AlphaEvolve «современных»-в частности, модели Близнецов-делает его значительно более способным, чем более ранние случаи ИИ.
Чтобы использовать Alphaevolve, пользователи должны привлечь систему проблемой, опционально включив детали, такие как инструкции, уравнения, фрагменты кода и соответствующую литературу. Они также должны предоставить механизм для автоматической оценки ответов системы в виде формулы.
Поскольку Alphaevolve может решать только проблемы, которые могут самооценка, система может работать только с определенными типами проблем-в частности, в таких областях, как информатика и оптимизация системы. В другом серьезном ограничении Alphaevolve может описывать только решения как алгоритмы, что делает его плохой подходящей для проблем, которые не являются численными.
Чтобы сравнить Alphaevolve, Deepmind предприняла систему попытки кураторского набора из около 50 математических задач, охватывающих ветви от геометрии до комбинаторной комбинаторики. Alphaevolve сумела «заново открыть» самые известные ответы на проблемы в 75% случаев и выявить улучшенные решения в 20% случаев, претендует на Deepmind.
DeepMind также оценил Alphaevolve по практическим проблемам, таким как повышение эффективности центров обработки данных Google и ускорение модельных тренировок. Согласно лаборатории, Alphaevolve генерировал алгоритм, который непрерывно восстанавливает 0,7% в среднем 0,7% Google Worldwide Compute Resources. Система также предложила оптимизацию, которая сократила общее время, которое нужно Google, чтобы обучить свои модели Близнецов на 1%.
Чтобы быть ясным, Alphaevolve не делает прорывные открытия. В одном эксперименте система смогла найти улучшение для дизайна чипов Accelerator Chip от TPU TPU, которая была отмечена другими инструментами ранее.
DeepMind, однако, вызывает тот же случай, как и многие лаборатории искусственного интеллекта для своих систем: что Alphaevolve может сэкономить время, освобождая экспертов, чтобы сосредоточиться на другой, более важной работе.