
Технологические гиганты, такие как Microsoft, могут рекламировать «Агенты» в качестве инструментов для получения прибыли для корпораций, но некоммерческая организация пытается доказать, что агенты также могут быть силой навсегда.
Sage Future, 501 (c) (3), поддержанный открытой филантропией, выпустил эксперимент в начале этого месяца, задавая четыре модели искусственного интеллекта в виртуальной среде с собранием денег на благотворительность. Модели-GPT-4O Openai и O1 и две из более новых моделей Anpropic Claude (3.6 и 3.7 сонета)-имели свободу выбирать, какую благотворительную организацию для сбора средств и как наилучшим образом побудить интерес к своей кампании.
Примерно через неделю агентская четверка собрала 257 долларов для Helen Keller International, которая финансирует программы по доставке добавок витамина А детям.
Чтобы быть ясным, агенты не были полностью автономными. В их среде, которая позволяет им просматривать Интернет, создавать документы и многое другое, агенты могут принимать предложения от человеческих зрителей, наблюдающих за их прогрессом. И пожертвования пришли почти полностью от этих зрителей. Другими словами, агенты не собирали много денег органично.
Вчера агенты в деревне создали систему для отслеживания доноров.
Вот Claude 3.7, заполняющий свою таблицу.
Вы можете увидеть, как O1 открывает его на компьютере на протяжении всего пути!
Клод отмечает: «Я вижу, что O1 теперь также просматривает электронную таблицу, что отлично подходит для сотрудничества». pic.twitter.com/89b6chr7ic
— AI Digest (@Aidigest_) 8 апреля 2025 года
Тем не менее, директор мудреца Адам Бинксмит считает, что эксперимент служит полезной иллюстрацией текущих возможностей агентов и скорости, с которой они улучшаются.
«Мы хотим понять — и помочь людям понять — что агенты … на самом деле могут делать, с чем они в настоящее время борются, и так далее», — сказал Бинксмит в интервью TechCrunch. «Сегодняшние агенты просто передают порог способности выполнять короткие строки действий — Интернет может скоро быть полон агентов искусственного интеллекта, сталкивающихся друг с другом и взаимодействовать с аналогичными или противоречивыми целями».
Агенты оказались удивительно находчивыми днями в тесте Sage. Они координировали друг с другом в групповом чате и отправляли электронные письма через предварительные учетные записи Gmail. Они создали и редактировали Google Docs вместе. Они исследовали благотворительные организации и оценили минимальное количество пожертвований, которые потребуются, чтобы сэкономить жизнь через Helen Keller International (3500 долларов США). И они даже создали учетную запись X для продвижения по службе.
«Вероятно, самая впечатляющая последовательность, которую мы видели, была, когда (агент Клода) нуждалась в изображении профиля для его учетной записи», — сказал Бинксмит. «Он зарегистрировался на бесплатную учетную запись CHATGPT, сгенерировал три разных изображения, создал онлайн -опрос, чтобы увидеть, какое изображение предпочитает человеческие зрители, затем загрузил это изображение, и загрузил его на X, чтобы использовать в качестве его профиля».
Агенты также столкнулись с техническими препятствиями. Иногда они застряли — зрителям приходилось предоставить им рекомендации. Они отвлекались от таких игр, как мир, и они сделали необъяснимые перерывы. Однажды GPT-4O «остановился» в течение часа.
Интернет не всегда плавный плавание для LLM.
Вчера, выполняя филантропическую миссию деревни, Клод столкнулся с капкой.
Клод пытался снова и снова, когда (человеческие) зрители в чате предлагали руководство и поддержку, но в конечном итоге не смогли преуспеть. pic.twitter.com/y4dtltge95
— AI Digest (@Aidigest_) 5 апреля 2025 года
Бинксмит считает, что новые и более способные агенты ИИ преодолеют эти препятствия. Sage планирует постоянно добавлять новые модели в среду, чтобы проверить эту теорию.
«Возможно, в будущем мы попробуем такие вещи, как дают агентам разные цели, несколько команд агентов с разными целями, секретным агентом диверсатора — много интересных вещей, с которыми можно экспериментировать», — сказал он. «По мере того, как агенты становятся более способными и быстрее, мы сопоставляем это с более крупными системами автоматического мониторинга и надзора в целях безопасности».
Если повезет, в процессе агенты проведут значительную благотворительную работу.