Предполагается, что агенты ИИ станут следующим большим достижением в области ИИ, но точного определения того, что они из себя представляют, не существует. На данный момент люди не могут договориться о том, что именно представляет собой агент ИИ.
Проще говоря, агент ИИ лучше всего описывается как программное обеспечение на основе ИИ, которое выполняет за вас ряд работ, которые в прошлом могли выполнять агент по обслуживанию клиентов, специалист по персоналу или сотрудник службы ИТ-поддержки, хотя в конечном итоге это может включать в себя любые задача. Вы просите его что-то сделать, и он делает это за вас, иногда пересекая несколько систем и выходя далеко за рамки простого ответа на вопросы. Например, в прошлом месяце Perplexity выпустила ИИ-агента, который помогает людям делать праздничные покупки (и это не единственный). А на прошлой неделе Google объявила о своем первом агенте искусственного интеллекта под названием Project Mariner, который можно использовать для поиска рейсов и отелей, покупок предметов домашнего обихода, поиска рецептов и других задач.
Кажется достаточно простым, не так ли? Однако все осложняется отсутствием ясности. Даже среди технологических гигантов нет единого мнения. Google рассматривает их как помощников, ориентированных на выполнение задач, в зависимости от работы: помощь разработчикам в написании кода; помощь маркетологам в создании цветовой схемы; помощь ИТ-специалисту в отслеживании проблемы путем запроса данных журнала.
В случае с Асаной агент может действовать как дополнительный сотрудник, выполняя порученные задачи, как любой хороший коллега. Sierra, стартап, основанный бывшим со-генеральным директором Salesforce Бретом Тейлором и ветераном Google Клэем Бавором, рассматривает агентов как инструменты взаимодействия с клиентами, помогающие людям совершать действия, которые выходят далеко за рамки чат-ботов прошлых лет и помогают решать более сложные комплексы проблем.
Отсутствие связного определения действительно оставляет место для путаницы в отношении того, что именно эти вещи будут делать, но независимо от того, как они определены, агенты предназначены для того, чтобы помогать выполнять задачи автоматизированным способом с минимальным взаимодействием с человеком.
Рудина Сесери, основатель и управляющий партнер Glasswing Ventures, говорит, что это только начало, и это может объяснить отсутствие соглашения. «Не существует единого определения того, что такое «агент ИИ». Однако наиболее распространенная точка зрения заключается в том, что агент — это интеллектуальная программная система, предназначенная для автономного восприятия окружающей среды, ее анализа, принятия решений и действий для достижения конкретных целей», — рассказал Сесери TechCrunch.
Она говорит, что для этого они используют ряд технологий искусственного интеллекта. «Эти системы включают в себя различные методы искусственного интеллекта и машинного обучения, такие как обработка естественного языка, машинное обучение и компьютерное зрение, для работы в динамических доменах автономно или вместе с другими агентами и пользователями».
Аарон Леви, соучредитель и генеральный директор Box, говорит, что со временем, когда ИИ станет более способным, агенты ИИ смогут делать гораздо больше от имени людей, и уже есть динамика, которая будет стимулировать эту эволюцию.
«Самоусиливающийся маховик ИИ-агентов состоит из нескольких компонентов, которые помогут значительно улучшить то, чего ИИ-агенты могут достичь в краткосрочной и долгосрочной перспективе: цена/производительность графического процессора, эффективность модели, качество и интеллект модели, структуры ИИ и улучшения инфраструктуры», — написал недавно Леви на LinkedIn.
Это оптимистичный взгляд на технологию, предполагающий, что рост будет происходить во всех этих областях, хотя это не обязательно является данностью. Пионер робототехники Массачусетского технологического института Родни Брукс отметил в недавнем интервью TechCrunch, что искусственному интеллекту приходится иметь дело с гораздо более сложными проблемами, чем большинству технологий, и он не обязательно будет расти так же быстро, как, скажем, чипы по закону Мура.
«Когда человек видит, что система ИИ выполняет задачу, он сразу же обобщает ее на схожие вещи и оценивает компетентность системы ИИ; не только производительность в этом вопросе, но и компетентность в этом вопросе», — сказал Брукс во время интервью. «И они обычно очень чрезмерно оптимистичны, и это потому, что они используют модель выполнения человеком задачи».
Проблема в том, что пересекать системы сложно, и это осложняется тем фактом, что в некоторых устаревших системах отсутствует базовый доступ к API. Хотя мы наблюдаем устойчивые улучшения, о которых упомянул Леви, получение программного обеспечения для доступа к нескольким системам и одновременное решение проблем, с которыми оно может столкнуться на этом пути, может оказаться более сложной задачей, чем многие думают.
Если это так, то каждый может переоценить возможности агентов ИИ. Дэвид Кушман, руководитель исследований в HFS Research, рассматривает нынешнее поколение ботов скорее как Асана: помощников, которые помогают людям выполнять определенные задачи в интересах достижения какой-то определенной пользователем стратегической цели. Задача состоит в том, чтобы помочь машине справиться с непредвиденными обстоятельствами по-настоящему автоматизированным способом, и мы явно еще не приблизились к этому.
«Я думаю, что это следующий шаг», — сказал он. «Именно здесь ИИ работает независимо и эффективно в большом масштабе. Таким образом, именно здесь люди устанавливают руководящие принципы, ограждения и применяют множество технологий, чтобы вывести человека из цикла — в то время как все было направлено на то, чтобы сохранить человечность. в цикл с GenAI», — сказал он. Поэтому, по его словам, главное здесь — позволить агенту ИИ взять на себя управление и применить настоящую автоматизацию.
Джон Туроу, партнер Madrona Ventures, говорит, что для этого потребуется создание инфраструктуры агентов ИИ — технологического стека, разработанного специально для создания агентов (как бы вы их ни определяли). В недавнем сообщении в блоге Туров привел примеры агентов ИИ, которые в настоящее время работают в дикой природе, и то, как они сегодня создаются.
По мнению Туроу, растущее распространение агентов ИИ — и он также признает, что определение все еще немного неясно — требует технологического стека, как и любая другая технология. «Все это означает, что нашей отрасли предстоит поработать над созданием инфраструктуры, поддерживающей агентов ИИ и приложения, которые на них полагаются», — написал он в статье.
«Со временем рассуждения будут постепенно улучшаться, передовые модели будут управлять большей частью рабочих процессов, а разработчики захотят сосредоточиться на продукте и данных — вещах, которые их отличают. Они хотят, чтобы базовая платформа «просто работала» с масштабом, производительностью и надежностью».
Здесь следует иметь в виду еще одну вещь: для того, чтобы агенты работали, вероятно, потребуется несколько моделей, а не один LLM, и это имеет смысл, если вы думаете об этих агентах как о наборе различных задач. «Я не думаю, что сейчас какая-либо отдельная большая языковая модель, по крайней мере публично доступная, монолитная большая языковая модель, способна справиться с агентными задачами. Я не думаю, что они еще могут провести многоэтапное рассуждение, которое действительно воодушевило бы меня насчет агентного будущего. Я думаю, что мы приближаемся, но этого еще не произошло», — сказал Фред Хавемейер, руководитель отдела исследований искусственного интеллекта и программного обеспечения в США в Macquarie US Equity Research.
«Я действительно думаю, что наиболее эффективными агентами, скорее всего, будут несколько наборов различных моделей с уровнем маршрутизации, который отправляет запросы или подсказки наиболее эффективному агенту и модели. И я думаю, что это было бы что-то вроде интересного (автоматизированного) руководителя, делегирующего свои роли».
В конечном счете, по мнению Хавемейера, отрасль работает над достижением цели, заключающейся в том, чтобы агенты работали независимо. «Размышляя о будущем агентов, я хочу и надеюсь увидеть агентов, которые действительно автономны и способны ставить перед собой абстрактные цели, а затем совершенно независимо продумывать все отдельные шаги между ними», — сказал он. TechCrunch.
Но дело в том, что мы все еще находимся в переходном периоде, что касается этих агентов, и мы не знаем, когда доберемся до этого конечного состояния, которое описал Хавемейер. Хотя то, что мы видели до сих пор, явно является многообещающим шагом в правильном направлении, нам все еще нужны некоторые достижения и прорывы, чтобы агенты ИИ могли работать так, как их представляют сегодня. И важно понимать, что мы еще не там.
Эта история была первоначально опубликована 13 июля 2024 года и дополнена новыми агентами от Perplexity и Google.