Французский стартап Rounded полагает, что голосовые агенты с искусственным интеллектом станут стандартным способом взаимодействия клиентов с компаниями, поэтому вместо создания готовых к использованию голосовых агентов с искусственным интеллектом компания создает платформу оркестрации, которая позволит компаниям создавать свои собственные голосовые агенты.
Rounded начала работу над продуктом web3, а в июне 2023 года переключила свое внимание на изучение голосовых агентов с искусственным интеллектом. «Идея заключалась в том, что мы просто поместим ChatGPT после транскрибатора и перед синтезатором, и это будет ценно», — соучредитель. Эмерик Водлен (на фото выше, первый слева) рассказал TechCrunch.
Но вскоре команда столкнулась с обычной загадкой соответствия продукта рынку. «Через несколько месяцев мы поняли, что рынок еще не готов услышать о голосовых агентах. Итак, мы создали продукт и упаковали все для создания первого агента», — добавил Водлен.
Результатом этих усилий стала Донна, голосовой агент с искусственным интеллектом для анестезиологов. Хотя это кажется несколько случайным, стартап выбрал этот рынок, потому что секретарям-анестезиологам приходится иметь дело с большим количеством пациентов, и обычно это очень транзакционный опыт.
Во Франции, когда вы планируете хирургическую операцию, вам необходимо заранее поговорить с анестезиологом, чтобы он мог убедиться в отсутствии у вас аллергии на анестезирующие средства или каких-либо потенциальных осложнений.
Секретарям-анестезиологам приходится обрабатывать большое количество вызовов, которые довольно просты. Обычно люди просто хотят узнать, когда анестезиолог доступен, записаться на прием или изменить дату.
Более того, это не рекламные звонки, поэтому агенту ИИ не обязательно быть убедительным или чрезвычайно эффективным. «В первые дни мы боролись с задержкой иногда в 4, 5, 6 секунд», — сказал Водлен.
Тем не менее, вместе с Донной, Rounded удалось убедить 15 частных больниц разрешить голосовому агенту с искусственным интеллектом отвечать на звонки, и компания утверждает, что на данный момент агент обработал сотни тысяч разговоров. Со временем Rounded улучшила свой продукт, чтобы он был точнее, лучше интегрировался с другими продуктами и, что немаловажно, быстрее.
«Например, при веб-вызове мы теперь получаем задержку менее 700 миллисекунд — скорее, 600 миллисекунд. Вы добавляете примерно 200 миллисекунд на подключение к телефону», — сказал Водлен.
Совсем недавно Rounded расширила сферу своей деятельности, выпустив продукт для оркестрации, который другие компании могут использовать для создания собственных голосовых агентов.
Rounded позволяет вам выбирать готовые модели искусственного интеллекта, которые могут быть моделью преобразования речи в текст, LLM и моделью преобразования текста в речь. Например, для вашего первого голосового агента вы можете использовать Azure для расшифровки звонка, GPT-4o mini в качестве LLM и ElevenLabs в качестве механизма преобразования речи в текст.
Затем платформа помогает определить деревья инструкций и подсказки, благодаря которым LLM будет работать в вашем конкретном случае. «Реализация агента означает поиск правильных подсказок, правильных параметров и правильных переменных в подсказке», — сказал Водлен.
«Наша идея заключается в том, что мы дадим возможность каждому создавать отличные подсказки или отличных агентов, а наш продукт будет поддерживать их в этом итерационном процессе по созданию сверхнадежных агентов», — сказал Водлен.
На данный момент Rounded привлек 600 000 евро (около 620 000 долларов США) от акселератора глубоких технологий SkyDeck Калифорнийского университета в Беркли и нескольких бизнес-ангелов. Но учитывая, что искусственный интеллект остается чрезвычайно оживленной отраслью, я уверен, что в ближайшие месяцы стартап привлечет больше денег.