Linkup соединяет LLM с источниками премиум-контента (легально)

Если вы использовали ChatGPT Search или Perplexity, вы знаете, что возможность осуществлять поиск в Интернете и получать цитаты онлайн значительно улучшает работу этих чат-ботов с искусственным интеллектом. Результаты лучше, когда они включают своевременную информацию, а веб-поиск может уменьшить так называемые галлюцинации (т. е. когда генеративный ИИ выдает неверную информацию).

Вот почему французский стартап Linkup создает API, который позволяет разработчикам получать доступ к веб-контенту из проверенных источников премиум-класса и передавать результаты в большую языковую модель (LLM) для обогащения ее ответов. Многие разработчики ИИ называют этот рабочий процесс «Поисковая дополненная генерация» (или RAG).

Что еще более важно, будущее парсинг-ботов остается неопределенным. Если между издателями контента и организациями, сканирующими веб-страницы, не существует ранее существовавшего финансового соглашения, эти боты извлекают контент из открытой сети без оплаты, и многие люди недовольны этой сделкой, что усиливает контроль со стороны регулирующих органов в отношении обучения ИИ.

В настоящее время в поле зрения также находятся громкие судебные дела, такие как продолжающийся судебный процесс между OpenAI, создателем ChatGPT, и New York Times, поэтому ситуация с парсингом веб-страниц может измениться в ближайшем будущем. Именно поэтому OpenAI подписала многолетние соглашения о лицензировании контента с такими крупными издателями, как AP, Axel Springer, Condé Nast, El País, Financial Times, Le Monde и другими.

«Мы основали компанию примерно в то время, когда OpenAI заключала сделки с источниками новостей… в целях обучения или вывода, чтобы дополнить ответы от моделей OpenAI и их продуктов. И мы подумали: «Хорошо, это здорово, потому что у нас наконец-то есть компании, занимающиеся искусственным интеллектом, которые платят своим источникам», — рассказал TechCrunch соучредитель и генеральный директор Linkup Филипп Мизрахи, рассказывая, что побудило основателей создать бизнес для связи разработчиков искусственного интеллекта с провайдеры контента – будем надеяться – для их взаимной выгоды.

В настоящее время издатели контента сталкиваются с трудным решением, что делать с жаждой данных GenAI. Они могут блокировать веб-скраперы, используя (не имеющий юридической силы) файл метаданных robots.txt (который указывает, можно ли использовать веб-сайт для обучения модели ИИ или нет). Кроме того, они могут подать в суд на компании, занимающиеся искусственным интеллектом, которые, по их мнению, нарушили их авторские права. В качестве альтернативы они могли бы позволить ботам свободно индексировать их контент (э-э, YOLO?). Или они могут лицензировать контент разработчикам искусственного интеллекта, чтобы получить некоторую компенсацию за свою интеллектуальную собственность.

Но существуют тысячи компаний, занимающихся искусственным интеллектом (или технологических компаний, использующих ИИ), которые не имеют такого масштаба и охвата, как OpenAI. В то же время, что хорошо в Интернете, так это то, что существует длинный хвост издателей контента. Но это означает, что у мелкого издателя контента обычно не хватает финансовых ресурсов для подачи иска. Это также означает, что будет сложно перейти от модели парсинга к модели лицензирования для миллионов веб-сайтов.

Вот почему Linkup — это не просто техническое решение. Это рынок; посредник между издателями контента и компаниями, которые хотят дополнить свои ответы LLM веб-контентом.

Linkup подписывает соглашения о лицензировании контента с издателями и интегрируется с их CMS, чтобы можно было получать контент от издателей без какой-либо очистки. Затем Linkup платит партнерам по контенту в зависимости от того, как часто клиенты Linkup получают доступ к их контенту.

Команда основателей LinkupКредиты изображений:Соединение

«На самом деле мы нацелены на приложения, которые внедряют ИИ в свои собственные продукты», — сказал Мизрахи. «Итак, типичный вариант использования — я создаю приложение ИИ, используя модель Mistral или OpenAI. Я строю свой собственный конвейер, но мне нужно обогатить этот конвейер внешней информацией».

Кстати, ChatGPT может просматривать веб-страницы, а модели GPT — нет. OpenAI предоставляет как чрезвычайно популярное приложение (ChatGPT), так и LLM, которые разработчики могут использовать с API (GPT). Но веб-поиск — это функция ChatGPT.

«Мне нравится пример: один из наших клиентов… создал внутреннее приложение для своих продавцов», — также рассказал нам Мизрахи. «С одной стороны, они перечислили все преимущества собственной продукции. И благодаря нам они получают свежую, качественную информацию о своих перспективах и помещают ее в Mistral LLM. А LLM компании Mistral собирается подготовить для торговых представителей своего рода коммерческое предложение, которое они будут иметь перед собой, когда будут звонить потенциальным клиентам».

Сначала Linkup решила сосредоточиться на корпоративной и деловой информации. Помимо новостных сайтов, стартап работает с базами знаний — вспомните Statista, Xerfi или другие ресурсы в том же духе.

Это не единственный стартап, работающий над предоставлением премиального контента для LLM с негласными лицензионными контрактами. Наиболее заметным конкурентом является ScalePost, стартап, который работает с Perplexity, чтобы ускорить заключение лицензионных соглашений с издателями.

Несколько месяцев назад Linkup привлек стартовый раунд в размере 3 миллионов евро (3,2 миллиона долларов по текущему обменному курсу) от Axeleo Capital, Motier Ventures, Seedcamp и сотни бизнес-ангелов. Сейчас в стартапе работают около 10 человек, и в следующем году компания планирует нанять еще 10 сотрудников.

Previous post Обзор ресторана: Mezzeway – POLITICO
Next post Ф1: Уволенный стюард предупреждает, что в FIA «не хватает людей для выполнения этой работы»