Сегодня новая компания выходит из тени при поддержке венчурного фонда Google, ориентированного на искусственный интеллект, чтобы помочь предприятиям создать свою инфраструктуру искусственного интеллекта с открытым исходным кодом и сократить свои инженерные накладные расходы.
Cake интегрирует и защищает более 100 компонентов для предприятий, включая адаптеры источников данных (например, Apache Hadoop), прием данных (например, Apache Kafka), маркировку данных (например, Label Studio), векторные и графовые базы данных (например, Milvus или Neo4j), генеративный искусственный интеллект. API и связанные с ними инструменты (например, Anthropic), а также многие другие категории.
Это намекает на то, почему Cake называется именно так — он берет различные «слои», составляющие стек искусственного интеллекта, и интегрирует их в более удобоваримый, готовый к использованию формат, подходящий для бизнеса.
«Проблема общей картины»
Компания Cake, основанная в Нью-Йорке в 2022 году Мишей Херску (генеральный директор) и Скайлером Томасом (технический директор) (на фото выше), запустила свою деятельность в прошлом году и уже работает с такими клиентами, как бионаучный стартап в области искусственного интеллекта Altis Labs и страховая компания по анализу данных Ping. Однако до сих пор компания не поднимала особого шума на публике.
Помимо официального открытия сегодня, Cake заявила, что с момента своего создания привлекла 13 миллионов долларов. Сюда входит предварительное финансирование в размере 3 миллионов долларов США в течение пары лет его становления, а также недавний посевной раунд в размере 10 миллионов долларов США под руководством Google Gradient Ventures.
«Мы не были сверхсекретными; мы только что строили и работали с клиентами», — объяснил Эрску TechCrunch в интервью на прошлой неделе.
Ранее Эрску основал компанию McCoy Medical Technologies, занимающуюся искусственным интеллектом, которая занималась инфраструктурой машинного обучения для радиологии, и продал ее в 2017 году ИТ-поставщику TeraRecon. Позже он присоединился к нью-йоркской венчурной фирме Primary Venture Partners в качестве «резидентного оператора», где он реализовал свое следующее предприятие, общаясь с сотнями руководителей в области науки о данных и искусственного интеллекта.
«Я сделал более 200 звонков по выявлению клиентов, спрашивая, каковы их самые большие болевые точки и узкие места», — сказал Эрску. «Самая большая проблема заключалась не в какой-то отдельной части стека, например, в настройке базы данных векторов или конвейера данных. Дело в том, что в очень богатой экосистеме есть масса различных компонентов. Как вы собираетесь все надежно интегрировать и подготовить к производству?»
Это то, что Эрску называет «проблемой общей картины», и именно здесь в борьбу вступает его новый бизнес.
Цель Cake — разобраться в множестве компонентов с открытым исходным кодом, составляющих современный стек искусственного интеллекта, и предоставить объединенную управляемую инфраструктуру искусственного интеллекта с открытым исходным кодом для небольших команд. Речь идет не о построении бизнеса вокруг одного проекта с открытым исходным кодом, как это делают бесчисленные компании; вместо этого речь идет о сборке и обслуживании тщательно отобранных проектов с открытым исходным кодом в рамках всего стека и обеспечении его бесперебойной работы.
Допустим, у крупной компании, предоставляющей финансовые услуги, есть миллионы документов, содержащих сложные финансовые данные, и она хочет применить к этим файлам RAG (генерацию с расширенным поиском) для улучшения качества ответов на запросы на естественном языке. Если готовый продукт не соответствует поставленной задаче или не подходит по соображениям соответствия, компании придется создать собственную систему, установив и сшивая несколько различных компонентов. Это трудоемкая задача, о которой Cake может позаботиться.
В другом месте больнице может потребоваться создать безопасную систему для анализа изображений, полученных при компьютерной томографии, или компания электронной коммерции может захотеть обновить свой механизм рекомендаций. Это все потенциальные варианты использования Cake.
«У нас есть широкий спектр возможностей, но я бы сказал, что наша золотая середина определенно — это когда компании выходят за рамки того, что вы можете сделать с простым, готовым продуктом», — сказал Эрску.
Параллельная разработка
Технический директор Cake Томас ранее работал в IBM в качестве главного архитектора, а в последнее время он был выдающимся инженером и директором по стратегии в Hewlett Packard Enterprise, которая приобрела предыдущую компанию MapR, в которой он работал.
Томас говорит, что на протяжении многих лет он работал над сотнями проектов, как с крупными, так и с мелкими клиентами, и заметил тенденцию, пронизывающую почти все из них — каждый так или иначе использовал инструменты с открытым исходным кодом, большая часть которых была свежей в результате исследований. лаборатории. Тем не менее, использовать их на предприятии было непросто.
«Даже крупнейшим предприятиям требуется огромное количество времени, чтобы взять то, что выходит из лабораторий, и интегрировать это в свою работу», — сказал Томас TechCrunch. «Во многом это связано с тем, что большая часть из них не готова для предприятий — у них может не быть аутентификации и авторизации, и предприятиям приходится делать это самостоятельно».
Здесь есть параллели с тем, к чему стремится Cake. В Европе есть такие компании, как финская Aiven, «единорог» с оборотом в 2 миллиарда долларов, которая делает нечто подобное, но с упором на инфраструктуру данных. Пожалуй, наиболее очевидным сравнением будет Red Hat, которую IBM приобрела за 34 миллиарда долларов и которая наиболее известна своей операционной системой Linux корпоративного уровня (RHEL).
«На заре Linux существовали тысячи пакетов с открытым исходным кодом, которые все хотели использовать, но они не были интегрированы и не были безопасными», — сказал Томас. «Для этого просто не существовало модели поддержки, и поэтому Red Hat мира сделали Linux безопасным для предприятия. Сегодня мы хотим сделать то же самое для ИИ».
Хотя есть планы со временем представить хостинговую версию Cake, на данный момент компаниям приходится запускать ее в своих собственных средах. Для многих это не будет проблемой, поскольку положения о конфиденциальности данных означают, что они в любом случае не могут отправлять данные за пределы своих систем. Но размещенная версия может понравиться организациям с меньшими обязательствами по соблюдению требований.
«Нам на самом деле будет легче, если мы сможем контролировать облако», — добавил Эрску.
Помимо ведущего инвестора Gradient, в посевном раунде Cake приняли участие его предварительный инвестор Primary Venture Partners, а также Alumni Ventures, Friends & Family Capital, Correlation Ventures и Firestreak Ventures.
До сих пор необъявленный посевной раунд стоимостью 10 миллионов долларов, который завершился еще в апреле, свидетельствует не только о прошлом основателей, но и об успехах компании. Эрску сказал, что компания уже готовится к следующему раунду финансирования и планирует снова привлечь средства примерно в середине 2025 года.
«С точки зрения тяги мы уже больше похожи на компанию серии А. Мы смогли добраться туда довольно быстро», — сказал Эрску. «Когда мы перейдем к Серии А, она, вероятно, будет больше похожа на Серию Б».