Расходящее будущее ИИ

Разблокировать дайджест редактора бесплатно

Принадлежит ли будущее горстке всемогущих, широкомасштабных агентов искусственного интеллекта, которые ориентируются по миру от нашего имени-преемники чатгптов, Клоудс и Гроки, которые стремятся выполнить практически любую задачу, которую вы им бросаете? Или это будет заполнено множеством специализированных цифровых помощников, каждый из которых обучил выполнять узкую задачу и вызововать только при необходимости?

Некоторое сочетание двух кажется вероятным, но огромный темп перемен оставил даже лидеров в области, признав, что у них мало представления о том, как все будет выглядеть год или два.

Для сторонников идеи «Один ИИ управлять всеми ими» было много обнадеживающих событий. Например, OpenAI добавил функцию покупок в CHATGPT на этой неделе, которая указывает на то, как персонализированные агенты искусственного интеллекта могут переупорядочить экономику электронной коммерции. Использование одного запроса, чтобы получить чат -бот для проведения исследования вашего продукта, и рекомендации по покупке угрожает подорвать всю «воронку», которую бренды полагались на управляющих покупателями, очень много разместите в центре.

Подобные достижения могут привлечь наибольшее внимание, но за кулисами новое поколение более специализированных агентов начинает обретать форму. Эти обещают быть узкого нацеленным и — ключевым соображением — гораздо дешевле, как для строительства, так и для бега.

На этой неделе конференция Meta's Llamacon Developer дала представление о состоянии игры. Компания по социальной сети сделала свою ставку на адаптивность своих «открытых весов», моделей ИИ, которые имеют ограниченную форму структуры с открытым исходным кодом. Это позволяет другим использовать и адаптировать модели, даже если они не могут точно видеть, как они были обучены.

Одним из признаков того, что Meta поразила нерв в более широком технологическом мире, является загрузку 1,2 млрд. Сгрузки его «открытых» моделей ламы в первые два года. Подавляющее большинство из них включало версии ламы, которые другие разработчики адаптировали для конкретного использования, а затем предоставляют любого для загрузки.

Методы превращения этих моделей открытых весов в полезные инструменты быстро развиваются. Например, дистилляция — наполнение небольших моделей некоторыми интеллектами из гораздо более крупных — стала общей техникой. Компании с «закрытыми» моделями, такими как Openai, оставляют за собой право решать, как и от которых их модели могут быть дистиллированы. В мире открытых весов, для сравнения, разработчики могут свободно адаптировать модели, как они хотят.

Заинтересован в создании более специализированных моделей в последние месяцы, так как в центре внимания развития искусственного интеллекта сместилась интенсивная-и очень дорогие-начальные тренировочные прогоны для самых больших моделей. Вместо этого большая часть особого соуса в последних из них создается на шагах, которые появятся дальше-в «пост-тренировке», в которой часто используется метод, известный как обучение подкреплению для формирования результатов, и в так называемой фазе испытания, используемой моделями рассуждений для решения проблемы.

По словам Али Годси, исполнительного директора DataBricks, одна мощная форма пост-тренировок, которая привлекла участие в использовании собственных данных компании для формирования моделей на этапе обучения подкреплению, что делает их гораздо более надежными для использования в бизнесе. Выступая на мероприятии Meta, он сказал, что это возможно только для открытых моделей.

Еще один любимый новый трюк состоял в том, чтобы объединить лучшие части разных открытых моделей. После того, как DeepSeek шокировал мир ИИ с успехом своей недорогой модели рассуждений R1, например, другие разработчики быстро узнали, как копировать свои рассуждения «следы»-пошаговые модели мышления, которые показали, как это работало через проблему-и запустить их на вершине ламы Meta,

Эти и другие методы обещают приливную волну умных агентов, которые требуют менее дорогого оборудования и потребляют гораздо меньше мощности.

Между тем, для модельных строителей это увеличивает риск коммодита — что более дешевые альтернативы подрывают их самые дорогие и продвинутые модели.

Но самыми крупными победителями из всех, как стоимость водопада ИИ, могут быть пользователи: компании, у которых есть возможность проектировать и внедрять специализированных агентов в свои повседневные рабочие процессы.

Richard.waters@ft.com

Previous post FPL Gameweek 35 Советы: капитан Брайан Мбемо, Олли Уоткинс и Марко Асенсио Double-Up
Next post May Mobility для запуска Robotaxis на платформе Uber в этом году в Техасе