Google запускает «неявное кэширование», чтобы сделать доступ к своим последним моделям искусственного интеллекта дешевле

Google разрабатывает функцию в своем API Gemini, которая утверждает, что компания сделает свои последние модели искусственного интеллекта дешевле для сторонних разработчиков.

Google называет функцию «неявное кэширование» и говорит, что может обеспечить 75% экономию в «повторяющемся контексте», передаваемом моделям через API Gemini. Он поддерживает Google Gemini 2.5 Pro и 2,5 Flash Models.

Это, вероятно, будет желанной новостью для разработчиков, поскольку стоимость использования пограничных моделей продолжает расти.

Мы только что отправили неявное кэширование в API Gemini, автоматически обеспечивая 75% экономию средств с моделями Gemini 2.5, когда ваш запрос достигает кэша

Мы также опустили токен MIN, необходимый для удара кешам до 1K на 2,5 Flash и 2K на 2,5 Pro!

— Логан Килпатрик (@officiallogank) 8 мая 2025 года

Кэширование, широко принятая практика в отрасли искусственного интеллекта, повторно использует часто доступ к данным или предварительно вычисляемым данным моделей для сокращения требований и затрат на вычисление. Например, кэши могут хранить ответы на вопросы, которые пользователи часто задают модели, устраняя необходимость в модели воссоздать ответы на тот же запрос.

Ранее Google предлагал модель быстрого кэширования, но только явный быстрое кэширование, означающее, что разработчики должны были определить их самые высокие подсказки. В то время как экономия стоимости должна была быть гарантирована, явное быстрое кэширование обычно включало много ручной работы.

Некоторые разработчики не были довольны тем, как явная реализация Google Cacaching работала для Gemini 2.5 Pro, что, по их словам, может вызвать удивительно большие счета API. На прошлой неделе жалобы достигли лихорадки, побудив команду Близнецов извиниться и обещать внести изменения.

В отличие от явного кэширования, неявное кэширование является автоматическим. По умолчанию для моделей Gemini 2.5 он проходит по экономии средств, если запрос API Gemini на модель попадает в кэш.

Мероприятие TechCrunch

Беркли, Калифорния
|
5 июня

Забронируйте сейчас

«(W) курица, вы отправляете запрос на одну из моделей Gemini 2.5, если запрос имеет общий префикс в качестве одного из предыдущих запросов, то он имеет право на получение кэша», — объяснил Google в посте в блоге. «Мы динамически передадим вам экономию средств».

Минимальное количество токенов для подсказки для неявного кэширования составляет 1 024 для 2,5 вспышки и 2 048 для 2,5 Pro, согласно документации Google разработчика, которая не является ужасно большой суммой, что означает, что это не должно заработать на эти автоматические сбережения. Токены — это необработанные кусочки моделей данных, с которыми работают, с тысячей токенов, эквивалентных примерно 750 словам.

Учитывая, что последние претензии Google о экономии затрат от кэширования пробежали в отказе, в этой новой функции есть некоторые области покупателя. С одной стороны, Google рекомендует, чтобы разработчики сохраняли повторяющийся контекст в начале запросов, чтобы увеличить шансы неявных хитов кэша. Контекст, который может измениться от запроса к запросу, должен быть добавлен в конце, сообщает компания.

С другой стороны, Google не предложил никакой сторонней проверки, что новая неявная система кэширования обеспечит обещанную автоматическую экономию. Итак, нам придется посмотреть, что говорят ранние последователи.

Уимблдон 2025: Гарриет Дарт затронут реакцией на комментарии Лоис Боассон Дезодорант

Неделя в обзоре: Meta's AI Recruiting Blitz

Ваш комковой уголь сделан из выращенных в США лиственных пород? Эксперт исследует

Англия против Индии: Смрити Мандхана поражает сотню, так как туристы выигрывают первое T20

Мечта чемпионата мира по футболу Пола Погбы, оценивая как Monaco Transfer Complete

У Виталика Бутерина есть оговорки о мировом проекте Сэма Альтмана

AI AI ANPROPIC стал ужасным владельцем бизнеса в эксперименте, который стал «странным»

US Multinational корпорации на пути к минимальной налоговой отсрочке после сделки G7

Слияние Scottish Scottish Sparks Scottish Power Sparks Talks с OVO Energy | Денежные новости

По сообщениям, Иран запретил руководителю МАГАТО

Папа Лео смотрит на мегадоноры Мага, чтобы укрепить церковные финансы — Politico

F1 не только в Голливуде — это тоже в романтике и Booktok