Антропическая запускает новую модель искусственного интеллекта, которая «думает», пока вы хотите

Anpropic выпускает новую модель AI Frontier под названием Claude 3.7 Sonnet, которую компания разработала, чтобы «думать» о вопросах до тех пор, как этого захотят пользователи.

Антропический называет Claude 3.7 Sonnet первой в отрасли «модель гибридных рассуждений искусственного интеллекта», потому что это единственная модель, которая может дать как ответы в реальном времени, так и более рассматриваемые «продуманные» ответы на вопросы. Пользователи могут выбирать, активировать ли способности «рассуждения» модели искусственного интеллекта, которые подсказывают Sonnet Claude 3.7 «мыслить» в течение короткого или длительного периода времени.

Модель представляет собой более широкие усилия Anpropic по упрощению пользовательского опыта вокруг своих продуктов искусственного интеллекта. У большинства чат -ботов AI сегодня есть сложный сборщик модели, который заставляет пользователей выбирать из нескольких различных вариантов, которые варьируются по стоимости и возможностям. Лаборатории, такие как Антроп, предпочли бы, чтобы вам не придется думать об этом — в идеале, одна модель выполняет всю работу.

По словам Антропика, Claude 3.7 Sonnet раздается всем пользователям и разработчикам, но только люди, которые платят за планы Chatbot Premium Antropic Claude, получат доступ к функциям рассуждений модели. Бесплатные пользователи Claude получат стандартную, не взволнованную версию Sonnet Claude 3.7, которая, как утверждает Антропические утверждения, превзойдет свою предыдущую модель по границе ИИ, Claude 3.5 Sonnet. (Да, компания пропустила номер.)

Claude 3,7 Сонет стоит 3 доллара за миллион токенов (то есть вы можете ввести примерно 750 000 слов, больше слов, чем вся серия «Властелин колец», в Клод за 3 доллара) и 15 долларов за миллион токенов. Это делает его дороже, чем O3-Mini Openai (1,10 долл. США на 1 миллион входных токенов/4,40 долл. США на 1 миллион токенов выходного дня) и Ryeek's R1 (55 центов на 1 миллион входных токенов/2,19 долл. США на 1 миллион токенов), но имейте в виду, что в том, что в нем есть в виду, что введите на 1 млн. O3-Mini и R1-это строго рассуждающие модели, а не гибриды, такие как Claude 3.7 Sonnet.

Новые режимы мышления Антропика Кредиты изображения:Антроп

Claude 3.7 Sonnet — первая модель AI AI AIPIC, которая может «рассуждать», метод, который многие лаборатории искусственного интеллекта обратились к традиционным методам улучшения искусственного искусства.

Модели рассуждений, такие как O3-Mini, R1, Flash Google's Gemini 2.0, и Xai's Grok 3 (Think) используют больше времени и вычислительной мощности, прежде чем отвечать на вопросы. Модели разбивают проблемы на более мелкие шаги, что имеет тенденцию повысить точность окончательного ответа. Модели рассуждений не думают и не рассуждают, как человек, обязательно, но их процесс моделируется после вычета.

В конце концов, Антропик хотел бы, чтобы Клод выяснил, как долго он должен «думать» о вопросах самостоятельно, не нуждаясь в пользователях заранее выбирать элемент управления, продукт Anpropic и лидерство в исследованиях, Дайан Пенн, рассказала TechCrunch в интервью.

«Подобно тому, как у людей нет двух отдельных мозгов для вопросов, на которые можно ответить немедленно, по сравнению с теми, которые требуют мысли», — написал Антропик в посте в блоге, поделившимся с TechCrunch, — мы считаем рассуждения просто одну из возможностей, которые должна пограничная модель быть плавно интегрированными с другими возможностями, а не чем -то, что должно быть предоставлено в отдельной модели ».

Антропик говорит, что позволит Claude 3.7 Sonnet показать свою фазу внутреннего планирования через «видимую подушку для царапины». Пенн сказал, что пользователи TechCrunch увидят полный процесс мышления Клода для большинства подсказок, но некоторые части могут быть отредактированы в целях доверия и безопасности.

Процесс мышления Клода в приложении Claude Кредиты изображения:Антроп

Anpropic говорит, что оптимизировал режимы мышления Клода для реальных задач, таких как сложные проблемы кодирования или агентские задачи. Разработчики, поступившие с API Антрии, могут контролировать «бюджет» на мышление, скорость торговли и стоимость качества ответа.

На одном тесте для измерения задач по кодированию реального слова Swe-Bench, Claude 3,7 Sonnet был точным 62,3% по сравнению с моделью O3-Mini OpenAI, которая набрала 49,3%. На другом тесте, чтобы измерить способность модели AI взаимодействовать с моделируемыми пользователями и внешними API в розничной торговле, Tau-Bench, Claude 3.7 Sonnet набрал 81,2%по сравнению с моделью Operai, которая набрала 73,5%.

Антропик также говорит, что Claude 3.7 Sonnet откажется отвечать на вопросы реже, чем его предыдущие модели, утверждая, что модель способна провести более подробные различия между вредными и доброкачественными подсказками. Anpropic говорит, что снизил ненужные отказы на 45% по сравнению с Claude 3,5 сонета. Это происходит в то время, когда некоторые другие лаборатории искусственного интеллекта переосмысливают их подход к ограничению ответов их AI Chatbot.

В дополнение к Sonnet Claude 3.7, Anpropic также выпускает инструмент агентского кодирования под названием Claude Code. Запуск в качестве предварительного просмотра исследования, инструмент позволяет разработчикам выполнять конкретные задачи через Клода непосредственно из их терминала.

В демонстрации сотрудники антропного показали, как Claude Code может проанализировать проект кодирования с простой командой, такой как, «Объясните эту структуру проекта ». Используя простой английский в командной строке, разработчик может изменить кодовую базу. Claude Code будет описать свои изменения по мере внесения изменений, и даже тестирует проект на предмет ошибок или подтолкнуть его к репозиторию GitHub.

Claude Code изначально будет доступен для ограниченного числа пользователей на основе «первого прихода, сначала», сообщил представитель антропного антропного представителя.

Anpropic выпускает Sonnet Claude 3.7 в то время, когда лаборатории искусственного интеллекта отправляют новые модели искусственного интеллекта в головокружительном темпе. Антропик исторически принимал более методичный, ориентированный на безопасность подход. Но на этот раз компания хочет возглавить пакет.

Как долго, однако, вопрос. OpenAI может быть близок к выпуску собственной гибридной модели ИИ; Генеральный директор компании, Сэм Альтман, сказал, что она появится в «месяцах».

Previous post Старшие сотрудники Министерства юстиции сказали сотрудникам игнорировать: «Что вы делали на прошлой неделе?» Электронная почта, продвигаемое мускусом
Next post World Open: Шон Мерфи претендует на 10-й карьеру 147 перерыв в 5-0 побед над Чжоу Джинхао