Новые модели AI AI от Anpropic могут рассуждать на многих этапах

Во время первой конференции разработчиков в четверг Anpropic выпустила две новые модели искусственного интеллекта, которые, по крайней мере, одни из лучших отрасли, по крайней мере, с точки зрения того, как они забивают по популярным показателям.

Claude Opus 4 и Claude Sonnet 4, часть нового семейства моделей Anpropic, Claude 4, могут проанализировать крупные наборы данных, выполнять задачи с длинными горы и предпринять сложные действия, по данным компании. По словам Антрии, обе модели были настроены на хорошо выполнять задачи по программированию, что делает их хорошо для написания и редактирования кода.

Как платящие пользователи, так и пользователи бесплатных приложений компании получат доступ к Sonnet 4, но только платящие пользователи получат доступ к Opus 4. Для API API Anpropic через Amazon Bedrock Platform и Google Vertex AI, Opus 4 будет стоить 15 долларов США/75 долларов на токенс (вход/выход) и Sonnet 4 за 3 доллара США за миллион (вход/выход).

Токены — это необработанные биты данных, с которыми работают модели ИИ, причем миллион токенов эквивалентны около 750 000 слов — примерно на 163 000 слов длиннее «войны и мира».

Антропический Клод 4 — **Кредиты изображения:**Антроп

Модели Anpropic Claude 4 прибывают, поскольку компания стремится существенно увеличить доход. Как сообщается, наряд, основанный бывшими исследователями Опеная, направлена на получение доходов в размере 12 миллиардов долларов в 2027 году, по сравнению с прогнозируемыми 2,2 миллиарда долларов в этом году. Антропик недавно закрыл кредитную линию в размере 2,5 млрд. Долл. США и собрал миллиарды долларов от Amazon и других инвесторов в ожидании растущих затрат, связанных с разработкой пограничных моделей.

Соперники не позволяли легко поддерживать полюсную позицию в гонке искусственного интеллекта. В то время как Anpropic запустила новую флагманскую модель искусственного интеллекта в начале этого года, Claude Sonnet 3.7, наряду с агентным инструментом кодирования под названием Claude Code, конкурентами, включая Openai и Google, участвовали в том, чтобы превзойти компанию с мощными моделями и собственными инструментами разработчиков.

Антроп играет за Keeps с Claude 4.

По словам Антропика, более способные к двум моделям, представленным сегодня, Opus 4 может поддерживать «сосредоточенные усилия» на многих этапах рабочего процесса. Между тем, Sonnet 4, разработанный как «замена погружения» для сонета 3.7, улучшается в кодировании и математике по сравнению с предыдущими моделями Anpropic и более точно следует инструкциям, по данным компании.

Семья Claude 4 также реже, чем сонет 3.7, чтобы участвовать в «взломе вознаграждения», утверждает антроп. Взлом награды, также известная как Specization Gaming, представляет собой поведение, в котором модели принимают ярлыки и лазейки для выполнения задач.

Чтобы быть ясным, эти улучшения не дали мирового лучший модели по каждому тесту. Например, в то время как Opus 4 бьет Google Gemini 2.5 Pro и Openai's O3 и GPT-4.1 на проверке SWE-Bench, которая предназначена для оценки способностей кодирования модели, он не может превзойти O3 по мультимодальной оценке MMMU или Diamond GPQA, набору биологических вопросов, связанных с физическими и химическими, ими, обращенными к химии.

Тем не менее, Anpropic выпускает Opus 4 под более строгими гарантиями, включая усиленные вредные детекторы контента и защиту кибербезопасности. Компания утверждает, что его внутреннее тестирование обнаружило, что Opus 4 может «существенно увеличить» способность кого-то с фонами ствола получать, производить или развернуть химическое, биологическое или ядерное оружие, достигая спецификации модели «ASL-3» Антропика.

По словам Антропика, как Opus 4, так и Sonnet 4 являются «гибридными» моделями-способными к почти мгновенным ответам и расширенным мышлениям для более глубоких рассуждений (в той степени, в которой ИИ может «рассуждать» и «думать», как люди понимают эти понятия). При включении режима рассуждений моделям может потребоваться больше времени, чтобы рассмотреть возможные решения заданной проблемы, прежде чем отвечать.

По словам Антропика, как и модели, они покажут «удобное для пользователя» резюме своего мыслительного процесса. Почему бы не показать все это? Частично для защиты «конкурентных преимуществ» Антрии компания признается в проекте блога, предоставленного TechCrunch.

Opus 4 и Sonnet 4 могут использовать несколько инструментов, таких как поисковые системы, параллельно и чередуются между рассуждениями и инструментами для улучшения качества их ответов. Они также могут извлекать и сохранять факты в «памяти», чтобы более надежно выполнять задачи, создавая то, что Антропическое описывает как «молчаливое знание» с течением времени.

Чтобы сделать модели более удобными для программиста, Anpropic разворачивает модернизацию вышеупомянутого кода Клода. Claude Code, который позволяет разработчикам выполнять конкретные задачи через модели Anpropic непосредственно из терминала, теперь интегрируется с IDES и предлагает SDK, который позволяет разработчикам соединять его со сторонними приложениями.

Claude Code SDK, объявленный ранее на этой неделе, позволяет запустить Claude Code в качестве подпроцесса в поддерживаемых операционных системах, предоставляя способ создать помощников и инструменты для кодирования с AI, которые используют возможности Claude Models.

Anpropic выпустила расширения и разъемы Claude Code для кода Microsoft VS, Jetbrains и GitHub. Разъем GitHub позволяет разработчикам пометить Claude Code, чтобы ответить на отзыв рецензента, а также пытаться исправить ошибки — или иным образом изменить — код.

Модели ИИ по -прежнему пытаются кодировать качественное программное обеспечение. ИИ, генерирующий код, имеет тенденцию вводить уязвимости и ошибки в области безопасности из-за недостатков в таких областях, как способность понимать логику программирования. Тем не менее, их обещание повысить производительность кодирования заставляет компаний — и разработчиков — быстро их принять.

Антропический, остро зная об этом, обещает более частые модели обновлений.

«Мы (…) переходим к более частым модельным обновлениям, обеспечивая постоянный поток улучшений, которые быстрее обеспечивают прорывные возможности для клиентов», — написал стартап в своем проекте. «Этот подход удерживает вас на переднем крае, поскольку мы непрерывно усовершенствоваем и улучшаем наши модели».

Трамп говорит, что не будет называть Вальц о стрельбе из Миннесоты законодателя, называет губернатора «разбитым»

23andme оштрафован миллионы наблюдений Великобритании за «глубоко разрушительный» кибер -атаку | Наука, климат и технические новости

Sword Health Nabs 40 млн. Долл. США за 4 млрд. Долл. США, продвигает планы IPO не менее 2028 года

Трамп хлопает ЕС из -за «несправедливого» торгового предложения — Politico

Федеральный судья сбивает с толку Трамп, гранты NIH Medical Research, связанные с разнообразием, пол

Собственность, новое приложение для социальных сетей, направлено на токенизация экономики создателя

Xai от Elon Musk приближается к 9,3 млрд. Долл. США.

Оуэн Фаррелл: бывший капитан Англии, чтобы «любить каждую минуту» возвращения сарацинов

Сенатор Тина Смит противостоит сенатору Майку Ли из -за «жестокого» поста о стрельбе по законодательству Миннесоты

Сенат Республиканская партия заплавляет ядерную и геотермальную энергию, забивая ветер и солнечную энергию

Чиновники ФРС остались в «неудобной чистилище», поскольку тарифы усложняют решение о ставке этой недели

Тепловая энергия — это золото для глобальной конкурентоспособности Европы — Politico