
Новая компания, Deep Cogito, появилась из Stealth с семейством открытых доступных моделей искусственного интеллекта, которые можно переключаться между «рассуждениями» и необработанными режимами.
Модели рассуждений, такие как OPE OPE, показали большие перспективы в таких областях, как математика и физика, благодаря их способности эффективно проверять себя фактами, выполняя сложные проблемы шаг за шагом. Однако эти рассуждения стоят за счет: более высокие вычисления и задержка. Вот почему лаборатории, такие как Anpropic, преследуют «гибридные» модельные архитектуры, которые сочетают в себе компоненты рассуждений со стандартными, не ведущими элементами. Гибридные модели могут быстро ответить на простые вопросы, проводя дополнительное время, учитывая более сложные запросы.
Все модели Deep Cogito, называемые Cogito 1, являются гибридными моделями. Cogito утверждает, что они превзошли лучшие открытые модели того же размера, включая модели Meta и китайского запуска AI DeepSeek.
«Каждая модель может ответить непосредственно (…) или саморефлексировать перед ответом (например, модели рассуждений)»,-объяснила компания в посте в блоге. «(Все) были разработаны небольшой командой примерно через 75 дней».
Модели Cogito 1 варьируются от 3 миллиардов параметров до 70 миллиардов параметров, и Cogito говорит, что модели в диапазоне до 671 миллиарда параметров присоединятся к ним в ближайшие недели и месяцы. Параметры примерно соответствуют навыкам решения проблем, причем больше параметров, как правило, лучше.
Cogito 1 не был разработан с нуля, чтобы быть ясным. Deep Cogito, построенный на вершине Meta's Open Llama и модели Alibaba QWEN, чтобы создать свои собственные. Компания заявляет, что применяла новые подходы к обучению, чтобы повысить производительность базовых моделей и обеспечить возможность обоснования.
Согласно результатам внутреннего сравнительного анализа Cogito, крупнейшей модели Cogito 1, Cogito 70B, с рассуждением превосходит модель рассуждения Deepseek R1 по нескольким математике и оценке языка. Cogito 70b с рассуждением отключений также затмивает недавно выпущенную Meta Meta's Llama 4 Scout Model на Livebench, общем тесте AI.
Каждая модель Cogito 1 доступна для загрузки или использования с помощью API на облачных поставщиках Fireworks AI и вместе с AI.

«В настоящее время мы все еще находимся на ранних стадиях (нашей) масштабирующей кривой, используя лишь часть вычислительных веществ, обычно зарезервированных для традиционного пост с большим языком модели/продолжения обучения», — написал Cogito в своем блоге. «Двигаясь вперед, мы расследуем дополнительные подходы после тренировки для самосовершенствования».
Согласно заявкам в штате Калифорния, Deep Cogito, базирующаяся в Сан-Франциско, была основана в июне 2024 года. На странице компании LinkedIn перечислены два соучредителя, Дришан Арора и Дхрув Малхотра. Малхотра ранее был менеджером по продуктам в Google AI Lab DeepMind, где он работал над технологией генеративного поиска. Арора была старшим инженером -программистом в Google.
Глубокий Cogito, покровители которых включают в себя South Park Commons, по словам Pitchbook, амбициозно стремится построить «общую суперинтеллигентность». Основатели компании понимают, что фраза означает ИИ, который может выполнять задачи лучше, чем большинство людей, и «раскрыть совершенно новые возможности, которые мы еще представляли».