Cogito V2 Preview Deepseek 671B — это одна из моделей искусственного интеллекта с архитектурой из 671 миллиардов параметров типа MoE (mixture-of-experts), разработанная компанией Deep Cogito. Эта модель сочетает в себе возможности гибридного рассуждения, позволяя работать как в режиме стандартной генерации текста, так и в режиме самоанализа и рассуждения, что улучшает качество и точность ответов.
Основные особенности Cogito V2 Preview Deepseek 671B:
- Модель относится к числу сильнейших открытых моделей в мире, сопоставима и даже превосходит по качеству последние версии DeepSeek (v3 и R1).
- Использует технологию Iterated Distillation and Amplification (IDA), которая позволяет модели улучшать "интуицию" и внутренние политики рассуждения, что ведет к более коротким цепочкам рассуждений (на 60% короче, чем у DeepSeek R1).
- Модель была обучена с акцентом на развитие интуиции выбора правильной траектории поиска решений и на оптимизацию процесса мышления, а не просто увеличение количества поисковых шагов.
- Обладает высокой эффективностью обучения, затраты на тренинг всех моделей Cogito V2 (от 3 млрд до 671 млрд параметров) составили менее 3.5 млн долларов.
- Модель доступна по открытой лицензии и может использоваться через API на платформах Together AI, Baseten, RunPod и локально через Unsloth.
Поддерживает многоязычные возможности и имеет контекстную длину до 128 тысяч токенов.
Таким образом, Cogito V2 Preview Deepseek 671B — это крупномасштабная передовая языковая модель со встроенными возможностями рассуждения и самоулучшения, предназначенная для достижения близости к суперинтеллекту и предназначенная для широкого коммерческого и исследовательского использования с открытым доступом к коду и моделям