Результаты поиска в Telegram по запросу DeepSeek

30 Aug, 2025 · кэш · @ai_storm/1370

03 Sep, 2025 · кэш · @glavnygroup/1470

30 Aug, 2025 · кэш · @midjourney_5/51

30 Aug, 2025 · кэш · @payzick/2291

30 Aug, 2025 · кэш · @payzick/2292

03 Sep, 2025 · кэш · @richiksoon/1824

02 Sep, 2025 · кэш · @damir_rmanpo/232

02 Sep, 2025 · кэш · @velena_d/1048

02 Sep, 2025 · кэш · @zorki_view/223

02 Sep, 2025 · кэш · @ai365ai/354

https://t.me/ai365ai/354 / 2025-09-02 19:03:10+00:00

Cogito V2 Preview Deepseek 671B — это одна из моделей искусственного интеллекта с архитектурой из 671 миллиардов параметров типа MoE (mixture-of-experts), разработанная компанией Deep Cogito. Эта модель сочетает в себе возможности гибридного рассуждения, позволяя работать как в режиме стандартной генерации текста, так и в режиме самоанализа и рассуждения, что улучшает качество и точность ответов. Основные особенности Cogito V2 Preview Deepseek 671B: - Модель относится к числу сильнейших открытых моделей в мире, сопоставима и даже превосходит по качеству последние версии DeepSeek (v3 и R1). - Использует технологию Iterated Distillation and Amplification (IDA), которая позволяет модели улучшать "интуицию" и внутренние политики рассуждения, что ведет к более коротким цепочкам рассуждений (на 60% короче, чем у DeepSeek R1). - Модель была обучена с акцентом на развитие интуиции выбора правильной траектории поиска решений и на оптимизацию процесса мышления, а не просто увеличение количества поисковых шагов. - Обладает высокой эффективностью обучения, затраты на тренинг всех моделей Cogito V2 (от 3 млрд до 671 млрд параметров) составили менее 3.5 млн долларов. - Модель доступна по открытой лицензии и может использоваться через API на платформах Together AI, Baseten, RunPod и локально через Unsloth. Поддерживает многоязычные возможности и имеет контекстную длину до 128 тысяч токенов. Таким образом, Cogito V2 Preview Deepseek 671B — это крупномасштабная передовая языковая модель со встроенными возможностями рассуждения и самоулучшения, предназначенная для достижения близости к суперинтеллекту и предназначенная для широкого коммерческого и исследовательского использования с открытым доступом к коду и моделям