Китайский стартап DeepSeek без лишнего шума открыл исходный код новой специализированной модели искусственного интеллекта, всего через день после того, как Alibaba представила третье поколение своего семейства Qwen.
Компания DeepSeek из Ханчжоу загрузила свою последнюю модель Prover-V2 с открытым исходным кодом в Hugging Face, крупнейшее в мире сообщество ИИ с открытым исходным кодом. Серия Prover компании DeepSeek состоит из предметно-ориентированных моделей, предназначенных для решения математических задач.
Компания пока не предоставила никаких подробностей о модели, которая, предположительно, построена на основе модели V3 DeepSeek и имеет 671 миллиард параметров. Разработка математической модели, которая могла бы улучшить математические возможности базовой модели общего назначения, породила предположения о том, что DeepSeek вскоре запустит дополнительные модели. Компания DeepSeek не отреагировала на просьбу прокомментировать ситуацию.