DeepSeek发布Prover-V2模型，参数量达6710亿，能处理复杂的数学证明-企业头条

投稿
评论
转发

DeepSeek发布Prover-V2模型，参数量达6710亿，能处理复杂的数学证明

DeepSeek今日于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模型。

据悉，DeepSeek-Prover-V2-671B使用了更高效的safetensors文件格式，并支持多种计算精度，方便模型更快、更省资源地训练和部署，参数达6710亿，或为去年发布的Prover-V1.5数学模型升级版本。在模型架构上，该模型使用了DeepSeek-V3架构，采用MoE(混合专家)模式，具有61层Transformer层，7168维隐藏层。同时支持超长上下文，最大位置嵌入达16.38万，使其能处理复杂的数学证明，并且采用了FP8量化，可通过量化技术减小模型大小，提高推理效率。

不过，新模型并不是R2。

近半个月来，有关“DeepSeek全新模型R2即将问世”的传闻持续发酵。除HuggingFace首席执行官Clément Delangue发布动态外，玩家@deedydas也在社交平台贴出了所谓DeepSeek-R2大模型的详细技术参数。

据《中国企业家》报道，过去DeepSeek创始人梁文锋率领的AI团队始终保持着与国际巨头同频的产品迭代节奏——2024年9月推出V2.5版本，12月发布V3基础架构，次年3月即升级至V3-0324版本，形成每季度重大更新的开发范式。这种紧扣行业脉搏的研发策略，使得业界普遍预测其下一代主力模型R2或将延续“五一档”发布传统。

此前就有市场消息称DeepSeek-R2将提前发布，DeepSeek官方企业咨询账号则在用户群中辟谣称R2发布为假消息。目前，DeepSeek官方尚未正式公布R2的具体日期及技术细节等，市场预期R2将于5月发布。

(科技责编：拓荒牛