DeepSeek 近期成果分析及V4影响力预测

报告来源：北京国联视讯信息技术股份有限公司发布时间：2026-01-29

The Information报道，DeepSeek将在2026年2月中旬推出新一代旗舰AI模型 DeepSeek V4，V4编码能力超越Claude和GPT系列。我们认为V4对标预期中在2025年5月发布的R2模型。

2026年1月12日，DeepSeek论文聚焦分配的稀疏化方案，引入了名为“Engram”的条件记忆模块，明显改善了模型性能，成为MOE的重要补充。同时通过对计算与内存的解耦，缓解了当前GPU内存受限的困境，有望大幅缓解国产AI芯片厂商HBM被卡脖子的境况。

2026年1月1日，DeepSeek论文提出了名为mHC的新网络架构，解决信息的流动。mHC架构是建立在此前字节发布的HC基础上，重点改进了ResNet架构信息通道宽度受限、增加的计算冗余和内存占用的问题。在MoE模型上，mHC使得模型训练的收敛速度提升了约1.8倍。

DeepSeek在模型DeepSeek-OCR和DeepSeek-OCR2中，将视觉作为文本压缩媒介的新方法，将文本以图片的方式进行输入，可以极大减少输入所需要的token数量，解决长文本输入问题。

2026年1月4日，DeepSeek更新了R1论文，从22页增加到了86页，让业界对V4的发布充满了更多的期待。根据论文的成本数据，R1的总训练成本为586万美元，远低于顶级模型训练动辄千万美元的门槛，其中预训练和后训练分别占总成本的95%和5%。

结合DeepSeek当前的研究成果，我们给出V4潜在的创新方向的猜想和影响力预测：

(1)模型成本的降低，有望较大缓解地目前国内缺芯的状况。

(2)继续开源路线，同时模型能力超越闭源模型。有望深刻改变海外AI产业的发展格局，利好AI应用的落地。

(3)基于独立于transformer的全新架构。这意味着V4将带来里程碑意义的技术突破，开启大模型发展的新范式，帮助人类更快地通往AGI。

(4)与国产芯片进一步的深度融合，可能部分或全部采用国产芯片进行训练，利好国产算力的生态建设。

风险提示：国际局势的不确定性;海外AI产业竞争格局变化带来市场调整风险。

联系方式

400-0087-010转0

行业导航

[传媒]DeepSeek 近期成果分析及V4影响力预测