您当前的位置:国联资源网 > 行业报告 > 传媒行业报告 > DeepSeek 近期成果分析及V4影响力预测

[传媒]DeepSeek 近期成果分析及V4影响力预测

报告来源:北京国联视讯信息技术股份有限公司 发布时间:2026-01-29

  • PDF版价格:0.00元/篇
  • 编  号:HYBG202601290001
  • WORD版价格:0.00元/篇
  • 完成日期:2026-01-29
  • 关键字:DeepSeek模型

The Information报道,DeepSeek将在2026年2月中旬推出新一代旗舰AI模型 DeepSeek V4,V4编码能力超越Claude和GPT系列。我们认为V4对标预期中在2025年5月发布的R2模型。

2026年1月12日,DeepSeek论文聚焦分配的稀疏化方案,引入了名为“Engram”的条件记忆模块,明显改善了模型性能,成为MOE的重要补充。同时通过对计算与内存的解耦,缓解了当前GPU内存受限的困境,有望大幅缓解国产AI芯片厂商HBM被卡脖子的境况。

2026年1月1日,DeepSeek论文提出了名为mHC的新网络架构,解决信息的流动。mHC架构是建立在此前字节发布的HC基础上,重点改进了ResNet架构信息通道宽度受限、增加的计算冗余和内存占用的问题。在MoE模型上,mHC使得模型训练的收敛速度提升了约1.8倍。

DeepSeek在模型DeepSeek-OCR和DeepSeek-OCR2中,将视觉作为文本压缩媒介的新方法,将文本以图片的方式进行输入,可以极大减少输入所需要的token数量,解决长文本输入问题。

2026年1月4日,DeepSeek更新了R1论文,从22页增加到了86页,让业界对V4的发布充满了更多的期待。根据论文的成本数据,R1的总训练成本为586万美元,远低于顶级模型训练动辄千万美元的门槛,其中预训练和后训练分别占总成本的95%和5%。

结合DeepSeek当前的研究成果,我们给出V4潜在的创新方向的猜想和影响力预测:

(1)模型成本的降低,有望较大缓解地目前国内缺芯的状况。

(2)继续开源路线,同时模型能力超越闭源模型。有望深刻改变海外AI产业的发展格局,利好AI应用的落地。

(3)基于独立于transformer的全新架构。这意味着V4将带来里程碑意义的技术突破,开启大模型发展的新范式,帮助人类更快地通往AGI。

(4)与国产芯片进一步的深度融合,可能部分或全部采用国产芯片进行训练,利好国产算力的生态建设。

风险提示:国际局势的不确定性;海外AI产业竞争格局变化带来市场调整风险。

公众号

小程序

在线客服