2026年4月,备受期待的DeepSeek V4即将正式发布。这款由杭州深度求索公司开发的大模型,预计将首次支持多模态能力——不仅能处理文本,还能理解图像和视频。作为中国开源AI领域的领军企业,DeepSeek的每一步动作都牵动着行业的神经。
从V3.2到V4:漫长的等待
DeepSeek V3.2版本发布已经有一段时间了。此后,DeepSeek的动态似乎只剩下一些小修小补:上下文窗口扩展到100万token、API微调功能更新等,但没有新权重、没有重大功能跃升。GitHub和Hugging Face上的新仓库也趋于停滞,API更新日志的最后一条仍然停留在2025年12月1日。
这种”静默期”让外界开始猜测:DeepSeek是不是遇到了瓶颈?36氪甚至发文质疑:《DeepSeek V4迟迟不发,中国开源王者为何越来越慢?》
但事实上,DeepSeek团队一直在默默耕耘。据接近团队的人士透露,V4版本的研发工作量远超外界想象,团队正在攻克多模态融合的技术难题。
V4的核心亮点:多模态能力
据DeepSeek团队公开的研究方向,V4版本将带来以下重大突破:
首先是多模态能力的扩展。目前的DeepSeek模型主要处理纯文本,而V4将能够同时理解文本、图像和视频内容。这意味着用户可以直接上传一张图片或一段视频,让AI进行分析和解读。对于教育、医疗、设计等行业来说,这将带来革命性的应用可能。
其次是使用华为芯片进行推理。在国产化替代的大背景下,DeepSeek V4将支持使用华为昇腾芯片进行模型推理。这不仅是技术层面的突破,更具有重要的战略意义——它证明了中国在AI算力领域正在逐步摆脱对国外芯片的依赖。
第三是推理能力的进一步提升。基于V3.2版本的良好基础,V4将在逻辑推理、数学计算、代码生成等方面有显著提升。据悉,团队正在研发新的训练方法,以提升模型在复杂任务上的表现。
3月9日的”V4 Lite”
有趣的是,就在外界等待V4正式发布的时候,DeepSeek在3月9日悄悄上线了一个被社区称为”V4 Lite”的版本。这个更新没有任何公告,没有技术论文,也没有来自DeepSeek官方的说明。
但这个”静默更新”却带来了重磅功能:上下文窗口扩展到了100万token。这意味着用户可以一次性输入相当于一本长篇小说的文本量,让AI进行分析和处理。对于需要处理长文档的用户来说,这是一个巨大的福音。
这种”悄无声息”的发布方式,很符合DeepSeek团队一贯的风格——少说话,多做事。
从DeepSeek到MiMo:人才的流动
就在DeepSeek V4即将发布之际,一个有趣的消息引起了外界关注。小米公司最近推出了MiMo大模型,而其负责人罗福莉正是DeepSeek的前研究员。
罗福莉在X平台上公开认领了MiMo项目,并透露Hunter Alpha和Healer Alpha都是MiMo的早期内测版本。这一人事变动引发了业界的广泛讨论:DeepSeek的人才正在被其他科技公司”挖角”。
但对于一个快速发展的行业来说,人才的流动是正常现象。更重要的是,DeepSeek已经建立起了完善的技术体系和人才梯队,个别人员的离开不会动摇其根基。
转向Agentic AI:DeepSeek的新方向
值得注意的是,DeepSeek最新的招聘信息显示,团队正在向Agentic AI(智能体AI)方向转型。这意味着未来的DeepSeek模型将不仅仅是被动回答问题的工具,而是能够主动执行任务的智能助手。
这与OpenClaw等AI智能体的发展趋势不谋而合。可以预见,未来的AI竞争将不再局限于模型参数的比拼,而是转向谁能提供更好的智能体体验。
中国开源AI的格局
DeepSeek的崛起,标志着中国在开源AI领域已经从跟随者变成了引领者。从最初的模仿学习,到如今的自主创新,中国AI企业正在走出一条属于自己的道路。
但挑战依然存在。如何保持技术领先?如何建立可持续的商业模式?如何应对国际竞争?这些都是DeepSeek乃至整个中国AI产业需要思考的问题。
写在最后
DeepSeek V4的发布,不仅是一次产品更新,更是中国开源AI发展的一个重要里程碑。它代表着中国AI企业在技术创新上的持续投入,也预示着多模态大模型时代的到来。
4月,让我们拭目以待。
