在这里插入图片描述

“V4什么时候来?”

这个问题从2026年1月开始,已经折磨了AI圈整整三个月。一月的“春节前后”,二月的“2月中旬”,三月的“本周上线”——一次次把开发者吊到嗓子眼,又一次次落空。

直到4月8日深夜,DeepSeek网页端悄悄更新了。“快速模式”和“专家模式”,一个闪电标,一个钻石标,就这样毫无预告地出现在了输入框上方。

这场为期三个月的“狼来了”大戏,终于迎来了第一缕真正的曙光。

深夜更新、灰度测试、页面崩溃——这一切信号都在说明一件事:V4真的不远了。

但今天我想聊的,不只是V4有多强。我想聊的是:V4之后,AI行业会变成什么样?

因为V4的价值,从来就不止于技术参数本身。

一、为国产算力量身定制:V4的“换芯”决策有多硬核?

在这里插入图片描述

灰度测试消息传出的同时,另一条更劲爆的消息在技术圈炸开了锅。

据《The Information》报道,DeepSeek在V4发布前夕,未按行业惯例将预发布版本交付英伟达、AMD等美国芯片巨头进行优化,而是选择将优先测试机会提供给华为等国内供应商。DeepSeek已直接与华为及寒武纪合作,协助重写模型底层代码。

V4的底层代码已从英伟达CUDA框架全面迁移至华为自研CANN框架,全面基于华为昇腾芯片完成适配与优化。

这不是一次常规的芯片适配。这是一次“换心脏”级别的手术。

而这次换芯的代价,是DeepSeek亲自推迟了V4的发布计划。据内部人士透露,如果只做英伟达版本,V4本可以在更早的时间上线,但DeepSeek选择了等待国产芯片生态的成熟。

为什么DeepSeek愿意为此推迟发布?

算一下这组数字就知道了:2025年中国AI加速服务器市场中,本土芯片厂商的市占率已攀升至约41%,华为昇腾以81.2万张出货量占据国产芯片总出货量的近一半。阿里、字节、腾讯已提前向华为下单数十万颗昇腾芯片。

更重要的是,这不仅是商业选择,更是战略卡位。当中国互联网巨头和AI创业公司都开始用国产算力,DeepSeek的模型生态就站在了这波国产替代浪潮的最前端。如果V4跑顺了,就等于给国产AI芯片阵营发了一张“质量保证”的合格证。

对一个想当AI“水电煤”的公司来说,这个战略价值,值得等这三个月。

而昇腾950PR的算力参数也确实撑得起这份等待:FP8精度下1 PFLOPS,是英伟达H20的2.87倍,搭载华为自研高带宽内存HiBL,容量112GB,带宽1.4TB/s。

二、开发者最关心的事:V4性能到底如何?

在这里插入图片描述

当然,对于开发者来说,“为国争光”这件事没那么重要,重要的是:模型到底能不能打?

2.1 专家模式的实测结果:物理仿真吊打快速版

灰度测试中,“专家模式”很可能是V4正式版的预览形态。有网友让快速模式和专家模式分别编写物理仿真程序,模拟球在旋转六边形内弹跳,且要求程序中的球体运动需受重力和摩擦力影响。结果显示,专家模式给出的程序运行结果更符合物理直觉,落点精准,弹跳轨迹也更加真实,快速模式的表现则逊色不少。

有媒体用经典逻辑题“洗车店离我家50米,开车去还是走路去?”进行测试,专家模式的回答明显更具幽默感和深度思考。

物理仿真、逻辑推理、创意写作——凡是需要深度推理的场景,专家模式都有明显优势。简单任务上,两个模式的差异确实有限。

另有网友测试发现,目前专家模式尚不支持文件上传,这意味着完整的多模态功能可能还在路上。

2.2 泄露的基准测试数据:开源模型首次接近闭源旗舰

虽然官方尚未公布完整基准测试,但根据多方泄露的信息,V4的性能数据相当惊人。

MMLU-Pro达到89.7分,比GPT-5的90.2分仅差0.5分,但V3只有82.3分,提升了7.4个百分点。SWE-Bench Verified方面,泄露信息显示V4达到83.7%,超过了Claude Opus 4.5(80.9%)和GPT-5.2(80%)。HumanEval代码生成测试达到约90%,Claude是88%,GPT-4是82%,国产大模型编程能力首次超越硅谷头部玩家。

这组数据的意义在于:开源模型的能力,第一次真正进入了闭源旗舰的射程。 不再是“追赶”,而是“同台竞技”。

三、成本革命:从1亿美元到560万美元的“降维打击”

在这里插入图片描述

如果说性能是V4的A面,那么成本就是它的B面——而这面,才是真正可能重塑整个行业格局的杀招。

3.1 训练成本:只有OpenAI的5%

V3的训练成本是560万美元。GPT-4的训练成本据报超过1亿美元。将近20倍的差距。

V4是万亿参数模型,但DeepSeek延续了MoE路线的核心优势:总参数1万亿,但推理时仅激活约370亿参数,推理成本与V3基本持平,但能力翻倍。基于DeepSeek的一贯策略,V4预计延续MIT许可,允许商业使用和自由修改。

这不是“技术小步快跑”,这是成本数量级的碾压

3.2 推理成本:用“几分钱”做“几块钱”的事

根据官方定价:输入$0.30/百万token,输出$0.50/百万token,缓存命中输入仅$0.03/百万token(90%折扣),夜间时段(北京11PM-7AM)所有Token再享50%折扣。

横向对比,GPT-4输出$2.5/百万token,Claude Opus 4.5输出$15/百万token。V4的输出价格大约是Claude的1/30。在这个定价下,一个开发者月消耗200万token的场景,成本从Claude的数千美元降到了几十美元。

把V4跑在生产环境里,核心业务每日处理10万token,月账单仅约9美元。V3的缓存命中率已证明可以稳定维持在65-70%,系统指令和工具定义保持不变时成本自动降低。AI的成本正在从“资本性支出”变成“运营性支出”的下限。

这意味着什么?意味着过去只有大公司敢做的AI应用,现在个人开发者也能玩了。

3.3 部署门槛:从数据中心降到消费级显卡

V4可以在双RTX 4090上本地运行,在MIT许可下开源权重。部署成本从传统1T模型的约8万美元,降到了3000美元(双RTX 4090)。降低了96%

这还不是最夸张的。Engram技术将静态知识存储从昂贵的神经网络计算中剥离,转向O(1)复杂度的确定性查找,在百万token“大海捞针”测试中,V4的检索准确率达到了97%,传统注意力机制仅为84.2%。查算分离后,部署成本甚至可降至约1200美元。

四、从“工具”到“生态”:V4的第三战场

在这里插入图片描述

V4要做的,从来不只是一次技术迭代。

4.1 三模并进:不只是一个模型,而是一套产品矩阵

根据灰度测试的界面推测,DeepSeek正在构建的不只是一个模型,而是一套分层清晰的模型体系:DeepSeek V4 Lite(快速版)针对日常对话优化,即时响应;DeepSeek V4(专家版)旗舰复杂推理,支持深度思考;DeepSeek V4 Vision(视觉版)独立多模态,专攻图像理解。报道称,DeepSeek还在同时开发至少两款完全基于国产AI芯片训练的大模型。

4.2 从聊天机器人走向“AI Agent”

DeepSeek过去在Agent领域几乎没有投入,消费端仅限于Chatbot,产品团队约几十人。V4发布后,战略方向正在发生明显转向。

“晚点LatePost”评价认为,V4大概率仍是开源最强,但“很难是碾压级的强”。因为不同场景的开发者对“强”的标准已经越来越多元。更重要的是,进入Agent时代后,产品触达和长尾使用数据变得比单纯的benchmark分数更重要。招聘信息也开始首次明确提及Agent方向的产品经理,要求“熟悉并广泛使用Claude Code、OpenClaw等知名Agent”。

DeepSeek正在从“训练模型的实验室”走向“提供Agent能力的平台”。 而这个转型,比发布一个更强的模型本身更有想象力。

五、当模型百花齐放,你需要的是“连接器”

就在各家模型厂商争相发布新模型的时候,一个问题也随之而来:模型越来越多,我怎么管理所有API?

每个厂商都有不同的API Key、不同的计费方式、不同的调用接口。想同时用Gemma 4做文本、GPT-5.4做代码、Kimi K2.5做长文档分析,你得注册三个账号、充值三次、写三套适配代码。

这就是向量引擎的价值所在。
地址:https://178.nz/dn
保姆级教程https://www.yuque.com/nailao-zvxvm/pwqwxv

六、AI应用爆发的临界点

在这里插入图片描述

当模型的成本降下来、性能提上去、国产芯片生态成熟,AI的商业化就不再是“少数人的游戏”。

6.1 从“概念验证”到“生产级部署”

过去两年,AI行业有一个巨大的悖论:模型很强,但落地很难。

问题不在模型本身,而在模型之外的配套——API不稳定、成本不可控、部署门槛高、合规风险大。

V4带来的变化是:本地可部署(数据不出境)、价格够低(个人开发者也能承受)、性能够强(开源模型接近闭源旗舰)。这意味着,AI应用可以真正从“Demo”走向“产品”了。

6.2 价格战、国产化、Agent化

2026年的AI行业有三个清晰的趋势:一是价格战,开源模型价格持续下探,闭源模型面临巨大压力;二是国产化,从芯片到模型的全栈自主可控正在加速;三是Agent化,AI从聊天助手变成可以执行任务的“数字员工”。

V4恰好站在这三个趋势的交汇点上:它很便宜、它是国产化的代表、它正在往Agent方向走。当一个模型同时卡住这三个身位,它就有可能成为整个行业的基础设施。

6.3 谁的“基础设施”之争

OpenAI想用ChatGPT当AI时代的Windows,Google想用Gemini当Android。而DeepSeek和国产厂商们在做的事情更底层——用更低的价格、更开放的生态、更自主可控的算力,把AI变成一个“公共服务”,就像水和电一样——基础设施不一定要最先进,但一定要最普及。

V4真正的意义,或许不是“打败GPT”,而是把AI从“贵族玩具”变成了“日常工具”

而这,才是这个行业真正的分水岭。

Logo

作为“人工智能6S店”的官方数字引擎,为AI开发者与企业提供一个覆盖软硬件全栈、一站式门户。

更多推荐