国产大模型DeepSeek V4重磅发布:参数翻2.5倍,国产化战略升级!
DeepSeek V4 重磅发布:国产大模型迎来重大升级 DeepSeek V4 正式发布,参数规模达 1.6 万亿,较 V3.2 提升 2.5 倍,性能逼近 Gemini 3.1 Pro 和 GPT-5。在知识推理(MMLU-Pro 87.5 分)、代码能力(HumanEval 98%)和 Agent 任务上表现突出,但暂不支持多模态。 定价优势:V4-Pro 输入/输出成本分别为 $1.74/
等了一年的 DeepSeek V4,终于发布了!
这一周真的是各种新模型集体爆发啊!
DeepSeek V4 这次不是简单的性能提升,是为国产化而生的一次重大升级!
先看数据:参数翻 2.5 倍
两个版本

作为对比:V3.2 总参数:671B(6710 亿),V4-Pro 参数量翻了 2.5 倍!
Benchmark:能打,但不是夯爆


知识推理类:
- SimpleQA-Verified:最强,逼近 Gemini 3.1 Pro
- MMLU-Pro:87.5 分
- Humanities-X:92.1 分,和 GPT-5、Claude Opus 4 持平
代码类:
- HumanEval:98%
- Arena 排名:第 3(GLM-5.1 第一)
- 走的是 Gemini 那一卦:竞赛、算法类强,真实工程第一梯队
Agent 能力: 相比前代模型,DeepSeek-V4-Pro 的 Agent 能力显著增强
总结: DeepSeek V4 是强者,但不是碾压者。在诸神混战的年代里,能给到"人上人"水平。
价格:涨了,但下半年会降
对比

| 模型 | 输入($/M) | 输出($/M) |
|---|---|---|
| DeepSeek V4-Pro | $1.74 | $3.48 |
| DeepSeek V4-Flash | $0.14 | $0.28 |
| Claude Opus 4.7 | $5.00 | $25.00 |
| GPT-5.5 | $5.00 | $30.00 |
虽然涨价了,但还是比海外模型平均便宜 60%!
重要细节
DeepSeek 在定价页面底部有一行小字:
“受限于高端算力,目前 Pro 的服务吞吐十分有限,预计下半年昇腾 950 超节点批量上市后,Pro 的价格会大幅下调。”
也就是,V4-Pro 现在的价格还不是最终态,等芯片产能跟上了,价格还会降!
使用渠道
普通用户
登录官网 chat.deepseek.com 或官方 App,即可直接体验
开发者
开发者 API 调用改 model 参数为 deepseek-v4-pro /deepseek-v4-flash 即可,base_url 保持不变,兼容 OpenAI 与 Anthropic 接口
API 文档
地址:
https://api-docs.deepseek.com/zh-cn/guides/thinking_mode
DeepSeek-V4 模型开源链接
地址:
https://huggingface.co/collections/deepseek-ai/deepseek-v4
地址:
https://modelscope.cn/collections/deepseek-ai/DeepSeek-V4
DeepSeek-V4 技术报告
地址:
https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro/blob/main/DeepSeek_V4.pdf
遗憾:还是没有多模态
DeepSeek V4 还是纯文本模型,没有多模态能力!
没有多模态的话,读不了图会导致审美不行,而且Computer Use 之类的 Agent 能力也没办法使用。
看来适配国产卡的压力还有非常大!
希望之后的版本可以支持多模态。
总结一下
DeepSeek V4 不是简单的版本迭代,是为国产化战略服务的重大升级。
三个值得关注的点:
- 参数翻 2.5 倍 - 从 671B 到 1.6T
- 为国产芯片优化 - MXFP4、TileLang、MegaMoE 全面适配昇腾
- 价格下半年还会降 - 等昇腾 950 超节点批量上市
最重要的是:
当算力博弈成为常态,能跑在国产芯片上的模型,才是真正有未来的模型。
说真的,这两年看着身边一个个搞Java、C++、前端、数据、架构的开始卷大模型,挺唏嘘的。大家最开始都是写接口、搞Spring Boot、连数据库、配Redis,稳稳当当过日子。
结果GPT、DeepSeek火了之后,整条线上的人都开始有点慌了,大家都在想:“我是不是要学大模型,不然这饭碗还能保多久?”
我先给出最直接的答案:一定要把现有的技术和大模型结合起来,而不是抛弃你们现有技术!掌握AI能力的Java工程师比纯Java岗要吃香的多。
即使现在裁员、降薪、团队解散的比比皆是……但后续的趋势一定是AI应用落地!大模型方向才是实现职业升级、提升薪资待遇的绝佳机遇!
这绝非空谈。数据说话
2025年的最后一个月,脉脉高聘发布了《2025年度人才迁徙报告》,披露了2025年前10个月的招聘市场现状。
AI领域的人才需求呈现出极为迫切的“井喷”态势

2025年前10个月,新发AI岗位量同比增长543%,9月单月同比增幅超11倍。同时,在薪资方面,AI领域也显著领先。其中,月薪排名前20的高薪岗位平均月薪均超过6万元,而这些席位大部分被AI研发岗占据。
与此相对应,市场为AI人才支付了显著的溢价:算法工程师中,专攻AIGC方向的岗位平均薪资较普通算法工程师高出近18%;产品经理岗位中,AI方向的产品经理薪资也领先约20%。
当你意识到“技术+AI”是个人突围的最佳路径时,整个就业市场的数据也印证了同一个事实:AI大模型正成为高薪机会的最大源头。
最后
我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。
我整理出这套 AI 大模型突围资料包【允许白嫖】:
- ✅从入门到精通的全套视频教程
- ✅AI大模型学习路线图(0基础到项目实战仅需90天)
- ✅大模型书籍与技术文档PDF
- ✅各大厂大模型面试题目详解
- ✅640套AI大模型报告合集
- ✅大模型入门实战训练
这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

①从入门到精通的全套视频教程
包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图(0基础到项目实战仅需90天)
全过程AI大模型学习路线

③学习电子书籍和技术文档
市面上的大模型书籍确实太多了,这些是我精选出来的

④各大厂大模型面试题目详解

⑤640套AI大模型报告合集

⑥大模型入门实战训练

👉获取方式:
有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

更多推荐




所有评论(0)