DeepSeek-V4 预览版:技术报告要点速览图。
DeepSeek推出双版本大模型V4系列:旗舰版Pro(1.6T参数/49B激活参数)主打复杂任务处理,支持三种推理模式;经济版Flash(284B参数)专注性价比与高效部署。基准测试显示Pro在代码生成(93.5分)等场景媲美国际顶级模型,Flash则具备显著成本优势(海外API输入$0.14/1M)。核心技术采用混合注意力架构,使1M上下文推理算力降至27%。全系支持1M上下文、工具调用及国产
1双版本并行
🔥 DeepSeek-V4-Pro (旗舰性能)
参数规模:总参数 1.6T / 激活参数 49B
核心亮点:三种推理模式(Non-think / Think High / Think Max)。在最强计算预算下,解决复杂 Agentic 任务的能力直接逼近全球闭源顶级水平。
⚡ DeepSeek-V4-Flash (快捷经济)
参数规模:总参数 284B / 激活参数 13B
核心亮点:全面继承 Pro 版底层训练管线,主打极致性价比与极速吞吐。同享 1M 超大上下文,是企业级规模化落地与降本增效的基石。部分 Coding Agent已经可以体验。
2基准测试对抗(部分)
|
核心能力维度 |
DeepSeek-V4 Pro Max |
海外头部竞品对比 |
|---|---|---|
|
复杂代码生成 |
93.5 分 |
高于 Gemini-3.1-Pro High 的91.7 |
|
真实仓库修复 |
80.6 分 |
与 Gemini-3.1-Pro High 持平 |
|
复杂工程任务 |
55.4 分 |
低于 K2.6 思维的58.6 |
|
Agent 终端任务 |
67.9 分 |
低于 GPT-5.4 xHigh 的75.1 |
|
广义世界知识 |
87.5 分 |
与 GPT-5.4 xHigh 持平 |
|
商业部署经济性 |
极高 |
海外头部模型通常成本更高 |
3核心技术创新
- 混合注意力架构 (Hybrid Attention):
结合压缩稀疏注意力(CSA)与重度压缩注意力(HCA),在1M上下文时,推理算力直降至27%,KV Cache 需求暴降至10%。
- 流形约束超连接 (mHC):
强化残差连接,极大提升信号跨层传播保真度,提升超深层模型中信号传播稳定性,降低长链路推理中的退化风险。
- Muon优化器赋能:
替代传统 Adam 系列,在超大规模训练里获得更快的收敛速度和更高的训练稳定性。
- 模块化后训练管线:
“两阶段范式”,SFT与GRPO先培育独立专家,再通过同策略蒸馏无损熔合进基础大模型。
4官方定价
计费单位:每百万 (1M) Token。
|
模型 / 维度 |
输入 (命中缓存) |
输入 (未命中) |
输出计算 |
|---|---|---|---|
|
V4-Flash |
$0.028 |
$0.14 |
$0.28 |
|
V4-Flash |
约 0.2 元 |
约 1.0 元 |
约 2.0 元 |
|
V4-Pro |
$0.145 |
$1.74 |
$3.48 |
|
V4-Pro |
约 1.0 元 |
约 12.0 元 |
约 24.0 元 |
💡 以 V4-Flash 非缓存输入 $0.14 / 1M、输出 $0.28 / 1M 计,其 API 单价显著低于多数海外头部通用模型;但具体倍数应随对比模型和缓存命中率重新计算。
5API 使用
🌐 双兼容端点 (Endpoint):
• OpenAI 兼容: https://api.deepseek.com
• Anthropic 兼容: https://api.deepseek.com/anthropic
🏷️ 模型名称 (Model Name):deepseek-v4-pro或deepseek-v4-flash
🛠️ 全功能扩展支持:
原生支持 JSON 结构化输出 (JSON Output)、外部工具调用 (Tool Calls)、前缀补全及代码填充。
⚠️ 废弃预警:旧版deepseek-chat/reasoner将于 2026年7月24日 全面停服,过渡期内将在后端自动映射至 V4-Flash 的两种模式。
✨ 国产之光,开放生态 ✨
【算力主权】率先完成与华为昇腾(Ascend)国产AI芯片的原生适配,实质性推进“去CUDA化”,推动国产算力生态落地。
【开放生态】1.6万亿参数的完整权重在MIT 协议下开源,允许商用部署及二次开发,为企业、开发者和研究机构提供了更大的使用空间。
DeepSeek-V4 的意义,不只在于参数规模和基准成绩,更在于它展示了一条更开放、更高效、更易落地的大模型发展路径。对于企业而言,它降低了尝试先进模型能力的门槛;对于开发者而言,它提供了一个可研究、可部署、可二次开发的基模选择;对于生态而言,它也让普惠 AI 的落地多了一种现实可能。
更多推荐




所有评论(0)