当余承东喊出“我的字典里没有第二”，大模型战场已进入“华为时间”

何玺

20人浏览 · 2026-06-20 19:58:21

何玺 · 2026-06-20 19:58:21 发布

出品 | 何玺

排版 | 叶媛

2026年，华为开发者大会。余承东正式对外宣布接手华为盘古大模型团队。

余承东在发布会上表示“去年国庆节前夕，公司又让我来负责这个大模型，我会带领团队一路赶超，我的字典里没有第二、只有第一。我们会从中国第一，走向将来的世界第一。”

这段发言背后，是一个正在加速兑现的承诺。

就在不久前，深圳河套学院联合哈尔滨工业大学（深圳）、深圳市大数据研究院及华为团队，依托昇腾910C国产AI算力集群，成功完成了1.6万亿参数大模型DeepSeek-V4-Pro的全参数后训练。消息一出，南华早报等海外主流科技媒体第一时间跟进，称这一进展标志着在美国制裁持续收紧的背景下，中国半导体行业正努力从支持基础AI推理，迈向更复杂的模型训练阶段。

紧接着，鸿蒙7正式发布，将百亿参数级别的盘古大模型6.0直接嵌入系统内核，实现了端侧AI的本地部署。这已不再是“手机能用AI”，而是“系统本身就已是AI”。

这两件事在时间上紧密相连——昇腾证明了国产算力能“训练”世界级大模型，鸿蒙证明了国产系统能“运行”世界级大模型。两者相加，指向一个清晰的事实：大模型的竞争规则正在发生根本性变化。

当AI能力被固化到操作系统层面，竞争就不再是单一技术的比拼，而是“成本-规模-场景”三角效率的全面较量。谁能在这一三角中建立有效闭环，谁就能在下一阶段占据主动。余承东的底气，来自华为独一无二的全栈能力——从昇腾芯片到盘古模型，从鸿蒙OS到6600万台终端，这条链路构成的系统性优势，正在将大模型竞争带入一个全新的维度。

战局切换：大模型竞争进入“效率为王”新阶段

余承东喊出“没有第二”的时间点，恰好踩在大模型竞争逻辑切换的临界点上。

过去两年，大模型竞争的主战场是“参数竞赛”——谁的模型更大、谁的跑分更高，谁就是赢家。但这一逻辑正在失效。当前国内大模型API主力价格已降至极低水平：DeepSeek Flash版输入仅1元/百万Token，缓存命中时更是压到0.02元；华为云MaaS平台也按照实际使用的Tokens数量进行计费。大部分厂商的API定价贴着甚至低于成本线，整个行业仍处于“以规模换市场”的投入期。

字节2025年AI相关研发投入超千亿，阿里云AI收入增速虽快但模型成本同步上涨——这是新技术商业化早期的正常现象，但也说明单一的技术领先已不足以支撑可持续的商业模型。当技术能力的差距逐渐收窄，竞争的焦点正在从“谁的技术更先进”转向“谁的商业化路径更可持续”。

在这一背景下，DeepSeek划下了一道新的基准线。2026年4月，DeepSeek V4正式发布，其官方技术文档中首次将华为昇腾与英伟达并列写入硬件验证清单。多位业内人士指出，DeepSeek V4基于华为昇腾实现全栈适配，标志着国产大模型和国产算力芯片已经打通了从训练到部署的全流程，验证了万亿参数模型在国产算力架构下落地的可行性。

这一步的意义远超一次技术适配。它证明了国产算力路线是可行的——不仅可行，而且可以支撑世界级的大模型训练与推理。而这也意味着，任何想在算力成本上获得长期优势的玩家，都必须认真考虑切换到国产算力平台的可能性。

与此同时，2025-2026年算力成本持续上涨，行业整体面临“成本通胀”压力。谁能在算力利用效率上持续优化，谁就能在长期竞争中拥有更大的定价空间和商业弹性。

余承东接手盘古，恰好站在了这场范式转移的起点。他面对的不是一个“从零开始”的战场，而是一个“规则正在被重写”的战场——而华为，恰恰是这个新规则最有可能的定义者。

华为的三层优势：算力自主、终端规模、场景闭环

当战局转向效率竞赛，华为在“软硬芯云”全栈能力上的多年积累，正在转化为独特的系统性优势。

华为拥有从芯片（昇腾AI芯片）、模型（盘古大模型）、操作系统（鸿蒙OS）到终端（海量设备）的全链路自主能力。这套体系在“成本-规模-场景”三角中，形成了难以复制的系统级优势。

算力自主：决定成本结构的基础层。

昇腾910C与盘古模型的深度协同，是这套体系的第一块基石。华为HDC 2026上发布的openPangu 2.0，深度适配昇腾算力，单卡吞吐率达到业内主流开源模型的2倍。盘古模型在运行智能体任务时，具备速度更快、精度更高、资源消耗更低的优势。

更重要的是，昇腾910C已经完成了“实战验证”——1.6万亿参数大模型的全参数后训练，算力利用率突破30%。此次实践为全球第三方机构在国产算力平台上完成该级别模型训练积累了重要经验，也印证了国产AI芯片可支撑世界级超大参数模型训练工作。在“算力即成本”的时代，拥有自主算力意味着从源头决定了成本竞争力的起点。

终端规模：决定落地速度的通道层。

鸿蒙生态的终端设备数量已突破6600万台，这构成了盘古大模型最直接的落地通道。鸿蒙7将百亿参数的盘古大模型直接嵌入系统内核，采用Agent亲和系统架构与鸿蒙智能体框架2.0，复杂任务成功率超过90%。

这意味着盘古的能力可以天然触达海量用户，而不需要经历“下载App→注册→付费”的转化漏斗。对于开发者而言，在鸿蒙上开发Agent化应用可以直接调用系统级AI能力，开发效率和用户体验远超独立App。据接近华为的内部人士透露，余承东被任正非钦点负责AI后，两大当务之急正是“捋顺华为昇腾算力平台相关业务，顺利实现对英伟达的替代”和“推进大模型的技术攻关和商业化落地”。

场景闭环：决定收入质量的商业层。

华为与三大运营商的深度绑定，可将AI算力以“套餐”形式触达用户，有效降低付费门槛。政企市场方面，国产自主方案的信任优势形成天然壁垒——在政策导向下，核心行业的AI应用会优先考虑国产自主方案，华为是最大的受益者。

华为已形成“终端硬件+运营商包月+政企服务”三条同时运转的变现通道。与其他厂商仍在探索如何让用户为AI付费不同，华为的商业模式天然嵌入了用户的日常使用场景——用户为终端买单时，AI能力已经包含其中；用户选择运营商套餐时，AI算力已成为选项之一。

在外部环境存在不确定性的背景下，华为是少数几家不需要依赖外部算力的中国AI企业。这使得华为在AI战略的长期执行上拥有更高的确定性和主动权。余承东坦言，自己留的算力数量非常有限，因为大量算力支持了国内其他企业的需求——这句话的另一面是，华为的算力平台已经成为中国AI产业的基础设施之一。

大模型竞争格局的多元化演进：各有所长，路径不同

华为的崛起并不意味着其他玩家的退场。相反，每家厂商正在基于自身的禀赋寻找差异化的路径。

字节跳动在C端流量与产品能力上持续深耕。豆包拥有国内最大的C端AI用户基础，在产品迭代和用户体验上有深厚积累，其“流量+AI”的路径在用户规模上形成了明显优势。阿里巴巴在云+AI的B端纵深上优势明显——阿里云在国内公有云市场占据领先地位，通义大模型与云业务的协同效应突出，B端客户资源和行业解决方案能力是其核心竞争力。腾讯则走场景驱动的差异化路径：微信、企业微信、腾讯会议等应用场景为混元大模型提供了独特的落地土壤，强调“Co-Design”的路径让AI能力更贴近用户真实需求。

华为的竞争力则体现在从芯片到终端的全链路协同。这种“系统级”优势，使得华为在算力成本控制和商业化效率上具备独特的竞争力。与其他厂商在应用层、模型层或云层的竞争不同，华为的差异化定位是“软硬芯云”一体化的全栈整合。

值得注意的是，华为对openPangu 2.0的开源力度远超行业常规——将预训练代码、后训练代码、训练算子等七大核心组件全部公开。这一策略的目标清晰：通过降低开发者门槛，吸引更多第三方基于昇腾和盘古构建应用，从而在算力层和应用层同时建立生态壁垒。

大模型赛道是一个足够大的市场，容得下多种路径并存。华为的崛起，不是在挤压其他玩家的空间，而是在用系统级的整合能力，将大模型竞争带入一个更高维度的战场。

结语

综上，余承东喊出“没有第二”，不是一句口号，而是一个正在被验证的事实。

昇腾910C已经证明国产算力可以训练世界级大模型，鸿蒙7已经证明国产系统可以把大模型变成系统原生能力，6600万终端已经证明华为拥有同行无法比拟的落地通道。这三件事同时成立，意味着华为在“软硬芯云”一体化这个维度上，已经成为全球唯一。

唯一一家能够从芯片到终端、从模型到操作系统，实现全链路自主闭环的中国科技企业。这种系统级的整合能力，正在将大模型竞争从“单点突破”推向“体系竞争”的新阶段。

当字节深耕流量、阿里聚焦B端、腾讯打磨场景时，华为选择了一条更重的路——把整个链条上的每一个环节都攥在自己手里。这条路前期投入巨大，但一旦跑通，形成的系统效率优势，是任何单点突破都无法撼动的。

余承东说的“第一”，不是月活第一，不是参数第一，而是“系统级整合能力”的第一。在这个维度上，华为没有对手。大模型战场，已经进入了华为的时间表。