TL;DR

  • 场景:半导体从业者、技术管理者、关心国产芯片发展的工程师
  • 结论:韬定律是以"时间τ缩微"替代"几何缩微"的新路线,通过LogicFolding在固定节点下实现53.5%密度提升,但非制程替代而是系统优化补充
  • 产出:韬定律四层体系、麒麟2026规格、Atlas 960超节点参数、风险边界、与摩尔定律对比

请添加图片描述

版本矩阵

数据项 数值/事实 来源 核查状态
韬定律发布时间 2026年5月25日,IEEE ISCAS 2026 新浪/东方财富/今日头条 ✅ 已核查
发布人 何庭波,华为董事、半导体业务部总裁 多家媒体确认 ✅ 已核查
τ 含义 时间常数,信号状态切换所需时间 华为官方/上证报 ✅ 已核查
麒麟2026密度提升 53.5%(部分媒体引述为55%,实为53.5%) IT之家/太平洋/新浪 ✅ 已核查(53.5%)
麒麟2026晶体管密度 238 MTr/mm² 多家媒体 ✅ 已核查
麒麟2026 P核能效提升 41% IT之家/太平洋 ✅ 已核查
麒麟2026峰值频率 3.1GHz(首超3GHz) 多家媒体 ✅ 已核查
麒麟2026发布时间 2026年秋季 华为官方 ✅ 已核查
6年量产芯片数量 381款(2020-2026) 华为官方 ✅ 已核查
Atlas 960超节点昇腾卡数 15488张 华为全联接大会 ✅ 已核查
Atlas 960 FP8算力 30 EFLOPS 华为全联接大会 ✅ 已核查
Atlas 960 FP4算力 60 EFLOPS 华为全联接大会 ✅ 已核查
Atlas 960超节点上市 2027年Q4 华为徐直军演讲 ✅ 已核查
2031年密度目标 400+ MTr/mm²,等效1.4nm制程 华为官方PPT ✅ 已核查
2031年频率目标 5.0GHz 华为PPT(部分媒体引述) ✅ 已核查

华为"韬定律"与 LogicFolding:时间缩微如何绕过制程焦虑

2026 年 5 月,华为在 IEEE ISCAS 2026 上提出了一个新的半导体发展原则:韬定律,也就是 τ Scaling。与它一起出现的,还有一个更容易被大众理解的技术名词:LogicFolding,逻辑折叠。

很多人第一反应会把它理解成"华为发布了一个最新处理器架构"。这个说法不算错,但不完整。

更准确地说,它不是单纯的 CPU 架构,也不是类似 ARM、x86、RISC-V 这种指令集架构,更不是一句"华为做出了 1.4nm 芯片"就能概括的事情。它更像是一套新的芯片演进方法论:当先进制程继续缩小越来越难,尤其是在 EUV 光刻、先进制造设备、全球供应链受限的背景下,芯片性能还能不能继续往前走?

华为给出的答案是:不只盯着"空间变小",也要盯着"时间变短"。

过去几十年,半导体行业的主线是摩尔定律。晶体管越做越小,单位面积放下更多晶体管,芯片性能提升,功耗下降,成本降低。这个逻辑支撑了整个现代计算产业。但到了 7nm 之后,单纯几何缩微带来的收益变得越来越有限,先进节点的成本、设计复杂度、制造难度都在快速上升。华为这次提出的韬定律,就是试图把优化目标从"几何缩微"转向"时间缩微"。官方表述是,以"时间 τ 缩微"替代"几何缩微",通过逻辑折叠等技术压缩信号传播时延,并在器件、电路、芯片、系统多个层面共同优化。

这篇文章分三层讲。

初阶部分,先说清楚它到底是什么,以及普通人该怎么理解。

中阶部分,展开讲 LogicFolding、麒麟芯片、AI 芯片、超节点这些技术路线。

高阶部分,判断它对华为、国产芯片、AI 算力产业到底意味着什么,以及它的边界在哪里。

第一部分:初阶理解——从"把晶体管做小",到"让信号少跑路"

先用一个很直白的类比。

假设一家公司有一栋办公楼。过去提升效率的方式,是把每个工位做得更小,让一层楼里坐下更多人。人多了,产出就高了。这就是传统芯片制造里"几何缩微"的直觉:晶体管越小,单位面积能放下的晶体管越多,性能就越强。

但是问题来了。

工位越来越小之后,继续缩小变得很困难。桌子不能无限小,人不能无限挤,消防通道、走廊、电梯、空调、管理成本都会变成新的限制。芯片也是一样。晶体管不能无限缩小,线宽、功耗、发热、漏电、制造良率、掩膜成本、EDA 复杂度都会变成越来越硬的约束。

这时候另一种思路出现了:不只是让工位更小,而是重新设计办公楼的布局。

把经常协作的部门放近一点。把原本要跨楼层、跨楼栋沟通的团队放到上下相邻的位置。把中间重复审批流程去掉。把电梯、走廊、会议室重新规划。这样即使每个工位没有继续变小,整体效率也能提升。

LogicFolding 逻辑折叠,大体就是这个意思。

传统芯片里,大量逻辑电路是在二维平面上展开的。信号从一个逻辑单元传到另一个逻辑单元,需要沿着金属互连线路走。线越长,寄生电阻、电容越大,信号传播越慢,功耗也更高。到了先进节点后,很多时候限制性能的已经不只是晶体管本身,而是"线"本身。

所以华为提出的思路是:把原本铺在一个平面上的部分逻辑,折叠到上下两层甚至未来更多层里,让关键路径变短。信号不必在平面上绕很远,而是可以通过垂直方向连接到另一层。线短了,延迟下降,功耗下降,时钟偏斜更容易控制,频率和能效就有提升空间。

这就是"时间缩微"的基本直觉:不是只问"晶体管有没有更小",而是问"信号从 A 到 B 的时间有没有更短"。

如果用一句话概括:

过去的芯片进步,主要靠把东西做小。

华为这次强调的芯片进步,是把东西重新摆,让数据和信号少走弯路。

这并不意味着先进制程不重要。先进制程依然非常重要。真正先进的晶体管本身,仍然决定功耗、频率、密度、漏电、良率等基础能力。但当制程继续推进变得越来越难,尤其是当外部设备和工艺受限时,系统级优化就变得更重要。

所以,对普通读者来说,最应该避开的误解有三个。

第一个误解:华为已经直接做出了 1.4nm 芯片。

不是。华为官方和相关报道里说的是,到 2031 年,高端芯片晶体管密度目标达到 1.4nm 制程的同等水平。这是"等效密度"或"等效水平"的说法,不等于已经拥有传统意义上的 1.4nm 光刻制造工艺。Reuters 也明确提到,这是在先进制程设备受限背景下,华为提出的一条新路线,但目前仍缺少独立性能验证。

第二个误解:LogicFolding 就是普通 3D 封装。

也不完全是。3D 封装可以只是把不同芯片堆在一起,而 LogicFolding 更强调把逻辑电路在设计层面跨层拆分,让上下层在电路设计上像一个连续整体,而不是简单把两个现成芯片叠起来。

第三个误解:这是一项马上能全面领先苹果、高通、英伟达的技术。

也不是。它是有技术含量、有战略价值的路线,但是否能在真实产品中形成代差,需要看真机、服务器、AI 集群的长期实测。芯片行业不是发布一个概念就结束,后面还有制造、良率、散热、EDA、封测、软件生态和量产成本。

第二部分:中阶理解——LogicFolding 到底解决了什么问题

理解 LogicFolding,先要理解现代芯片里的一个重要事实:芯片慢,不一定是因为"算得慢",也可能是因为"传得慢"。

在理想状态下,晶体管完成开关动作,逻辑门完成计算,然后数据快速传给下一个模块。但现实里,电路之间的连接线会带来延迟。信号沿着金属线传播,线路越长,寄生电阻和电容越明显。到了先进节点后,局部互连的 RC 延迟已经越来越成为标准单元延迟的重要组成部分。

这就导致一个现象:即使晶体管本身还能做得更强,芯片整体也可能被互连拖住。

LogicFolding 要解决的就是这个问题。

根据 ChinaXiv 上公开的论文《A Time Scaling Theory for Multi-Layer Electronic Systems》,LogicFolding 是一种把数字、模拟、存储电路分布到垂直堆叠有源层中的设计方法,目标是在同一器件节点下共同优化性能、功耗和面积。论文披露,在移动 SoC 场景中,LogicFolding 带来了约 53.5% 的晶体管密度提升,以及 41% 的功效提升(注:部分媒体引述为55%,实为华为PPT官方数据的53.5%)。

这几个数字很关键。

因为它不是说"我换了更先进的制程,所以性能提升了"。它强调的是,在固定器件节点下,通过电路拓扑和空间布局重组来获得提升。

传统二维设计里,逻辑单元铺在一个平面上。关键路径上的门电路可能隔得比较远,时钟树也要覆盖较大范围。LogicFolding 的做法是,把一部分关键逻辑分布到上下两层,通过超细间距混合键合连接。这样一来,原本平面里很长的线,可以变成更短的垂直连接或短距离连接。

这对芯片性能有几个直接影响。

第一,关键路径变短。

芯片最高频率往往受关键路径限制。关键路径就是一个时钟周期内必须完成的最长计算路径。如果这条路径太长,芯片就不能继续提高频率,否则数据还没稳定,下一个时钟沿就来了。LogicFolding 通过缩短关键路径走线,理论上可以提升最高频率。

第二,功耗降低。

线越长,充放电成本越高。减少走线长度,本质上是在减少不必要的数据搬运成本。现代芯片里,数据移动经常比计算本身更耗能,所以缩短路径有实际意义。

第三,面积效率提升。

把部分逻辑折叠到垂直方向,相当于从平面扩展到立体空间。单位平面面积上可以容纳更多有效电路。这就是它对"晶体管密度"的贡献。

第四,时钟分配更容易优化。

高性能芯片里,时钟树非常重要。时钟要尽量同时到达不同模块,否则会出现时钟偏斜。论文和相关解读中提到,逻辑折叠可以减少时钟缓冲器数量、降低时钟偏斜、缩短代表性处理核心的线长。

不过,这里也要看到一个细节:当前的 Kirin 2026 并不是全面折叠,而是选择性折叠。

也就是说,它不是整颗芯片所有地方都做成立体逻辑,而是优先在关键路径、关键模块上使用。相关报道提到,麒麟 2026 的逻辑折叠应用仍偏保守,混合键合间距为 1.5 微米,折叠针对关键路径选择性应用,而不是整个设计全面应用。

这反而说明它更接近真实工程,而不是宣传口号。

真正的工程路线通常不是一步到位,而是先在最有收益、风险可控的地方使用。先在移动 SoC 上验证,再逐步扩大使用范围。华为官方也提到,2026 年秋季面世的麒麟芯片将率先采用逻辑折叠技术,后续更多创新会逐步落地到 2027 年及之后的量产芯片中。

这意味着,2026 年的麒麟芯片会是一个重要观察点。

如果它在真机上确实带来明显的性能、能效、续航、发热改善,那么 LogicFolding 就不是单纯的论文概念,而是进入消费级产品验证阶段。反过来,如果真机表现一般,或者只有少数场景改善,那就说明这条路线还需要更多时间成熟。

第三部分:从麒麟到昇腾——这不是只服务手机芯片

如果只把 LogicFolding 理解成手机芯片技术,会低估它的野心。

华为这次提出的韬定律,本质上是一个跨层级的优化体系。官方将它分成器件层、电路层、芯片层、系统层。器件层关注晶体管和互连的电阻、电容;电路层通过逻辑折叠缩短关键路径;芯片层强调软件、架构、芯片协同;系统层则通过灵衢总线等互联方式,降低超节点通信时延。

这说明它不是单点优化,而是全栈优化。

手机芯片只是第一个容易被看见的落点。更大的落点,很可能在 AI 算力和服务器系统。

原因很简单:AI 时代的瓶颈,越来越不是单颗芯片算得有多快,而是大量芯片之间怎么协同。

训练和推理大模型时,算力不是孤立存在的。GPU、NPU、HBM、CPU、网卡、交换机、存储、互联协议、调度系统都会影响最终效率。一块芯片很强,但如果芯片之间通信慢,显存不够,数据搬运成本高,集群调度效率低,最终性能也上不去。

这也是为什么英伟达真正强的地方,不只是 GPU 芯片,而是从 CUDA、NVLink、NVSwitch、InfiniBand、整机柜、整集群到软件生态的一整套系统能力。

华为现在也在往这个方向走。

在 AI 计算方面,华为公开提出 Atlas 超节点路线。2025 年华为全联接大会上,华为介绍了 Atlas 960 超节点,基于 Ascend 960,最大支持 15488 张昇腾芯片,由 176 个计算柜和 44 个互联柜组成,计划 2027 年第四季度上市,FP8 总算力达到 30 EFLOPS,FP4 总算力达到 60 EFLOPS。

这些数字背后,核心不是"堆更多卡"这么简单,而是怎么让更多卡像一个整体一样工作。

单机时代,芯片内部互连重要。

服务器时代,板内、机内互连重要。

AI 集群时代,机柜之间、数据中心之间的互连也变得重要。

如果通信成本过高,堆卡会迅速遇到收益递减。你可以把 10000 张卡摆在一起,但如果它们之间传数据像堵车,实际训练效率不会线性增长。

韬定律里系统层的意义就在这里。华为强调灵衢总线、统一内存编址、原生内存语义,目标就是降低系统通信时延,让大规模计算系统更像一个统一机器,而不是一堆松散服务器。

这和 LogicFolding 的思想是一致的。

在芯片内部,减少信号跑路。

在服务器内部,减少数据绕路。

在 AI 集群内部,减少协议转换和远程访问延迟。

从这个角度看,韬定律真正想做的不是一颗芯片,而是一种计算系统的重新组织方式。

第四部分:为什么华为一定要走这条路

华为走这条路,有技术原因,也有现实原因。

技术原因是,传统摩尔定律的收益确实在下降。

早期制程升级时,晶体管变小,频率提升,功耗下降,成本降低,几乎所有人都受益。但现在先进制程越来越贵。2nm、1.4nm 这类节点,需要极其昂贵的设备、材料、工艺、EDA 工具和设计能力。先进芯片设计预算已经可以高到非常夸张的程度。ChinaXiv 论文中也提到,先进节点每颗芯片的设计预算已经超过十亿美元,先进节点的单位晶体管成本不再像过去那样稳定下降。

现实原因是,华为受到外部供应链限制。

Reuters 报道提到,美国制裁限制了华为获取先进芯片制造工具,中国当前可验证的先进制造能力与台积电等领先厂商仍存在差距。华为这次提出的新路线,就是在这种背景下寻找不完全依赖最先进光刻路径的芯片发展方式。

这不是说华为不想要先进制程。

任何芯片公司都想要先进制程。先进制程带来的基础优势非常直接。能用 2nm,没人愿意一直卡在 7nm。问题在于,如果现实条件下无法稳定获得最先进制造能力,那就必须从其他地方找增量。

LogicFolding、先进封装、chiplet、光互联、统一总线、超节点,本质上都是在回答同一个问题:

当单颗芯片制造不能无限领先时,系统能不能领先?

这也是国产芯片接下来非常关键的命题。

过去很多讨论过于执着于"几纳米"。几纳米当然重要,但不是全部。芯片产业竞争已经从单点制程竞争,转向制程、封装、架构、互联、内存、软件、生态、系统工程的综合竞争。

华为这次的意义就在于,它试图把这些分散方向统一成一个叙事:从几何缩微,转向时间缩微。

这条路有现实主义色彩。

它不是说"我在传统道路上已经完全追平",而是说"既然传统道路存在限制,那就换一个优化维度继续推进"。

第五部分:高阶判断——它的价值在哪里,风险在哪里

要判断这件事的意义,不能只看宣传,也不能只看质疑。

只看宣传,会得出一个过度乐观的结论:华为已经绕开了 ASML,马上等效 1.4nm,国产芯片彻底突破。

只看质疑,也会得出一个过度悲观的结论:这只是概念包装,制程落后就是落后,没什么意义。

这两种判断都太粗。

更准确的判断应该是:这是一条真实、有难度、有战略价值的工程路线,但它还没有到可以宣布胜利的时候。

它的价值主要有三点。

第一,它把芯片进步从"制程单变量"变成了"系统多变量"。

如果一个产业只能靠最先进光刻机继续前进,那对受限企业来说就是死局。但如果性能还能通过逻辑折叠、先进封装、chiplet、互联协议、光互联、系统软件继续改善,那就有了可操作空间。

这不代表制程不重要,而是制程不再是唯一战场。

第二,它符合 AI 时代的计算趋势。

AI 计算越来越依赖集群,而不是单颗芯片。数据移动、显存容量、互联带宽、通信延迟、调度效率,都会决定最终性能。华为如果能在超节点、统一互联、昇腾生态上形成闭环,就可能在中国 AI 算力市场形成强竞争力。

第三,它更适合华为的组织能力。

华为的强项一直不是只做一个单点器件,而是做系统工程。从通信设备、基站、手机、服务器、云、操作系统,到现在的 AI 算力和机器人,华为习惯做端到端整合。韬定律这种从器件、电路、芯片、系统到软件的全栈路线,和它的组织能力是匹配的。

但它的风险也很明显。

第一,制造难度很高。

逻辑折叠不是画个图就能做出来。多层有源晶圆、混合键合、TSV、对准精度、良率控制、工艺一致性,每一个都很难。一旦良率上不去,成本就会失控。

第二,热问题更难。

3D 堆叠提高了密度,但热也更难散出去。二维平面芯片至少可以把热扩散开,立体堆叠后,内部层的热可能更难导出。Reuters 的报道也提到,功耗、散热和系统集成是这条路线面临的重要挑战。

第三,EDA 工具链要重构。

传统芯片设计工具主要围绕二维布局布线建立。LogicFolding 要求工具链理解跨层逻辑拆分、跨 die 时序收敛、垂直互连寄生参数、工艺偏差和热分布。这不是简单改几个参数,而是设计方法学本身要升级。

第四,软件生态仍然关键。

尤其在 AI 芯片上,硬件只是基础。英伟达真正强,是因为 CUDA 和整个软件生态形成了开发者锁定。昇腾如果要在 AI 训练和推理中真正替代英伟达,不仅要有硬件,还要有模型适配、算子优化、编译器、框架、工具链、开发者体验和稳定性。

第五,外部数据仍然不足。

目前很多性能数据来自华为官方、论文或媒体报道,第三方大规模拆解和实测还不够。真正的判断要等 Kirin 2026 终端上市、Ascend 新产品落地、Atlas 超节点实际运行之后,才能更清楚。

第六部分:这对中国技术人有什么启发

这件事不只是半导体新闻,对技术人也有一个很重要的启发:

当一条主路径走不通时,不是只有"继续硬冲"和"彻底放弃"两种选择,还可以重新定义优化目标。

过去大家讨论芯片,很容易陷入一个数字崇拜:7nm、5nm、3nm、2nm、1.4nm。

这些数字重要,但它们不是计算本身的目的。

用户真正关心的是:手机是否流畅,续航是否更好,发热是否更低,AI 推理是否更快,服务器是否更稳定,单位算力成本是否更低。

企业真正关心的是:在给定成本、功耗、供应链和工程能力下,能不能把系统做到更强。

所以华为这次提出"时间缩微",本质上是在重新定义问题。

不是问:我能不能马上拥有最先进制程?

而是问:在现有条件下,我还能从哪里减少延迟、减少数据搬运、提高密度、提高能效?

这个思维对软件工程也成立。

很多系统性能问题,最后不是 CPU 不够快,而是链路太长、调用太多、数据来回搬、缓存设计差、协议栈复杂、架构边界混乱。

微服务系统也是这样。

一个请求从网关进来,经过鉴权、服务 A、服务 B、数据库、缓存、MQ、搜索引擎、对象存储,再绕一圈回来。单个服务可能都不慢,但整体链路就是慢。优化不一定是把某个函数写得更快,而是缩短链路、减少序列化、减少网络往返、合并不必要调用、优化数据局部性。

这和芯片里的 LogicFolding 有某种相似性。

芯片里,信号少跑路。

系统里,请求少跑路。

AI 集群里,数据少跑路。

本质上都是对"时间"的优化。

这也是韬定律这个概念有意思的地方。它不是一个只属于半导体工程师的词,它背后是一种工程思想:真正的效率,不只是局部算力,而是全链路时延。

第七部分:最终判断

华为这次提出的韬定律和 LogicFolding,不能简单理解为"发布了一个新处理器"。

它更像是华为在半导体受限背景下,提出的一套长期技术路线:

在手机芯片上,通过逻辑折叠提升晶体管密度、频率和能效。

在 AI 芯片上,通过 chiplet、3D Folding、光互联和统一总线提升集群效率。

在服务器和超节点上,通过系统级互联把大量芯片组织成一个更高效的计算整体。

它不是魔法,也不是宣传里一句"等效 1.4nm"就能代表全部。它仍然要面对制造、良率、热、功耗、EDA、软件生态、成本和第三方验证。

但它确实说明了一件事:

国产芯片接下来不会只沿着"追赶最先进制程"这一条路走,也会越来越强调系统级创新。

先进制程仍然是硬实力。

但架构、封装、互联、内存、软件、系统工程,会变成另一种硬实力。

如果未来几年 Kirin 2026、Ascend 950/960、Atlas 超节点能够逐步兑现这些技术路线,华为在芯片领域的竞争方式会发生变化。它不一定在单点制程上立刻追平最领先厂商,但它可能通过系统工程,把一部分差距转化成可以被弥补、被重组、被优化的问题。

这才是这次发布最值得关注的地方。

不是"华为有没有直接做出 1.4nm"。

而是"当几何缩微不再是唯一答案时,谁能最先把芯片、封装、互联、软件和系统重新组织起来"。


错误速查卡

症状 根因 定位 修复
误以为华为已做出1.4nm芯片 将"等效密度1.4nm"理解为"已具备1.4nm制程" 华为说的是2031年目标,非当前能力 区分"等效密度"与"实际制程",核实华为官方表述
密度提升数字混淆 部分媒体引述为55%,实为53.5% 华为PPT官方数据为53.5% 以华为官方PPT和IT之家等权威媒体为准
LogicFolding等于3D封装 混淆了设计层面的跨层拆分与简单芯片堆叠 LogicFolding强调电路设计连续性,非简单堆叠 理解LogicFolding是设计方法学,不是封装技术
认为可马上超越苹果高通英伟达 忽视芯片行业需要制造、良率、软件生态验证 芯片从概念到产品需要多年工程验证 等待Kirin 2026真机、Atlas超节点实际运行后的第三方数据
低估制程价值 过度强调系统优化而忽视先进晶体管基础优势 韬定律是补充而非替代 制程仍是硬实力,韬定律解决的是受限下的优化问题
忽视热与制造挑战 只看到性能提升数字,忽视3D堆叠散热难题 立体堆叠散热是工程难题 关注Kirin 2026真机散热表现和量产良率数据

作者:武子康的个人博客

Logo

作为“人工智能6S店”的官方数字引擎,为AI开发者与企业提供一个覆盖软硬件全栈、一站式门户。

更多推荐