[中国,北京,2026年5月22日]鲲鹏昇腾开发者大会2026——CANN技术论坛在北京成功举办。此次论坛以“硬件架构创新,编程体验全新升级”为主题,七大议题围绕CANN架构演进、算子开发生态、开源社区协同及前沿应用实践展开,全景式呈现了昇腾计算基础软件在开发者体验、编程范式创新与开源生态共建领域的最新突破与深度思考。

CANN持续开源开放,软硬协同驱动编程体验升级

会上,华为昇腾计算基础软件总经理李守平在《硬件架构创新,CANN编程体验全新升级》专题演讲中表示,从开发者真实体验出发,围绕算子性能、编程灵活性、社区体验三大方向,持续优化开发者体验,提供高效成长路径。

1.jpg

华为昇腾计算基础软件总经理 李守平

CANN基于硬件新架构迭代升级,持续深化软硬协同创新。面向开发者真实体验,CANN聚焦核心诉求:匹配开发者习惯,提供Ascend C/CATLASS/PyPTO等多路径编程方式,灵活选择;同时毕昇编译器全新升级,编译底座AscendNPU IR全面开源,使能昇腾兼容业界主流编程范式,开发者可以高效复用Triton、TileLang等社区资产。此外,新增CCU通信能力,并开源SHMEM库,简化通信编程,亲和MoE模型,实现高吞吐、低时延的通信能力。

在提升开发体验方面,CANN持续多维探索。联合30+企业/高校,共建15+生态算子库,通过广泛适配,赋能行业开发者加速创新。CANNBot Agent智能辅助编程亮相,显著提升昇腾算子开发效率。同时,CANN持续优化全链路社区体验,从部署、开发到调试调优,一站式赋能开发者成长,加速昇腾计算生态的繁荣发展。

昇腾开源生态的发展,离不开每一位贡献者的专业和付出,会上设置了颁奖环节,为优秀个人颁发了“昇腾CANN开源贡献优秀个人奖”,表彰近一年来昇腾开发者在昇腾技术创新、技术生态发展中的优异表现。14名个人优秀贡献者获得“昇腾CANN开源贡献优秀个人奖”荣誉。

2.jpg

昇腾CANN开源贡献优秀个人奖 颁奖环节

北京大学计算机学院副研究员杨智带来了《TileLang for Ascend:面向CANN生态的算子开发新范式》专题分享,提到TileLang作为tile级编程框架,其“Beginner、Developer、Expert”三种使用模式可满足从入门到专家的全层次开发者需求,有效兼顾易用性与极致性能。在DeepSeek V4的算子实践中表现出了高开发效率与高性能,使能昇腾全面支持DeepSeek V4推理,同时也证明了TileLang优秀的跨平台能力。在未来TileLang for Ascend还有广阔的发展空间,比如昇腾950的编程插件、torch.compile与Graph优化、超节点统一编程等。

3.jpg

北京大学计算机学院副研究员 杨智

众智FlagOS社区秘书长朱其罡以《FlagOS开源社区与昇腾生态深度融合实践》为题,分享了FlagOS基于昇腾生态的适配成果。FlagOS在编译器、算子及框架等多层与昇腾实现深度融合,兼顾广度覆盖与深度优化。其中,新发布的FlagTree v0.5支持多架构的统一中间表示层 FLIR,并通过接入AscendNPU IR实现昇腾适配与跨代兼容。未来,FlagOS也将持续探索更高效的跨芯片适配方案。

4.jpg

众智FlagOS社区秘书长 朱其罡

昇腾CANN首席架构师闫长江带来了《Ascend C使能昇腾950算子编程》的技术深入解读。Ascend C正全面使能昇腾950架构新能力,涵盖SIMD+SIMT新同构编程、NDDMA多维数据搬运、锁同步方法及CCU通信编程等关键特性,充分释放新一代芯片的硬件潜力。与此同时,Ascend C聚焦开发者易用性持续升级:推出Tensor API、支持Host device混合编程,改进资料与样例,使CATLASS全面适配950架构,并引入CANNBot AI自动算子编程工具,系统降低算子开发门槛,助力开发者高效释放昇腾950极致算力。

5.jpg

昇腾CANN首席架构师 闫长江

上海创智学院助理教授冯思远在《PTO-昇腾原生的Tile编程生态》中指出,Tile编程找到了性能与效率平衡的“甜点区”。PTO作为昇腾原生设计,能够充分利用昇腾硬件特性;同时基于灵衢原生,可面向整个集群编写统一程序,大幅简化大规模并行开发。更进一步,PTO深度支持Agent能力,实现了“用AI构建,也为AI构建”的智能化编程闭环,为昇腾计算生态注入了面向未来的创新活力。

6.jpg

上海创智学院助理教授 冯思远

北京大学Open-Sora Plan团队核心贡献者葛云阳以《OSP-Next:基于稀疏序列并行和HiF8量化实践的大规模视频生成模型》为主题,分享了北大团队与昇腾深度合作的最新成果。Open-Sora Plan作为国内首个类Sora开源项目,其v1.5版本是国内首个全流程依托国产算力训练的大模型,性能达到开源领先水平。本次亮相的OSP-Next模型,进一步基于稀疏序列并行与HiF8量化实践,在昇腾950上实现了相较于基线2.27倍的加速比。

7.jpg

北京大学Open-Sora Plan团队核心贡献者 葛云阳

CANN以开发者为中心,从原生编程范式到AI辅助开发,从社区生态共建到前沿模型实践,持续深化硬件架构创新与编程体验升级。未来,CANN将携手各界伙伴,共建繁荣开放的昇腾AI新生态。


「免责声明」:以上页面展示信息由第三方发布,目的在于传播更多信息,与本网站立场无关。我们不保证该信息(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关信息并未经过本网站证实,不对您构成任何投资建议,据此操作,风险自担,以上网页呈现的图片均为自发上传,如发生图片侵权行为与我们无关,如有请直接微信联系g1002718958。 

Logo

作为“人工智能6S店”的官方数字引擎,为AI开发者与企业提供一个覆盖软硬件全栈、一站式门户。

更多推荐