[北京,2026年05月23日] 面向开发者一年一度的技术盛典——鲲鹏昇腾开发者大会2026(KADC 2026)在北京中关村国际创新中心圆满结束。大会期间,openFuyao多样化算力集群软件开源社区成功举办专题分论坛,汇聚社区行业用户、核心开发者及生态伙伴,共同分享社区最新技术演进成果与落地实践案例;并围绕AI原生架构创新方向组织Panel研讨,为开发者提供技术思路与实践启示,以加速产业发展,繁荣集群软件生态。

openFyao社区进展及未来演进

胡昊 openFuyao技术委员会主席

论坛伊始,胡昊主席分享社区从2025年KADC提出的5大调度能力发展至20+创新能力,在算力使能、调度增强和场景化加速等方向突破,成果落地十余个行业40+项目,6家商业发行版伙伴已实现商业化。与Mooncake社区及某互联网公司合作新一代V3架构(Cache Tier V3),部分能力已集成至openFuyao InferNex AI推理加速套件中,显著提升生产性能,TTFT下降40%,端到端延迟下降30%。此外,积极拥抱灵衢新一代计算架构,推出URMA通信、内存池化、拓扑感知调度和容器热迁移等新特性,释放硬件高速互联能力。

接下来,社区继续深耕新模型加速调优、超节点架构下的文件语义抽象、多模态能力支持、DRA动态资源分配等技术方向,布局Agent沙箱和智能运维两大新赛道,持续释放AI Native集群软件价值。

Aether:面向大规模AI原生工作负载的高可用弹性调度框架

季万强 openFuyao技术委员会委员&京东零售架构师

分享大规模AI原生工作负载的弹性调度技术实践,京东联合openFuyao共创Aether高可用弹性调度框架,从触发条件、执行策略、调度粒度和响应速度四个维度构建弹性能力,通过Brain全局决策、Driver运行态感知、Executor进程级执行与故障隔离,实现作业资源动态规划、弹性伸缩和故障自愈,并与KubeRay、Kubernetes等云原生体系融合,接入京东零售九数AI平台统一调度训练、推理等任务。落地后,有效训练时间占比提升至97%,批量推理端到端处理时间缩短10%,资源成本降低30%,PD分离服务端到端效率提升5%。

移动云超大规模集群实践

罗刚毅 openFuyao技术委员会委员&移动云能力中心平台产品部总监

围绕万卡级超节点智算基础设施案例,分享移动云联合openFuyao社区基于鲲鹏+昇腾超节点底座构建超大规模Kubernetes发行版实践,通过APIServer多实例/IPVS 负载均衡、APF流控、Informer预加载等方式优化提升控制面承载能力;同时引入三层拓扑感知调度、逻辑超节点、自动故障感知隔离和断点续训等机制,打通数据导入、预取、训练、Checkpoint、模型导出的全链路流程。最终实现openFuyao在客户现网2万卡超节点集群中的稳定落地,提升任务调度与资源利用效率,支撑训练任务分钟级恢复和超大规模算力基础设施持续运营。

智算容器在分布式推理场景的实践

李涛 天翼云公有云事业部研发总监

天翼云通过全域智算容器方案,将算力、模型、AI 应用作为基础设施“一等公民”,构建统一算力纳管、AI网关接入、镜像与模型分发加速、KVCache感知路由和全链路可观测能力,实现云上云下、多云多地域资源统一调度与一致运维体验。实践中,IDC集群可实现小时级交付,百GB级镜像下载从十几分钟优化到约1分钟,模型扩容等待时间缩短99%以上;KVCache感知路由使平均时延降低36%、TTFT提升 50%,整体提升了推理服务的部署效率、响应性能和故障定位能力。

灵雀云基于openFuyao的海外落地实践

杜东明 灵雀云首席架构师

灵雀云全栈云原生平台ACP与openFuyao深度适配,构建企业级AI原生基础设施发行版:通过Agent理解业务意图并转化为策略,经MCP/CLI下发到基础设施;依托 openFuyao的多样化算力调度、在离线混部、NPU Operator、AI InferNex推理加速等能力,实现通算与智算融合管理;同时以策略即代码、权限边界和审计链增强确定性安全治理。该方案兼具ACP金融级稳定性与openFuyao智算调度能力,面向香港、东南亚、非洲等地区的银行、能源、医疗等行业形成一体化落地实践,帮助企业整合异构算力、操作系统、容器集群调度、AI服务与安全治理,降低AI原生基础设施建设和出海交付门槛。

AI原生时代开源基础设施

李昊阳 Director of CNCF Asia

当前CNCF作为全球主导的开源基础设施底座,正全面拥抱AI Native时代,围绕训练(如PyTorch)、推理和Agent三大支柱演进。其中推理需求高速增长,正在成为驱动云原生工作负载的新锚点,而专用化模型相比通用大模型在成本、性能和硬件适配方面更具优势,CNCF将持续扩展云原生生态,推动AI推理从“大规模训练超算”走向广泛的“企业级推理”。未来,期待CNCF与openFuyao社区围绕通算、智算及AI Native基础设施深化合作,共同推动关键技术创新与开源生态繁荣。

AI原生技术参考架构与核心能力

朱浩鹏 华为Fellow

面对AI Native概念复杂、边界不清的问题,议题以“关注点分离(SoC)”和“第一性原理”为方法论起点:通过分层架构拆解AI系统这一“系统的系统”,明确功能边界与演进路径;同时回归AI原生的本质特征,提炼其不可或缺的关键要素。基于此,AI Native整体架构可从AI基础设施、模型与数据使能、智能体协同/调度、Agentic应用四个层次进行系统化拆解。在关键能力建设上,重点关注声明式智能契约、专注型智能体协同、动态任务图和语义检查点四类要素,为构建可扩展、可治理的AI原生系统提供参考。面向未来泛终端等带来的百倍级流量增长,呼吁产业围绕超通量高可靠 Agentic Core、智能体平台与基础设施、6G AI原生核心网标准生态等方向开展协同共建,共同探索电信网络架构从CNF向ANF演进的新路径。

Panel:AI原生基础设施关键技术挑战

主持人:邓辉(左一)

嘉宾:雷超(左二)、胡昊(左三)、朱浩鹏(右三)、沃天宇(右二)、杨珂(右一)

本场圆桌围绕AI原生时代基础设施演进、Agentic工作负载调度与推理架构优化展开深入讨论。嘉宾认为,Kubernetes仍具备成熟生态和声明式API等核心优势,但面对 GPU/NPU/TPU等异构算力、卡间互联、拓扑感知、亚秒级调度等新需求,需要从传统容器负载管理进一步演进。进入Agent时代后,系统瓶颈不再只在GPU/NPU推理侧,CPU工具调用、任务执行、记忆管理、安全审计与多智能体协同同样关键,亟需打通从Agent工作流到CPU/GPU/NPU资源调度的信息链路。针对推理架构,嘉宾指出KV Cache命中率、数据搬移效率和内存/网络带宽将成为影响成本与性能的重要因素,未来应以更开放、可感知、可调度的推理基础设施支撑低时延、高质量、低成本的智能体应用落地。

分论坛结束合影

openFuyao社区这一年持续突破,多项技术成果落地应用,持续提升产业性能!由衷感谢社区全体成员的贡献。接下来将继续与广大开发者携手并肩,演进多样化算力集群软件生态,让每一份算力都转化为生产力。下一年新征程满怀期许,静待更多前沿创新在社区蓬勃迸发,以技术赋能千行百业,共同推进全球AI原生新时代璀璨发展!

Logo

作为“人工智能6S店”的官方数字引擎,为AI开发者与企业提供一个覆盖软硬件全栈、一站式门户。

更多推荐