当大模型和 Agent 持续进入软件研发、测试场景,如何把专家经验从"隐性知识"转化为"可复用能力"正成为越来越重要的问题。

无论是算子开发、模型训练与推理、性能调优,背后都依赖大量专业知识、实践经验和标准流程。如果这些能力只能停留在个人经验里,就很难被规模化复用;如果能被沉淀为标准化 Skills,就可以真正释放 AI 辅助的价值。

Agent-Skills 正是在这样的背景下持续建设的核心仓库。它聚焦 Agent Skills for Ascend 的全栈能力,目标是将昇腾软件栈中的专家经验、最佳实践和流程方法沉淀为可复用的技能模块,让 Agent 更懂昇腾,更能解决开发部署等方面问题。

Agent-Skills 仓获取地址:https://gitcode.com/Ascend/agent-skills

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

Agent-Skills 核心优势

Agent-Skills 是面向昇腾的 Agent Skills 仓,聚焦昇腾研发中的专家经验、最佳实践和工作流沉淀为可复用的 Skill 资产。

它的核心优势可以概括为三点:

  • 把分散在个人和项目中的经验沉淀为标准化能力,降低学习使用成本
  • 让 Agent 从"能回答问题"走向"能理解场景、按流程执行任务"
  • 支持开发者能力复用和协同共建

当前仓库已经沉淀 50+ Skills 覆盖算子开发、调优调试等场景

现仓库已沉淀 50+ Skills,如 Ascend C 算子开发 9 个,CATLASS 算子模板库 5 个,Triton 算子开发 9 个,迁移适配与性能优化 8 个,自动化测试能力 8 个,安装部署 4 个等。

面向 AI 辅助研发持续演进的新阶段,Agent-Skills 也将继续围绕真实场景拓展能力边界,完善标准规范,沉淀更多高价值 Skills。

如果你正在关注以下方向:

  • 昇腾算子开发
  • 模型训练与推理
  • 生成式推荐
  • Agent 在昇腾场景中的落地实践

欢迎持续关注并参与 Agent-Skills 仓的建设,一起把昇腾研发经验沉淀为更专业、更高效、更可复用的 Agent 能力。

安装 Agent-Skills

建议使用 Skills 管理工具(npx skills)来灵活安装 Skills。以下为常用命令示例:

# 列出 ascend/agent-skills 仓库中包含的所有 Skills
npx skills add ascend/agent-skills --list

# 安装指定的某个或某几个 Skills
npx skills add ascend/agent-skills --skill ascend-inference-repos-copilot --skill ascendc-operator-testcase-gen

# 将 Skills 安装到特定的 Agent(例如 opencode)
npx skills add ascend/agent-skills -a trae -a opencode

# 非交互式安装(适合 CI/CD 场景):安装指定 Skill 到 opencode,自动确认
npx skills add ascend/agent-skills --skill ascend-inference-repos-copilot -g -a opencode -y

# 安装仓库中的所有 Skills 到全部 Agents
npx skills add ascend/agent-skills --all

# 安装仓库中的所有 Skills 到指定的多个 Agent
npx skills add ascend/agent-skills --skill '*' -a trae -a opencode

使用实践

Triton Vector 算子开发与迁移

在 Triton Vector 算子场景中,仓库内的 triton-operator-devsimple-vector-triton-gpu-to-npuvector-triton-ascend-ops-optimizer 等 Skills,可以覆盖从需求分析、环境配置、代码生成,到 GPU 向昇腾 NPU 迁移、精度验证和性能优化的关键步骤。对于开发者来说,这类 Skills 能帮助把原本依赖经验驱动的迁移和调优过程,整理成更清晰、更可复用的执行路径。

相关场景也可参考 CSDN 案例文章:Triton Vector 算子开发参考

CATLASS 融合算子开发

在 CATLASS(昇腾算子模板库)场景中,仓库内的 catlass-operator-designcatlass-operator-code-genascendc-operator-compile-debugcatlass-operator-performance-optim 等 Skills,可以覆盖从需求分析、算子设计、代码生成,到编译调试、精度验证和性能调优的端到端开发流程。对于开发者来说,这类 Skill 能将传统需 3-5 天的矩阵算子开发周期压缩至 1 小时,同时保障代码质量与精度对齐,让进阶算子开发门槛显著降低。

相关场景也可参考 CSDN 案例文章:1 小时完成 CATLASS 融合算子开发

Agent-Skills SIG 例会信息

Logo

作为“人工智能6S店”的官方数字引擎,为AI开发者与企业提供一个覆盖软硬件全栈、一站式门户。

更多推荐