基于麒麟V11、昇腾300i Duo安装torch、torch_npu
本文介绍了在ARM架构(aarch64)系统上安装PyTorch和torch_npu插件的完整流程。首先通过清华镜像源下载并安装Anaconda,创建Python 3.10环境。然后逐步安装PyTorch 2.6.0和torch_npu 7.3.0,详细说明了可能遇到的问题及解决方法,如缺少yaml包、gcc环境等。最后提供了升级和配置pip源的方法,并指引用户参考官方文档进行模型训练。整个过程涵
1、安装anaconda
1.1 清华镜像源下载
国内用户推荐使用清华镜像源,下载anaconda安装包,地址:
https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/

我的系统是arm架构,所以下载aarch64版本,注意下载自己操作系统对应版本。
1.2 安装
![]()
在当前路径下打开终端,运行下述命令,默认 yes即可。
bash ./Anaconda3-2025.06-1-Linux-aarch64.sh
1.3 验证
重新打开一个终端,验证conda信息,出现版本号即安装成功。

2、pytorch安装
2.1 安装方案

2.2 以物理机场景为例
驱动、固件和CANN在上篇文章中已经介绍,未安装的可以参考上篇文章进行安装。
https://blog.csdn.net/TiAmo992/article/details/160218108?spm=1001.2014.3001.5502
2.2.1 查看设备是否支持
可以看到,官方给出的训练场景支持设备列表中包含昇腾300 i Duo

2.2.3 选取安装版本
pytorch 2.6.0 、 torch_npu 7.3.0、 python 3.10、 CANN 8.5.0

# 下载并安装PyTorch框架
wget https://download.pytorch.org/whl/cpu/torch-2.6.0%2Bcpu-cp310-cp310-manylinux_2_28_aarch64.whl
pip3 install torch-2.6.0+cpu-cp310-cp310-manylinux_2_28_aarch64.whl
# 下载并安装torch_npu插件
wget https://gitcode.com/Ascend/pytorch/releases/download/v7.3.0-pytorch2.6.0/torch_npu-2.6.0.post5-cp310-cp310-manylinux_2_28_aarch64.whl
pip3 install torch_npu-2.6.0.post5-cp310-cp310-manylinux_2_28_aarch64.whl
2.2.4 软件包安装
在conda中新建一个python环境为3.10,激活环境后安装
conda create -n py310 python==3.10
conda activate py310
遇到问题,安装wget,我是麒麟系统使用yum安装
(py310) [root@localhost downloads]# wget https://download.pytorch.org/whl/cpu/torch-2.6.0%2Bcpu-cp310-cp310-manylinux_2_28_aarch64.whl
bash: wget: 未找到命令
(py310) [root@localhost downloads]# yum install -y wget
再次运行,保存至当前路径下

安装pytorch框架 ,即可安装成功
pip3 install torch-2.6.0+cpu-cp310-cp310-manylinux_2_28_aarch64.whl
同理,安装torch_npu框架
2.2.5 安装后验证
python3 -c "import torch;import torch_npu; a = torch.randn(3, 4).npu(); print(a + a);"
有一个警告信息,这张昇腾300I Duo卡不支持double,自动转float,对推理训练过程没影响。
至此已经安装完成pytorch、torch_npu!
2.2.6 (可能)遇到问题
(1)import yaml ModuleNotFoundError: No module named 'yaml'
缺少包,直接安装
pip install pyyaml
pip install pyyaml
(2)fatal error: 'cstdint' file not found #include <cstdint>
缺少 gcc /gcc-c++ 环境
yum install -y gcc gcc-c++ glibc-devel
yum install -y gcc gcc-c++ glibc-devel
(3)fatal error: 'cstdint' file not found
找不到C++头文件
建立软连接,查看一下自己的路径。
这是我的路径地址,建立连接即可:
ln -s /usr/include/c++/12/aarch64-kylin-linux/bits /usr/include/c++/12/
#刷新环境变量再重新测试
source /usr/local/Ascend/cann-8.5.0/set_env.sh
python3 -c "import torch;import torch_npu; a = torch.randn(3, 4).npu(); print(a + a);"
3、升级
3.1 卸载旧版本
卸载PyTorch框架需执行如下命令
卸载PyTorch框架需执行如下命令
pip3 uninstall torch
pip3 uninstall torch_npu
3.2 升级安装
卸载完旧版本可以安装新的版本,在驱动、固件和CANN软件配套场景下,可单独升级PyTorch框架与torch_npu插件。
4、配置pip源
使用pip安装软件包的用户,执行如下命令:
cd ~/.pip
如果提示目录不存在,则执行如下命令创建:
mkdir ~/.pip
cd ~/.pip
编辑pip.conf文件。
使用vi pip.conf命令打开pip.conf文件,写入如下内容:
[global]
#以华为源为例,请根据实际情况进行替换。
index-url = https://mirrors.huaweicloud.com/repository/pypi/simple
trusted-host = mirrors.huaweicloud.com
timeout = 120
执行 :wq! 命令保存文件。
4、模型训练
请参考官方文档进行训练调优:
更多推荐





所有评论(0)