贴出官方文档:https://www.hiascend.com/document/detail/zh/Pytorch/730/configandinstg/instg/docs/zh/installation_guide/installation_description.md

1、安装anaconda

1.1 清华镜像源下载

国内用户推荐使用清华镜像源,下载anaconda安装包,地址:

https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/

我的系统是arm架构,所以下载aarch64版本,注意下载自己操作系统对应版本。

1.2 安装

在当前路径下打开终端,运行下述命令,默认 yes即可。

bash ./Anaconda3-2025.06-1-Linux-aarch64.sh 

1.3 验证

重新打开一个终端,验证conda信息,出现版本号即安装成功。

2、pytorch安装

2.1 安装方案

2.2 以物理机场景为例

驱动、固件和CANN在上篇文章中已经介绍,未安装的可以参考上篇文章进行安装。

https://blog.csdn.net/TiAmo992/article/details/160218108?spm=1001.2014.3001.5502

2.2.1 查看设备是否支持

可以看到,官方给出的训练场景支持设备列表中包含昇腾300 i Duo

2.2.3 选取安装版本

pytorch 2.6.0 、 torch_npu 7.3.0、  python 3.10、 CANN 8.5.0

# 下载并安装PyTorch框架
wget https://download.pytorch.org/whl/cpu/torch-2.6.0%2Bcpu-cp310-cp310-manylinux_2_28_aarch64.whl
pip3 install torch-2.6.0+cpu-cp310-cp310-manylinux_2_28_aarch64.whl

# 下载并安装torch_npu插件
wget https://gitcode.com/Ascend/pytorch/releases/download/v7.3.0-pytorch2.6.0/torch_npu-2.6.0.post5-cp310-cp310-manylinux_2_28_aarch64.whl
pip3 install torch_npu-2.6.0.post5-cp310-cp310-manylinux_2_28_aarch64.whl

2.2.4 软件包安装

在conda中新建一个python环境为3.10,激活环境后安装

conda create -n py310 python==3.10
conda activate py310

遇到问题,安装wget,我是麒麟系统使用yum安装

(py310) [root@localhost downloads]# wget https://download.pytorch.org/whl/cpu/torch-2.6.0%2Bcpu-cp310-cp310-manylinux_2_28_aarch64.whl
bash: wget: 未找到命令
(py310) [root@localhost downloads]# yum install -y wget

再次运行,保存至当前路径下

安装pytorch框架 ,即可安装成功

pip3 install torch-2.6.0+cpu-cp310-cp310-manylinux_2_28_aarch64.whl

同理,安装torch_npu框架

2.2.5 安装后验证

python3 -c "import torch;import torch_npu; a = torch.randn(3, 4).npu(); print(a + a);"

有一个警告信息,这张昇腾300I Duo卡不支持double,自动转float,对推理训练过程没影响。

至此已经安装完成pytorch、torch_npu!

2.2.6 (可能)遇到问题

(1)import yaml ModuleNotFoundError: No module named 'yaml'

        缺少包,直接安装 

 pip install pyyaml 

        pip install pyyaml

(2)fatal error: 'cstdint' file not found #include <cstdint>

        缺少 gcc /gcc-c++ 环境

yum install -y gcc gcc-c++ glibc-devel 

        yum install -y gcc gcc-c++ glibc-devel

(3)fatal error: 'cstdint' file not found

        找不到C++头文件

        建立软连接,查看一下自己的路径。

        这是我的路径地址,建立连接即可:

ln -s /usr/include/c++/12/aarch64-kylin-linux/bits /usr/include/c++/12/
#刷新环境变量再重新测试
source /usr/local/Ascend/cann-8.5.0/set_env.sh
python3 -c "import torch;import torch_npu; a = torch.randn(3, 4).npu(); print(a + a);"

3、升级

3.1 卸载旧版本

卸载PyTorch框架需执行如下命令

卸载PyTorch框架需执行如下命令

pip3 uninstall torch
pip3 uninstall torch_npu

3.2 升级安装

卸载完旧版本可以安装新的版本,在驱动、固件和CANN软件配套场景下,可单独升级PyTorch框架与torch_npu插件。

4、配置pip源

使用pip安装软件包的用户,执行如下命令:

cd ~/.pip

如果提示目录不存在,则执行如下命令创建:

mkdir ~/.pip 
cd ~/.pip

编辑pip.conf文件。

使用vi pip.conf命令打开pip.conf文件,写入如下内容:

[global]
#以华为源为例,请根据实际情况进行替换。
index-url = https://mirrors.huaweicloud.com/repository/pypi/simple
trusted-host = mirrors.huaweicloud.com
timeout = 120

执行 :wq! 命令保存文件。

4、模型训练

请参考官方文档进行训练调优:

https://www.hiascend.com/document/detail/zh/Pytorch/730/ptmoddevg/trainingmigrguide/PT_LMTMOG_0002.html

Logo

作为“人工智能6S店”的官方数字引擎,为AI开发者与企业提供一个覆盖软硬件全栈、一站式门户。

更多推荐