运行百度的paddle多卡训练需要依赖nccl,所以需要安装nccl,本文提供压缩包的nccl安装方式,亲测可用

1.通过英伟达nccl下载 nccl 的txz安装包
2.解压nccl压缩包,得到两个文件夹include 和 lib, 如图:
3.
3.将include文件夹下的文件都复制到cuda文件夹下对应的inlcude中去


sudo cp include/* /usr/local/cuda-11.0/include
sudo cp lib/* /usr/local/cuda-11.0/lib64

我这里安装的cuda是cuda-11.0
然后进入/usr/local/cuda-11.0/lib64可以看到
在这里插入图片描述
4. 需要删除原有文件,然后重新生成libnccl.so 和 libnccl.so.2这两个文件.

cd /usr/local/cuda-11.0/lib64
sudo rm libnccl.so libnccl.so.2
sudo ln -s libnccl.so.2.3.5 libnccl.so.2
sudo ln -s libnccl.so.2 libnccl.so

这里的libnccl.so.2.3.5 要根据自己的来决定
最后在ls可以看到
在这里插入图片描述
颜色变了,说明OK

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐