运行百度的paddle多卡训练需要依赖nccl,所以需要安装nccl,本文提供压缩包的nccl安装方式,亲测可用

1.通过英伟达nccl下载 nccl 的txz安装包
2.解压nccl压缩包,得到两个文件夹include 和 lib, 如图:
3.
3.将include文件夹下的文件都复制到cuda文件夹下对应的inlcude中去


sudo cp include/* /usr/local/cuda-11.0/include
sudo cp lib/* /usr/local/cuda-11.0/lib64

我这里安装的cuda是cuda-11.0
然后进入/usr/local/cuda-11.0/lib64可以看到
在这里插入图片描述
4. 需要删除原有文件,然后重新生成libnccl.so 和 libnccl.so.2这两个文件.

cd /usr/local/cuda-11.0/lib64
sudo rm libnccl.so libnccl.so.2
sudo ln -s libnccl.so.2.3.5 libnccl.so.2
sudo ln -s libnccl.so.2 libnccl.so

这里的libnccl.so.2.3.5 要根据自己的来决定
最后在ls可以看到
在这里插入图片描述
颜色变了,说明OK

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐