一、多个cuda版本

1、sudo ubuntu-drivers autoinstall 安装驱动,会自带一个cuda,这个cuda是一个版本(通过 nvidia-smi 查看)

2、从官网上下载,并安装cuda在/usr/local下,此时又是一个cuda版本(通过 cat /usr/local/cuda/version.txt 查看)

1和2两种安装cuda方法,https://blog.csdn.net/qq_40947610/article/details/114706170

1和2两个cuda版本并存,为何不冲突?https://www.cnblogs.com/marsggbo/p/11838823.html

3、miniconda安装pytorch或者tensorflow也会安装另一个cuda版本(在 /miniconda3/pkgs/cudatoolkit*

2和3的区别,https://blog.csdn.net/qq_40947610/article/details/114707085


二、执行顺序

调用哪个 cuda 库要看生成 tensorflow / pytorch 库的时候,设置的链接库寻找目录,以 pytorch 为例,项目根目录下的 setup.py 中指定了链接库的搜索目录,其中 cuda 的根目录 CUDA_HOME在 tool.setup_helpers.cuda 中有获取逻辑,大概过程是:

      0. ~/.bashrc下指定的CUDA_HOME

  1. 默认 cuda 安装目录 /usr/local/cuda
  2. 如默认目录不存在(例如安装原生 cuda 到其他自定义位置),那么搜索 nvcc 所在的目录
  3. 如果 nvcc 不存在,那么直接寻找 cudart 库文件目录(此时可能是通过 conda 安装的 cudatoolkit,一般直接用 conda install cudatoolkit,就是在这里搜索到 cuda 库的),库文件目录的上级目录就作为 CUDA_HOME
  4. 如果最终未能得到 CUDA_HOME,那么生成的 pytorch 将不使用 CUDA。

(以上过程的 pytorch 源码版本 '1.3.0')

详细的可去看 pytorch 源码。tensorflow 源码我没看过,不过思路应该差不多。

 

参考:https://www.zhihu.com/question/344950161

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐