Ubuntu20.04 + CUDA11.6+Pytorch(GPU版)

1. NVIDIA驱动安装

https://blog.csdn.net/qq_40907977/article/details/115305634

比较详细的nvidia驱动安装的教程,根据个人电脑不同应自己调整

1.1删除原有驱动

sudo apt-get purge nvidia*
sudo apt-get autoremove

1.2 安装依赖

sudo apt-get install build-essential gcc-multilib dkms

1.3 禁用nouveau驱动

使用Vim编辑器,没有请按照提示安装

编辑/etc/modprobe.d/blacklist-nouveau.conf 文件,添加一下内容

blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off

关闭nouveau

$ echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf

1.4 重启

reboot

1.5 获取内核源代码

$ apt-get install linux-source
$ apt-get install linux-headers-x.x.x-x-generic

在这里我安装的是linux-headers-4.15.0-101-generic

1.6 安装nvidia驱动

此时由于显卡没有安装驱动,图形化界面会出现问题,但是并不影响操作

sudo chmod NVIDIA*.run

从nvidia官网找到自己的显卡驱动并下载该驱 https://www.nvidia.cn/Download/index.aspx?lang=cn

在这里插入图片描述
在下载文件下打开terminal输入以下命令进行安装

sudo ./NVIDIA-Linux-x86_64-384.59.run –no-x-check -no-nouveau-check -no-opengl-files(下载文件名)

安装完成后对驱动进行挂载

modprobe nvidia

驱动的安装过程一定要看链接给出的图文进行选择,否则可能会出现问题,安装完成后重启,重启后图形界面就会恢复

1.7 检验安装是否成功

nvidia-smi

若显示如下信息说明安装成功

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-eoqyaHZd-1652090712132)(/Users/littlestar/Documents/Pytorch环境配置/Screenshot from 2022-04-23 16-27-03.png)]

Anacond安装

CUDA11.6安装

本人选择的是CUDA11.6 直接在网页上选择network安装[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-12PQoMjh-1652090712133)(/Users/littlestar/Documents/Pytorch环境配置/截屏2022-05-09 18.07.02.png)]

直接输入命令行

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/cuda-ubuntu1804.pin
sudo mv cuda-ubuntu1804.pin /etc/apt/preferences.d/cuda-repository-pin-600
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/3bf863cc.pub
sudo add-apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu1804/x86_64/ /"
sudo apt-get update
sudo apt-get -y install cuda

注意:一般使用network安装的,大部分都是最新版本,若下载比较老的版本请使用runfile(local)

配置环境变量,输入sudo vim ~/.bashrc在文件末尾添加

# CUDA Soft Link
export PATH=/usr/local/cuda-11.1/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.1/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

刷新环境变量source ~/.bashrc

输入mvcc -V 查看CUDA的版本

cuDNN的安装

按照官方网站的cuDNN安装指南进行的安装,安装的版本文deb版本

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-sgIX11pO-1652090712133)(/Users/littlestar/Documents/Pytorch环境配置/截屏2022-05-09 18.31.52.png)]

进入Installation Guide

本人使用的是Ubuntu Network Installation输入指令

wget https://developer.download.nvidia.com/compute/cuda/repos/${OS}/x86_64/cuda-${OS}.pin 

sudo mv cuda-${OS}.pin /etc/apt/preferences.d/cuda-repository-pin-600
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/${OS}/x86_64/7fa2af80.pub
sudo add-apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/${OS}/x86_64/ /"
sudo apt-get update

输入如下指令

sudo apt-get install libcudnn8=${cudnn_version}-1+${cuda_version}
sudo apt-get install libcudnn8-dev=${cudnn_version}-1+${cuda_version}

其中

Where:

  • ${cudnn_version} is 8.4.0.*
  • ${cuda_version} is cuda10.2 or cuda11.6

然后进行测试

$cp -r /usr/src/cudnn_samples_v8/ $HOME
$ cd  $HOME/cudnn_samples_v8/mnistCUDNN
$make clean && make
$ ./mnistCUDNN

第一次测试失败,失败原因:

 
mnistCUDNN  sudo make
CUDA_VERSION is 11010
Linking agains cublasLt = true
CUDA VERSION: 11010
TARGET ARCH: x86_64
HOST_ARCH: x86_64
TARGET OS: linux
SMS: 35 50 53 60 61 62 70 72 75 80 86
test.c:1:10: fatal error: FreeImage.h: No such file or directory
    1 | #include "FreeImage.h"
      |          ^~~~~~~~~~~~~
compilation terminated.

此时执行

sudo apt-get install libfreeimage3 libfreeimage-dev

运行

./mnistCUDNN

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3KePBPOl-1652090712133)(/Users/littlestar/Documents/Pytorch环境配置/Screenshot from 2022-04-23 20-20-53.png)]

安装Pytorch

个人建议不要使用anacond自带的导航进行安装,因为会安装比较旧的版本,会出现与CUDA版本不符的情况

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-fmjOVt7x-1652090712133)(/Users/littlestar/Documents/Pytorch环境配置/Screenshot from 2022-04-23 18-16-46.png)]

pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113

安装时要更cu113成为cu116即可安装成功

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐