【Ubuntu20.04上3090显卡安装Nvidia驱动和CUDA11.4,cuDNN,anaconda,以及解决向日葵无法连接和重装Ubuntu20.04遇到的问题】
Ubuntu20.04上3090显卡安装Nvidia驱动和CUDA11.4,cuDNN,anaconda,以及解决向日葵无法连接和重装Ubuntu20.04遇到的问题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如
Ubuntu20.04上3090显卡安装Nvidia驱动和CUDA11.4,cuDNN,anaconda,以及解决向日葵无法连接和重装Ubuntu20.04遇到的问题
安装的步骤以及出现的问题
软硬件信息:
操作系统:Ubuntu20.04
显卡:GeForce RTX 3090
(小菜鸟装两台电脑踩过的所有坑)
一、安装Nvidia驱动
- 根据显卡型号3090,到官网下载驱动:
自己下载的版本是:
NVIDIA-Linux-x86_64-470.94.run - 禁用nouveau
打开终端,输入:
sudo gedit /etc/modprobe.d/blacklist.conf
在blacklist.conf文件末尾加上
blacklist nouveau
并保存。
然后执行:
sudo update-initramfs -u //应用更改
重启电脑:
reboot
验证是否禁用nouvea
lsmod | grep nouveau
若没有信息返回说明已经禁用
- 安装NVIDIA驱动:
打开terminal卸载旧版本NVIDIA驱动:
sudo apt-get remove –purge nvidia*
给驱动run文件赋予执行权限:
sudo chmod a+x NVIDIA-Linux-x86_64-470.94.run
安装:
sudo ./NVIDIA-Linux-x86_64-470.94.run -no-x-check -no-nouveau-check -no-opengl-files
安装过程出现的问题:
问题一:
出现unable to find the development tool cc的问题:
解决方法:
sudo apt-get update
sudo apt-get install gcc
安装完gcc之后继续执行安装的命令:
sudo ./NVIDIA-Linux-x86_64-470.94.run -no-x-check -no-nouveau-check -no-opengl-files
问题二:
出现unable to find the development tool make的问题:
解决方法:
sudo apt-get update
sudo apt-get install ubuntu-make
sudo apt-get install make
安装完make之后继续执行安装的命令:
sudo ./NVIDIA-Linux-x86_64-470.94.run -no-x-check -no-nouveau-check -no-opengl-files
安装过程中出现的选项:
选择Ignore CC version check继续
选择OK继续
Install NVIDIA’s 32-bit compatibility libraries?
选择No继续
Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up.
选择 Yes
最后,输入nvidia-smi
查看NVIDIA版本检验是否安装成功
二、安装CUDA
-
到官网下载符合自己电脑的cuda版本
最后一项Installer Type建议选择runfile[local],因为更方便一些。
这里,我下载的是:cuda_11.4.0_470.42.01_linux.run -
安装
下载好之后,输入:
sudo sh cuda_11.4.0_470.42.01_linux.run
输入accept回车:
这个地方不要下载Driver,因为之前已经安装完了
取消选择的方法是:光标停留在Driver那一行上,然后回车,使[]里的X消失
选择install回车
看到上边的页面,则安装完毕
- 验证是否安装成功
cat /usr/local/cuda/version.txt
若没有这个文件,则在该文件夹下看看是否有version.json
有的话输入则输入:cat /usr/local/cuda/version.json
4. 设置环境变量
gedit ~/.bashrc
加入环境变量:
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
保存并退出,终端运行:
source ~/.bashrc
- 查看是否安装成功:
终端运行:
nvcc -V
显示上述文字则代表安装成功。
(在安装另一台机子配置环境时出现了nvcc fatal: nvcc fatal:Failed to preprocess host compiler properties的问题:
解决方法如下:
在终端输入:
sudo apt-get install build-essential
再运行nvcc -V则成功
三、安装cuDNN
- 进入官网进行注册
- 下载CUDA对应的cuDNN版本
CUDA11.4下载的安装包:
- 解压
tar -xzvf cudnn-11.4-linux-x64-v8.2.4.15.tgz
- 将相关文件复制到CUDA路径
sudo cp cuda/include/cudnn.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
- 重建软链接
cd /usr/local
sudo rm -rf cuda //删除之前创建的软链接
sudo ln -s cuda-11.4 cuda //重建软链接
四、安装conda
- 到官网下载
找到最下边找到下图界面,根据自己所需要的版本进行下载:
我下载的是:Anaconda3-2021.11-Linux-x86_64.sh - 安装
打开终端,执行下列命令:
bash Anaconda3-2021.11-Linux-x86_64.sh
按回车继续安装
输入yes回车继续
按回车确认安装位置:/home/{虚拟机名称}/anaconda3
输入yes,继续
出现类似界面,则代表Anaconda3已经安装成功。
- 查看是否安装成功
最后可以输入conda list查看(重新打开一个终端):
五、安装 ssh
- 安装
sudo apt-get install sshd
- 查看是否安装
ssh -V
- 开启ssh服务
sudo service ssh start
- 查看ssh是否开启
sudo ps -e |grep ssh
(sshd如果只显示一个,则表明没有开启ssh服务)
解决方法:
sudo apt-get install openssh-server
ssh -V
sudo service ssh start
sudo ps -e |grep ssh
开启成功
5. 安装ssh服务器
sudo apt install openssh-server
- 安装ssh客户端
sudo apt install openssh-client
- 配置ssh客户端
终端运行:
sudo gedit /etc/ssh/ssh_config
去掉PasswordAuthentication yes前面的#号,保存并退出
- 配置ssh服务器
终端运行:
sudo gedit /etc/ssh/sshd_config
把PermitRootLogin prohibit-password改成PermitRootLogin yes,保存退出:
9. 重启ssh服务
sudo /etc/init.d/ssh restart
出现Restarting ssh (via systemctl):ssh.service.则安装成功:
六、解决向日葵无法连接的问题
- 安装并登陆好Ubuntu的向日葵客户端
在终端执行以下命令:
sudo apt-get update
sudo apt-get grade
sudo apt-get install lightdm
- 切换lightdm图形页面
sudo dpkg-reconfigure lightdm
- 重启
reboot
一台机子完全成功,可以顺利连接向日葵。
- 在另一台机子上出现的问题
切换lightdm图形页面之后,重启时无法进入界面:
尝试了很多方法都没有作用,于是就重新安装了Ubuntu20.04。
七、重新安装Ubuntu20.04出现的GNU GRUB问题
-
在grub指令处,输入ls指令
可以用来查看当前路径下的文件和文件夹。
(hd0)、(hd0,msdos4)类似这些的输出是磁盘的分区,我们需要在这些分区内找到能够正确引导系统的文件配置。 -
寻找引导文件所在的位置
使用类似的命令:
ls (hd0,msdos4)/
来一个个测试,看是否出现vmlinuz或者linux,initrd.img,root这样的字样:
3. 找到引导文件所在位置(hd0,msdos4),输入以下命令:
set root= (hd0,msdos4)
set prefix= (hd0,msdos4)/boot/grub
insmod normal
normal
参考资料
[1] Ubuntu20.04上3090显卡安装Nvidia驱动和CUDA11.1及cuDNN8.0.4
[2] Ubuntu20.04系统,3090显卡,安装驱动、CUDA、cuDNN的步骤
[3] vscode 连接虚拟机(Ubuntu)
[4] Ubuntu安装和配置ssh教程
[5] linux向日葵远程安装及卸载和使用
[6] Ubuntu开机出现grub指令,无法正常开机
更多推荐
所有评论(0)