最近一直想要用GPU训练一个五子棋AI,无奈自己的笔记本是A卡,速度太慢,计算一局需要7、8分钟。所以在之前安了Ubuntu虚拟机,使用了ROCm框架,训练速度提升为一局1、2分钟,但其实速度还是很慢。这两天实验室老师拿来了一台主机,配置:Nvidia 显卡,GeForce GTX1660。所以就想安一下GPU,安了一下午,终于可以调用GPU训练了,速度为1分钟12局。。。真是舒服了。

1.查看你的显卡是否支持GPU

点击查看显卡是否支持GPU
满足之后就可以进行下面的步骤了。

2.安装python环境

其实大家知道,安装python环境可以直接安装,也可以通过Anaconda安装,Anaconda安装时候需要注意你想要安装python版本,如果不想要默认自带的python版本,就不要勾选在这里插入图片描述
建议不要勾选把path直接加入到环境变量中:

在这里插入图片描述

安装好之后,打开Anaconda命令行,输入conda -V,如果输出是你所安的版本,即为成功。

3.安装Tensorflow-GPU

可以打开tensorflow官网:https://www.tensorflow.org/install/install_windows#installing_with_anaconda ,可以了解下官网上有详细的教程。
我是新建了一个名为“tensorflow”的conda环境:版本可以自选,要注意tensorflow-GPU与python版本对应
conda create -n tensorflow pip python=3.6
推荐更换国内的源,速度会快很多的。
然后要激活环境,才能继续在这个环境下安装tensorflow-GPU。当然你也可以不新建一个环境,直接就在anaconda环境下安装也是可以的。
activate tensorflow
下面进行安装tensorflow-GPU,虽然换源了,但你会发现下载还是会很慢。
pip install --ignore-installed --upgrade tensorflow-gpu 
推荐使用这行代码下载:
pip install --ignore-installed --upgrade tensorflow-gpu -i https://pypi.tuna.tsinghua.edu.cn/simple

这样安装的版本可能不是你所需要的,可以指定tensorflow的版本安装,只需在tensorflow-gpu后面指定版本即可,即改为:我安装的tensorflow-gpu 1.14.0版本

pip install --ignore-installed --upgrade tensorflow-gpu==1.14.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

4.安装CUDA ToolKit +cuDNN

第一步要查看要安装的CUDA + cuDNN版本,因为大家要安的tensoflow版本不一样,所以对应的CUDA 和cuDNN版本也就不一样,所以一定要对应上,否则就会报错。

可以点击查看你所要安装的tensorflow所对应的版本cuDNN和CUDA版本

记得点击右上角的 语言选项,把中文改成英语,否则最新的版本显示不出来。然后点击左侧栏的windows

在这里插入图片描述

然后向下翻,翻到这里,查看对应关系,我要安的是1.14.0,所以按第一行的对应版本安装

在这里插入图片描述

然后下载CUDA + cuDNN
在这个网址查找CUDA已发布版本:https://developer.nvidia.com/cuda-toolkit-archive

在这里插入图片描述

按照刚才官网提示进行下载,我下载的是10.0本地安装版本。

在这里插入图片描述

下载好CUDA Toolkit 10.0 后,我们开始下载cuDnn 7.4,需要注意的是,下载cuDNN需要在nvidia上注册账号,使用邮箱注册,完全免费的。登陆账号之后才可以继续下载。
一定要按照tensorflow官网的提示,选择安装CUDA和cuDNN的版本,一定要对应好。
cuDNN历史版本在该网址下载网址:https://developer.nvidia.com/rdp/cudnn-archive
下载之后,下面进行安装。

注意:最重要的一步,先卸载原有的显卡的驱动。

CUDA Toolkit需要在指定版本显卡驱动环境下才能使用,如果已经安装了nvidia显卡驱动,再安装CUDA Toolkit时,会因二者版本不兼容而导致CUDA无法使用。而CUDA Toolkit安装包中自带与之匹配的显卡驱动,所以一定要删除电脑先前的显卡驱动。
大家可以在左下角的 小娜 中搜索,NVIDIA GeFore Experience(我安装的驱动是这个,具体还要看你自己的驱动名称,一定要找好了,别删错了),找到之后,卸载掉就可以安装CUDA Toolkit了。建议先把自己原来的驱动型号先记下来,万一出什么问题,还可以补救。
先安装CUDA Toolkit,安装路径默认就可以了,但是要记住这个路径,一会还有用。接下来就是安装了,在安装选项时,选择自定义,然后在自定义安装选项中,勾选所有的安装项,然后就可以了。
接下来将cudnn的那个压缩包解压,里面有三个文件夹,直接复制到CUDA的根目录下就可以,例如这个路径下:C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0,然后进行环境变量配置。记住:要改成你自己的路径,否则系统是找不到。
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\bin

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\lib\x64

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\libnvvp
到这里安装步骤已经完成了,下面就以开始测试了。

5 测试

在你的环境下依次运行代码:
import tensorflow as tf 

tf.test.gpu_device_name() 
我的命令行输出的是:

在这里插入图片描述

上面是自己GPU的信息,最后一句说明安装成功了。
查看在使用那个GPU,依次输入代码:
from tensorflow.python.client import device_lib

device_lib.list_local_devices()

在这里插入图片描述

我这个主机只有一块GPU,所以输出的信息也是只有一块。至此,终于完成了。。。
至此,安装成功,希望这个教程可以帮助到大家,少走一些弯路,早点开始调用GPU训练,说句题外话:GPU训练的速度是真的快啊,如有任何疑问,请留言与我交流。也欢迎大家登陆我的个人博客

给大家推荐一个非常好的科研网站可以使用免费Web of Science、zhi网、IEEE、EI等账号。亲测好用。这个网站拥有众多的数据库,法律的、医学的、工科的,等等。
感谢大家的时间,并希望以上的内容会对大家有所帮助。

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐