一、问题描述

刚配好CUDA  +  TensorFlow-GPU  +  Python环境,在编译器中运行时确报错

Could not load dynamic library 'libnvinfer.so.6'; dlerror: libnvinfer.so.6: cannot open shared object file: No such file or directory; LD_LIBRARY_PATH: :/usr/local/cuda-10.0/lib64

报错后仍可以正常运行,但是发现GPU并未调用,只跑在CPU上。在尝试多次重装CUDA10.0、CUDA ToolKit等后,均无效。

报错中还可能会提示缺失“TensorRT”;

二、原因分析

CUDA的Python相关库cudnn、cudatoolkit等没有安装全,并不是CUDA10.0等的锅(当然如果CUDA10.0等没有装也会有其他报错,而不是缺失库)

三、环境

Ubuntu+Python2.7+TensorFlow2.1.0

不管什么环境,出现此类报错解决的思路都类似。

四、解决方法

1.pip或者conda卸载掉所有的tensorflow包

2.如果没有安装CUDA等,先安装它们

3.用conda安装包

不要用pip安装TensorFlow包,要用conda来安装包(前提是要有Anaconda),输入conda指令:

conda install tensorflow-gpu==2.1.0

上面的版本可以换成2.0.0,无论什么版本切记一定要指明版本!否则可能会安装到1.0的旧版本。

conda会自动将TensorFlow相关的库给安装齐全,如cudnn、cudatoolkit、tensorflow-base等。

4.检查cudnn的版本是否与CUDA的版本相对应

参考下图:

5.此时再在编译器中运行环境,则不会有缺失文件的报错,且GPU开始有高占用率并正常工作

<该方法同样适用于解决TensorFlow只跑CPU不跑GPU的问题>

<该方法同样适用于如何配置TensorFlow与CUDA的问题>

 

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐