提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


前言

提示:这里可以添加本文要记录的大概内容:
例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。


提示:以下是本篇文章正文内容,下面案例可供参考

一、背景

笔者需要在linux下对图像分类网络使用TensorRT进行推理加速,配置cuda的时候出现各种问题,这边记录一下,也给遇到同样问题的同学一点我自己适用的解决方案~

二、cuda安装时出现段错误(核心已转储)解决办法。

一般都是因为栈溢出

1.在终端使用查看栈限制

使用ulimit -a命令查看用户限制

ulimit -a

可以看到如下信息

core file size          (blocks, -c) 0
data seg size           (kbytes, -d) unlimited
file size               (blocks, -f) unlimited
pending signals                 (-i) 1024
max locked memory       (kbytes, -l) 32
max memory size         (kbytes, -m) unlimited
open files                      (-n) 1024
pipe size            (512 bytes, -p) 8
POSIX message queues     (bytes, -q) 819200
stack size              (kbytes, -s) 10240
cpu time               (seconds, -t) unlimited
max user processes              (-u) 4096
virtual memory          (kbytes, -v) unlimited
file locks                      (-x) unlimited

这里我们可以看到 stack size是10240
此时输入命令修改栈限制

ulimit -s unlimited

此时再进行cuda配置,这边建议使用cuda官网的runfile形式配置

2.cuda安装命令第二部错误:Installation failed. See log at /var/log/cuda-installer.log for details.解决办法

在官网的第二条命令

sudo sh cuda_11.0.2_450.51.05_linux.run

运行后出现:
[ERROR]: Install of driver component failed.
[ERROR]: Install of 450.51.05 failed, quitting
说明电脑中其实是有的cuda驱动,因为这次安装的cuda是用来加速计算的而不是驱动显示,所以这样会安装两次驱动显示从而报错

解决方法
在执行cuda配置的两条命令语句后得到下图,选择continue:
在这里插入图片描述
输入accept:
在这里插入图片描述
将光标移动到Driver选项并回车,取消选中后install:
在这里插入图片描述
此时可以解决上述问题2
最后不要忘记配置cuda的环境变量

vim ~/.bashrc
#按o进入编辑模式,并在最后一行添加如下代码
export PATH=$PATH:/usr/local/cuda-11.0/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.0/lib64
export LIBRARY_PATH=$LIBRARY_PATH:/usr/local/cuda-11.0/lib64
#esc后输入wq退出保存

该处使用的url网络请求的数据。


3、nvcc -Vcuda版本不对应解决方法

首先查看调用nvcc命令的位置

/usr/bin/nvcc

输入以下命令,将其出现的路径改为刚安装的cuda路径

sudo vi /usr/bin/nvcc

再次使用nvcc -V得到最新的cuda版本信息

欢迎大家指出不足

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐