报错场景:

Linux ubuntu-users 4.15.0-112-generic #113~16.04.1-Ubuntu
ubuntu 16


问题描述:

在ubuntu :Linux ubuntu-users 4.15.0-112-generic #113~16.04.1-Ubuntu内核版本重启之后发现打开任何软件都会报:段错误(核心已转储)。

原因分析:

core dump又叫核心转储, 当程序运行过程中发生异常, 程序异常退出时, 由操作系统把程序当前的内存状况存储在一个core文件中, 叫core dump. (linux中如果内存越界会收到SIGSEGV信号,然后就会core dump)
在程序运行的过程中,有的时候我们会遇到Segment fault(段错误)这样的错误。这种看起来比较困难,因为没有任何的栈、trace信息输出。该种类型的错误往往与指针操作相关。往往可以通过这样的方式进行定位。

一 造成segment fault,产生core dump的可能原因

1.内存访问越界

a) 由于使用错误的下标,导致数组访问越界

b) 搜索字符串时,依靠字符串结束符来判断字符串是否结束,但是字符串没有正常的使用结束符

c) 使用strcpy, strcat, sprintf, strcmp, strcasecmp等字符串操作函数,将目标字符串读/写爆。应该使用strncpy, strlcpy, strncat, strlcat, snprintf, strncmp, strncasecmp等函数防止读写越界。


2.多线程程序使用了线程不安全的函数


3.多线程读写的数据未加锁保护。对于会被多个线程同时访问的全局数据,应该注意加锁保护,否则很容易造成core dump


4.非法指针

a) 使用空指针

b) 随意使用指针转换。一个指向一段内存的指针,除非确定这段内存原先就分配为某种结构或类型,或者这种结构或类型的数组,否则不要将它转换为这种结构或类型 的指针,而应该将这段内存拷贝到一个这种结构或类型中,再访问这个结构或类型。这是因为如果这段内存的开始地址不是按照这种结构或类型对齐的,那么访问它 时就很容易因为bus error而core dump.


5 堆栈溢出.不要使用大的局部变量(因为局部变量都分配在栈上),这样容易造成堆栈溢出,破坏系统的栈和堆结构,导致出现莫名其妙的错误


二 配置操作系统使其产生core文件

首先通过ulimit命 令查看一下系统是否配置支持了dump core的功能。通过ulimit -c或ulimit -a,可以查看core file大小的配置情况,如果为0,则表示系统关闭了dump core。可以通过ulimit -c unlimited来打开。若发生了段错误,但没有core dump,是由于系统禁止core文件的生成。

三 用gdb查看core代码文件

发生core dump之后, 用gdb进行查看core文件的内容, 以定位文件中引发core dump的行.
适用于编译报错出现的段错误(核心已转储)

gdb [exec file] [core file]
如: gdb ./test test.core

解决方案:

  1. ubuntu 查看修改线程默认栈空间大小 ulimit -s ( ulimit:控制shell程序的资源)
    a、通过命令 ulimit -s 查看linux的默认栈空间大小,默认情况下 为10240 即10M
    b、通过命令 ulimit -s 设置大小值 临时改变栈空间大小:ulimit -s 102400, 即修改为100M
    c、可以在/etc/rc.local 内 加入 ulimit -s 102400 则可以开机就设置栈空间大小
    d、在/etc/security/limits.conf 中也可以改变栈空间大小:

/etc/rc.local 设置开机时启用的配置和软件,在/etc/rc.local中将加密软件关闭

#<domain> <type> <item> <value>
    *      soft  stack   102400
   重新登录,执行ulimit -s 即可看到改为102400 即100M
  1. 在~/.bashrc加入ulimit -m unlimited (内存大小无限制)。
Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐