麒麟系统开发笔记(十一):在国产麒麟系统上使用gdb定位崩溃异常方法流程进阶定位代码行数及专项测试Demo
前言
上一篇,通过研究,可以定位到函数,本篇进一步优化,没有行数,程序较为复杂的时候,就无法定位,所以进一步定位。
本篇做了 qBreakpad 的研究,但是没有成功,过程也还是填出来,后来突然注意到 gdb 出现行数的方法,并通过了几轮测试以及实战,确实可以定位到行数,所以为了大家方便,把国企麒麟上的 Qt 崩溃方法分享出来。
本篇文章比较长,就不分篇了,同时还做了专项测试。
阅读者如果一开始有点懵,可能先要看先大致扫一下:《麒麟系统开发笔记(十):在国产麒麟系统上使用 gdb 定位崩溃异常方法流程以及测试 Demo》,本篇也是解决上一篇探讨的遗留问题(只定位了函数,未定位代码行号)。
(这里是上一篇的 demo,只关注红框的即可)
与没有 -g 的时候没有啥区别。
修改下代码:
测试:
还是没有堆栈信息:
改为 debug 版本,也没有:
不清楚原因,这里博主就没有深究了
研究 qBreakpad 去了,但是 qBreakpad 也入深坑了,在爬坑的时候,突然注意到 gdb 的 bt 指令,所以研究了个把小时 qBreakpad 又折回来继续了。
至此,出现了行号:
为了确认最简单的方式,所以进行测试:
DEFINES += QT_NO_DEBUG_OUTPUT
DEFINES += QT_NO_WARN_OUTPUT
QMAKE_CXXFLAGS += -g
#QMAKE_CXXFLAGS += -g3
有行号,行号跟函数在同一行。
有行号,行号跟函数在同一行。
#DEFINES += QT_NO_DEBUG_OUTPUT
#DEFINES += QT_NO_WARN_OUTPUT
QMAKE_CXXFLAGS += -g
#QMAKE_CXXFLAGS += -g3
还试了下 -g3:
定位了函数,不定位行号。
所以,最终发现是不能屏蔽 qt 打印输出的,不然是没有的,跟 release 或者 debug 没有关系(没有去论证 debug 下屏蔽 qt 打印输出了)
所以,无 -g 也不行
先加了一句代码:
取消屏蔽 qt 打印,加上 -g:
使用 release 编译后,运行崩溃:
定位 coredump 文件:
然后使用 gdb 的方法:
这里得行是 qlist.h 的行号,不是我们代码的行号,所以下标错误估计就这样了。可以判断出,越界也是最后某个地方调用指针导致错误,所以越界当时是不会有问题,当越界在用越界调用的就把出错的指针调用出行数打出来。
下面试试指针错误:
Gdb 调试不出现行数
- 原因 1:release 与 debug 问题
- 原因 2:-g 问题
- 原因 3:是否屏蔽 qt 打印问题
1+2+3,导致情况多种,花了不少时间定位
进行了专项测试论证,查看“专项测试论证”。
qBreakpad 下载地址:https://github.com/buzzySmile/qBreakpad
git clone --recursive https://github.com/buzzySmile/qBreakpad.git
好像下下来有点问题,最后还是手动下载 zip 包了:
qBreakpad 依赖 breakpad 和 lss
下不下来,另外找把
breakpad 下载地址:https://github.com/google/breakpad
(最新版报错),下载 v2021.08.09 版本
lss:https://github.com/ithaibo/linux-syscall-support
下载来:
复制过去并改名:
改完后(先删除已经存在的):
怀疑是版本问题,降低版本试试:
如下,下载解压后替换:
步骤五:解决错误“*** No rule to make target ‘xxx/minidump_file_writer.cc’, needed by ‘_build/obj/minidump_file_writer.o’. Stop.”
“*** No rule to make target ‘…/…/qBreakpad-master/third_party/breakpad/src/client/minidump_file_writer.cc’, needed by ‘_build/obj/minidump_file_writer.o’. Stop.”
那岂不是要降低 qBreakpad 的版本?试一试
至此,突然发现 gdb 的 bt,所以这边停止了。