8月 302012
 

摘自: http://tldp.org/HOWTO/Secure-Programs-HOWTO/avoid-vfork.html

The portable way to create new processes in Unix-like systems is to use the fork(2) call. BSD introduced a variant called vfork(2) as an optimization technique. In vfork(2), unlike fork(2), the child borrows the parent’s memory and thread of control until a call to execve(2V) or an exit occurs; the parent process is suspended while the child is using its resources. The rationale is that in old BSD systems, fork(2) would actually cause memory to be copied while vfork(2) would not. Linux never had this problem; because Linux used copy-on-write semantics internally, Linux only copies pages when they changed (actually, there are still some tables that have to be copied; in most circumstances their overhead is not significant). Nevertheless, since some programs depend on vfork(2), recently Linux implemented the BSD vfork(2) semantics (previously vfork(2) had been an alias for fork(2)).

翻译:

在类Unix系统中, 可移植的创建一个新进程的方式是调用fork(2)。BSD中作为一种优化技术引入了一个叫做vfork(2) 的变体。vfork(2) 和fork(2) 不同,它在退出或者调用execve(2V)之前是作为父进程的一个线程存在的,和父进程共用内存空间;而在子进程使用这些资源时,父进程是被挂起的。之所以会有vfork(2),是因为在老的BSD系统中,fork(2)将导致一次真实的内存拷贝,而vfork(2)则不会。Linux中从来没有过这个问题;因为,Linux内部使用的是写时复制(copy-on-write)的机制,Linux仅仅在页被修改时才复制(事实上,仍然会有一些表被复制;在大多数情况下,这没有太大影响)。然而,因为一些程序依赖了vfork(2),最近Linux也实现了BSD的vfork(2)机制(以前的vfork(2)是fork(2)的别名)。

There are a number of problems with vfork(2). From a portability point-of-view, the problem with vfork(2) is that it’s actually fairly tricky for a process to not interfere with its parent, especially in high-level languages. The not interfering” requirement applies to the actual machine code generated, and many compilers generate hidden temporaries and other code structures that cause unintended interference. The result: programs using vfork(2) can easily fail when the code changes or even when compiler versions change.

For secure programs it gets worse on Linux systems, because Linux (at least 2.2 versions through 2.2.17) is vulnerable to a race condition in vfork()’s implementation. If a privileged process uses a vfork(2)/execve(2) pair in Linux to execute user commands, there’s a race condition while the child process is already running as the user’s UID, but hasnt entered execve(2) yet. The user may be able to send signals, including SIGSTOP, to this process. Due to the semantics of vfork(2), the privileged parent process would then be blocked as well. As a result, an unprivileged process could cause the privileged process to halt, resulting in a denial-of-service of the privileged process' service. FreeBSD and OpenBSD, at least, have code to specifically deal with this case, so to my knowledge they are not vulnerable to this problem. My thanks to Solar Designer, who noted and documented this problem in Linux on the `security-audit” mailing list on October 7, 2000.

The bottom line with vfork(2) is simple: don’t use vfork(2) in your programs. This shouldn’t be difficult; the primary use of vfork(2) is to support old programs that needed vfork’s semantics.

 

其它参考: http://linux.about.com/library/cmd/blcmdl2_vfork.htm

 

重点:

1. fork不会挂起父进程, vfork会挂起父进程,直到调用execve或_exit

2. 一般来讲,vfork都是会和execve成对出现的

3. vfork中不应该调用exit

4. 当一个特权进程使用vfork来派生一个非特权进程时,在vfork设置为非特权进程之后,调用execve之前,非特权用户给该进程发送一个STOP信号,将可能会挂起特权进程,所以,尽量不要使用vfork

 

 Posted by at 下午 11:38
10月 072011
 

1、不要在C++中调用longjmp,因为他会打破析构函数将被调用的顺序。
http://blog.sina.com.cn/s/blog_4d8498800100bonm.html

2.inline函数是否可以访问静态成员变量
可以啊,内联函数就相当于把函数展开,所以就相当于一系列语句,并不是真正的函数。
可以,inline 只是提供给编译器的一个建议,具体怎么做要看实际情况而定,比如说如果函数内出现循环,那么编译器通常不会将其内联。而且是否内联可以通过一系列编译选项和宏来控制,即便如此,具体怎么做仍要看编译器,也可以使用 #pragma auto_inline( [{on | off}] ) 来告知编译器使之自动决定是否内联某些函数 。对于直接在类定义内部实现的函数就相当于前面加上 inline 关键字。

综上所述,内联函数在功能上与普通函数相同 。

3、C++函数中那些不可以被声明为虚函数
常见的不不能声明为虚函数的有:普通函数(非成员函数);静态成员函数;内联成员函数;构造函数;友元函数。

(1).为什么C++不支持普通函数为虚函数?

普通函数(非成员函数)只能被overload,不能被override,声明为虚函数也没有什么意思,因此编译器会在编译时邦定函数。

(2).为什么C++不支持构造函数为虚函数?

这个原因很简单,主要是从语义上考虑,所以不支持。因为构造函数本来就是为了明确初始化对象成员才产生的,然而virtual function主要是为了再不完全了解细节的情况下也能正确处理对象。另外,virtual函数是在不同类型的对象产生不同的动作,现在对象还没有产生,如何使用virtual函数来完成你想完成的动作。(这不就是典型的悖论)

(3).为什么C++不支持内联成员函数为虚函数?
其实很简单,那内联函数就是为了在代码中直接展开,减少函数调用花费的代价,虚函数是为了在继承后对象能够准确的执行自己的动作,这是不可能统一的。(再说了,inline函数在编译时被展开,虚函数在运行时才能动态的邦定函数)

4.为什么C++不支持静态成员函数为虚函数?
这也很简单,静态成员函数对于每个类来说只有一份代码,所有的对象都共享这一份代码,他也没有要动态邦定的必要性。

5.为什么C++不支持友元函数为虚函数?
因为C++不支持友元函数的继承,对于没有继承特性的函数没有虚函数的说法。
*********************************************************************

1.顶层函数:多态的运行期行为体现在虚函数上,虚函数通过继承方式来体现出多态作用,顶层函数不属于成员函数,是不能被继承的。

2.构造函数:
(1)构造函数不能被继承,因而不能声明为virtual函数

(2)构造函数一般是用来初始化对象,只有在一个对象生成之后,才能发挥多态作用,如果将构造函数声明为virtual函数,则表现为在对象还没有生成的情

5、什么时候调用拷贝构造函数?
通过数值传递、数值返回、明确地拷贝一个对象的时候。

6、当使用布局new语法时,程序员将单独承担释放对象的责任。通过明确地调用析构函数可以做到这一点,它是少有的几个需要明确调用析构函数的情况之一。

 
  1. using namespace std;
  2. //在构造函数中调用虚函数,不会产生多态的效果,只会调用自己的成员函数
  3. class Base
  4. {
  5. public:
  6.     Base();
  7.     virtual void f();
  8.     virtual ~Base(){}
  9. };
  10. class Derived : public Base
  11. {
  12. public:
  13.     Derived();
  14.     virtual void f();
  15. };
  16. Base::Base()
  17. {
  18.     cout<<"Base::Base() calling f()!"<<endl;
  19.     f(); //为了明了,此处应改为Base::f();
  20. }
  21. void Base::f()
  22. {
  23.     cout<<"Base::f()!"<<endl;
  24. }
  25. Derived::Derived():Base()
  26. {
  27.     cout<<"Derived::Derived() calling f()!"<<endl;
  28.     f(); //为了明了,此处应改为Derived::f();
  29. }
  30. void Derived::f()
  31. {
  32.     cout<<"Derived::f()!"<<endl;
  33. }
  34. int main()
  35. {
  36.     cout<<"Create a Derived!"<<endl;
  37.     Derived d;
  38.     return 0;
  39. }

private:和protected:赋值运算符返回的是什么?
返回对this对象的一个引用或者void

private:和protected:赋值运算符不必返回*this,这是因为该类的运算符只有非常少的用户,因此限制了返回*this的优点。

我们经常声明赋值运算符为private:以便阻止用户对该类的对象赋值。
为了防止偶然一个成员函数或者一个友元函数调用,我们经常不对其进行定义。

在抽象类中,我们经常把赋值运算符声明为:protected:以便确保当目标是一个抽象类的引用时,赋值操作不会发生。

如何在派生类内使用赋值运算符?
派生类中的赋值运算符首先调用其直接基类的赋值运算符,然后在调用它的成员对象的赋值运算符。

 
  1. /假如基类的赋值运算符是虚拟的,那么派生类应该做什么?
  2. //开发人员应该覆盖基类的赋值运算符,并且提供一个重载的赋值运算符。
  3. #include <iostream>
  4. using namespace std;
  5. class B
  6. {
  7. public:
  8.     virtual ~B();
  9.     virtual B& operator= (const B& b);
  10. };
  11. B::~B(){}
  12. B& B::operator= (const B& b)
  13. {
  14.     cout<<"B::operator= (const B& b)"<<endl;
  15.     return *this;
  16. }
  17. class D : public B
  18. {
  19. public:
  20.     virtual D& oeprator= (const B& b);  //覆盖父类的
  21.     D& operator= (const D& d);          //重载
  22. };
  23. D& D::operator= (const B& b) //覆盖
  24. {
  25.     cout<<"D::operator= (const B& b)"<<endl;
  26.     return *this;
  27. }
  28. D& D::operator= (const D& d)
  29. {
  30.     cout<<"D::operator= (const D& d)"<<endl;
  31.     return *this;
  32. }
  33. void Sample(D& d, B&b, D& d2, B& b2)
  34. {
  35.     cout<<"d = d2: "; d = d2;
  36.     cout<<"d = b2: "; d = b2;
  37.     cout<<"b = b2: "; b = b2;
  38.     cout<<"b = d2: "; b = d2;
  39. }
  40. int main()
  41. {
  42.     D d, b, d2, b2;
  43. //  Sample(d, b, d2, b2);
  44.     return 0;
  45. }

什么是最终类/
最终类(也称叶子类)是一个永久地禁止产生派生类的类。
仅当设计者决定永久地禁止任何将来的类从一个类派生时,才能声明该类为最终类。
C++不支持&ldquo;finnal&rdquo;关键词,因此我们一般只是对其加以注释。

使编译器强制某个类成为最终类并不困难:只需使构造函数private:并且提供public:static create()成员函数。这样阻止派生类的存在,因为派生类不能调用最终类(private:)构造函数。

最终类不应该有protected:数据成员——它所有的数据成员都应该是private:。类似地,最终类也不应该声明任何新的虚拟函数(尽管它经常覆盖继承的虚拟函数)。

转载: http://blog.csdn.net/wangyangkobe/article/details/6118748

 Posted by at 上午 3:02
9月 202011
 

一.用途:
主要用于程序异常退出时寻找错误原因
二.功能:
回溯堆栈,简单的说就是可以列出当前函数调用关系
三.原理:
1. 通过对当前堆栈的分析,找到其上层函数在栈中的帧地址,再分析上层函数的堆栈,再找再上层的帧地址……一直找到最顶层为止,帧地址指的是一块:在栈上存放局部变量,上层返回地址,及寄存器值的空间。
2.  由于不同处理器堆栈方式不同,此功能的具体实现是编译器的内建函数__buildin_frame_address及 __buildin_return_address中,它涉及工具glibc和gcc,  如果编译器不支持此函数,也可自己实现此函数,举例中有arm上的实现
四.方法:
在程序中加入backtrace及相关函数调用
五.举例:
1. 一般backtrace的实现
i. 程序

 
  1. #include <signal.h>
  2. #include <stdio.h>
  3. #include <stdlib.h>
  4. #include <execinfo.h>
  5. #include <sys/types.h>
  6. #include <sys/stat.h>
  7. #include <fcntl.h>
  8. #include <string.h>
  9. #include <unistd.h>
  10. #define PRINT_DEBUG
  11. static void print_reason(int sig, siginfo_t * info, void *secret)
  12. {
  13. void *array[10];
  14. size_t size;
  15. #ifdef PRINT_DEBUG
  16. char **strings;
  17. size_t i;
  18. size = backtrace(array, 10);
  19. strings = backtrace_symbols(array, size);
  20. printf("Obtained %zd stack frames.\n", size);
  21. for (i = 0; i < size; i++)
  22. printf("%s\n", strings);
  23. free(strings);
  24. #else
  25. int fd = open("err.log", O_CREAT | O_WRONLY);
  26. size = backtrace(array, 10);
  27. backtrace_symbols_fd(array, size, fd);
  28. close(fd);
  29. #endif
  30. exit(0);
  31. }
  32. void die()
  33. {
  34. char *test1;
  35. char *test2;
  36. char *test3;
  37. char *test4 = NULL;
  38. strcpy(test4, "ab");
  39. }
  40. void test1()
  41. {
  42. die();
  43. }
  44. int main(int argc, char **argv)
  45. {
  46. struct sigaction myAction;
  47. myAction.sa_sigaction = print_reason;
  48. sigemptyset(&myAction.sa_mask);
  49. myAction.sa_flags = SA_RESTART | SA_SIGINFO;
  50. sigaction(SIGSEGV, &myAction, NULL);
  51. sigaction(SIGUSR1, &myAction, NULL);
  52. sigaction(SIGFPE, &myAction, NULL);
  53. sigaction(SIGILL, &myAction, NULL);
  54. sigaction(SIGBUS, &myAction, NULL);
  55. sigaction(SIGABRT, &myAction, NULL);
  56. sigaction(SIGSYS, &myAction, NULL);
  57. test1();
  58. }

ii. 编译参数
gcc main.c -o test -g -rdynamic

 Posted by at 上午 9:39
9月 202011
 

   C++编程语言在程序开发应用中能够帮助我们轻松的完成许多功能需求。比如今天为大家介绍的C++获取文件大小的方法,就可以以多种方式轻松的实现。现在将会实现方法呈现给大家,以便大家参考。
C++获取文件大小代码示例:

  

  
C++获取文件大小的相关方法就为大家介绍到这里。

 Posted by at 上午 9:38  Tagged with:
7月 252011
 

观看一个例子:

 
  1. #include <iostream>
  2. using namespace std;
  3. class A{
  4.     public:
  5.         virtual void say() {
  6.             cout<<"A say: "<<endl;
  7.         }
  8. };
  9. class B :public A{
  10.     public:
  11.         void say() {
  12.             cout<<"B say: "<<endl;
  13.         }
  14. };
  15. void testVirtual(A& a) {
  16.     a.say();
  17. }
  18. int main(void) {
  19.     B b;
  20.     //b.say("hello B");
  21.     testVirtual(b);
  22.     return 0;
  23. }

1. 注意 第6行的virtual关键字和第18行的引用传参
2. 现在的结果是 "B say:";
3. 如果去掉virtual关键字,或者传参的时候不使用引用传参,则,输出的结果都将是: "A say:"
4. 这种语法现象叫 upcast
5. c++ 中class声明类,要以分号结束
6. 参考资料: 《C++编程思想》之 第15章 多态性和虚函数

 Posted by at 上午 10:34
7月 242011
 

好久没看c++了,以为自己还能看明白,今天看了kyototycoon中的一个类,遇到了好几个知识点:

 
  1. // plug-in server driver
  2. class PlugInDriver : public kc::Thread {
  3.  public:
  4.   // constructor
  5.   explicit PlugInDriver(kt::PluggableServer* serv) : serv_(serv), error_(false) {}
  6.   // get the error flag
  7.   bool error() {
  8.     return error_;
  9.   }
  10.  private:
  11.   // perform service
  12.   void run(void) {
  13.     kc::Thread::sleep(0.4);
  14.     if (serv_->start()) {
  15.       if (!serv_->finish()) error_ = true;
  16.     } else {
  17.       error_ = true;
  18.     }
  19.   }
  20.   kt::PluggableServer* serv_;
  21.   bool error_;
  22. };

且只看:
explicit
 PlugInDriver(kt::PluggableServer* serv) : serv_(serv), error_(false) {}
1.
explicit  参看: http://wenku.baidu.com/view/3a02f28fcc22bcd126ff0ced.html
 
explicit 用来修饰构造函数的, 表明构造函数是显示的,而且,由explicit修饰的构造函数为默认构造函数;
  因为使用了explicit,则可以:
 
PlugInDriver p(serv);  // 而不能:
 
PlugInDriver p = serv; // 如果没有explicit ,则这样是可以的, 如:
  string s = "abcd"; // 等价于
  string s("abcd")

2. serv_(serv), error_(false)
  这个是给两个私有成员赋值,至于为什么不卸载构造函数的函数体内,参看《c++编程思想》p329

3. 基类kt::Thread 使用了public来修饰
  如果没有public来修饰的话,则子类的所有的public成员和方法在子类上都将体现为private的,这显然不是我们想看到的; 那样则可以只用组合而不用继承了

 Posted by at 上午 7:00
6月 112011
 

使用rpm命名查看gdb的rpm包,主要由下面几个程序:
/usr/bin/gcore
/usr/bin/gdb
/usr/bin/gdbserver
/usr/bin/gdbtui
/usr/bin/gstack

其中:
gcore 是生成core文件用的
gdb 调试用的
gdbserver 远程调试使用
gdbtui 界面化的gdb, 同 gdb -tui
gstack 查看正在运行的进程的调用栈信息

实例:
gcore:
# gcore -o a 3236
[root@login ~]# ll a.3236
-rw-r–r–  1 root root 64691440  6? 11 20:48 a.3236

产生core的过程中进程暂停工作
========================================

# gdbserver 10.55.38.18:12345 a.out
Process a.out created; pid = 20975
Listening on port 12345
Remote debugging from host 10.55.38.14

注意: 本地需要有a.out 和a.c

========================================
# gstack 24874
#0  0x0088e7a2 in ?? () from /lib/ld-linux.so.2
#1  0x0096f68b in semop () from /lib/tls/libc.so.6
#2  0x006fdbe3 in proc_mutex_sysv_acquire (mutex=0x70ed50)
#3  0x006fe608 in apr_proc_mutex_lock (mutex=0xfffffffc)
#4  0x080829bf in child_main (child_num_arg=-4) at prefork.c:205
#5  0x08082c5e in make_child (s=0x808260c, slot=4) at prefork.c:758
#6  0x080837e5 in ap_mpm_run (_pconf=0x1, plog=0x9dfe160, s=0x2)
#7  0x08063de4 in main (argc=3, argv=0xbfe63654) at main.c:740

=========================================
gdbtui:

 Posted by at 上午 6:35
6月 112011
 

GDB 概述

————

GDB GNU 开源组织发布的一个强大的 UNIX 下的程序调试工具。或许,各位比较喜欢那种图形界面方式的,像 VC BCB IDE 的调试,但如果你是在 UNIX 平台下做软件,你会发现 GDB 这个调试工具有比 VC BCB 的图形化调试器更强大的功能。所谓寸有所长,尺有所短就是这个道理。

一般来说, GDB 主要帮忙你完成下面四个方面的功能:

    1 、启动你的程序,可以按照你的自定义的要求随心所欲的运行程序。
2
、可让被调试的程序在你所指定的调置的断点处停住。(断点可以是条件表达式)
3
、当程序被停住时,可以检查此时你的程序中所发生的事。
4
、动态的改变你程序的执行环境。

从上面看来, GDB 和一般的调试工具没有什么两样,基本上也是完成这些功能,不过在细节上,你会发现 GDB 这个调试工具的强大,大家可能比较习惯了图形化的调试工具,但有时候,命令行的调试工具却有着图形化工具所不能完成的功能。让我们一一看来。


一个调试示例
——————

源程序: tst.c

     1 #include <stdio.h>
2
3 int func(int n)
4 {
5         int sum=0,i;
6         for(i=0; i<n; i++)
7         {
8                 sum+=i;
9         }
10         return sum;
11 }
12
13
14 main()
15 {
16         int i;
17         long result = 0;
18         for(i=1; i<=100; i++)
19         {
20                 result += i;
21         }
22
23        printf("result[1-100] = %d \n", result );
24        printf("result[1-250] = %d \n", func(250) );
25 }

编译生成执行文件:( Linux 下)
hchen/test> cc -g tst.c -o tst

使用 GDB 调试:

hchen/test> gdb tst  <———- 启动 GDB
GNU gdb 5.1.1
Copyright 2002 Free Software Foundation, Inc.
GDB is free software, covered by the GNU General Public License, and you are
welcome to change it and/or distribute copies of it under certain conditions.
Type "show copying" to see the conditions.
There is absolutely no warranty for GDB.  Type "show warranty" for details.
This GDB was configured as "i386-suse-linux"…
(gdb) l     <——————– l
命令相当于 list ,从第一行开始例出原码。
1        #include <stdio.h>
2
3        int func(int n)
4        {
5                int sum=0,i;
6                for(i=0; i<n; i++)
7                {
8                        sum+=i;
9                }
10               return sum;
(gdb)       <——————–
直接回车表示,重复上一次命令
11       }
12
13
14       main()
15       {
16               int i;
17               long result = 0;
18               for(i=1; i<=100; i++)
19               {
20                       result += i;  
(gdb) break 16    <——————–
设置断点,在源程序第 16 行处。
Breakpoint 1 at 0x8048496: file tst.c, line 16.
(gdb) break func  <——————–
设置断点,在函数 func() 入口处。
Breakpoint 2 at 0x8048456: file tst.c, line 5.
(gdb) info break  <——————–
查看断点信息。
Num Type           Disp Enb Address    What
1   breakpoint     keep y   0x08048496 in main at tst.c:16
2   breakpoint     keep y   0x08048456 in func at tst.c:5
(gdb) r           <———————
运行程序, run 命令简写
Starting program: /home/hchen/test/tst

Breakpoint 1, main () at tst.c:17    <———- 在断点处停住。
17               long result = 0;
(gdb) n          <———————
单条语句执行, next 命令简写。
18               for(i=1; i<=100; i++)
(gdb) n
20                       result += i;
(gdb) n
18               for(i=1; i<=100; i++)
(gdb) n
20                       result += i;
(gdb) c          <———————
继续运行程序, continue 命令简写。
Continuing.
result[1-100] = 5050       <———-
程序输出。

Breakpoint 2, func (n=250) at tst.c:5
5                int sum=0,i;
(gdb) n
6                for(i=1; i<=n; i++)
(gdb) p i        <———————
打印变量 i 的值, print 命令简写。
$1 = 134513808
(gdb) n
8                        sum+=i;
(gdb) n
6                for(i=1; i<=n; i++)
(gdb) p sum
$2 = 1
(gdb) n
8                        sum+=i;
(gdb) p i
$3 = 2
(gdb) n
6                for(i=1; i<=n; i++)
(gdb) p sum
$4 = 3
(gdb) bt        <———————
查看函数堆栈。
#0  func (n=250) at tst.c:5
#1  0x080484e4 in main () at tst.c:24
#2  0x400409ed in __libc_start_main () from /lib/libc.so.6
(gdb) finish    <———————
退出函数。
Run till exit from #0  func (n=250) at tst.c:5
0x080484e4 in main () at tst.c:24
24              printf("result[1-250] = %d \n", func(250) );
Value returned is $6 = 31375
(gdb) c     <———————
继续运行。
Continuing.
result[1-250] = 31375    <———-
程序输出。

Program exited with code 027. <——– 程序退出,调试结束。
(gdb) q     <———————
退出 gdb
hchen/test>

好了,有了以上的感性认识,还是让我们来系统地认识一下 gdb 吧。


使用 GDB
————

一般来说 GDB 主要调试的是 C/C++ 的程序。要调试 C/C++ 的程序,首先在编译时,我们必须要把调试信息加到可执行文件中。使用编译器( cc/gcc/g++ )的 -g 参数可以做到这一点。如:

    > cc -g hello.c -o hello
> g++ -g hello.cpp -o hello

如果没有 -g ,你将看不见程序的函数名、变量名,所代替的全是运行时的内存地址。当你用 -g 把调试信息加入之后,并成功编译目标代码以后,让我们来看看如何用 gdb 来调试他。

启动 GDB 的方法有以下几种:

    1 gdb <program>
program
也就是你的执行文件,一般在当然目录下。

    2 gdb <program> core
gdb 同时调试一个运行程序和 core 文件, core 是程序非法执行后 core dump 后产生的文件。

    3 gdb <program> <PID>
如果你的程序是一个服务程序,那么你可以指定这个服务程序运行时的进程 ID gdb 会自动 attach 上去,并调试他。 program 应该在 PATH 环境变量中搜索得到。

GDB 启动时,可以加上一些 GDB 的启动开关,详细的开关可以用 gdb -help 查看。我在下面只例举一些比较常用的参数:

    -symbols <file>
-s <file>
从指定文件中读取符号表。

    -se file
从指定文件中读取符号表信息,并把他用在可执行文件中。

    -core <file>
-c <file>
调试时 core dump core 文件。

    -directory <directory>
-d <directory>
加入一个源文件的搜索路径。默认搜索路径是环境变量中 PATH 所定义的路径。

GDB 的命令概貌
———————

启动 gdb 后,就你被带入 gdb 的调试环境中,就可以使用 gdb 的命令开始调试程序了, gdb 的命令可以使用 help 命令来查看,如下所示:

    /home/hchen> gdb
GNU gdb 5.1.1
Copyright 2002 Free Software Foundation, Inc.
GDB is free software, covered by the GNU General Public License, and you are
welcome to change it and/or distribute copies of it under certain conditions.
Type "show copying" to see the conditions.
There is absolutely no warranty for GDB.  Type "show warranty" for details.
This GDB was configured as "i386-suse-linux".
(gdb) help
List of classes of commands:

    aliases — Aliases of other commands
breakpoints — Making program stop at certain points
data — Examining data
files — Specifying and examining files
internals — Maintenance commands
obscure — Obscure features
running — Running the program
stack — Examining the stack
status — Status inquiries
support — Support facilities
tracepoints — Tracing of program execution without stopping the program
user-defined — User-defined commands

    Type "help" followed by a class name for a list of commands in that class.
Type "help" followed by command name for full documentation.
Command name abbreviations are allowed if unambiguous.
(gdb)

gdb 的命令很多, gdb 把之分成许多个种类。 help 命令只是例出 gdb 的命令种类,如果要看种类中的命令,可以使用 help <class> 命令,如: help breakpoints ,查看设置断点的所有命令。也可以直接 help <command> 来查看命令的帮助。


gdb
中,输入命令时,可以不用打全命令,只用打命令的前几个字符就可以了,当然,命令的前几个字符应该要标志着一个唯一的命令,在 Linux 下,你可以敲击两次 TAB 键来补齐命令的全称,如果有重复的,那么 gdb 会把其例出来。

示例一:在进入函数 func 时,设置一个断点。可以敲入 break func ,或是直接就是 b func
(gdb) b func
Breakpoint 1 at 0x8048458: file hello.c, line 10.

示例二:敲入 b 按两次 TAB 键,你会看到所有 b 打头的命令:
(gdb) b
backtrace  break      bt
(gdb)

    示例三:只记得函数的前缀,可以这样:
(gdb) b make_ <
TAB >
(再按下一次 TAB 键,你会看到 :
make_a_section_from_file     make_environ
make_abs_section             make_function_type
make_blockvector             make_pointer_type
make_cleanup                 make_reference_type
make_command                 make_symbol_completion_list
(gdb) b make_
GDB
把所有 make 开头的函数全部例出来给你查看。

    示例四:调试 C++ 的程序时,有可以函数名一样。如:
(gdb) b ‘bubble( M-?
bubble(double,double)    bubble(int,int)
(gdb) b ‘bubble(
你可以查看到 C++ 中的所有的重载函数及参数。(注: M-? 按两次 TAB 是一个意思)

要退出 gdb 时,只用发 quit 或命令简称 q 就行了。

GDB 中运行 UNIX shell 程序
————————————

gdb 环境中,你可以执行 UNIX shell 的命令,使用 gdb shell 命令来完成:

    shell <command string>
调用 UNIX shell 来执行 <command string> ,环境变量 SHELL 中定义的 UNIX shell 将会被用来执行 <command string> ,如果 SHELL 没有定义,那就使用 UNIX 的标准 shell /bin/sh 。(在 Windows 中使用 Command.com cmd.exe

还有一个 gdb 命令是 make
make <make-args>
可以在 gdb 中执行 make 命令来重新 build 自己的程序。这个命令等价于 “ shell make <make-args> ”

GDB 中运行程序
————————

当以 gdb <program> 方式启动 gdb 后, gdb 会在 PATH 路径和当前目录中搜索 <program> 的源文件。如要确认 gdb 是否读到源文件,可使用 l list 命令,看看 gdb 是否能列出源代码。

gdb 中,运行程序使用 r 或是 run 命令。程序的运行,你有可能需要设置下面四方面的事。

1 、程序运行参数。
set args
可指定运行时参数。(如: set args 10 20 30 40 50
show args
命令可以查看设置好的运行参数。

2 、运行环境。
path <dir>
可设定程序的运行路径。
show paths
查看程序的运行路径。
set environment varname [=value]
设置环境变量。如: set env USER=hchen
show environment [varname]
查看环境变量。

3 、工作目录。
cd <dir>
相当于 shell cd 命令。
pwd
显示当前的所在目录。

4 、程序的输入输出。
info terminal
显示你程序用到的终端的模式。
使用重定向控制程序输出。如: run > outfile
tty
命令可以指写输入输出的终端设备。如: tty /dev/ttyb


调试已运行的程序
————————

两种方法:
1
、在 UNIX 下用 ps 查看正在运行的程序的 PID (进程 ID ),然后用 gdb <program> PID 格式挂接正在运行的程序。
2
、先用 gdb <program> 关联上源代码,并进行 gdb ,在 gdb 中用 attach 命令来挂接进程的 PID 。并用 detach 来取消挂接的进程。

暂停 / 恢复程序运行
—————————

调试程序中,暂停程序运行是必须的, GDB 可以方便地暂停程序的运行。你可以设置程序的在哪行停住,在什么条件下停住,在收到什么信号时停往等等。以便于你查看运行时的变量,以及运行时的流程。

当进程被 gdb 停住时,你可以使用 info program 来查看程序的是否在运行,进程号,被暂停的原因。

gdb 中,我们可以有以下几种暂停方式:断点( BreakPoint )、观察点( WatchPoint )、捕捉点( CatchPoint )、信号( Signals )、线程停止( Thread Stops )。如果要恢复程序运行,可以使用 c 或是 continue 命令。


一、设置断点( BreakPoint

我们用 break 命令来设置断点。正面有几点设置断点的方法:

break <function>
在进入指定函数时停住。 C++ 中可以使用 class::function function(type,type) 格式来指定函数名。

    break <linenum>
在指定行号停住。

    break +offset
break -offset
在当前行号的前面或后面的 offset 行停住。 offiset 为自然数。

    break filename:linenum
在源文件 filename linenum 行处停住。

    break filename:function
在源文件 filename function 函数的入口处停住。

    break *address
在程序运行的内存地址处停住。

    break
break
命令没有参数时,表示在下一条指令处停住。

    break … if <condition>
可以是上述的参数, condition 表示条件,在条件成立时停住。比如在循环境体中,可以设置 break if i=100 ,表示当 i 100 时停住程序。

    查看断点时,可使用 info 命令,如下所示:(注: n 表示断点号)
info breakpoints [n]
info break [n]

二、设置观察点( WatchPoint

观察点一般来观察某个表达式(变量也是一种表达式)的值是否有变化了,如果有变化,马上停住程序。我们有下面的几种方法来设置观察点:

watch <expr>
为表达式(变量) expr 设置一个观察点。一量表达式值有变化时,马上停住程序。

rwatch <expr>
当表达式(变量) expr 被读时,停住程序。

awatch <expr>
当表达式(变量)的值被读或被写时,停住程序。

info watchpoints
列出当前所设置了的所有观察点。


三、设置捕捉点( CatchPoint

    你可设置捕捉点来补捉程序运行时的一些事件。如:载入共享库(动态链接库)或是 C++ 的异常。设置捕捉点的格式为:

catch <event>
event 发生时,停住程序。 event 可以是下面的内容:
1
throw 一个 C++ 抛出的异常。( throw 为关键字)
2
catch 一个 C++ 捕捉到的异常。( catch 为关键字)
3
exec 调用系统调用 exec 时。( exec 为关键字,目前此功能只在 HP-UX 下有用)
4
fork 调用系统调用 fork 时。( fork 为关键字,目前此功能只在 HP-UX 下有用)
5
vfork 调用系统调用 vfork 时。( vfork 为关键字,目前此功能只在 HP-UX 下有用)
6
load load <libname> 载入共享库(动态链接库)时。( load 为关键字,目前此功能只在 HP-UX 下有用)
7
unload unload <libname> 卸载共享库(动态链接库)时。( unload 为关键字,目前此功能只在 HP-UX 下有用)

    tcatch <event>
只设置一次捕捉点,当程序停住以后,应点被自动删除。

四、维护停止点

上面说了如何设置程序的停止点, GDB 中的停止点也就是上述的三类。在 GDB 中,如果你觉得已定义好的停止点没有用了,你可以使用 delete clear disable enable 这几个命令来进行维护。

    clear
清除所有的已定义的停止点。

    clear <function>
clear <filename:function>
清除所有设置在函数上的停止点。

    clear <linenum>
clear <filename:linenum>
清除所有设置在指定行上的停止点。

    delete [breakpoints] [range…]
删除指定的断点, breakpoints 为断点号。如果不指定断点号,则表示删除所有的断点。 range 表示断点号的范围(如: 3-7 )。其简写命令为 d


比删除更好的一种方法是 disable 停止点, disable 了的停止点, GDB 不会删除,当你还需要时, enable 即可,就好像回收站一样。

    disable [breakpoints] [range…]
disable
所指定的停止点, breakpoints 为停止点号。如果什么都不指定,表示 disable 所有的停止点。简写命令是 dis.

    enable [breakpoints] [range…]
enable
所指定的停止点, breakpoints 为停止点号。

    enable [breakpoints] once range…
enable
所指定的停止点一次,当程序停止后,该停止点马上被 GDB 自动 disable

    enable [breakpoints] delete range…
enable
所指定的停止点一次,当程序停止后,该停止点马上被 GDB 自动删除。

五、停止条件维护

前面在说到设置断点时,我们提到过可以设置一个条件,当条件成立时,程序自动停止,这是一个非常强大的功能,这里,我想专门说说这个条件的相关维护命令。一般来说,为断点设置一个条件,我们使用 if 关键词,后面跟其断点条件。并且,条件设置好后,我们可以用 condition 命令来修改断点的条件。(只有 break watch 命令支持 if catch 目前暂不支持 if

    condition <bnum> <expression>
修改断点号为 bnum 的停止条件为 expression

    condition <bnum>
清除断点号为 bnum 的停止条件。


还有一个比较特殊的维护命令 ignore ,你可以指定程序运行时,忽略停止条件几次。

    ignore <bnum> <count>
表示忽略断点号为 bnum 的停止条件 count 次。

六、为停止点设定运行命令

我们可以使用 GDB 提供的 command 命令来设置停止点的运行命令。也就是说,当运行的程序在被停止住时,我们可以让其自动运行一些别的命令,这很有利行自动化调试。对基于 GDB 的自动化调试是一个强大的支持。


commands [bnum]
… command-list …
end

    为断点号 bnum 指写一个命令列表。当程序被该断点停住时, gdb 会依次运行命令列表中的命令。

    例如:

        break foo if x>0
commands
printf "x is %d\n",x
continue
end
断点设置在函数 foo 中,断点条件是 x>0 ,如果程序被断住后,也就是,一旦 x 的值在 foo 函数中大于 0 GDB 会自动打印出 x 的值,并继续运行程序。

如果你要清除断点上的命令序列,那么只要简单的执行一下 commands 命令,并直接在打个 end 就行了。


七、断点菜单

C++ 中,可能会重复出现同一个名字的函数若干次(函数重载),在这种情况下, break <function> 不能告诉 GDB 要停在哪个函数的入口。当然,你可以使用 break <function(type)> 也就是把函数的参数类型告诉 GDB ,以指定一个函数。否则的话, GDB 会给你列出一个断点菜单供你选择你所需要的断点。你只要输入你菜单列表中的编号就可以了。如:

    (gdb) b String::after
[0] cancel
[1] all
[2] file:String.cc; line number:867
[3] file:String.cc; line number:860
[4] file:String.cc; line number:875
[5] file:String.cc; line number:853
[6] file:String.cc; line number:846
[7] file:String.cc; line number:735
> 2 4 6
Breakpoint 1 at 0xb26c: file String.cc, line 867.
Breakpoint 2 at 0xb344: file String.cc, line 875.
Breakpoint 3 at 0xafcc: file String.cc, line 846.
Multiple breakpoints were set.
Use the "delete" command to delete unwanted
breakpoints.
(gdb)

可见, GDB 列出了所有 after 的重载函数,你可以选一下列表编号就行了。 0 表示放弃设置断点, 1 表示所有函数都设置断点。


八、恢复程序运行和单步调试

当程序被停住了,你可以用 continue 命令恢复程序的运行直到程序结束,或下一个断点到来。也可以使用 step next 命令单步跟踪程序。

    continue [ignore-count]
c [ignore-count]
fg [ignore-count]
恢复程序运行,直到程序结束,或是下一个断点到来。 ignore-count 表示忽略其后的断点次数。 continue c fg 三个命令都是一样的意思。


step <count>
单步跟踪,如果有函数调用,他会进入该函数。进入函数的前提是,此函数被编译有 debug 信息。很像 VC 等工具中的 step in 。后面可以加 count 也可以不加,不加表示一条条地执行,加表示执行后面的 count 条指令,然后再停住。

    next <count>
同样单步跟踪,如果有函数调用,他不会进入该函数。很像 VC 等工具中的 step over 。后面可以加 count 也可以不加,不加表示一条条地执行,加表示执行后面的 count 条指令,然后再停住。

    set step-mode
set step-mode on
打开 step-mode 模式,于是,在进行单步跟踪时,程序不会因为没有 debug 信息而不停住。这个参数有很利于查看机器码。

    set step-mod off
关闭 step-mode 模式。

    finish
运行程序,直到当前函数完成返回。并打印函数返回时的堆栈地址和返回值及参数值等信息。

    until u
当你厌倦了在一个循环体内单步跟踪时,这个命令可以运行程序直到退出循环体。

    stepi si
nexti
ni
单步跟踪一条机器指令!一条程序代码有可能由数条机器指令完成, stepi nexti 可以单步执行机器指令。与之一样有相同功能的命令是 “ display/i $pc ” ,当运行完这个命令后,单步跟踪会在打出程序代码的同时打出机器指令(也就是汇编代码)


九、信号( Signals

信号是一种软中断,是一种处理异步事件的方法。一般来说,操作系统都支持许多信号。尤其是 UNIX ,比较重要应用程序一般都会处理信号。 UNIX 定义了许多信号,比如 SIGINT 表示中断字符信号,也就是 Ctrl+C 的信号, SIGBUS 表示硬件故障的信号; SIGCHLD 表示子进程状态改变信号; SIGKILL 表示终止程序运行的信号,等等。信号量编程是 UNIX 下非常重要的一种技术

GDB 有能力在你调试程序的时候处理任何一种信号,你可以告诉 GDB 需要处理哪一种信号。你可以要求 GDB 收到你所指定的信号时,马上停住正在运行的程序,以供你进行调试。你可以用 GDB handle 命令来完成这一功能。

    handle <signal> <keywords…>
GDB 中定义一个信号处理。信号 <signal> 可以以 SIG 开头或不以 SIG 开头,可以用定义一个要处理信号的范围(如: SIGIO-SIGKILL ,表示处理从 SIGIO 信号到 SIGKILL 的信号,其中包括 SIGIO SIGIOT SIGKILL 三个信号),也可以使用关键字 all 来标明要处理所有的信号。一旦被调试的程序接收到信号,运行程序马上会被 GDB 停住,以供调试。其 <keywords> 可以是以下几种关键字的一个或多个。

        nostop
当被调试的程序收到信号时, GDB 不会停住程序的运行,但会打出消息告诉你收到这种信号。
stop
当被调试的程序收到信号时, GDB 会停住你的程序。
print
当被调试的程序收到信号时, GDB 会显示出一条信息。
noprint
当被调试的程序收到信号时, GDB 不会告诉你收到信号的信息。
pass
noignore
当被调试的程序收到信号时, GDB 不处理信号。这表示, GDB 会把这个信号交给被调试程序会处理。
nopass
ignore
当被调试的程序收到信号时, GDB 不会让被调试程序来处理这个信号。


info signals
info handle
查看有哪些信号在被 GDB 检测中。


十、线程( Thread Stops

如果你程序是多线程的话,你可以定义你的断点是否在所有的线程上,或是在某个特定的线程。 GDB 很容易帮你完成这一工作。

    break <linespec> thread <threadno>
break <linespec> thread <threadno> if …
linespec
指定了断点设置在的源程序的行号。 threadno 指定了线程的 ID ,注意,这个 ID GDB 分配的,你可以通过 “ info threads ” 命令来查看正在运行程序中的线程信息。如果你不指定 thread <threadno> 则表示你的断点设在所有线程上面。你还可以为某线程指定断点条件。如:

(gdb) break frik.c:13 thread 28 if bartab > lim

    当你的程序被 GDB 停住时,所有的运行线程都会被停住。这方便你你查看运行程序的总体情况。而在你恢复程序运行时,所有的线程也会被恢复运行。那怕是主进程在被单步调试时。

查看栈信息
—————

当程序被停住了,你需要做的第一件事就是查看程序是在哪里停住的。当你的程序调用了一个函数,函数的地址,函数参数,函数内的局部变量都会被压入 Stack )中。你可以用 GDB 命令来查看当前的栈中的信息。

下面是一些查看函数调用栈信息的 GDB 命令:

    backtrace
bt
打印当前的函数调用栈的所有信息。如:

(gdb) bt
#0  func (n=250) at tst.c:6
#1  0x08048524 in main (argc=1, argv=0xbffff674) at tst.c:30
#2  0x400409ed in __libc_start_main () from /lib/libc.so.6

从上可以看出函数的调用栈信息: __libc_start_main –> main() –> func()

backtrace <n>
bt <n>
n 是一个正整数,表示只打印栈顶上 n 层的栈信息。

    backtrace <-n>
bt <-n>
-n
表一个负整数,表示只打印栈底下 n 层的栈信息。

如果你要查看某一层的信息,你需要在切换当前的栈,一般来说,程序停止时,最顶层的栈就是当前栈,如果你要查看栈下面层的详细信息,首先要做的是切换当前栈。

    frame <n>
f <n>
n
是一个从 0 开始的整数,是栈中的层编号。比如: frame 0 ,表示栈顶, frame 1 ,表示栈的第二层。

up <n>
表示向栈的上面移动 n 层,可以不打 n ,表示向上移动一层。

down <n>
表示向栈的下面移动 n 层,可以不打 n ,表示向下移动一层。

    上面的命令,都会打印出移动到的栈层的信息。如果你不想让其打出信息。你可以使用这三个命令:

select-frame <n> 对应于 frame 命令。
up-silently <n>
对应于 up 命令。
down-silently <n>
对应于 down 命令。

  
查看当前栈层的信息,你可以用以下 GDB 命令:

    frame f
会打印出这些信息:栈的层编号,当前的函数名,函数参数值,函数所在文件及行号,函数执行到的语句。

info frame
info f
这个命令会打印出更为详细的当前栈层的信息,只不过,大多数都是运行时的内内地址。比如:函数地址,调用函数的地址,被调用函数的地址,目前的函数是由什么样的程序语言写成的、函数参数地址及值、局部变量的地址等等。如:
(gdb) info f
Stack level 0, frame at 0xbffff5d4:
eip = 0x804845d in func (tst.c:6); saved eip 0x8048524
called by frame at 0xbffff60c
source language c.
Arglist at 0xbffff5d4, args: n=250
Locals at 0xbffff5d4, Previous frame’s sp is 0x0
Saved registers:
ebp at 0xbffff5d4, eip at 0xbffff5d8

info args
打印出当前函数的参数名及其值。

info locals
打印出当前函数中所有局部变量及其值。

info catch
打印出当前的函数中的异常处理信息。

查看源程序
—————

一、显示源代码

    GDB 可以打印出所调试程序的源代码,当然,在程序编译时一定要加上 -g 的参数,把源程序信息编译到执行文件中。不然就看不到源程序了。当程序停下来以后, GDB 会报告程序停在了那个文件的第几行上。你可以用 list 命令来打印程序的源代码。还是来看一看查看源代码的 GDB 命令吧。

list <linenum>
显示程序第 linenum 行的周围的源程序。

list <function>
显示函数名为 function 的函数的源程序。

list
显示当前行后面的源程序。

list –
显示当前行前面的源程序。

一般是打印当前行的上 5 行和下 5 行,如果显示函数是是上 2 行下 8 行,默认是 10 行,当然,你也可以定制显示的范围,使用下面命令可以设置一次显示源程序的行数。

    set listsize <count>
设置一次显示源代码的行数。

show listsize
查看当前 listsize 的设置。

list 命令还有下面的用法:

    list <first>, <last>
显示从 first 行到 last 行之间的源代码。

list , <last>
显示从当前行到 last 行之间的源代码。

list +
往后显示源代码。

一般来说在 list 后面可以跟以下这们的参数:

    <linenum>   行号。
<+offset>  
当前行号的正偏移量。
<-offset>  
当前行号的负偏移量。
<filename:linenum>  
哪个文件的哪一行。
<function>  
函数名。
<filename:function>
哪个文件中的哪个函数。
<*address>  
程序运行时的语句在内存中的地址。

二、搜索源代码

不仅如此, GDB 还提供了源代码搜索的命令:

    forward-search <regexp>
search <regexp>
向前面搜索。

    reverse-search <regexp>
全部搜索。

其中, <regexp> 就是正则表达式,也主一个字符串的匹配模式,关于正则表达式,我就不在这里讲了,还请各位查看相关资料。


三、指定源文件的路径

某些时候,用 -g 编译过后的执行程序中只是包括了源文件的名字,没有路径名。 GDB 提供了可以让你指定源文件的路径的命令,以便 GDB 进行搜索。

    directory <dirname … >
dir <dirname … >
加一个源文件路径到当前路径的前面。如果你要指定多个路径, UNIX 下你可以使用 “ : ” Windows 下你可以使用 “ ; ”
directory
清除所有的自定义的源文件搜索路径信息。

show directories
显示定义了的源文件搜索路径。

四、源代码的内存

你可以使用 info line 命令来查看源代码在内存中的地址。 info line 后面可以跟行号函数名文件名 : 行号文件名 : 函数名,这个命令会打印出所指定的源码在运行时的内存地址,如:

        (gdb) info line tst.c:func
Line 5 of "tst.c" starts at address 0x8048456 <func+6> and ends at 0x804845d <func+13>.

还有一个命令( disassemble )你可以查看源程序的当前执行时的机器码,这个命令会把目前内存中的指令 dump 出来。如下面的示例表示查看函数 func 的汇编代码。

        (gdb) disassemble func
Dump of assembler code for function func:
0x8048450 <func>:       push   %ebp
0x8048451 <func+1>:     mov    %esp,%ebp
0x8048453 <func+3>:     sub    $0x18,%esp
0x8048456 <func+6>:     movl   $0x0,0xfffffffc(%ebp)
0x804845d <func+13>:    movl   $0x1,0xfffffff8(%ebp)
0x8048464 <func+20>:    mov    0xfffffff8(%ebp),%eax
0x8048467 <func+23>:    cmp    0x8(%ebp),%eax
0x804846a <func+26>:    jle    0x8048470 <func+32>
0x804846c <func+28>:    jmp    0x8048480 <func+48>
0x804846e <func+30>:    mov    %esi,%esi
0x8048470 <func+32>:    mov    0xfffffff8(%ebp),%eax
0x8048473 <func+35>:    add    %eax,0xfffffffc(%ebp)
0x8048476 <func+38>:    incl   0xfffffff8(%ebp)
0x8048479 <func+41>:    jmp    0x8048464 <func+20>
0x804847b <func+43>:    nop
0x804847c <func+44>:    lea    0x0(%esi,1),%esi
0x8048480 <func+48>:    mov    0xfffffffc(%ebp),%edx
0x8048483 <func+51>:    mov    %edx,%eax
0x8048485 <func+53>:    jmp    0x8048487 <func+55>
0x8048487 <func+55>:    mov    %ebp,%esp
0x8048489 <func+57>:    pop    %ebp
0x804848a <func+58>:    ret
End of assembler dump.

查看运行时数据
———————

在你调试程序时,当程序被停住时,你可以使用 print 命令(简写命令为 p ),或是同义命令 inspect 来查看当前程序的运行数据。 print 命令的格式是:

print <expr>
print /<f> <expr>
<expr> 是表达式,是你所调试的程序的语言的表达式( GDB 可以调试多种编程语言), <f> 是输出的格式,比如,如果要把表达式按 16 进制的格式输出,那么就是 /x

一、表达式

    print 和许多 GDB 的命令一样,可以接受一个表达式, GDB 会根据当前的程序运行的数据来计算这个表达式,既然是表达式,那么就可以是当前程序运行中的 const 常量、变量、函数等内容。可惜的是 GDB 不能使用你在程序中所定义的宏。

表达式的语法应该是当前所调试的语言的语法,由于 C/C++ 是一种大众型的语言,所以,本文中的例子都是关于 C/C++ 的。(而关于用 GDB 调试其它语言的章节,我将在后面介绍)

在表达式中,有几种 GDB 所支持的操作符,它们可以用在任何一种语言中。

@
是一个和数组有关的操作符,在后面会有更详细的说明。

::
指定一个在文件或是一个函数中的变量。

{<type>} <addr>
表示一个指向内存地址 <addr> 的类型为 type 的一个对象。

二、程序变量

     GDB 中,你可以随时查看以下三种变量的值:
1
、全局变量(所有文件可见的)
2
、静态全局变量(当前文件可见的)
3
、局部变量(当前 Scope 可见的)

如果你的局部变量和全局变量发生冲突(也就是重名),一般情况下是局部变量会隐藏全局变量,也就是说,如果一个全局变量和一个函数中的局部变量同名时,如果当前停止点在函数中,用 print 显示出的变量的值会是函数中的局部变量的值。如果此时你想查看全局变量的值时,你可以使用 “ :: ” 操作符:

file::variable
function::variable
可以通过这种形式指定你所想查看的变量,是哪个文件中的或是哪个函数中的。例如,查看文件 f2.c 中的全局变量 x 的值:

gdb) p ‘f2.c’::x

当然, “ :: ” 操作符会和 C++ 中的发生冲突, GDB 能自动识别 “ :: ” 是否 C++ 的操作符,所以你不必担心在调试 C++ 程序时会出现异常。

另外,需要注意的是,如果你的程序编译时开启了优化选项,那么在用 GDB 调试被优化过的程序时,可能会发生某些变量不能访问,或是取值错误码的情况。这个是很正常的,因为优化程序会删改你的程序,整理你程序的语句顺序,剔除一些无意义的变量等,所以在 GDB 调试这种程序时,运行时的指令和你所编写指令就有不一样,也就会出现你所想象不到的结果。对付这种情况时,需要在编译程序时关闭编译优化。一般来说,几乎所有的编译器都支持编译优化的开关,例如, GNU C/C++ 编译器 GCC ,你可以使用 “ -gstabs ” 选项来解决这个问题。关于编译器的参数,还请查看编译器的使用说明文档。

三、数组

    有时候,你需要查看一段连续的内存空间的值。比如数组的一段,或是动态分配的数据的大小。你可以使用 GDB “ @ ” 操作符, “ @ ” 的左边是第一个内存的地址的值, “ @ ” 的右边则你你想查看内存的长度。例如,你的程序中有这样的语句:

int *array = (int *) malloc (len * sizeof (int));

于是,在 GDB 调试过程中,你可以以如下命令显示出这个动态数组的取值:

        p *array@len

    @ 的左边是数组的首地址的值,也就是变量 array 所指向的内容,右边则是数据的长度,其保存在变量 len 中,其输出结果,大约是下面这个样子的:

(gdb) p *array@len
$1 = {2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40}

    如果是静态数组的话,可以直接用 print 数组名,就可以显示数组中所有数据的内容了。

  
四、输出格式

    一般来说, GDB 会根据变量的类型输出变量的值。但你也可以自定义 GDB 的输出的格式。例如,你想输出一个整数的十六进制,或是二进制来查看这个整型变量的中的位的情况。要做到这样,你可以使用 GDB 的数据显示格式:

x  按十六进制格式显示变量。
d  
按十进制格式显示变量。
u  
按十六进制格式显示无符号整型。
o  
按八进制格式显示变量。
t  
按二进制格式显示变量。
a  
按十六进制格式显示变量。
c  
按字符格式显示变量。
f  
按浮点数格式显示变量。

        (gdb) p i
$21 = 101  

(gdb) p/a i
$22 = 0x65

(gdb) p/c i
$23 = 101 ‘e’

(gdb) p/f i
$24 = 1.41531145e-43

(gdb) p/x i
$25 = 0x65

(gdb) p/t i
$26 = 1100101


五、查看内存

    你可以使用 examine 命令(简写是 x )来查看内存地址中的值。 x 命令的语法如下所示:

x/<n/f/u> <addr>

n f u 是可选的参数。

n 是一个正整数,表示显示内存的长度,也就是说从当前地址向后显示几个地址的内容。
f
表示显示的格式,参见上面。如果地址所指的是字符串,那么格式可以是 s ,如果地十是指令地址,那么格式可以是 i
u
表示从当前地址往后请求的字节数,如果不指定的话, GDB 默认是 4 bytes u 参数可以用下面的字符来代替, b 表示单字节, h 表示双字节, w 表示四字节, g 表示八字节。当我们指定了字节长度后, GDB 会从指内存定的内存地址开始,读写指定字节,并把其当作一个值取出来。

<addr> 表示一个内存地址。

    n/f/u 三个参数可以一起使用。例如:

命令: x/3uh 0x54320 表示,从内存地址 0x54320 读取内容, h 表示以双字节为一个单位, 3 表示三个单位, u 表示按十六进制显示。

六、自动显示

    你可以设置一些自动显示的变量,当程序停住时,或是在你单步跟踪时,这些变量会自动显示。相关的 GDB 命令是 display

display <expr>
display/<fmt> <expr>
display/<fmt> <addr>

expr 是一个表达式, fmt 表示显示的格式, addr 表示内存地址,当你用 display 设定好了一个或多个表达式后,只要你的程序被停下来, GDB 会自动显示你所设置的这些表达式的值。

格式 i s 同样被 display 支持,一个非常有用的命令是:

display/i $pc

$pc GDB 的环境变量,表示着指令的地址, /i 则表示输出格式为机器指令码,也就是汇编。于是当程序停下后,就会出现源代码和机器指令码相对应的情形,这是一个很有意思的功能。

下面是一些和 display 相关的 GDB 命令:

undisplay <dnums…>
delete display <dnums…>
删除自动显示, dnums 意为所设置好了的自动显式的编号。如果要同时删除几个,编号可以用空格分隔,如果要删除一个范围内的编号,可以用减号表示(如: 2-5

disable display <dnums…>
enable display <dnums…>
disable enalbe 不删除自动显示的设置,而只是让其失效和恢复。

info display
查看 display 设置的自动显示的信息。 GDB 会打出一张表格,向你报告当然调试中设置了多少个自动显示设置,其中包括,设置的编号,表达式,是否 enable

七、设置显示选项

    GDB 中关于显示的选项比较多,这里我只例举大多数常用的选项。

    set print address
set print address on
打开地址输出,当程序显示函数信息时, GDB 会显出函数的参数地址。系统默认为打开的,如:

(gdb) f
#0  set_quotes (lq=0x34c78 "<<", rq=0x34c88 ">>")
at input.c:530
530         if (lquote != def_lquote)


set print address off
关闭函数的参数地址显示,如:

(gdb) set print addr off
(gdb) f
#0  set_quotes (lq="<<", rq=">>") at input.c:530
530         if (lquote != def_lquote)

    show print address
查看当前地址显示选项是否打开。

set print array
set print array on
打开数组显示,打开后当数组显示时,每个元素占一行,如果不打开的话,每个元素则以逗号分隔。这个选项默认是关闭的。与之相关的两个命令如下,我就不再多说了。

set print array off
show print array

    set print elements <number-of-elements>
这个选项主要是设置数组的,如果你的数组太大了,那么就可以指定一个 <number-of-elements> 来指定数据显示的最大长度,当到达这个长度时, GDB 就不再往下显示了。如果设置为 0 ,则表示不限制。

show print elements
查看 print elements 的选项信息。

set print null-stop <on/off>
如果打开了这个选项,那么当显示字符串时,遇到结束符则停止显示。这个选项默认为 off

set print pretty on
如果打开 printf pretty 这个选项,那么当 GDB 显示结构体时会比较漂亮。如:

            $1 = {
next = 0x0,
flags = {
sweet = 1,
sour = 1
},
meat = 0x54 "Pork"
}

    set print pretty off
关闭 printf pretty 这个选项, GDB 显示结构体时会如下显示:

$1 = {next = 0x0, flags = {sweet = 1, sour = 1}, meat = 0x54 "Pork"}

show print pretty
查看 GDB 是如何显示结构体的。

set print sevenbit-strings <on/off>
设置字符显示,是否按 “ \nnn ” 的格式显示,如果打开,则字符串或字符数据按 \nnn 显示,如 “ \065 ”

show print sevenbit-strings
查看字符显示开关是否打开。

set print union <on/off>
设置显示结构体时,是否显式其内的联合体数据。例如有以下数据结构:

typedef enum {Tree, Bug} Species;
typedef enum {Big_tree, Acorn, Seedling} Tree_forms;
typedef enum {Caterpillar, Cocoon, Butterfly}
Bug_forms;

struct thing {
Species it;
union {
Tree_forms tree;
Bug_forms bug;
} form;
};

struct thing foo = {Tree, {Acorn}};

        当打开这个开关时,执行 p foo 命令后,会如下显示:
$1 = {it = Tree, form = {tree = Acorn, bug = Cocoon}}

当关闭这个开关时,执行 p foo 命令后,会如下显示:
$1 = {it = Tree, form = {…}}

    show print union
查看联合体数据的显示方式

set print object <on/off>
C++ 中,如果一个对象指针指向其派生类,如果打开这个选项, GDB 会自动按照虚方法调用的规则显示输出,如果关闭这个选项的话, GDB 就不管虚函数表了。这个选项默认是 off

show print object
查看对象选项的设置。

set print static-members <on/off>
这个选项表示,当显示一个 C++ 对象中的内容是,是否显示其中的静态数据成员。默认是 on

show print static-members
查看静态数据成员选项设置。

set print vtbl <on/off>
当此选项打开时, GDB 将用比较规整的格式来显示虚函数表时。其默认是关闭的。

show print vtbl
查看虚函数显示格式的选项。

      
八、历史记录

    当你用 GDB print 查看程序运行时的数据时,你每一个 print 都会被 GDB 记录下来。 GDB 会以 $1, $2, $3 ….. 这样的方式为你每一个 print 命令编上号。于是,你可以使用这个编号访问以前的表达式,如 $1 。这个功能所带来的好处是,如果你先前输入了一个比较长的表达式,如果你还想查看这个表达式的值,你可以使用历史记录来访问,省去了重复输入。

九、 GDB 环境变量

    你可以在 GDB 的调试环境中定义自己的变量,用来保存一些调试程序中的运行数据。要定义一个 GDB 的变量很简单只需。使用 GDB set 命令。 GDB 的环境变量和 UNIX 一样,也是以 $ 起头。如:

set $foo = *object_ptr

使用环境变量时, GDB 会在你第一次使用时创建这个变量,而在以后的使用中,则直接对其賦值。环境变量没有类型,你可以给环境变量定义任一的类型。包括结构体和数组。

show convenience
该命令查看当前所设置的所有的环境变量。

这是一个比较强大的功能,环境变量和程序变量的交互使用,将使得程序调试更为灵活便捷。例如:

set $i = 0
print bar[$i++]->contents

于是,当你就不必, print bar[0]->contents, print bar[1]->contents 地输入命令了。输入这样的命令后,只用敲回车,重复执行上一条语句,环境变量会自动累加,从而完成逐个输出的功能。

十、查看寄存器

    要查看寄存器的值,很简单,可以使用如下命令:

info registers
查看寄存器的情况。(除了浮点寄存器)

info all-registers
查看所有寄存器的情况。(包括浮点寄存器)

info registers <regname …>
查看所指定的寄存器的情况。

寄存器中放置了程序运行时的数据,比如程序当前运行的指令地址( ip ),程序的当前堆栈地址( sp )等等。你同样可以使用 print 命令来访问寄存器的情况,只需要在寄存器名字前加一个 $ 符号就可以了。如: p $eip

改变程序的执行
———————

    一旦使用 GDB 挂上被调试程序,当程序运行起来后,你可以根据自己的调试思路来动态地在 GDB 中更改当前被调试程序的运行线路或是其变量的值,这个强大的功能能够让你更好的调试你的程序,比如,你可以在程序的一次运行中走遍程序的所有分支。

  
一、修改变量值

    修改被调试程序运行时的变量值,在 GDB 中很容易实现,使用 GDB print 命令即可完成。如:

(gdb) print x=4

x=4 这个表达式是 C/C++ 的语法,意为把变量 x 的值修改为 4 ,如果你当前调试的语言是 Pascal ,那么你可以使用 Pascal 的语法: x:=4

在某些时候,很有可能你的变量和 GDB 中的参数冲突,如:

(gdb) whatis width
type = double
(gdb) p width
$4 = 13
(gdb) set width=47
Invalid syntax in expression.

    因为, set width GDB 的命令,所以,出现了 “ Invalid syntax in expression ” 的设置错误,此时,你可以使用 set var 命令来告诉 GDB width 不是你 GDB 的参数,而是程序的变量名,如:

(gdb) set var width=47

另外,还可能有些情况, GDB 并不报告这种错误,所以保险起见,在你改变程序变量取值时,最好都使用 set var 格式的 GDB 命令。

二、跳转执行

    一般来说,被调试程序会按照程序代码的运行顺序依次执行。 GDB 提供了乱序执行的功能,也就是说, GDB 可以修改程序的执行顺序,可以让程序执行随意跳跃。这个功能可以由 GDB jump 命令来完:

jump <linespec>
指定下一条语句的运行点。 <linespce> 可以是文件的行号,可以是 file:line 格式,可以是 +num 这种偏移量格式。表式着下一条运行语句从哪里开始。

jump <address>
这里的 <address> 是代码行的内存地址。

注意, jump 命令不会改变当前的程序栈中的内容,所以,当你从一个函数跳到另一个函数时,当函数运行完返回时进行弹栈操作时必然会发生错误,可能结果还是非常奇怪的,甚至于产生程序 Core Dump 。所以最好是同一个函数中进行跳转。

熟悉汇编的人都知道,程序运行时,有一个寄存器用于保存当前代码所在的内存地址。所以, jump 命令也就是改变了这个寄存器中的值。于是,你可以使用 “ set $pc ” 来更改跳转执行的地址。如:

set $pc = 0x485


三、产生信号量

    使用 singal 命令,可以产生一个信号量给被调试的程序。如:中断信号 Ctrl+C 。这非常方便于程序的调试,可以在程序运行的任意位置设置断点,并在该断点用 GDB 产生一个信号量,这种精确地在某处产生信号非常有利程序的调试。

语法是: signal <singal> UNIX 的系统信号量通常从 1 15 。所以 <singal> 取值也在这个范围。

single 命令和 shell kill 命令不同,系统的 kill 命令发信号给被调试程序时,是由 GDB 截获的,而 single 命令所发出一信号则是直接发给被调试程序的。

四、强制函数返回

    如果你的调试断点在某个函数中,并还有语句没有执行完。你可以使用 return 命令强制函数忽略还没有执行的语句并返回。

return
return <expression>
使用 return 命令取消当前函数的执行,并立即返回,如果指定了 <expression> ,那么该表达式的值会被认作函数的返回值。

五、强制调用函数

    call <expr>
表达式中可以一是函数,以此达到强制调用函数的目的。并显示函数的返回值,如果函数返回值是 void ,那么就不显示。

另一个相似的命令也可以完成这一功能 —— print print 后面可以跟表达式,所以也可以用他来调用函数, print call 的不同是,如果函数返回 void call 则不显示, print 则显示函数返回值,并把该值存入历史数据中。

 

在不同语言中使用 GDB
——————————

GDB 支持下列语言: C, C++, Fortran, PASCAL, Java, Chill, assembly, Modula-2 。一般说来, GDB 会根据你所调试的程序来确定当然的调试语言,比如:发现文件名后缀为 “ .c ” 的, GDB 会认为是 C 程序。文件名后缀为 “ .C, .cc, .cp, .cpp, .cxx, .c++ ” 的, GDB 会认为是 C++ 程序。而后缀是 “ .f, .F ” 的, GDB 会认为是 Fortran 程序,还有,后缀为如果是 “ .s, .S ” 的会认为是汇编语言。

也就是说, GDB 会根据你所调试的程序的语言,来设置自己的语言环境,并让 GDB 的命令跟着语言环境的改变而改变。比如一些 GDB 命令需要用到表达式或变量时,这些表达式或变量的语法,完全是根据当前的语言环境而改变的。例如 C/C++ 中对指针的语法是 *p ,而在 Modula-2 中则是 p^ 。并且,如果你当前的程序是由几种不同语言一同编译成的,那到在调试过程中, GDB 也能根据不同的语言自动地切换语言环境。这种跟着语言环境而改变的功能,真是体贴开发人员的一种设计。


下面是几个相关于 GDB 语言环境的命令:

    show language
查看当前的语言环境。如果 GDB 不能识为你所调试的编程语言,那么, C 语言被认为是默认的环境。

info frame
查看当前函数的程序语言。

info source
查看当前文件的程序语言。

如果 GDB 没有检测出当前的程序语言,那么你也可以手动设置当前的程序语言。使用 set language 命令即可做到。

     set language 命令后什么也不跟的话,你可以查看 GDB 所支持的语言种类:

(gdb) set language
The currently understood settings are:

local or auto    Automatic setting based on source file
c                Use the C language
c++              Use the C++ language
asm              Use the Asm language
chill            Use the Chill language
fortran          Use the Fortran language
java             Use the Java language
modula-2         Use the Modula-2 language
pascal           Use the Pascal language
scheme           Use the Scheme language

于是你可以在 set language 后跟上被列出来的程序语言名,来设置当前的语言环境。

后记
——

    GDB 是一个强大的命令行调试工具。大家知道命令行的强大就是在于,其可以形成执行序列,形成脚本。 UNIX 下的软件全是命令行的,这给程序开发提代供了极大的便利,命令行软件的优势在于,它们可以非常容易的集成在一起,使用几个简单的已有工具的命令,就可以做出一个非常强大的功能。

 Posted by at 上午 6:17
6月 112011
 

无论是多么优秀的程序员,都难以保证自己在编写代码时不会出现任何错误,因此调试是软件开发过程中的一个必不可少的 组成部分。当程序完成编译之后,它很可能无法正常运行,或者会彻底崩溃,或者不能实现预期的功能。此时如何通过调试找到问题的症结所在,就变成了摆在开发 人员面前最严峻的问题。通常说来,软件项目的规模越大,调试起来就会越困难,越需要一个强大而高效的调试器作为后盾。对于Linux程序员来讲,目前可供 使用的调试器非常多,GDB(GNU DeBugger)就是其中较为优秀的。

    初识GDB

GDB 是自由软件基金会(Free Software  Foundation,FSF)的软件工具之一。它的作用是协助程序员找到代码中的错误。如果没有GDB的帮助,程序员要想跟踪代码的执行流程,唯一的办 法就是添加大量的语句来产生特定的输出。但这一手段本身就可能会引入新的错误,从而也就无法对那些导致程序崩溃的错误代码进行分析。GDB的出现减轻了开 发人员的负担,他们可以在程序运行的时候单步跟踪自己的代码,或者通过断点暂时中止程序的执行。此外,他们还能够随时察看变量和内存的当前状态,并监视关 键的数据结构是如何影响代码运行的。

调试方法

如果想对程序进行调试,必须先在用GCC编译源代码时加上-g选项,以便产生GDB所需要的调试符号信息。例如,debugme.c是一个存在错误程序,可以使用如下的命令对其进行编译,同时产生调试符号:
# gcc -g debugme.c -o debugme

如 果愿意的话,还可以在编译时使用“-ggdb”选项来生成更多的调试信息。由于这些调试信息中的相当一部分是GDB所特有的,所以生成的代码将无法在其它 调试器中正常调试。对于大多数情况来说,普通的-g选项就足够了。需要注意的是,GCC虽然允许同时使用-g(调试)和-o(优化)选项,但优化会影响最 终生成的代码,导致程序源代码和二进制代码之间的关系变得复杂起来。如果不想为调试制造障碍,建议不要将-g和-o选项一同使用,并且只在程序彻底调试完 后才开始进行代码优化。这样调试过程将变得相对轻松和愉快。

基本应用

现在可以启动GDB来调试已经生成的可执行程序debugme,命令如下:

    

        

            

        

    

                         

如果一切正常,GDB将被启动并在屏幕上输出版权信息,但如果使用了-q或–quiet选项则不会显示它们。启动GDB时另外一个有用的命令行选项是“-d dirname”,其中dirname是一个目录名。该目录名告诉GDB应该到哪里去寻找源代码。

一 旦出现GDB的命令提示符(gdb),就表明GDB已经准备好接收来自用户的各种调试命令了。如果想在调试环境下运行这个程序,可以使用GDB提供的 “run”命令,而程序在正常运行时所需的各种参数可以作为“run”命令的参数传入,或者使用单独的“set  args”命令进行设置。如果在执行“run”命令时没有给出任何参数,GDB将使用上一次“run”或“set  args”命令指定的参数。如果想取消上次设置的参数,可以执行不带任何参数的“set args”命令。下面尝试在调试器中运行这个程序:

    

        

            

        

    

                         

最后一行输出表明程序在调用动态链接库/lib/ld-linux.so.2中的_dl_fini() 函数时出现了错误,地址是0x4000c6ac。这些对调试是非常重要的线索。另外还有一种信息对调试也很重要,就是错误发生时的函数调用层级关系,可以 通过执行“backtrace”命令来获得。在使用GDB调试命令时,用户可以不必输入完整的命令名称,使用任何惟一的缩写都可以。例如 “backtrace”命令就可以缩写成“back”甚至“bt”。GDB还支持很多常用的Shell命令编辑特征,比如可以像在bash或tcsh中那 样按Tab键补齐命令。如果相关命令不惟一的话,则列出所有可能的匹配项。此外键盘上的方向键可用来翻动历史命令。

GDB是一个源代码级的调试器,使用“list”命令可以查看当前调试对象的源代码。该命令的通用格式为“list [m,n]”,表示显示从m行开始到n行结束的代码段,而不带任何参数的“list”命令将显示最近10行源代码。

设置断点
在 调试有问题的代码时,在某一点停止运行往往很管用。这样程序运行到此外时会暂时挂起,等待用户的进一步输入。GDB允许在几种不同的代码结构上设置断点, 包括行号和函数名等,并且还允许设置条件断点,让程序只有在满足一定的条件时才停止执行。要根据行号设置断点,可以使用“ break  linenum”命令。要根据函数名设置断点,则应该使用“break funcname”命令。

在以上两种情况中,GDB将 在执行指定的行号或进入指定的函数之前停止执行程序。此时可以使用“print”显示变量的值,或者使用“list”查看将要执行的代码。对于由多个源文 件组成的项目,如果想在执行到非当前源文件的某行或某个函数时停止执行,可以使用如下形式的命令:

    

        

            

        

    

                         

条件断点允许当一定条件满足时暂时停止程序的执行。它对于调试来讲非常有用。设置条件断点的正确语法如下:

    

        

            

        

    

                         

其中expr是一个逻辑表达式。当该表达式的值为真时,程序将在该断点处暂时挂起。例如,下面的命令将在debugme程序的第38行设置一个条件断点。当程序运行到该行时,如果count的值等于3,就将暂时停止执行:
(gdb) break 38 if count==3

设置断点是调试程序时最常用到的一种手段。它可以中断程序的运行,给程序员一个单步跟踪的机会。使用命令“ break main”在main函数上设置断点可以在程序启动时就开始进行跟踪。

接 下去使用“continue”命令继续执行程序,直到遇到下一个断点。如果在调试时设置了很多断点,可以随时使用“info  breakpoints”命令来查看设置的断点。此外,开发人员还可以使用“delete”命令删除断点,或者使用“disable”命令来使设置的断点 暂时无效。被设置为无效的断点在需要的时候可以用“enable”命令使其重新生效。

观察变量
GDB 最有用的特性之一是能够显示被调试程序中几乎任何表达式、变量或数组的类型和值,并且能够用编写程序所用的语言打印出任何合法表达式的值。查看数据最简单 的办法是使用“print”命令,只需在“print”命令后面加上变量表达式,就可以打印出此变量表达式的当前值,示例如下:

    

        

            

        

    

                         

从输出信息中可以看出,输入字符串被正确地存储在了字符指针str所指向的内存缓冲区中。除了给出变量 表达式的值外,“print”命令的输出信息中还包含变量标号($1)和对应的内存地址(0x40015360)。变量标号保存着被检查数值的历史记录, 如果此后还想访问这些值,就可以直接使用别名而不用重新输入变量表达式。

如果想知道变量的类型,可以使用“whatis”命令,示例如下:

    

        

            

        

    

                         

对于第一次调试别人的代码,或者面对的是一个异常复杂的系统时,“whatis”命令的作用不容忽视。

单步执行
为了单步跟踪代码,可以使用单步跟踪命令“step”,它每次执行源代码中的一行。

在GDB中可以使用许多方法来简化操作,除了可以将“step”命令简化为“s”之外,还可以直接输入回车键来重复执行前面一条命令。

除了可以用“step”命令来单步运行程序之外,GDB还提供了另外一条单步调试命令“next”。两者功能非常相似,差别在于如果将要被执行的代码行中包含函数调用,使用step命令将跟踪进入函数体内,而使用next命令则不进入函数体内。

在进入下一部分之前,使用下面的命令退出GDB:
(gdb) quit

分析核心(core)文件

在 程序发生崩溃时,有时可能无法直接运行GDB来进行调试。比如程序可能是在另外一台机器上运行的,或者因为程序对时间比较敏感,所以手动跟踪调试会产生无 法接受的延迟等。遇到这些情况,就只能等到程序运行结束后才能判断崩溃的原因了。这时需要用到Linux提供的core  dump机制。当程序中出现内存操作错误时,会发生崩溃并产生核心文件。使用GDB可以对产生的核心文件进行分析,找出程序是在什么时候崩溃的和在崩溃之 前程序都做了些什么。当然,如果要用GDB来分析核心文件,也必须在编译时加上-g选项来产生调试符号表。

在分析核心文件之前必须确认系统是否允许生成核心文件,很多Linux发行版在默认时禁止生成核心文件。为了生成核心文件,首先必须执行下面的命令:
# ulimit -c unlimited

然后就可以生成核心文件了。这里仍以前面的debugme程序为例,再次执行下面命令将产生核心文件:

    

        

            

        

    

                         

生成的核心文件名根据系统配置的不同会有所差异。要在GDB中分析核心文件,除了要给出核心文件的文件名外,还必须给出生成该核心文件的可执行程序的名称,示例如下:

    

        

            

        

    

                         

从GDB的输出信息中可以看出,产生这个核心文件的原因是因为程序收到了序号为11的信号。如果想知道程序在崩溃之前运行到了哪里,可以使用“backtrace”或“info stack”命令查看一下堆栈的历史记录。示例如下:

    

        

            

        

    

                         

由上可知,程序崩溃时正处于_dl_fini()函数之中。但很多时候程序员感兴趣的可能并不是这个, 而是exit()或_libc_start_main()函数,因为它们才可能是问题真正的症结所在。GDB提供的“frame”命令可以用来在不同的调 用上下文中切换。例如下面的命令可以查看exit()函数在执行时的状况:

    

        

            

        

    

                         

此外还可以用“up”或“down”命令在不同的函数调用上下文中切换。开发人员使用这三条命令可以很轻松地实现调用栈的遍历。在分析核心文件时,通过将遍历栈的命令和检查变量值的“print”命令结合起来,就能够复原程序运行时的全部景象。

调试其它进程

有 时会遇到一种很特殊的调试需求,对当前正在运行的其它进程进行调试。这种情况有可能发生在那些无法直接在调试器中运行的进程身上,例如有的进程只能在系统 启动时运行。另外如果需要对进程产生的子进程进行调试的话,也只能采用这种方式。GDB可以对正在执行的程序进行调度,它允许开发人员中断程序并查看其状 态,之后还能让这个程序正常地继续执行。

GDB提供了两种方式来调试正在运行的进程:一种是在GDB命令行上指定进程的PID,另一种是在GDB中使用“attach”命令。例如,开发人员可以先启动debugme程序,让其开始等待用户的输入。示例如下:

    

        

            

        

    

                         

接下去在另一个虚拟控制台中用下面的命令查出该进程对应的进程号:

    

        

            

        

    

                         

得到进程的PID后,就可以使用GDB对其进行调试了:

    

        

            

        

    

                         

在上面的输出信息中,以Attaching to program开始的行表明GDB已经成功地附加在PID为555的进程上了。另外一种连接到其它进程的方法是先用file命令加载调试时所需的符号表,然后再通过“attaché”命令进行连接:

    

        

            

        

    

                         

如果想知道程序现在运行到了哪里,同样可以使用“backtrace”命令。当然也可以使用“step”命令对程序进行单步调试。

在完成调试之后,不要忘记用detach命令断开连接,让被调试的进程可以继续正常运行:

GDB是Linux下一个最基本的调试器,其功能非常丰富。完整地介绍GDB的功能可能需要几百页,本文只涵盖了GDB的一些最常见的用法。作为一个合格的Linux程序员,花在GDB上的功夫和时间越多,从调试中获得的益处就越多。

 Posted by at 上午 5:58
6月 112011
 

感觉这篇文章分析的还算比较到位,故转之。
转自: http://www.52rd.com/Blog/Archive_Thread.asp?SID=10488

本来,一般是不自己计算sizeof的,知道内存对齐会对sizeof有影响,所以从来不手算,而是代码里写上sizeof。今天又看到http://blog.vckbase.com/smileonce/archive/2005/08/08/10658.html,翻来了http://blog.vckbase.com/billdavid/archive/2004/06/23/509.html ,自己想想还是也记录一下,万一以后自己真的也要计算sizeof,忘了,还能有个提示,也给不是很明白的朋友一个参考。
struct sample1
{
    char a;        /// sizeof(char) = 1
    double b;    /// sizeof(double) = 8
};
///default(  缺省#pragam pack(8) ——VC6和VC71,其它编译器,个人未知 )
    ///1+8 = 9 —> 16(  8 < 9 < 16  )

#pragma pack( 4 )
    ///1+8 = 9 —> 12(  8 < 9 < 12  )

#pragma pack( 2 )
    ///1+8 = 9 —> 10(  8 < 9 < 10  )

#pragma pack( 1 )
    ///1+8 = 9 —> 9

#pragma pack( 16 )
    ///1+8 = 9 —> 16(  16—>8 —- 8 < 9 < 16  )

struct sample2
{
    char a;     ///1
    int b;        ///4
};
#pragma pack( 8 )
    /// 1 + 4  = 5 —> 8(  8 —> 4  )

#pragma pack( 16 )
    /// 1 + 4 = 5 —> 8( 16 —> 4  )

    说明:#pragma pack告诉编译器进行内存边界对齐,一般都是采用编译器的设置对整个项目采用同一对齐方案,而且通常为缺省8字节对齐。

/////////////////////////////////以下内容于 2005-12-10 添加/////////////////////////////////

    今天又看到以前测试的一段代码,突然不明白了起来,又稍写了几个测试。
struct sample3
{
    char a;  ///1
    int b;    ///4
    char c;  ///1
};
///default                  ///12
#pragma pack( 4 )   ///12
#pragma pack( 2 )   ///08
#pragma pack( 1 )   ///06
#pragma pack( 16 ) ///12

    原来,其实编译器,根据对齐指示的对齐字节和最大成员的字节,对每个成员进行了对齐:编译器会取对齐指示和最大成员字节中较小的一个用于补齐其它成员。那么,上面的sample1/2/3也就都在情理之中了。为了证实这点,我们还再看一个例子:
struct sample4
{
    char a;      ///1
    int b;         ///4
    double c;  ///8
    char d;      ///1
};
///default:                ///8+8+8+8 = 32
#pragma pack( 4 )   ///4+4+8+4 = 20
#pragma pack( 2 )   ///2+4+8+2 = 16
#pragma pack( 1 )   ///1+4+8+1 = 14
#pragma pack( 16 ) ///8+8+8+8 = 32
而实际上,编译器给出的值是:24、20、16、14、24
那么说明我错了。注意一下,我发现char a,int b加起来也才5<8,难到编译器进行了联合对齐?
struct sample5
{
    char a;      ///1
    double c;  ///8
    int b;         ///4
    char d;      ///1
};
编译器给出结果:24、20、16、14、24

    这用联合对齐的解释正好符合,我又试验了不同的数据,发现这个结论并不太准确确。于是,我输出了每一个对象成员地址进行分析。由于试验数据量很大,这里就不列出了。

最后得到了以下结论:
    1. 成员的对齐是按声明顺序进行的;
    2. 对齐值由编译指示和最大成员两者较小的值决定;
    3. 未对齐到对齐值的成员一起形成块对齐(联合对齐);
    4. 上一个(下一个)对齐采用自己较大则不变,自己较小则填充自己对齐到上一个(下一个)大小;
    5. 每成员对齐:如果前面已对齐到对齐值,下一个对齐自己。如果前面未对齐到对齐值,如果加上下一个成员不大于对齐值,下一个对齐自己,否则填充自己块对齐到对齐值。
    6. 最后还未对齐到对齐值的,填充空间块对齐到对齐值。

从这些结论,可以得到:
    1. 以上的对齐原则其实是尽量整齐排列、尽量节省内存。
    2. 声明成员应该尽量避免不同类型错杂开来,最好采用从小到大或者从大到小的顺序(错开后,会因为上对齐和下对齐而增加填充开销)。
    3. 编译器缺省采用8字节对齐主要是因为最大基本类型为8自己(以前自己不明白,在论坛提过问,后来,以为是SSE指令的原因)。
    4. 手算sizeof是没有必要的,负责的(可以先对齐出对齐块,用块数乘对齐值)。

 
载自 :http://blog.vckbase.com/zhangjw_cn/archive/2005/08/09/10701.html
 
 
—————————————————————————————————-
 
文章二:

#pragma pack和数据对齐问题

结构数据存放时默认按4对齐,考虑以下程序,输出结果为:sizeof(A)=12

typedef struct _A
{
    
int x;
    
char z[7];
}
A;

void main()
{
    
int len = sizeof(A);
    printf(
"sizeof(A)=%d\n", len);    // len = 12
}

使用 #pragma pack,设置数据按1对齐,此时输出结果为:sizeof(A)=11

#pragma pack(push)
#pragma pack(
1)
typedef 
struct _A
{
    
int x;
    
char z[7];
}
A;
#pragma pack(pop)

void main()
{
    
int len = sizeof(A);
    printf(
"sizeof(A)=%d\n", len);    // len = 11
}
 
—————————————————————————————————-

文章三:

解惑:sizeof(联合)这个值是怎么计算的

[不要只做技术]在论坛上问如下代码结果为什么是24?

这个问题很好回答,并且我把这个问题归结于基本概念题(就是入门书必须介绍的)。我想一般来说,做过内存管理的,对这个语言特性肯定不会陌生。

摘几句The C Programming Language里面讲述这个问题的原话,以说明读书还是必要的:
①联合就是一个结构,②它的所有成员相对于基地址的偏移量都为0,③此结构空间要大到足够容纳最“宽”的成员,④并且,其对齐方式要适合于联合中所有类型的成员。

怕有的兄弟还不明白,特附图一个帮助理解:

   

    

        

            

            

            

            

            

            

            

            

            

            

            

            

            

            

            

            

            

            

            

            

            

            

            

            

            

            

        

        

            

            

            

            

            

            

            

            

        

        

            

            

            

            

            

        

    

char a; => x                                              
int i[5]; =>             

 x

            

            

 x

            

            

 x

            

            

 x

            

            

 x

            

            

x

            

double b; =>             

 x

            

            

 

            

            

 

            

该结构要放得下int  i[5]必须要至少占4×5=20个字节。如果没有double的话20个字节够用了,此时按4字节对齐。但是加入了double就必须考虑double 的对齐方式,double是按照8字节对齐的,所以必须添加4个字节使其满足8×3=24,也就是必须也是8的倍数,这样一来就出来了24这个数字。综上 所述,最终联合体的最小的size也要是所包含的所有类型的基本长度的最小公倍数才行。(这里的字节数均指winnt下的值,平台、编译器不同值也有可能 不同。)

联合在存储分配的时候用的机会最多,因为很少有像存储分配这样需要给多种不同类型的变量分配空间而又打算尽可能的节约内存的,这很适合联合的特性。上述对齐的方式有个很有趣的用法也就常在存储分配里面使用。(下面依旧用The C Programming Language中的例子作答)

这里的Align有什么用?作用只有一个,就是强迫分配的结构体按long的长度对齐。

========== test add by lijunjie =========
struct nn {
    float f;  // 4
    char c1;  // 1 -> 4
    long l;   // 4
    int i;    //4
    char c2;  // 1 -> 4
};

不管是 #pragma pack(4) 还是 #pragma pack(8) ; 因为成员的最大宽度为4,所以最大按照4字节对齐,;因为 c1 的前后成员都能自己对齐,所以c1只好自己完成对齐, 故sizeof 的结果为20;

或许该结构体写成如下方式更合理一些:
struct nn {
    float f;  // 4
    long l;   // 4
    int i;    //4
    char c1;  // c1 和 c2 联合后对齐, 故 1 + 1 = 2 -> 4
    char c2; 
};
故sizeof的结果为 16

=========== 相关文章 ===========
http://westsoftware.blog.163.com/blog/static/26094109201021301421829/

 Posted by at 上午 5:13