首页 > 源码分享, 程序人生 > 手把手教你调试STL容器(上)

手把手教你调试STL容器(上)

众所周知,调试(Debugging)是每个程序员所要必备的基本的技术素养,尤其是对C/C++的程序员来说。对于在linux下用C/C++开发的朋友,相信对GDB不会陌生,当程序有bug或者是出现core dump的时候,GDB是我们最好的朋友。STL是C++相较于C而言,增加的非常强有力的工具,它从某种程度上把C/C++程序员从繁琐的基本数据结构中解放了出来。不过,STL虽然用起来十分方便,但是,用GDB调试过C/C++程序的朋友都有这样痛苦的经历,在GDB状态下,要知道某个STL对象(比如容器)中的数据内容,并不是那么直接、简单。本文的主要内容就是介绍STL中大家比较常用到的容器的基本组成,帮助大家能够在调试的时候更好的驾驭它们。

  • 1. string
  • string是STL中最为常用的类型,它是模板类basic_string用char类型特化后的结果,下面我们来看一下string类型的基本组成:

    typedef basic_string    string;
    
    struct _Rep_base
    {
        size_type     _M_length;
        size_type     _M_capacity;
        _Atomic_word  _M_refcount;
    };
    
    struct _Alloc_hider
    {
        _CharT* _M_p; 
    };
    
    mutable _Alloc_hider  _M_dataplus;
    _M_data() const { return  _M_dataplus._M_p; }
    _Rep* _M_rep() const { return &((reinterpret_cast<_rep *> (_M_data()))[-1]); }

    从上面来看,string只有一个成员_M_dataplus。但是这里需要注意的是,string类在实现的时候用了比较巧的方法,在_M_dataplus._M_p中保存了用户的数据,在_M_dataplus._M_p的第一个元素前面的位置,保存了string类本身所需要的一些信息rep。这样做的好处,一方面不增加string类的额外开销,另一方面可以保证用户在调试器(GDB)中用_M_dataplus._M_p查看数据内容的时候,不受干扰。用户可以通过reinterpret_cast<_rep *> (_M_data()))[-1])来查看rep相关的信息,也可以调用_M_rep()函数来查看。

  • 2. vector
  • vector同样也是stl中最为常用类型,下面我们来看一下vector类型的基本组成:

    struct _Vector_impl
    {
        _Tp*           _M_start;
        _Tp*           _M_finish;
        _Tp*           _M_end_of_storage;
    };
    
    _Vector_impl _M_impl;

    vector本身很简单,就是一个动态数组。它只有一个数组成员_M_impl,用户可以通过_M_impl来查看vector内容的数据成员,具体包括动态数组的超始地址_M_impl._M_start,结束地址_M_impl._M_end_of_storage,数组内容的结束地址_M_impl._M_finish

  • 3. list
  • list是STL中的双向链表结构,也是大家经常用来的,下面我们一起来看一下list的基本组成:

    struct _List_node_base
    {
        _List_node_base* _M_next;   
        _List_node_base* _M_prev;   
    };
    
    template
    struct _List_node : public _List_node_base
    {
        _Tp _M_data;               
    };
    
    struct _List_impl
    {
        _List_node_base _M_node;
    };
    
    _List_impl _M_impl;

    通过上面的代码,我们可以看出,list本身只保留了一个空结点_M_impl._M_node,用来标示list的header,新加入的第一个结点,是直接链到_M_imp._M_node._M_next上的,后面的依次类推。我们可以把_M_impl._M_node.m_next强制转型成_List_node类型,然后通过_M_data来查看具体的数据内容,即((_List_node *)(_M_impl._M_node->M_next))->M_data (T是数据的类型)。
    我们知道,string和vector都是线型结构,只要知道数据的起始地址和容器大小,便可获取到所以的元素内容。但是list是非线型结构,这时候就需要iterator来帮忙了,下面我们来看下list的iterator的基本组成:

    template
    struct _List_iterator
    {
         _List_node_base* _M_node;
    };

    从上面的代码,我们可以看出,list的iterator只是保存了一个list结点的指针,有此足矣,通过它我们便可以获取到iter里面的数据内容:((_List_node *)(iter->_M_node)->M_data (T是数据的类型)

  • 4. deque
  • deque是STL中提供一个队列结构,它同时兼有vector和list的基本特点,因此实现要复杂一些,下面我们来看一下它的基本组成:

    template
    struct _Deque_iterator
    {
        typedef _Tp**   _Map_pointer;
    
        _Tp* _M_cur;
        _Tp* _M_first;
        _Tp* _M_last;
        _Map_pointer _M_node;
    };
    
    typedef _Deque_iterator<_tp , _Tp&, _Tp*>  iterator;
    struct _Deque_impl
        : public _Tp_alloc_type
    {
        _Tp**    _M_map;
        size_t   _M_map_size;
        iterator _M_start;
        iterator _M_finish;
    };
    _Deque_impl _M_impl;
    

    从上面的代码,及STL的源码,我们可以了解到,deque是由多块连续buffer,通过一个中控的数组_M_map来链在一起,实现的。我们可以通过_M_map,获取到每一个块的起始地址,在每一块内的数据,地址都是连续的,可以像数组一起取出对应的数据内容。
    另外,我们还可以通过iterator来访问deque的元素,上面的代码中,iterator的_M_cur是指向当前元素的指针,_M_first是当前块的起始地址,_M_last当前块的结束地址。
    本篇是〈手把手教你调试STL容器〉的上篇,主要介绍了string, vector, list和deque这些基本的容器,下篇将介绍map/set/multimap/multiset, hash_map/hash_set/hash_multimap/hash_multiset,敬请期待!

    1. 2011年5月4日14:02 | #1

      求问代码部分的显示是怎么做的?是插件吗?

    2. 2011年5月4日18:57 | #2

      恩,wp-syntax吧,好像是这个插件@Leon

    3. fogsnow
      2013年5月12日22:47 | #3

      gdb7.0以上,支持python,下个pretty print,在.gdbinit里设置一下就能用了
      svn://gcc.gnu.org/svn/gcc/trunk/libstdc++-v3/python
      不用这么麻烦了

    1. 2011年5月16日14:27 | #1
    您必须在 登录 后才能发布评论.