手把手教你调试STL容器(上)
众所周知,调试(Debugging)是每个程序员所要必备的基本的技术素养,尤其是对C/C++的程序员来说。对于在linux下用C/C++开发的朋友,相信对GDB不会陌生,当程序有bug或者是出现core dump的时候,GDB是我们最好的朋友。STL是C++相较于C而言,增加的非常强有力的工具,它从某种程度上把C/C++程序员从繁琐的基本数据结构中解放了出来。不过,STL虽然用起来十分方便,但是,用GDB调试过C/C++程序的朋友都有这样痛苦的经历,在GDB状态下,要知道某个STL对象(比如容器)中的数据内容,并不是那么直接、简单。本文的主要内容就是介绍STL中大家比较常用到的容器的基本组成,帮助大家能够在调试的时候更好的驾驭它们。
string是STL中最为常用的类型,它是模板类basic_string用char类型特化后的结果,下面我们来看一下string类型的基本组成:
typedef basic_stringstring; struct _Rep_base { size_type _M_length; size_type _M_capacity; _Atomic_word _M_refcount; }; struct _Alloc_hider { _CharT* _M_p; }; mutable _Alloc_hider _M_dataplus; _M_data() const { return _M_dataplus._M_p; } _Rep* _M_rep() const { return &((reinterpret_cast<_rep *> (_M_data()))[-1]); }
从上面来看,string只有一个成员_M_dataplus。但是这里需要注意的是,string类在实现的时候用了比较巧的方法,在_M_dataplus._M_p中保存了用户的数据,在_M_dataplus._M_p的第一个元素前面的位置,保存了string类本身所需要的一些信息rep。这样做的好处,一方面不增加string类的额外开销,另一方面可以保证用户在调试器(GDB)中用_M_dataplus._M_p查看数据内容的时候,不受干扰。用户可以通过reinterpret_cast<_rep *> (_M_data()))[-1])来查看rep相关的信息,也可以调用_M_rep()函数来查看。
vector同样也是stl中最为常用类型,下面我们来看一下vector类型的基本组成:
struct _Vector_impl { _Tp* _M_start; _Tp* _M_finish; _Tp* _M_end_of_storage; }; _Vector_impl _M_impl;
vector本身很简单,就是一个动态数组。它只有一个数组成员_M_impl,用户可以通过_M_impl来查看vector内容的数据成员,具体包括动态数组的超始地址_M_impl._M_start,结束地址_M_impl._M_end_of_storage,数组内容的结束地址_M_impl._M_finish
list是STL中的双向链表结构,也是大家经常用来的,下面我们一起来看一下list的基本组成:
struct _List_node_base { _List_node_base* _M_next; _List_node_base* _M_prev; }; templatestruct _List_node : public _List_node_base { _Tp _M_data; }; struct _List_impl { _List_node_base _M_node; }; _List_impl _M_impl;
通过上面的代码,我们可以看出,list本身只保留了一个空结点_M_impl._M_node,用来标示list的header,新加入的第一个结点,是直接链到_M_imp._M_node._M_next上的,后面的依次类推。我们可以把_M_impl._M_node.m_next强制转型成_List_node类型,然后通过_M_data来查看具体的数据内容,即((_List_node
我们知道,string和vector都是线型结构,只要知道数据的起始地址和容器大小,便可获取到所以的元素内容。但是list是非线型结构,这时候就需要iterator来帮忙了,下面我们来看下list的iterator的基本组成:
templatestruct _List_iterator { _List_node_base* _M_node; };
从上面的代码,我们可以看出,list的iterator只是保存了一个list结点的指针,有此足矣,通过它我们便可以获取到iter里面的数据内容:((_List_node
deque是STL中提供一个队列结构,它同时兼有vector和list的基本特点,因此实现要复杂一些,下面我们来看一下它的基本组成:
templatestruct _Deque_iterator { typedef _Tp** _Map_pointer; _Tp* _M_cur; _Tp* _M_first; _Tp* _M_last; _Map_pointer _M_node; }; typedef _Deque_iterator<_tp , _Tp&, _Tp*> iterator; struct _Deque_impl : public _Tp_alloc_type { _Tp** _M_map; size_t _M_map_size; iterator _M_start; iterator _M_finish; }; _Deque_impl _M_impl;
从上面的代码,及STL的源码,我们可以了解到,deque是由多块连续buffer,通过一个中控的数组_M_map来链在一起,实现的。我们可以通过_M_map,获取到每一个块的起始地址,在每一块内的数据,地址都是连续的,可以像数组一起取出对应的数据内容。
另外,我们还可以通过iterator来访问deque的元素,上面的代码中,iterator的_M_cur是指向当前元素的指针,_M_first是当前块的起始地址,_M_last当前块的结束地址。
本篇是〈手把手教你调试STL容器〉的上篇,主要介绍了string, vector, list和deque这些基本的容器,下篇将介绍map/set/multimap/multiset, hash_map/hash_set/hash_multimap/hash_multiset,敬请期待!
求问代码部分的显示是怎么做的?是插件吗?
恩,wp-syntax吧,好像是这个插件@Leon
gdb7.0以上,支持python,下个pretty print,在.gdbinit里设置一下就能用了
svn://gcc.gnu.org/svn/gcc/trunk/libstdc++-v3/python
不用这么麻烦了