程序各个段text,data,bss,stack,heap

时间:2023-01-03 16:12:09

网上找了一堆资料学习一下,了解这些,

有助于规化程序结构,优化代码;

使用gcc编译出来的程序,用size可以查看程序结构和大小,

   1: #size hello
   2: Text data bss dec hex filename
   3: 778  200  4   982 3D6 hello

所以一个可执行的程序文件,结构分三部分:

.text 代码段,用来存放代码,一般是只读的区域;

.data 数据段,用来存放全局初始化变量,常量,以及全局或局部静态变量,只初始化一次;

.bss  BSS段,用来存放全局未初化数据,用0初始化;

那有人问非全局变量放哪里了?

还有常说的堆和栈呢?

程序在执行时,会产生临时变量或是函数返回值,

还有函数中动态分配的地址空间,如malloc, new等…

根据这些需求,才需要堆和栈的出现,

所以堆(heap)和栈(Stack)这两个段是在程序运行时才有.

.stack 栈区,用来存放局部变量,函数的参数,返回值等,由编译器自动分配释放;

     栈的概念来自数据结构,栈只能在一端操作,所以先入栈的后出,“先进后出”,这种结构保护之前的现场,

    如一个函数被调用后,产生的临时变量都会存到栈区的顶部,当函数完成后,会自动从顶部将刚使用的数据销毁;

    另外栈区的地址是从高地址向下增长的;

.heap 堆区,用来动态内存分配,如malloc, new申请的内存,由程序员分配释放;

    程序中不释放,则程序结束时,由OS回收;据说这个和数据结构中的堆 没有什么关系;堆区使用时地址向上增长;

   

  

 

以上5部分在内存的位置如下图,

程序各个段text,data,bss,stack,heap

 

执行过程:

代码区的指令依次执行,代码由操作码和操作数组成,操作码决定是顺序执行,还是跳转,还是循环等;操作数可能是立即数,即具体的数直接包含在代码中,或者是局部变量,则在栈区分配空间,然后引用该数据地址执行,或者是BSS,DATA段的数据,同样引用其地址执行;

正因为代码有不同的操作,所以程序在内存中执行时,才分成不同的区,以便节约空间或访问方便;对于全局变量和静态变量,一般不会更改其值,但整个执行过程都需要访问,就单独放到一个区进行管理;临时变量生命周期短,需要频繁的操作,则统一放到栈区;用户*分配使用的空间统一放在堆区,便于管理;

引用网上的例子,

   1: //main.cpp 
   2:  int a = 0;     //a在全局已初始化数据区.data
   3:  char *p1;        //p1在.bss(未初始化全局变量)
   4: main() 
   5: {
   6:     int b;            //b在栈区 .stack
   7:     char s[] = "abc"; //s为数组变量,存储在栈区,.heap
   8:                       //"abc"为字符串常量,存储在已初始化数据区
   9:     char *p1,p2;     //p1,p2在栈区
  10:     char *p3 = "123456"; //123456\0在已初始化数据区,p3在栈区
  11:     static int c =0;    //C为全局(静态)数据,存在于已初始化数据区
  12:                         //另外,静态数据会自动初始化
  13:     p1 = (char *)malloc(10);//分配得来的10个字节的区域在堆区
  14:     p2 = (char *)malloc(20);//分配得来的20个字节的区域在堆区
  15:     //注意p1,p2是局部变量,所以存储在栈中,10Byte空间在堆中;
  16:     free(p1);
  17:     free(p2);
  18: } 
  19:  

 

以下引用这个博客的,堆和栈的区别:

http://www.cnblogs.com/hfww/archive/2011/06/04/2223366.html

二、堆和栈的理论知识

2.1申请方式

stack:

由系统自动分配。 例如,声明在函数中一个局部变量 int b; 系统自动在栈中为b开辟空间

heap:

需要程序员自己申请,并指明大小,在c中malloc函数

如p1 = (char *)malloc(10);

在C++中用new运算符

如p2 = (char *)malloc(10);

但是注意p1、p2本身是在栈中的。

2.2

申请后系统的响应

栈:只要栈的剩余空间大于所申请空间,系统将为程序提供内存,否则将报异常提示栈溢出。

堆:首先应该知道操作系统有一个记录空闲内存地址的链表,当系统收到程序的申请时,

会遍历该链表,寻找第一个空间大于所申请空间的堆结点,然后将该结点从空闲结点链表中删除,并将该结点的空间分配给程序,另外,对于大多数系统, 会在这块内存空间中的首地址处记录本次分配的大小,这样,代码中的delete语句才能正确的释放本内存空间。另外,由于找到的堆结点的大小不一定正好等 于申请的大小,系统会自动的将多余的那部分重新放入空闲链表中。

2.3申请大小的限制

栈:在Windows下,栈是向低地址扩展的数据结构,是一块连续的内存的区域。这句话的意思是栈顶的地址和栈的最大容量是系统预先规定好的,在 WINDOWS下,栈的大小是2M(也有的说是1M,总之是一个编译时就确定的常数),如果申请的空间超过栈的剩余空间时,将提示overflow。因 此,能从栈获得的空间较小。

堆:堆是向高地址扩展的数据结构,是不连续的内存区域。这是由于系统是用链表来存储的空闲内存地址的,自然是不连续的,而链表的遍历方向是由低地址向高地址。堆的大小受限于计算机系统中有效的虚拟内存。由此可见,堆获得的空间比较灵活,也比较大。

2.4申请效率的比较:

栈是机器系统提供的数据结构,计算机会在底层对栈提供支持:分配专门的寄存器存放栈的地址,压栈出栈都有专门的指令执行。堆则是C函数库提供的,它的机制很复杂,例如为了分配一块内存,库函数会按照一定的算法(具体的算法可以参考数据结构/操作系统)在堆内存中搜索可用的足够大的空间,如果没有足够大的空间(可能是由于内存碎片太多),就有需要操作系统来重新整理内存空间,这样就有机会分到足够大小的内存,然后返回。显然,堆的效率比栈要低得多。

栈由系统自动分配,速度较快。但程序员是无法控制的。

堆是由new分配的内存,一般速度比较慢,而且容易产生内存碎片,不过用起来最方便.

另外,在WINDOWS下,最好的方式是用VirtualAlloc分配内存,他不是在堆,也不是在栈是直接在进程的地址空间中保留一快内存,虽然用起来最不方便。但是速度快,也最灵活。

 

另外...VS下更改栈大小的方法,

http://www.cnblogs.com/sosi/archive/2011/03/27/1997180.html