从一个新手容易混淆的例子简单分析C语言中函数调用过程

时间:2022-04-30 00:20:07

某天,王尼玛写了段C程序:

 #include <stdio.h>

 void input()
{
int i;
int array[];
for(i = ; i < ; i++)
{
array[i] = i;
}
} void output()
{
int i;
int array[];
for(i = ; i < ; i++)
{
printf("%d\n", array[i]);
}
} int main()
{
input();
output();
while(){}
return ;
}

  这段代码的目的很简单,在input函数中定义了array[20]并赋值,在output函数中输出,运行结果如下:

从一个新手容易混淆的例子简单分析C语言中函数调用过程

  Nice Work!从一个新手容易混淆的例子简单分析C语言中函数调用过程

  But……在input()后来一发printf()呢?????

  int main()
{
input();
printf("any string");
output();
while(){}
return ;
}

从一个新手容易混淆的例子简单分析C语言中函数调用过程

  其实,只要学过一段时间的C语言的童鞋就会发现,刚刚开始那俩函数里定义的array[20]就出问题了,这俩array压根儿没关系,如果遇到这样的代码,第一反应就是通过参数或者全局变量的方法,让这俩array有关系。

  But,问题来了……王尼玛是个新手,他将两个array定义成一样的名字认为他们就是同一个数组,并且,他振振有词的说,我之前的代码是没问题的,只加了个printf就出问题了,应该就是这里有问题了,怎么可能是定义array的问题?从一个新手容易混淆的例子简单分析C语言中函数调用过程

  尼玛,这只是巧合而已,你的第一段程序就是错的!从一个新手容易混淆的例子简单分析C语言中函数调用过程

  可我的输出是正确的啊……从一个新手容易混淆的例子简单分析C语言中函数调用过程

  这……从一个新手容易混淆的例子简单分析C语言中函数调用过程

==============================================分割线================================================

  其实大家都知道,问题的根源是output和input函数中的数组array虽然同名,但却不是同一个数组,只是碰巧将原先赋值的内存给输出了而已,要解释这个问题,就需要了解C语言在函数调用过程中,堆栈是如何变化的。首先必须明确一点也是非常重要的一点,栈是向下生长的,所谓向下生长是指从内存高地址->低地址的路径延伸,那么就很明显了,栈有栈底和栈顶,那么栈顶的地址要比栈底低。对x86体系的CPU而言,其中

  ---> 寄存器ebp(base pointer )可称为“帧指针”或“基址指针”,其实语意是相同的。
  ---> 寄存器esp(stack pointer)可称为“ 栈指针”。

要知道的是:

  ---> ebp 在未受改变之前始终指向栈帧的开始,也就是栈底,所以ebp的用途是在堆栈中寻址用的。
  ---> esp是会随着数据的入栈和出栈移动的,也就是说,esp始终指向栈顶。

见下图,假设函数A调用函数B,我们称A函数为"调用者",B函数为“被调用者”则函数调用过程可以这么描述:

(1)先将调用者(A)的堆栈的基址(ebp)入栈,以保存之前任务的信息。

(2)然后将调用者(A)的栈顶指针(esp)的值赋给ebp,作为新的基址(即被调用者B的栈底)。

(3)然后在这个基址(被调用者B的栈底)上开辟(一般用sub指令)相应的空间用作被调用者B的栈空间。

(4)函数B返回后,从当前栈帧的ebp即恢复为调用者A的栈顶(esp),使栈顶恢复函数B被调用前的位置;然后调用者A再从恢复后的栈顶可弹出之前的ebp值(可以这么做是因为这个值在函数调用前一步被压入堆栈)。这样,ebp和esp就都恢复了调用函数B前的位置,也就是栈恢复函数B调用前的状态。

从一个新手容易混淆的例子简单分析C语言中函数调用过程

  回到之前的问题,由于input函数和output函数为各自的array数组分配的空间在内存中的地址恰好相同,所以可以顺利输出其内容;但是在调用printf函数以后,由于堆栈中一部分内容被修改了,所以输出结果前半部分是正确的,后半部分是错误的。看到这里,相信有童鞋会试着运行这段代码,如果使用Turbo C,恭喜你可以获得相同的结果(上述结果在Turbo C测试截图);如果使用Visual Studio XXXX,将得到如下结果:

从一个新手容易混淆的例子简单分析C语言中函数调用过程

  这是怎么回事呢?查看了反汇编,发现在Debug版本中,为了方便调试,VS会将数组初始化为0xCCCCCCCC,而output函数中的array数组是刚刚定义的,所以被VS初始化位0xCCCCCCCC,转换成unsigned int就是-858993460。

从一个新手容易混淆的例子简单分析C语言中函数调用过程

  当然,在Release版本中,为了提高效率,是不会对数组进行这种默认初始化的操作,那么结果是什么样的呢?

从一个新手容易混淆的例子简单分析C语言中函数调用过程

  纳尼?!如果VS不给数组初始化,得到的结果为毛和Turbo C不一样啊……从一个新手容易混淆的例子简单分析C语言中函数调用过程

  既然这样,只能再次借助反汇编了,见下图。可以发现input函数没有对应的汇编语句,也就是说,由于这货啥都不干,被编译器优化掉了。既然没有对数组array赋值,那么输出的自然是内存里原先乱七八糟的数据了。

从一个新手容易混淆的例子简单分析C语言中函数调用过程

  至于GCC会得出什么结果,作为Windows党,就不测试了,感兴趣的童鞋可以调整编译选项自己试试看从一个新手容易混淆的例子简单分析C语言中函数调用过程