深入讲解C语言编程中volatile修饰符的作用

时间:2022-03-10 06:25:44

volatile提醒编译器它后面所定义的变量随时都有可能改变,因此编译后的程序每次需要存储或读取这个变量的时候,都会直接从变量地址中读取数据。如果没有volatile关键字,则编译器可能优化读取和存储,可能暂时使用寄存器中的值,如果这个变量由别的程序更新了的话,将出现不一致的现象。下面举例说明。在DSP开发中,经常需要等待某个事件的触发,所以经常会写出这样的程序:

?
1
2
3
4
5
6
7
short flag;
void test()
{
do1();
while(flag==0);
do2();
}

    这段程序等待内存变量flag的值变为1(怀疑此处是0,有点疑问,)之后才运行do2()。变量flag的值由别的程序更改,这个程序可能是某个硬件中断服务程序。例如:如果某个按钮按下的话,就会对DSP产生中断,在按键中断程序中修改flag为1,这样上面的程序就能够得以继续运行。但是,编译器并不知道flag的值会被别的程序修改,因此在它进行优化的时候,可能会把flag的值先读入某个寄存器,然后等待那个寄存器变为1。如果不幸进行了这样的优化,那么while循环就变成了死循环,因为寄存器的内容不可能被中断服务程序修改。为了让程序每次都读取真正flag变量的值,就需要定义为如下形式:

?
1
volatile short flag;

    需要注意的是,没有volatile也可能能正常运行,但是可能修改了编译器的优化级别之后就又不能正常运行了。因此经常会出现debug版本正常,但是release版本却不能正常的问题。所以为了安全起见,只要是等待别的程序修改某个变量的话,就加上volatile关键字。

volatile的本意是“易变的”
      由于访问寄存器的速度要快过RAM,所以编译器一般都会作减少存取外部RAM的优化。比如:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
static int i=0;
int main(void)
{
...
while (1)
{
if (i) do_something();
}
}
/* Interrupt service routine. */
void ISR_2(void)
{
i=1;
}

    程序的本意是希望ISR_2中断产生时,在main当中调用do_something函数,但是,由于编译器判断在main函数里面没有修改过i,因此可能只执行一次对从i到某寄存器的读操作,然后每次if判断都只使用这个寄存器里面的“i副本”,导致do_something永远也不会被调用。如果变量加上volatile修饰,则编译器保证对此变量的读写操作都不会被优化(肯定执行)。此例中i也应该如此说明。
    一般说来,volatile用在如下的几个地方:
1、中断服务程序中修改的供其它程序检测的变量需要加volatile;
2、多任务环境下各任务间共享的标志应该加volatile;
3、存储器映射的硬件寄存器通常也要加volatile说明,因为每次对它的读写都可能由不同意义;
另外,以上这几种情况经常还要同时考虑数据的完整性(相互关联的几个标志读了一半被打断了重写),在1中可以通过关中断来实现,2中可以禁止任务调度,3中则只能依靠硬件的良好设计了。
volatile 的深层次含义
     volatile总是与优化有关,编译器有一种技术叫做数据流分析,分析程序中的变量在哪里赋值、在哪里使用、在哪里失效,分析结果可以用于常量合并,常量传播等优化,进一步可以死代码消除。但有时这些优化不是程序所需要的,这时可以用volatile关键字禁止做这些优化,volatile的字面含义是易变的,它有下面的作用: 

  1. 不会在两个操作之间把volatile变量缓存在寄存器中。在多任务、中断、甚至setjmp环境下,变量可能被其他的程序改变,编译器自己无法知道,volatile就是告诉编译器这种情况。
  2. 不做常量合并、常量传播等优化,所以像下面的代码:
?
1
2
volatile int i = 1;
if (i > 0) ...

if的条件不会当作无条件真。

  • 对volatile变量的读写不会被优化掉。如果你对一个变量赋值但后面没用到,编译器常常可以省略那个赋值操作,然而对Memory Mapped IO的处理是不能这样优化的。 

 前面有人说volatile可以保证对内存操作的原子性,这种说法不大准确,其一,x86需要LOCK前缀才能在SMP下保证原子性,其二,RISC根本不能对内存直接运算,要保证原子性得用别的方法,如atomic_inc。

    对于jiffies,它已经声明为volatile变量,我认为直接用jiffies++就可以了,没必要用那种复杂的形式,因为那样也不能保证原子性。
    你可能不知道在Pentium及后续CPU中,下面两组指令

?
1
2
3
4
5
inc jiffies
;;
mov jiffies, %eax
inc %eax
mov %eax, jiffies

作用相同,但一条指令反而不如三条指令快。
编译器优化 → C关键字volatile → memory破坏描述符zz

    “memory”比较特殊,可能是内嵌汇编中最难懂部分。为解释清楚它,先介绍一下编译器的优化知识,再看C关键字volatile。最后去看该描述符。
编译器优化介绍 
     内存访问速度远不及CPU处理速度,为提高机器整体性能,在硬件上引入硬件高速缓存Cache,加速对内存的访问。另外在现代CPU中指令的执行并不一定严格按照顺序执行,没有相关性的指令可以乱序执行,以充分利用CPU的指令流水线,提高执行速度。以上是硬件级别的优化。再看软件一级的优化:一种是在编写代码时由程序员优化,另一种是由编译器进行优化。编译器优化常用的方法有:将内存变量缓存到寄存器;调整指令顺序充分利用CPU指令流水线,常见的是重新排序读写指令。对常规内存进行优化的时候,这些优化是透明的,而且效率很好。由编译器优化或者硬件重新排序引起的问题的解决办法是在从硬件(或者其他处理器)的角度看必须以特定顺序执行的操作之间设置内存屏障(memory barrier),linux 提供了一个宏解决编译器的执行顺序问题。
void Barrier(void)
     这个函数通知编译器插入一个内存屏障,但对硬件无效,编译后的代码会把当前CPU寄存器中的所有修改过的数值存入内存,需要这些数据的时候再重新从内存中读出。
Memory 
      有了上面的知识就不难理解Memory修改描述符了,Memory描述符告知GCC:
1)不要将该段内嵌汇编指令与前面的指令重新排序;也就是在执行内嵌汇编代码之前,它前面的指令都执行完毕
2)不要将变量缓存到寄存器,因为这段代码可能会用到内存变量,而这些内存变量会以不可预知的方式发生改变,因此GCC插入必要的代码先将缓存到寄存器的变量值写回内存,如果后面又访问这些变量,需要重新访问内存。
     如果汇编指令修改了内存,但是GCC 本身却察觉不到,因为在输出部分没有描述,此时就需要在修改描述部分增加“memory”,告诉GCC 内存已经被修改,GCC 得知这个信息后,就会在这段指令之前,插入必要的指令将前面因为优化Cache 到寄存器中的变量值先写回内存,如果以后又要使用这些变量再重新读取。
     使用“volatile”也可以达到这个目的,但是我们在每个变量前增加该关键字,不如使用“memory”方便。

volatile的重要性对于搞嵌入式的程序员来说是不言而喻的,对于volatile的了解程度常常被不少公司在招聘嵌入式编程人员面试的时候作为衡量一个应聘者是否合格的参考标准之一,为什么volatile如此的重要呢?这是因为嵌入式的编程人员要经常同中断、底层硬件等打交道,而这些都用到volatile,所以说嵌入式程序员必须要掌握好volatile的使用。

其实就象读者所熟悉的const一样,volatile是一个类型修饰符。在开始讲解volatile之前我们先来讲解下接下来要用到的一个函数,知道如何使用该函数的读者可以跳过该函数的讲解部分。

原型:

?
1
int gettimeofday ( struct timeval * tv , struct timezone * tz );

头文件

?
1
#include <sys/time.h>

功能:获取当前时间

返回值:如果成功返回0,失败返回-1,错误代码存于errno中。

gettimeofday()会把目前的时间用tv所指的结构返回,当地时区的信息则放到tz所指的结构中。
timeval结构定义为:

?
1
2
3
4
struct timeval{
 long tv_sec;
 long tv_usec;
};

timezone 结构定义为:

?
1
2
3
4
struct timezone{
 int tz_minuteswest;
 int tz_dsttime;
};

先来说说timeval结构体,其中的tv_sec存放的是秒,而tv_usec存放的是微秒。其中的timezone成员变量我们很少使用,在此简单的说说它在gettimeofday()函数中的作用是把当地时区的信息则放到tz所指的结构中,在其中tz_minuteswest变量里存放的是和Greenwich 时间差了多少分钟,tz_dsttime日光节约时间的状态。我们在此主要的是关注前一个成员变量timeval,后一个我们在此不使用,所以使用gettimeofday()函数的时候我们把有一个参数设定为NULL,下面先来看看一段简单的代码。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
#include <stdio.h>
#include <sys/time.h>
 
int main(int argc, char * argv[])
{
 struct timeval start,end;
 gettimeofday( &start, NULL ); /*测试起始时间*/
 double timeuse;
 int j;
 for(j=0;j<1000000;j++)
 ;
 gettimeofday( &end, NULL ); /*测试终止时间*/
 timeuse = 1000000 * ( end.tv_sec - start.tv_sec ) + end.tv_sec - start.tv_sec ;
 timeuse /= 1000000;
printf("运行时间为:%f\n",timeuse);
 
 return 0;
 
}
root@ubuntu:/home# ./p

运行时间为:

?
1
0.002736

现在来简单的分析下代码,通过end.tv_sec - start.tv_sec 我们得到了终止时间跟起始时间以秒为单位的时间间隔,然后使用end.tv_sec - start.tv_sec 得到终止时间跟起始时间以微妙为单位的时间间隔。因为时间单位的原因,所以我们在此对于( end.tv_sec - start.tv_sec ) 得到的结果乘以1000000转换为微秒进行计算,之后再使用timeuse /= 1000000;将其转换为秒。现在了解了如何通过gettimeofday()函数来测试start到end代码之间的运行时间,那么我们现在接下来看看volatile修饰符。

通常在代码中我们为了防止一个变量在意想不到的情况下被改变,我们会将变量定义为volatile,这从而就使得编译器就不会自作主张的去“动”这个变量的值了。准确点说就是每次在用到这个变量时必须每次都重新从内存中直接读取这个变量的值,而不是使用保存在寄存器里的备份。

在举例之前我们先大概的说下Debug和Release 模式下编译方式的区别,Debug 通常称为调试版本,它包含调试信息,并且不作任何优化,便于程序员调试程序。Release 称为发布版本,它往往是进行了各种优化,使得程序在代码大小和运行速度上都是最优的,以便用户很好地使用。大致的知道了Debug和Release的区别之后,我们下面来看看一段代码。

?
1
2
3
4
5
6
7
8
9
10
#include <stdio.h>
 
void main()
{
int a=12;
printf("a的值为:%d\n",a);
__asm {mov dword ptr [ebp-4], 0h}
int b = a;
printf("b的值为:%d\n",b);
}

分析下上面的代码,我们使用了一句__asm {mov dword ptr [ebp-4], 0h}来修改变量a在内存中的值。前面已经讲解了Debug和Release 编译方式的区别,那么我们现在来对比看下结果。注:使用vc6编译运行,如无特殊说明,均在linux环境下编译运行。读者自己在编译的时候别忘了选择编译运行的模式。

使用Debug模式的结果为:

?
1
2
3
a的值为:12
b的值为:0
Press any key to continue

使用Release模式的结果为:

?
1
2
3
a的值为:12
b的值为:12
Press any key to continue

看看上面的运行结果我们发现在Release模式进行了优化之后b的值为了12,但是使用Debug模式的时候b的值为0。为什么会出现这样的情况呢?我们先不说答案,再来看看下面一段代码。注:使用vc6编译运行

?
1
2
3
4
5
6
7
8
9
10
#include <stdio.h>
 
void main()
{
int volatile a=12;
printf("a的值为:%d\n",a);
__asm {mov dword ptr [ebp-4], 0h}
int b = a;
printf("b的值为:%d\n",b);
}

使用Debug模式的结果为:

?
1
2
3
a的值为:12
b的值为:0
Press any key to continue

使用Release模式的结果为:

?
1
2
3
a的值为:12
b的值为:0
Press any key to continue

我们发现这种情况下不管使用Debug模式还是Release模式都是一样的结果。现在我们就来分析下,在此之前我们先说了Debug和Release 模式下编译方式的区别。

先分析上一段代码,由于在Debug模式下我们并没有对代码进行优化,所以对于在代码中每次使用a值得时候都是从它的内存地址直接读取的,所以在我们使用了__asm {mov dword ptr [ebp-4], 0h}语句改变了a的值之后,接下来使用a值的时候从内存中直接读取,所以得到的是更新后的a值;但是当我们在Release模式下运行的时候,发现b的值为a之前的值,而不是我们更新后的a值,这是由于编译器在优化的过程中做了优化处理。编译器发现在对a赋值之后没有再次改变a的值,所以编译器把a的值备份在了一个寄存器中,在之后的操作中我们再次使用a值的时候就直接操作这个寄存器,而不去读取a的内存地址,因为读取寄存器的速度要快于直接读取内存的速度。这就使得了读到的a值为之前的12。而不是更新后的0。

第二段代码中我们使用了一个volatile修饰符,这种情况下不管在什么模式下都得到的是更新后的a的值,因为volatile修饰符的作用就是告诉编译器不要对它所修饰的变量进行任何的优化,每次取值都要直接从内存地址得到。从这儿我们可以看出,对于我们代码中的那些易变量,我们最好使用volatile修饰,以此来得到每次对其进行更新后的值。为了加深下大家的印象我们再来看看下面一段代码。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
#include <stdio.h>
#include <sys/time.h>
 
int main(int argc, char * argv[])
{
 struct timeval start,end;
 gettimeofday( &start, NULL ); /*测试起始时间*/
 double timeuse;
 int j;
 for(j=0;j<10000000;j++)
  ;
 gettimeofday( &end, NULL ); /*测试终止时间*/
 timeuse = 1000000 * ( end.tv_sec - start.tv_sec ) + end.tv_usec -start.tv_usec;
 timeuse /= 1000000;
printf("运行时间为:%f\n",timeuse);
 
 return 0;
 
}

与之前我们测试时间的代码一样,我们只是增大了for()循环的次数。

先来看看我们不使用优化的结果:

?
1
2
3
root@ubuntu:/home# gcc time.c -o p
root@ubuntu:/home# ./p
运行时间为:0.028260

使用了优化的运行结果:

?
1
2
3
root@ubuntu:/home# gcc -o p time.c -O2
root@ubuntu:/home# ./p
运行时间为:0.000001

从结果显然可以看出差距如此之大,但是如果我们在上面的代码中修改一下int j为int  volatile j之后再来看看如下代码:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
#include <stdio.h>
#include <sys/time.h>
 
int main(int argc, char * argv[])
{
 struct timeval start,end;
 gettimeofday( &start, NULL ); /*测试起始时间*/
 double timeuse;
 int volatile j;
 for(j=0;j<10000000;j++)
  ;
 gettimeofday( &end, NULL ); /*测试终止时间*/
 timeuse = 1000000 * ( end.tv_sec - start.tv_sec ) + end.tv_usec -start.tv_usec;
 timeuse /= 1000000;
printf("运行时间为:%f\n",timeuse);
 
 return 0;
 
}

先来看看我们不使用优化的运行结果为:

?
1
2
3
root@ubuntu:/home# gcc time.c -o p
root@ubuntu:/home# ./p
运行时间为:0.027647

使用了优化的运行结果为:

?
1
2
3
root@ubuntu:/home# gcc -o p time.c -O2
root@ubuntu:/home# ./p
运行时间为:0.027390

我们发现此时此刻不管是否使用优化语句运行,时间几乎没有变化,只是有微小的差异,这微小的差异是由于计算机本身所导致的。所以我们通过对于上面一个没有使用volatile和下面一个使用了volatile的对比结果可知,使用了volatile的变量在使用优化语句是for()循环并没有得到优化,因为for()循环执行的是一个空操作,那么通常情况下使用了优化语句使得这个for()循环被优化掉,根本就不执行。就好比编译器在编译的过程中将i的值设置为大于或者等于10000000的一个数,使得for()循环语句不会执行。但是由于我们使用了volatile,使得编译器就不会自作主张的去动我们的i值,所以循环体得到了执行。举这个例子的原因是要让读者牢记,如果我们定义了volatile变量,那么它就不会被编译器所优化。

当然volatile还有那些值得注意的地方呢?由于访问寄存器的速度要快过直接访问内存的速度,所以编译器一般都会作减少对于内存的访问,但是如果将变量加上volatile修饰,则编译器保证对此变量的读写操作都不会被优化。这样说可能有些抽象了,再看看下面的代码,在此就简要的写出几步了。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
main()
 
{
 
  int i=o;
 
  while(i==0)
 
  {
 
     ……
 
  }
 
}

分析以上代码,如果我们没有在while循环体结构里面改变i的值,编译器在编译的过程中就会将i的值备份到一个寄存器中,每次执行判断语句时就从该寄存器取值,那么这将是一个死循环,但是如果我们做如下的修改:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
main()
 
{
 
  int volatile i=o;
 
  while(i==0)
 
  {
 
     ……
 
  }
 
}

我们在i的前面加上了一个volatile,假设while()循环体里面执行的是跟上一个完全一样的操作,但是这个时候就不能说是一个死循环了,因为编译器不会再对我们的i值进行"备份"操作了,每次执行判断的时候都会直接从i的内存地址中读取,一旦其值发生变化就退出循环体。

最后给出一点就是在实际使用中volatile的使用的场合大致有以下几点:

1、中断服务程序中修改的供其它程序检测的变量需要加volatile;

2、多任务环境下各任务间共享的标志应该加volatile;

3、存储器映射的硬件寄存器通常也要加volatile说明,因为每次对它的读写都可能有不同意义。