关于 unsigned 型变量在计算过程中发生的事情

运行环境：CentOS release 5.8 (Final)

#include<stdio.h>

#include<iostream>

using namespace std;

int main()

{

        unsigned short u = ;

        unsigned int n = ;

        //Style left:

        // u = u - 11;

        // n = u;

        //Style right:

        n = u -  ;

        cout<<"n=="<<n<<endl;

        return ;

}

运行结果：

Style left ：

$ ./a.out

n==65535

Style right ：

$ ./a.out

n==4294967295

下面是分别对这两种方式的汇编：

unsigned 变量先减(sub)，后赋值给n unsigned 变量先扩展，后进行减运算，最后赋值给非 unsigned 变量

关于 unsigned 型变量在计算过程中发生的事情

注：movzx，汇编语言数据传送指令MOV的变体。无符号扩展，并传送。

movzx 主要作用是，把一个变量进行编译器扩展，放到寄存器eax

1个二进制位称为1个bit（比特位） 1 bit

8个bit称为1个Byte（字节） 1 Byte == 8 bit

2个Byte就是1个 Word（机器字） 1 Word == 2 Byte

2个Word就是1个 DWord（机器双字） 1 DWord == 2 Word

WORD 表示2个字节，即 sizeof(unsigned short)。unsigned short 表示的范围：[0, 65536)

DWORD 表示4个字节，sizeof(unsigned int)。unsigned int 表示的范围：[0, 4294967296)

（一）左侧的方式：先运算后赋值分两步进

//Style left:

u = u - ;

n = u;

对应的汇编为：

sub      WORD PTR [ ebp-0xc ], 0xb

movzx    DOWRD PTR [ ebp-0x8 ], eax

【解释】：

因为第一步是对 unsigned 变量 u 进行自减，所以此时不需要进行编译器扩展

10 – 11 得到值为 -1，即 0xffff （unsigned short 能表示的最大范围就是4个f）。

第二步涉及到了赋值操作，

编译器要会赋值之前，先对赋值操作符=右侧的表达式进行编译器扩展：

将 0xffff 扩展为 0x0000ffff，然后接受赋值的变量是一个 DWORD，

根据 DWORD 的长度对扩展的值进行截取，DWORD 长度刚好能接受 0x0000ffff，

转换成 10 进制即为 65535

【结论】：

编译器先进行计算后，按 WORD 进行扩展，所以得到的是 WORD 范围的最大值（65535）

（二）右侧的方式：运算和赋值合为一步进行

//Style right:

n = u -  ;

对应的汇编为：

movzx eax, WORD PTR [ ebp-0xc ]

sub   eax, 0xb

由于赋值符右侧的表示范围和传进去的变量不是一种类型，编译器先对赋值符=右侧的值进行扩展，

10 – 11 == -1，编译器扩展为 0x0000ffffffff（只能扩展到DWORD？）

右侧的 DWORD 接收后，转换为 10 进制即为 4294967295

【结论】：

编译器先进行计算后，按 DWORD 进行扩展，所以得到的是 DWORD 范围的最大值（4294967295）