基于大端法、小端法以及网络字节序的深入理解

关于字节序(大端法、小端法)的定义

《UNXI网络编程》定义：术语“小端”和“大端”表示多字节值的哪一端(小端或大端)存储在该值的起始地址。小端存在起始地址，即是小端字节序；大端存在起始地址，即是大端字节序。

也可以说：
1.小端法(Little-Endian)就是低位字节排放在内存的低地址端即该值的起始地址，高位字节排放在内存的高地址端。
2.大端法(Big-Endian)就是高位字节排放在内存的低地址端即该值的起始地址，低位字节排放在内存的高地址端。
举个简单的例子，对于整形0x12345678。它在大端法和小端法的系统内中，分别如图1所示的方式存放。

网络字节序

我们知道网络上的数据流是字节流，对于一个多字节数值，在进行网络传输的时候，先传递哪个字节？也就是说，当接收端收到第一个字节的时候，它是将这个字节作为高位还是低位来处理呢？
网络字节序定义：收到的第一个字节被当作高位看待，这就要求发送端发送的第一个字节应当是高位。而在发送端发送数据时，发送的第一个字节是该数字在内存中起始地址对应的字节。可见多字节数值在发送前，在内存中数值应该以大端法存放。
网络字节序说是大端字节序。
比如我们经过网络发送0x12345678这个整形，在80X86平台中，它是以小端法存放的，在发送前需要使用系统提供的htonl将其转换成大端法存放，如图2所示。

基于大端法、小端法以及网络字节序的深入理解

字节序测试程序

不同cpu平台上字节序通常也不一样，下面写个简单的C程序，它可以测试不同平台上的字节序。

复制代码代码如下:

#include <stdio.h>
#include <netinet/in.h>
int main()
{
     int i_num = 0x12345678;
     printf("[0]:0x%x\n", *((char *)&i_num + 0));
     printf("[1]:0x%x\n", *((char *)&i_num + 1));
     printf("[2]:0x%x\n", *((char *)&i_num + 2));
     printf("[3]:0x%x\n", *((char *)&i_num + 3));

     i_num = htonl(i_num);
     printf("[0]:0x%x\n", *((char *)&i_num + 0));
     printf("[1]:0x%x\n", *((char *)&i_num + 1));
     printf("[2]:0x%x\n", *((char *)&i_num + 2));
     printf("[3]:0x%x\n", *((char *)&i_num + 3));

     return 0;
}

在80X86CPU平台上，执行该程序得到如下结果：
[0]:0x78
[1]:0x56
[2]:0x34
[3]:0x12

[0]:0x12
[1]:0x34
[2]:0x56
[3]:0x78

分析结果，在80X86平台上，系统将多字节中的低位存储在变量起始地址，使用小端法。htonl将i_num转换成网络字节序，可见网络字节序是大端法。

总结点：80X86使用小端法，网络字节序使用大端法。

秒客网

基于大端法、小端法以及网络字节序的深入理解

相关文章