网络字节顺序

很少有人关心字节顺序（Byte Ordering），因为它真的很少用到。何为字节顺序呢？让我们先来看一个例子，假设现在有一个WORD类型的变量，它的值为0x7788，那么它在内存中是怎么存放的呢？
内存中：

低地址高地址

0x77

0x88

高地址低地址

0x77

0x88

事实上，对于不同的CPU、不同的操作系统，上图中的两种字节顺序都是可能的。如果像图上半部分那样：高字节在前，低字节在后，则这种字节顺序称作为big-endian；如果像图下半部分那样：低字节在前，高字节在后，则这种字节顺序称作为 little-endian。

常见的CPU、操作系统上使用的字节顺序
CPU 操作系统字节顺序
x86 (Intel、AMD等) 所有 little-endian
DEC Alpha 所有 little-endian
HP-PA NT little-endian
HP-PA UNIX big-endian
SUN SPARC 所有 big-endian
MIPS NT little-endian
MIPS UNIX big-endian
PowerPC NT little-endian
PowerPC 非NT big-endian
RS/6000 UNIX big-endian
Motorola m68k 所有 big-endian
一般来说，我们不用关心字节顺序问题，除非要涉及到跨平台的通信和资源共享，比如本章将要介绍的网络编程（网络传输协议TCP/IP采用的是big- endian）。假设现在要在使用不同字节顺序的机器之间传输和交换数据，那该怎么办呢？（同样的数据，不同的机器可能有不同的理解，岂不是有悖初衷！）有两种方法，一种是全部转换成文本来传输，另一种是双方都按照某一方的字节顺序来传输（这时就有一个不同字节顺序之间的相互转换问题）。

Socket编程中经常采用第二种方法。整个传输过程如下：发送端将本机的数据转换成网络的字节顺序（调用API函数htonl或htons），然后发送；接收端收到网络数据后，先将数据转换成本机的字节顺序（调用API函数ntohl或ntohs），然后再进行其它操作——如此就能保证“会议精神”在通信双方的正确传达了！

这个过程中用到的几个API函数：ntohl、htonl、ntohs、htons，名字都差不多，很难区分。但是如果知道了它们的来历，问题也就不存在了：n是network，网络的意思；h是host，本地主机的意思。ntohl，就是将32位的u_long类型的数据从网络字节顺序转换成本机字节顺序（htonl的字节顺序转换过程与ntohl相反）；ntohs，就是将16位的u_short类型的数据从网络字节顺序转换成本机字节顺序（htons的字节顺序转换过程与ntohs相反）。

最后还有一个小问题：如何知道本机的字节顺序呢？有个很简单的方法，如下：
BOOL IsLittleEndian(void)
{
WORD wValue = 0x5678;
return (*((BYTE*)&wValue) == 0x78);
}

秒客网

网络字节顺序

相关文章