EASCII及ISO 8859字符编码方案

计算机出现之后，从美国发展到欧洲，由于欧洲很多国家中所用到的字符中，除了基本的美国也用的那128个ASCII字符之外，还有很多衍生的拉丁字母等字符，而且是不同的国家用到的衍生字符都不太相同，比如，在法语中，字母上方有注音符号，因此就无法用ASCII码表示。

考虑到一个字节能够表示的编码实际有256个(2^8=256)，而ASCII字符只用到了一个字节的低7位，编号为0x00~0x7F(十进制为0~127)，也就是占用了前128个(2^7=128)，后面128个编码不用白不用，因此很多人打起了后面这128个编码的主意。

可问题在于，很多人同时都有这样的想法，但大家对于0x80~0xFF(十进制为128~255)这后面的128个编码分别对应什么样的字符，却有各自不同的设计。

欧洲先后就设计了两套既兼容ASCII码，又支持欧洲多个国家所使用的那些衍生字符的单字节编码方案：一个是EASCII(Extended ASCII)字符编码方案，一个是ISO/IEC 8859字符编码方案。

其中，EASCII也是将ASCII中闲置的最高位(首位)用来编码新的字符，也就是说，将一个字节中的全部8个比特位用来表示一个字符。比如，法语中的é的编码为130(二进制1000 0010)。

这样一来，这些欧洲国家使用的编码方案，虽然与ASCII编码方案一样使用单字节编码，但却可以表示最多256个字符(2^8 = 256)，比ASCII的128个字符(2^7=128)多一倍。

为了保持与ASCII码的兼容性，还规定，当第一个比特位(即字节的最高位)为0时仍表示之前那些常用的ASCII字符(实际的二进制编码为0000 0000 ~ 0111 1111，对应的十进制就是0~127)，为1时就表示其他补充扩展字符(实际的二进制编码为1000 0000 ~ 1111 1111，对应的十进制就是128~255)。于是称之为Extended ASCII(扩展ASCII)，简称EASCII。

EASCII码比ASCII码扩充出来的符号包括表格符号、计算符号、希腊字母和特殊的拉丁符号。

扩展ASCII(EASCII)编码表

不过目前很少使用EASCII，常用的是ISO/IEC 8859字符编码方案。该方案也是在ASCII的基础上，同样利用了ASCII的7位编码所没有用到的最高位(首位)，将编码范围从原先ASCII的0x00~0x7F(十进制为0~127)的基础上多扩展出了0x80~0xFF(十进制为128~255)，而其中的0xA0~0xFF(十进制为160~255)部分，被ISO/IEC 8859编码所用到。

因此，ISO/IEC 8859字符编码方案同样是单字节编码方案，也同样完全兼容ASCII。

注意，与ASCII属于单个独立的字符集不同，ISO/IEC 8859是一组字符集的总称，其下共包含了15个字符集，即ISO/IEC 8859-n，其中n=1,2,3,...,15,16(其中12未定义，所以共15个)。

这15个字符集，每一个字符集的编码取值都是0xA0~0xFF(十进制为160~255)，但是对于同一个编码，不同字符集所对应的字符都不太一样。

其中ISO/IEC 8859-1目前使用较为普遍，有时也简称为ISO 8859-1，而Latin1是其别名(有些环境下也写作Latin-1)。

秒客网

刨根究底字符编码之四——EASCII及ISO 8859字符编码方案

EASCII及ISO 8859字符编码方案