Windows程序设再读笔记02-Unicode

时间:2023-03-16 00:00:44

1.ASCII,7位编码,共128个编码,1950年ansi提出。

2.变种的Ascii,0x40等10个代码保留各个国家单独使用,1967年由iso提出。旨在解决重音符号,英镑符号的问题。

3.扩展ASCII,增加到8位。有包括ibm的扩展字符集和windows支持的ansi字符集(ISO 8859-1)

扩展ascii引入代码页的概念,IBM字符集为437代码页或者msdos latin us,850代码页是msdos latin 1,类似ansi字符集,但是不同。所有代码页较低的128个字符都是ascii,高的128个代码由代码页定义。别的代码页用于其他语言。

4.DBCS/MBCS(双字节字符集/多字节字符集)

代码页932 936 949 950是四种windows支持的双字节代码页。

双字节字符集的问题在于有的字符是一个字节,有的是2个字节,带来了很大的处理困难--因此引入unicode