Java中常用的字符编码-解析

时间:2023-12-30 16:42:20

ASCII字符编码

美国信息互换标准代码,为罗马字母编制的一套编码,主要用于表达现代英语和其他西欧语言中的字符,1字节的7位表示一个字符。

ISO-8859-1字符编码

ISO为西欧语言中的字符制定的编码,与ASCII兼容,1字节的8位表示一个字符。

GB2312字符编码

对7445个简体中文字符的编码。6763个汉字和682个其他符号,与ASCII兼容。

GBK字符编码

对GB2312的扩展。

Unicode字符编码

国际Unicode协会编制,收录全球所有语言文件中的字符,是一种跨平台的字符编码。

Unicode具有两种编码方案:

UCS-2:2字节编码。java中采用的就是这种

UCS-4:4字节编码。(实际只用了31位,最高位必须为0)

UTF字符编码

有些操作系统不完全支持16位或32位的Unicode字符编码,UTF字符编码能够把Unicode字符编码转换成操作系统所支持的编码

常见的有UTF-8,UTF-7,UTF-16