java Unicode、ISO-8859-1、GBK、UTF-8编码转换深入浅出

时间:2022-07-21 16:41:43

参考文献:搞懂ASCII, ISO8859-1, ANSI和Unicode

     Unicode百度文献

     ISO-8859-1百度文献

注:

1、utf-8虽然是国际编码,对不同范围的字符使用不同长度的编码,也完全兼容了ASCII编码编码,但却没有兼容ISO-8859-1在ASCII编码扩展的字符(utf-8中用其他编码号代替),由于最高位被utf-8编码标识单字节字符占用。

2、String(bytes,charsetName)获取指定字符集编码字符串时,假如指定字符集不支持(无法完全匹配到字符)时,程序直接默认ISO-8859-1字符集转换返回。

3、String(bytes)或String.getBytes()在不指定字符编码时都会使用默认字符集编码方式,如果默认字符集不支持(无法完全匹配到字符)时,程序直接默认ISO-8859-1字符集转换返回。

java  Unicode、ISO-8859-1、GBK、UTF-8编码转换深入浅出