笔记:I/O流-字符集

时间:2023-03-09 05:39:52
笔记:I/O流-字符集

Java
库的
java.nio
包用
Charset
类统一了对字符集的转换,支付姐建立了两个字节Unicode码元序列与使用本地字符编码方式的字节序列之间的映射,Charset类使用的时由IANA字符集注册中心标准化的字符集名称,为了兼容其他的命名惯例,每个字符集都可以拥有许多别名,可以调用
aliases
方法返回由别名构成的
Set
对象,示例代码如下:

Charset charset = Charset.forName("utf-8");

                System.out.println("utf-8 charset");

                Set<String> aliases = charset.aliases();

                for (String a : aliases) {

                        System.out.println("aliase is " + a);

                }

为了确定在某个特定实现中哪些字符集是可用的,可以调用静态方法
avaliableCharsets
方法,示例代码如下:

Map<String, Charset> charsetMap = Charset.availableCharsets();

         for (String c : charsetMap.keySet()) {

             
System.out.println(c);

       
}

如果某个字符不能被字符集表示,他将被转换为?,一旦有了字符集就可以使用他在包含Unicode码元的Java
字符串和编码而成的字节序列之间进行转换,下面是如何编码Java
字符串的代码:

        String str = "受到法律框架dsfjkl23";

        // 编码字符串到Byte数组

        ByteBuffer buffer = charset.encode(str);

       
byte[] bytes = buffer.array();

        for (byte b : bytes) {

               System.out.print(Integer.toHexString(b & 0xff) + " ");

        }

       
System.out.println();

        // 将Byte数组解码为字符串

        ByteBuffer decodeBuffer = ByteBuffer.wrap(bytes);

        CharBuffer charBuffer = charset.decode(decodeBuffer);

        System.out.println(charBuffer.toString());