Java中String字符串默认编码

时间:2024-03-27 11:46:17
下面运行下面这个程序,图1为执行的结果。可看出相同的字符串,如果使用不同的编码方式,得到的byte[]数组可能会不同,

ASCII,GBK,UTF-8对数字和英文字母的编码相同,unicode的编码跟前面三项都不同。

源代码如下:

import java.nio.charset.Charset;
import java.io.IOException;

public class EncodingTest
{
public static void main(String[] args) throws IOException
{
//获取系统默认编码
System.out.println("系统默认编码:" + System.getProperty("file.encoding")); //查询结果GBK
//系统默认字符编码
System.out.println("系统默认字符编码:" + Charset.defaultCharset()); //查询结果GBK
//操作系统用户使用的语言
System.out.println("系统默认语言:" + System.getProperty("user.language")); //查询结果zh

//定义字符串包含数字和中文
String t = "hello, 大家好!";
//通过getBytes方法获取默认的编码
System.out.println("默认编码格式:");
byte[] b = t.getBytes(); //ASCII,GBK,UTF-8对数字和英文字母的编码相同,unicode的编码跟前面三项都不同
//打印默认编码
for(byte a : b)
System.out.print(a + ",\t");
System.out.println();
System.out.println(new String(b));
//打印GBK编码
System.out.println("GBK编码格式");
b = t.getBytes("GBK");
for(byte a : b)
System.out.print(a + ",\t");
System.out.println();
System.out.println(new String(b));
//打印UTF-8编码
System.out.println("UTF-8编码格式");
b = t.getBytes("UTF-8");
for(byte a : b)
System.out.print(a + ",\t");
System.out.println();
System.out.println(new String(b));
//打印ASCII编码
System.out.println("ASCII编码格式");
b = t.getBytes("ASCII");
for(byte a : b)
System.out.print(a + ",\t");
System.out.println();
System.out.println(new String(b));
//打印UNICODE编码
System.out.println("UNICODE编码格式");
b = t.getBytes("UNICODE");
for(byte a : b)
System.out.print(a + ",\t");
System.out.println();
System.out.println(new String(b));
System.out.println();
}
}

Java中String字符串默认编码
图1

欢迎大家留言讨论。