\u Unicode和汉字转化

时间:2023-03-09 17:33:22
\u Unicode和汉字转化

介绍

\uxxxx这种格式是Unicode写法,表示一个字符,其中xxxx表示一个16进制数字,范围所0~65535. Unicode十六进制数只能包含数字0~9、大写字母A~F或者小写字母A~F。需要注意到是:Unicode的大小端问题,一般都是小端在前,例如 \u5c0f 表示汉语中的 '小'字,转换成10进制就是9215,所以在byte数组中应该是1592.

汉字转Unicode

 private string Unicode2Chinese(string strUnicode)
{
string[] splitString = new string[];
splitString[] = "\\u";
string[] unicodeArray = strUnicode.Split(splitString, StringSplitOptions.RemoveEmptyEntries);
StringBuilder sb = new StringBuilder(); foreach (string item in unicodeArray)
{
byte[] codes = new byte[];
int code1, code2;
code1 = Convert.ToInt32(item.Substring(, ), );
code2 = Convert.ToInt32(item.Substring(), );
codes[] = (byte)code2;//必须是小端在前
codes[] = (byte)code1;
sb.Append(Encoding.Unicode.GetString(codes));
} return sb.ToString();
}

Unicode转汉字

private string Chinese2Unicode(string strChinese)
{
string strUnicodes = string.Empty;
foreach (char item in strChinese.ToCharArray())
{
strUnicodes += "\\u" + ((int)item).ToString("x"); //16进制
}
return strUnicodes;
}

程序截图:

\u Unicode和汉字转化