C#怎么判断字符是不是汉字 汉字和Unicode编码互相转换

时间:2023-03-09 03:12:26
C#怎么判断字符是不是汉字 汉字和Unicode编码互相转换

判断一个字符是不是汉字通常有三种方法,第1种用 ASCII 码判断(在 ASCII码表中,英文的范围是0-127,而汉字则是大于127,根据这个范围可以判断),第2种用汉字的 UNICODE 编码范围判 断(汉字的 UNICODE 编码范围是4e00-9fbb),第3种用正则表达式判断,下面是具体方法。

但是实际上并不怎么准确(从业务上讲,比如全角输入的数字),所以后来简单修改了一下 代码

public static bool IsChinese( this string CString)
{
bool BoolValue = false;
List<string> specialChar = new List<string> { "0", "1", "2", "3", "4", "5", "6", "7", "8", "9",
"a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k", "l", "m", "n", "o", "p", "q", "r", "s", "t" , "u", "v", "w", "x", "y", "z",
"A", "B", "C", "D", "E", "F", "G", "H", "I", "J", "K", "L", "M", "N", "O", "P", "Q", "R", "S", "T" , "U", "V", "W", "X", "Y", "Z",
"!", "@", "#", "$", "%", "^", "&", "*", "(", ")", "_", "-", "+", "=", "0", "'", "[", "]", "|", "\", """, ":", ";", ",", "。", "、", "?" };
for (int i = ; i < CString.Length; i++)
{
if (Convert.ToInt32(Convert.ToChar(CString.Substring(i, ))) < Convert.ToInt32(Convert.ToChar()))
{
BoolValue = false;
}
else
{
BoolValue = true;
}
}
if (BoolValue) {
if (specialChar.Any(x => CString.Contains(x))) {
BoolValue = false;
}
}
return BoolValue;
}

当然还有一些特殊字符 也能通过,比如全角输入的π,Ω

public static string String2Unicode(string source)
{
byte[] bytes = Encoding.Unicode.GetBytes(source);
StringBuilder stringBuilder = new StringBuilder();
for (int i = ; i < bytes.Length; i += )
{
stringBuilder.AppendFormat("\\u{0}{1}", bytes[i + ].ToString("x").PadLeft(, ''), bytes[i].ToString("x").PadLeft(, ''));
}
return stringBuilder.ToString();
} public static string Unicode2String(string source)
{
return new Regex(@"\\u([0-9A-F]{4})", RegexOptions.IgnoreCase | RegexOptions.Compiled).Replace(
source, x => string.Empty + Convert.ToChar(Convert.ToUInt16(x.Result("$1"), )));
}