java中文及特殊字符的校验方法

时间:2021-10-18 15:16:58

本文实例为大家分享了Android九宫格图片展示的具体代码,供大家参考,具体内容如下

参考链接:Character.UnicodeBlock中cjk的说明详解

1.关于Character.UnicodeBlock的介绍

CJK的意思是“Chinese,Japanese,Korea”的简写 ,实际上就是指中日韩三国的象形文字的Unicode编码

Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS : 4E00-9FBF:Unicode 编码为 U+4E00~U+9FFF 的 CJK 统一文字

Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS :F900-FAFF:CJK 兼容象形文字

Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A :3400-4DBF:CJK 统一表意符号扩展 A
Character.UnicodeBlock.GENERAL_PUNCTUATION :2000-206F:常用标点

Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION :3000-303F:CJK 符号和标点   

Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS :FF00-FFEF:半角及全角形式

2.封装

java" id="highlighter_544949">
?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
/**
 * 校验一个字符是否是汉字
 *
 * @param c
 *  被校验的字符
 * @return true代表是汉字
 */
public static boolean isChineseChar(char c) {
 try {
 return String.valueOf(c).getBytes("UTF-8").length > 1;
 } catch (UnsupportedEncodingException e) {
 e.printStackTrace();
 return false;
 }
}
 
/**
 * 验证字符串内容是否包含下列非法字符<br>
 * `~!#%^&*=+\\|{};:'\",<>/?○●★☆☉♀♂※¤╬の〆
 *
 * @param content
 *  字符串内容
 * @return 't'代表不包含非法字符,otherwise代表包含非法字符。
 */
public static char validateLegalString(String content) {
 String illegal = "`~!#%^&*=+\\|{};:'\",<>/?○●★☆☉♀♂※¤╬の〆";
 char isLegalChar = 't';
 L1: for (int i = 0; i < content.length(); i++) {
 for (int j = 0; j < illegal.length(); j++) {
  if (content.charAt(i) == illegal.charAt(j)) {
  isLegalChar = content.charAt(i);
  break L1;
  }
 }
 }
 return isLegalChar;
}
 
/**
 * 验证是否是汉字或者0-9、a-z、A-Z
 *
 * @param c
 *  被验证的char
 * @return true代表符合条件
 */
public static boolean isRightChar(char c) {
 return isChinese(c) || isWord(c);
}
 
/**
 * 校验某个字符是否是a-z、A-Z、_、0-9
 *
 * @param c
 *  被校验的字符
 * @return true代表符合条件
 */
public static boolean isWord(char c) {
 String regEx = "[\\w]";
 Pattern p = Pattern.compile(regEx);
 Matcher m = p.matcher("" + c);
 return m.matches();
}
 
/**
 * 判定输入的是否是汉字
 *
 * @param c
 *  被校验的字符
 * @return true代表是汉字
 */
public static boolean isChinese(char c) {
 Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
 if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS
  || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS
  || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A
  || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION
  || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION
  || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {
 return true;
 }
 return false;
}
 
/**
 * 校验String是否全是中文
 *
 * @param name
 *  被校验的字符串
 * @return true代表全是汉字
 */
public static boolean checkNameChese(String name) {
 boolean res = true;
 char[] cTemp = name.toCharArray();
 for (int i = 0; i < name.length(); i++) {
 if (!isChinese(cTemp[i])) {
  res = false;
  break;
 }
 }
 return res;
}

3.java 判断字符串中是否包含中文并过滤掉中文,请移步文章:java 判断字符串中是否包含中文并过滤掉中文

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持服务器之家。

原文链接:http://www.cnblogs.com/Marydon20170307/p/7428844.html