Java 使用正则表达式过滤字符串中的特殊字符

时间:2023-01-03 16:38:56

最近在公司做爬虫这方面的工作,接触正则比较多一点,有一个业务需求需要过滤掉字符串中的所有特殊字符,研究了一下,终于给实现。

package com.xx.filter;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

import org.junit.Test;

public class StringFilterTest {

// 过滤特殊字符
public String StringFilter(String str){
// 只允许字母和数字
// String regEx = "[^a-zA-Z0-9]";
// 清除掉所有特殊字符
String regEx = "[`~!@#$%^&*()+=|{}':;',//[//].<>/?~!@#¥%……&*()——+|{}【】‘;:”“’。,、?]";
Pattern p = Pattern.compile(regEx);
Matcher m = p.matcher(str);
return m.replaceAll("").trim();
}

@Test
public void testStringFilter(){
String str = "(长城)*?%%*(*.中国}34{45[]12.fd'*&999下面是中文的字符¥……{}【】。,;’“‘”?";
System.out.println(str);
System.out.println(StringFilter(str));
}
}



over