正则表达式:字符串中连续重复字符串的识别和替换

时间:2023-01-03 15:19:22

今天编程的时候遇到一个正则表达式查找和替换的问题:对于字符串连续出现的字符,用“(重复字符)”替换。我想到用正则表达式比较高效。

对于字符串中的连续重复的字符,正则表达式是:

(.)\1+

以下是程序的片段:

 Pattern pattern = Pattern.compile("(.)\\1+");
Matcher matcher = pattern.matcher("111234445466");
//sb 缓冲区作为存储替换后的结果
StringBuffer sb = new StringBuffer();
//用正则表达式的find函数去判断,有没有匹配的结果集
while (matcher.find()) {
//match.group(0) 是匹配的字符串,比如111234445466中的111
//match.group(1) 是匹配的字符串的单个字符,比如111234445466中的111中的1
String repeat = matcher.group(1);
//appendReplacement用第二个参数去替换匹配成功的子串,并把结果存放在sb中,前面未匹配成功的也会放进去,后面的未匹配成功的不会放进去。例如:11123444546634 最后会替换成(1)23(4)54(6)
matcher.appendReplacement(sb, "("+repeat+")" );
}
//把后面未匹配成功的附加到sb上,例如:11123444546634 最后会替换成(1)23(4)54(6)34
matcher.appendTail(sb);
return sb.toString();