Notepad++正则表达式查找替换文本中文字符

时间:2021-05-28 15:08:16

测试需求

测试工具中xml配置文件中注释字段包含中文字符,在Win10系统下使用工具中偶尔会出现中文乱码导致配置文件失效。解决方法将配置文件中的中文注释换成英文注释或者直接替换删除。如何将配置文件中的中文字符查找删除?

操作步骤

在Notepad文本工具中使用正则表达式匹配中文字符并替换。当然你可以采用Python写个小工具也无不可。Notepad中使用正则表达式[^\x00-\xff]匹配中文字符。

1、构造包含中文文本用于测试,包含中文字符、普通字符和特殊字符。

Notepad++正则表达式查找替换文本中文字符

2、中文字符正则表达式匹配:[^\x00-\xff]。其中\x00-\xff匹配ASCII代码中十六进制代码为00-ff的字符,加个取反^,则就表示表示匹配非单字节的字符,例如汉字,汉字符号等字符集。如下

Notepad++正则表达式查找替换文本中文字符

3、完成替换,中文字符已全部替换。替换后文本如下:

Notepad++正则表达式查找替换文本中文字符

附录

ASCII字符集:http://www.asciitable.com/

Notepad++正则表达式查找替换文本中文字符

Notepad++正则表达式查找替换文本中文字符