如何使用RegEX Tester工具通过正则表达式测试提取数据

时间:2024-03-24 07:33:41

正则表达式,又称规则表达式(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。(以上内容来之百度百科)

自从工作中需要接触到处理大量数据后,是真的觉得正则表达式是个好东西,不止对开发来说,对测试人员同样重要,通过合理的使用正则表达式可以精准的提取出想要的数据。

编程能力强的同学可以使用各种语言写一些小工具来处理数据,但是对于编程能力相对比较薄弱的测试人员可能就会有点难度,所以这里给推荐一个可以提取保存正则表达式过滤结果的小工具:RegEX Tester,点我下载 或者也可以去我的csdn下载里面下载。

下载好以后直接点击就可以运行,接下来简单说下用法:

如何使用RegEX Tester工具通过正则表达式测试提取数据

工具界面显示如上图,输入正则表达式和待测文本后点击Test按钮,若有返回即可在下方结果显示区域显示测试结果。

下面举个例子详细介绍下用法。

此处以网易云音乐评论距离,先打开网易云网页版,随便找首歌,点击进入评论,在网络请求中找到评论的接口,查看接口显示内容,提取json文本,可以看到content字段就是评论

如何使用RegEX Tester工具通过正则表达式测试提取数据

这个是优化显示的json格式,实际显示如下图,红框标注处就是我们要提取的内容

如何使用RegEX Tester工具通过正则表达式测试提取数据

在工具中输入正则表达式  "content":"(.+?)"  (正则的详细用法可以参考  正则表达式-教程 | 菜鸟教程),点击Test按钮,匹配到文本会在待测区已红色字体显示,同时会在结果区展示所有匹配结果。点击Export result 按钮可将测试结果导出为csv文件(中文可能用excel打开可能会有乱码,先用notepad++打开将文本编码方式更改为ANSI后再用excel打开即可)

最后展示结果如下,我们已经成功的将这段杂乱的json中的评论内容提取出来了。

如何使用RegEX Tester工具通过正则表达式测试提取数据