python中通过预先编译正则表达式提高效率

时间:2022-11-20 20:34:09

前言

在re的正则表达式模块里,可以通过模块的方式来访问正则表达式,但是如果重复多次地使用正则表达式,最好是使用compile函数把正则表达式编译成对象RegexObject,这样会大大地提高搜索的效率,因为基于非编译方式访问时,是使用模块里的一小块缓冲来进行的。

如下面的例子:

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
import re
 
# Precompile the patterns
regexes = [
 re.compile(p)
 for p in ['this', 'that']
]
text = 'http://blog.csdn.net/caimouse is great blog, this is my blog.'
 
print('Text: {!r}\n'.format(text))
 
for regex in regexes:
 print('Seeking "{}" ->'.format(regex.pattern),
   end=' ')
 
 if regex.search(text):
  print('match!')
 else:
  print('no match')

结果输出如下:

?
1
2
3
4
5
Text: 'http://blog.csdn.net/caimouse is great blog, this is my blog.'
 
 
Seeking "this" -> match!
Seeking "that" -> no match

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对服务器之家的支持。

原文链接:http://blog.csdn.net/caimouse/article/details/78070075