python爬虫笔记(五):实战(一)re库

时间:2022-06-24 04:14:03

re库介绍

python爬虫笔记(五):实战(一)re库

正则表达式(由字符和操作符)的语法:

https://juejin.im/post/5a98ad766fb9a028c5229ee8

re库的基本使用:

主要用来字符匹配。

python爬虫笔记(五):实战(一)re库

python爬虫笔记(五):实战(一)re库

import re
match = re.match(r'[1-9]\d{5}', '471003')
if match:
    print(match.group(0))

python爬虫笔记(五):实战(一)re库

re库的match对象


python爬虫笔记(五):实战(一)re库

import re

m = re.search(r'[1-9]\d{5}', 'BIT471003 BIT247711')

#属性操作
print(m.string)
print(m.re)
print(m.pos)
print(m.endpos)

#方法操作
print(m.group(0))
print(m.start())
print(m.end())

re库的贪婪匹配和最小匹配


import re

m = re.search(r'PY.*N', 'PYANBNCNDN')#默认贪婪匹配
print(m.group(0))
#result
#PYANBNCNDN

import re

m = re.search(r'PY.*?N', 'PYANBNCNDN')#设置为最小匹配
print(m.group(0))
#result
#PYAN