python爬虫之正则表达式

时间:2022-06-29 23:02:47

search函数

import re                   #re库
pattern=re.compile(r'worlda') #compile编译生成可操作对象
m=re.search(pattern,'hello world!') #search的结果有一些属性,其
#中group()返回[**如果查找成功,则返回匹配的段落**]。
if m:
print(m.group())

split函数

import re

pattern=re.compile(r'\d+') #\d+匹配数字
print(re.split(pattern,'one1two2three3four4')) # 返回被分割几个字母段,包括空段

=====输出
['one', 'two', 'three', 'four', '']

findall函数

import re
pattern = re.compile(r'\d+')
print(re.findall(pattern,'one1two2three3four4'))#找出所有的数字

finditer函数

import re
pattern=re.compile(r'\d+')
for m in re.finditer(pattern,'one1two2three3four4'):#返回数字迭代器
print (m.group())