Day 26 python 正则表达式

时间:2022-12-15 18:30:18

re模块\正则表达式

一、元字符

1、. ^ $ * + ? { } [ ] | ( ) \

"."  代表(任意一个字符)
"*"  代表(任意数量任意字符,0-无穷)
"+"  代表(任意一个或无数字符,1-无穷)
"?"  代表(0或1个字符)
"^"  代表(字符串开头)
"$"  代表(字符串结尾)
"{}"  代表(指定次数)

2、转义符 \

  1)、反斜杠后边跟元字符去除特殊功能,比如\.

  2)、反斜杠后边跟普通字符实现特殊功能,比如\d

\d  匹配任何十进制数;      它相当于类 [0-9]。
\D 匹配任何非数字字符; 它相当于类 [^0-9]。
\s 匹配任何空白字符; 它相当于类 [ \t\n\r\f\v]。
\S 匹配任何非空白字符; 它相当于类 [^ \t\n\r\f\v]。
\w 匹配任何字母数字字符; 它相当于类 [a-zA-Z0-9_]。
\W 匹配任何非字母数字字符; 它相当于类 [^a-zA-Z0-9_]
\b 匹配一个特殊字符边界,比如空格 ,&,#等

3、分组 ()

ret = re.findall("(yuan)+","lalal11yuanhao22yuanyuanhaohao33yuan") #分组(),用findall命令返回的是分组内容
print(ret) #['yuan', 'yuan', 'yuan']