Python基础-re正则模块

一、简介：
    正则表达式：是一种小型的、高度专业化的编程语言，(在Python中)它内嵌在Python中，并通过re模块实现，正则表达式模式被编译成
一系列的字节码，然后由用C编写的匹配引擎执行。

二、字符匹配(普通字符、元字符)
普通字符：
元字符：.   ^   $   *   +   ?   {   }   [   ]   |   (   )   \

\后边跟元字符去除特殊功能
\后边跟普通字符实现特殊功能

\d  匹配任何十进制数；相当于[0-9]
\D  匹配任何非数字字符；相当于[^0-9]
\s  匹配任何空白字符；相当于[ \t\n\r\f\v]
\S  匹配任何非空白字符；相当于[^ \t\n\r\f\v]
\w  匹配任何字母数字字符；相当于[a-zA-Z0-9_]
\W  匹配任何非字母数字字符；相当于[^a-zA-Z0-9_]
\b  匹配一个单词边界，比如空格，&，#等

import re

匹配第一个满足的结果

print(re.search('fansik', 'fansik,,,,,fansik').group())

匹配手机号：

print(re.findall('^0?1[3|4|5|8][0-9]\d{8}$', ''))

为分组取名字

print(re.search('(?P<id>\d{3})/(?P<name>\w{3})', 'asfda521/dfdsfaa').group('id'))

print(re.search('(?P<id>\d{3})/(?P<name>\w{3})', 'asfda521/dfdsfaa').group('name'))

取消组的优先级

print(re.findall('www.(\w+).com', 'www.baidu.com'))

# 执行结果：

['baidu']

print(re.findall('www.(?:\w+).com', 'www.baidu.com'))

# 取消优先级后的执行结果：

['www.baidu.com']

正则表达式的方法：
findall()：所有结果都返回到一个列表里
search()：返回匹配到的第一个对象(object)，对象可以调用group()返回结果
match()：只在字符串开始匹配匹配
print(re.match('fansik', 'fansikfanjinbao').group())
split()：以指定字符分割字符串

print(re.split('ma', 'fansikmafanjinbaomazhansanmalisi'))

执行结果：

['fansik', 'fanjinbao', 'zhansan', 'lisi']

re.sub()：字符替换

print(re.sub('ma', 'df', 'fansikmafanjinbaomazhansanmalisi'))

执行结果：

fansikdffanjinbaodfzhansandflisi

re.comile()：编译一个规则，使用与该规则被反复使用的情况下

obj = re.compile('\.com')

print(obj.findall('fansik.com'))

常用的匹配规则
手机：/^0?1[3|4|5|8][0-9]\d{8}$/
固话：/^0[\d]{2,3}-[\d]{7,8}$/
电子邮箱：/^([a-z0-9_\.-]+)@([\da-z\.-]+)\.([a-z\.]{2,6})$/
/^[a-z\d]+(\.[a-z\d]+)*@([\da-z](-[\da-z])?)+(\.{1,2}[a-z]+)+$/
用户名：/^[a-z0-9_-]{3,16}$/
密码：/^[a-z0-9_-]{6,18}$/
URL：/^(https?:\/\/)?([\da-z\.-]+)\.([a-z\.]{2,6})([\/\w \.-]*)*\/?$/

秒客网

Python基础-re正则模块

相关文章