本文实例讲述了python使用正则表达式提取网页URL的方法。分享给大家供大家参考。具体实现方法如下:
1
2
3
4
5
6
7
8
9
10
|
import re
import urllib
url = "https://www.zzvips.com"
s = urllib.urlopen(url).read()
ss = s.replace( " " ,"")
urls = re.findall(r "<a.*?href=.*?<\/a>" ,ss,re.I)
for i in urls:
print i
else :
print 'this is over'
|
希望本文所述对大家的Python程序设计有所帮助。