【Web crawler】爬虫之百度首页

刚开始学习爬虫，照着教程手打了一遍，还是蛮有成就感的。使用版本：python2.7

*注意：python2的默认编码是ASCII编码而python3默认编码是utf-8

import urllib2

url = "http://www.baidu.com"

response = urllib2.urlopen(url)

print response.read().decode('utf-8')

不过建议大家不要像上面那样写，这样写最好：



#定义需要用到的库urllib2

 import urllib2

#定义URL，构建请求

url = "http://www.baidu.com"

request = urllib2.Request(url)

#返回

 response = urllib2.urlopen(request)

#打印返回的数据

 print response.read().decode('utf-8')

【Web crawler】爬虫之百度首页

秒客网

【Web crawler】爬虫之百度首页

相关文章