【文件属性】:
文件名称:Python程序设计之爬虫读取(1)
文件大小:31KB
文件格式:PDF
更新时间:2021-01-20 03:03:22
爬虫 程序 程序设计
1.网页读取基础
Python3.x主要使用urlib库来读取网页内容!
2.网页内容读取方法
①使用简单的urlib.request来获取网页内容
import urllib
import urllib.request
def pa():
#请求打开网页
fp=urllib.request.urlopen(r'http://www.python.org')
#打印未解码的前100个字符
print(fp.read(100))
#打印解码的前一百个字符
print(fp.read(100).decode())
#关闭网页
fp.clos