爬虫案例二-第一步

时间:2024-04-15 12:10:15

我直接打开

requests.exceptions.SSLError: HTTPSConnectionPool(host='www.dytt28.com', port=443): Max retries exceeded with url: / (Caused by SSLError(SSLCertVerificationError(1, '[SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1000)')))

报错,这个一看就是证书的问题,所以我们需要让SSL证书失效

我们加了verify=False 意思是失效的意思。

然后这时候还出现问题,这个问题是字符集的问题

为什么我使用gbk,因为print自身不支持gb2312,但是他支持gbk,因为gbk是gb2312的扩展,兼容gb2312

至此拿到了页码源代码了