pyppeteer 模拟登录淘宝H5,获取cookie

时间:2024-04-08 12:36:15

 首先打开淘宝首页,右键点击检查,然后点击圈起来的地方切换手机版页面

pyppeteer 模拟登录淘宝H5,获取cookie

 然后刷新之后就会显示如下页面,点击 我的淘宝  就会显示用户登录页面

pyppeteer 模拟登录淘宝H5,获取cookie

 接下来要找到登录请求的url,如下所示,在故意输错账号密码的情况下,network中会有如下响应,这个就是我们要找的url

pyppeteer 模拟登录淘宝H5,获取cookie

 开始模拟登录

pyppeteer 模拟登录淘宝H5,获取cookie

 这里的page.evaluateOnNewDocument()用来修改浏览器的属性值,淘宝的反爬虫机制会根据这些属性值来检测你是正常登录还是爬虫。第一个是修改window.navigator.webdriver 的值,也是最重要的,正常访问时它的值是undefined,使用selenium的话它的值是true。第二个是修改navigator.plugins.length 的值,正常访问时它的值是0,使用selenium时它的值是3。第三个是修改navigator.languages的值,正常访问时它的值是["zh-CN", "zh"],使用selenium时它的值是["en"]。 

pyppeteer 模拟登录淘宝H5,获取cookie

 可以在console中查看这些属性值

pyppeteer 模拟登录淘宝H5,获取cookie

 在点击登录之后,可能会出现这样的验证页面

pyppeteer 模拟登录淘宝H5,获取cookie

 这里我是根据弹框的style属性的visibility的值来判断是否需要验证(通过分析网页源码,发现正常情况下visibility的值是hidden)

pyppeteer 模拟登录淘宝H5,获取cookie

pyppeteer 模拟登录淘宝H5,获取cookie

到此模拟登录已经结束,接下来是获取cookie,附上获取cookie的代码

pyppeteer 模拟登录淘宝H5,获取cookie