新人ubuntu安装phantomjs踩坑

时间:2022-11-25 15:58:35


PhantomJS

​PhantomJS​​ 是一个基于Webkit的“*面”(headless)浏览器,它会把网站加载到内存并执行页面上的 JavaScript,因为不会展示图形界面,所以运行起来比完整的浏览器要高效。

如果我们把 Selenium 和 PhantomJS 结合在一起,就可以运行一个非常强大的网络爬虫了,这个爬虫可以处理 JavaScrip、Cookie、headers,以及任何我们真实用户需要做的事情。

注意:PhantomJS 只能从它的官方网站​​http://phantomjs.org/download.html)​​ 下载。 因为 PhantomJS 是一个功能完善(虽然*面)的浏览器而非一个 Python 库,所以它不需要像 Python 的其他库一样安装,但我们可以通过Selenium调用PhantomJS来直接使用。

PhantomJS 官方参考文档:​​http://phantomjs.org/documentation​

 

1. wget https://bitbucket.org/ariya/phantomjs/downloads/phantomjs-2.1.1-linux-x86_64.tar.bz2
2. tar xvf phantomjs-2.1.1-linux-x86_64.tar.bz2
3. ln -sf /usr/local/src/phantomjs/bin/phantomjs /usr/local/bin/phantomjs
4. 运行 phantomjs
5. 没有反应? No such file or directory 恭喜恭喜!中招了!
6. 菜鸟们,首先需要安装以下依赖库:
apt install build-essential g++ flex bison gperf ruby perl libsqlite3-dev libfontconfig1-dev libicu-dev libfreetype6 libssl-dev libpng-dev libjpeg-dev python libx11-dev libxext-dev
7. 这下试一下? phantomjs --version