QQ空间爬虫(日志、说说、个人信息)

时间:2020-04-26 11:29:12
【文件属性】:
文件名称:QQ空间爬虫(日志、说说、个人信息)
文件大小:44KB
文件格式:ZIP
更新时间:2020-04-26 11:29:12
python,爬虫 ##QQSpider1:## 详情请见博客: 《QQ空间爬虫分享(一天可抓取 400 万条数据) 》 如果出现报错: Traceback (most recent call last): File ".\init.py", line 20, in my_messages.backups() # 备份爬虫信息 NameError: name 'my_messages' is not defined 多半的原因是 BitVector 模块用不了,可自行调试。 如果确定是BitVector用不了的话可以用 "BitVector模块报错解决" 里面的两个文件替换掉原有文件,不使用BitVector判重,改用python的list判重(数据量不大的话效果是一样的)。 ------------------------------------------------------- 分界线 ------------------------------------------------------- ##**QQSpider2:**## 更新后的版本,详情请见博客: [《QQ空间爬虫分享(2016年11月18日更新)》](http://blog.csdn.net/Bone_ACE/article/details/53213779) 有同学反映,爬QQ空间的很多都是学生想爬一些数据做统计研究的,本不是计算机专业,爬起来比较困难,希望有现成的数据出售。但是因为工作变动,其实今年3月份 程序开发完后我就没有跑过了,所以手上也没有数据。不过接下来我会开一两台机器跑这个爬虫,如果需要数据可以邮件联系我(bone_ace@163.com)。 遇到什么问题请尽量留言,方便后来遇到同样问题的同学查看
【文件预览】:
QQSpider-master
----README.md(2KB)
----QQSpider2()
--------init_messages.py(3KB)
--------public_methods.py(6KB)
--------myQQ.txt(26B)
--------information_spider.py(10KB)
--------spide_controller.py(4KB)
--------yundama.py(6KB)
--------friend_spider.py(1KB)
--------launch.py(695B)
--------blog_spider.py(7KB)
--------QQForSpider.txt(40B)
--------mood_spider.py(7KB)
----BitVector模块报错解决()
--------init_messages.py(4KB)
--------spide_controller.py(5KB)
----QQSpider1()
--------init_messages.py(4KB)
--------使用说明.txt(75B)
--------init.py(779B)
--------public_methods.py(6KB)
--------myQQ.txt(33B)
--------QQFailSpided.txt(0B)
--------information_spider.py(10KB)
--------spide_controller.py(4KB)
--------friend_spider.py(1KB)
--------.idea()
--------QQHadSpided.txt(0B)
--------blog_spider.py(8KB)
--------QQForSpider.txt(155B)
--------mood_spider.py(7KB)

网友评论