【文件属性】:
文件名称:csdn-spider:爬取CSDN上的博客文章
文件大小:3KB
文件格式:ZIP
更新时间:2021-05-19 21:12:51
spider csdn csdnspider Python
基于Python的Csdn博客爬虫(多线程)
说明
爬取Csdn某个博主的所有博文,并下载到本地(暂时只支持保存html格式),加入了多线程,爬取更快速。
SpiderGui----------------->爬虫gui界面
CsdnBlogSpider------------>爬虫主程序
环境
Python3.4
运行
* 确保安装Python解释器。
* SpiderGui.py
* 提示输入要爬取的博客名和开启线程数,根据自己需求配置
* 开始爬取,存储在当前目录的blog文件夹下
存在问题
本爬虫还不够完善,欢迎大家指导
【文件预览】:
csdn-spider-master
----README.md(598B)
----SpiderGui.py(3KB)
----CsdnBlogSpider.py(2KB)
网友评论
- 你好 下载后文件夹没有东西啊