python实现简单的贴吧爬虫工具

时间:2024-03-24 07:44:00

Python爬虫

这是一个python3 + bs4(beautifulsoup4)  完成的百度贴吧爬虫

github源代码 https://github.com/vvyun/python-tieba

功能如下

* 爬取指定百度贴吧内容
* 处理爬取内容
* 获取内容中的帖子链接
* 爬取帖子内容并保存到指定路径

运行方式

方法1

1. 下载[点击此处下载](https://github.com/vvyun/python-tieba/releases) 解压运行setup.exe

方法2

1. 安装python3 bs4

2. 运行main/setup.py

3. 输入贴吧名

4. 点击开始按钮,选择存储路径,开始爬取内容

运行界面如下 

python实现简单的贴吧爬虫工具
python实现简单的贴吧爬虫工具