《Forward团队-爬虫豆瓣top250项目-设计文档》

时间:2023-03-09 03:29:32
《Forward团队-爬虫豆瓣top250项目-设计文档》

成员:马壮,*宇,刘子轩,年光宇,邢云淇,张良

设计方案:

  1、能分析HTML语言;

  2、提取重要数据,并保存为文本文档;

  3、用PY代码调取文本文档的数据;

  4、编写提取部分数据的python代码;

  5、显示在python运行弹出框中;

  可能用上的工具:

  1、豆瓣API

  2、Scrapy spider:python爬虫