Mission-to-Mars

时间:2021-03-08 01:51:16
【文件属性】:
文件名称:Mission-to-Mars
文件大小:45KB
文件格式:ZIP
更新时间:2021-03-08 01:51:16
JupyterNotebook 火星任务 项目概况 我们介绍了网络抓取和从活动网站提取信息所需的各种工具。 我们执行以下步骤: 使用Chrome驱动程序工具识别HTML组件。 使用BeatifulSoup和Splinter来自动执行抓取。 使用Mongo存储数据 使用Flask显示数据 Web抓取是一种从不同资源中快速获取数据的方法,而不是使用每个网站,而是手动提取数据。 网页抓取过程是使用编程抓取来自动进行的。 在较小的规模上,Web抓取可以自动完成用于个人项目的繁琐任务。 例如,如果您要收集有关特定主题的最新新闻,则网络抓取可以使其变得简单。 Web抓取脚本将执行这些操作并保存抓取的数据以供以后分析,而不是访问每个网站并复制文章。 世界各地的组织都使用Web抓取来提取在线数据以进行分析。 大型公司使用网络抓取来评估其声誉或跟踪竞争对手的在线状态。 资源 数据来源: 软体: , 和 模组:Splinter
【文件预览】:
Mission-to-Mars-main
----.ipynb_checkpoints()
--------Mission_to_Mars_Challenge-checkpoint.ipynb(177KB)
--------Mission_to_Mars-checkpoint.ipynb(13KB)
--------practice-checkpoint.ipynb(72B)
----templates()
--------index.html(2KB)
----Mission_to_Mars_Challenge.ipynb(51KB)
----README.md(2KB)
----__pycache__()
--------app.cpython-37.pyc(880B)
----index.html(2KB)
----app.py(718B)
----scraping.py(4KB)

网友评论