【文件属性】:
文件名称:cariny.github.io:将网站部署到github页面
文件大小:452KB
文件格式:ZIP
更新时间:2021-04-04 15:56:33
JupyterNotebook
网络抓取挑战
在此作业中,您将构建一个Web应用程序,该应用程序将刮擦各个网站以获取与“火星任务”相关的数据,并将该信息显示在单个HTML页面中。 以下概述了您需要执行的操作。
第1步-刮
美国宇航局火星新闻
刮擦NASA火星新闻网站,并收集最新的新闻标题和段落文本。 将文本分配给以后可以引用的变量。
JPL火星空间图片-特色图片
在此处访问JPL Featured Space Image的URL。
使用splinter导航站点,找到当前“特色火星”图像的图像url,并将该url字符串分配给一个名为Featured_image_url的变量。
确保找到全尺寸.jpg图片的图片网址。
确保为该图像保存完整的url字符串。
火星事实
请访问此处的“火星事实”网页,并使用熊猫刮擦桌子,其中包含有关行星的事实,包括直径,质量等。
使用Pandas将数据转换为HTML表字符串。
火星半球