【文件属性】:
文件名称:udacity_data_scientist
文件大小:6.18MB
文件格式:ZIP
更新时间:2021-04-03 15:01:44
JupyterNotebook
西雅图的AirBnB数据分析
动机
在这个项目中,我将研究西雅图的公寓价格与不同特征之间的关系,例如卧室数量,公寓类型或等级评分。
该博客文章可。
问题1:更好的评论分数与更高的价格相关吗?
答案1:发现价格与评论评分之间存在很小的正相关关系。
问题2:airBnB在西雅图的公寓面积分布如何?
答案2:平均公寓面积为854平方英尺,最小面积为420,最大尺寸为3000。
问题3:哪种物业类型的价格最高?
答案3:每晚最高价格是用船赚的,而价格最低的公寓是宿舍。
问题4:让我们使用公寓的大小,物业类型,床位数和评论评分为价格创建线性回归模型,以预测每晚价格。 影响最大的因素是什么?
答案4:我们可以看到,价格和输入要素之间最强的相关性是床位数。 同样,公寓类型也不再重要了。 但是,由于输入要素的数量与原始数据集相比很小,因此我们应该对此有所了解。
档案说明
./files/seattle_
【文件预览】:
udacity_data_scientist-main
----project_2()
--------models()
--------README.md(2KB)
--------data()
--------app()
----README.md(2KB)
----project_1()
--------.ipynb_checkpoints()
--------blog()
--------README.md(35B)
--------project_1.html(520KB)
--------files()
--------project_1_files()
--------project_1.ipynb(263KB)
----capstone()
--------Sparkify_small_data.ipynb(102KB)
--------.idea()
--------README.md(2KB)
--------Sparkify_big_data.ipynb(52KB)
----.gitignore(2KB)