distances:致力于计算距离

时间:2021-05-19 18:48:25
【文件属性】:
文件名称:distances:致力于计算距离
文件大小:1.79MB
文件格式:ZIP
更新时间:2021-05-19 18:48:25
HTML 比较组概述 该存储库托管与计划用于Medium Towards Data Science的文章相关的支持文件。 本文的一般目的是提供有关如何实现三种距离度量的教程。 本教程重点介绍特定的用例。 用例正在构建类似比较单元的列表。 具体而言,本教程将使用来自美国教育部的与高等教育机构有关的数据。 该资料库和文章将展示距离度量如何作为一种识别类似机构的方法。 通过使用距离测量来识别相似的机构,研究人员和其他使用高等教育数据的人可以建立比较组。 比较组是相似的机构组。 在其他情况下,研究人员和其他人员通常需要查找相似的观察结果。 本教程显示了如何使用距离测量来找到相似的观测值。 用例和直觉 这是一个特定的用例。 使用距离测量来找到相似的观测值并不是一个新颖的主意。 要查看基本原理,请参考图1,该图显示了散点图上的四个观察结果。 使用假设数据,图1使用机构的规模(y轴)和机构的年学费率(x轴)在
【文件预览】:
distances-main
----.gitignore(58B)
----archive()
--------ndist_Jan28_2019.do(906B)
--------ndist_Jan_28_2019.py(1KB)
----LICENSE(1KB)
----ComparisonGroupScratchSpace.ipynb(41KB)
----README.md(7KB)
----ComparisonGroupLiveData.ipynb(227KB)
----ImageCodeFiles()
--------Figure5.png(84KB)
--------Figure2.png(143KB)
--------Figure3and 4.do(332B)
--------Figure1.png(125KB)
--------Figure3.png(74KB)
--------Figure4.png(79KB)
--------Figure1and2.do(2KB)
----ipeds_data_sample_2017_report.html(9.44MB)

网友评论