【文件属性】:
文件名称:hadoop-kmeans:使用 Hadoop 实现 K-Means 算法
文件大小:559KB
文件格式:ZIP
更新时间:2021-07-14 17:50:09
Java
Hadoop K-Means
使用 Hadoop 的 K-Means 算法实现。 该算法不执行任何初始质心的计算,必须给出这些。
用法
家庭输入集群数量输出增量最大
hadoop jar HadoopKMeans.jar com.jgalilee.hadoop.kmeans.driver.Driver \
input/kmeans.state \
input/points.txt \
input/clusters.txt \
2 \
output/ \
0.0 \
5
home - 每次迭代都可以写入文件名迭代状态的路径。
input - 输入点数据的路径。
集群 - 输入集群数据的路径。
number - 向 Hadoop 作业建议的减速器数量。
output - 为迭代 n 写入输出的路径 - 即 output/n
delta - 定义最后一个
【文件预览】:
hadoop-kmeans-master
----input()
--------clusters.txt(339B)
--------clusters.txt.txt(339B)
--------kmeans.state(40KB)
--------points.txt(1.03MB)
--------.kmeans.state.crc(0B)
----build.xml(2KB)
----src()
--------com()
----run.sh(252B)
----.gitignore(17B)
----README.md(2KB)