k-means聚类算法及matlab代码-dataMining:数据挖掘

时间:2021-05-21 14:56:12
【文件属性】:
文件名称:k-means聚类算法及matlab代码-dataMining:数据挖掘
文件大小:527KB
文件格式:ZIP
更新时间:2021-05-21 14:56:12
系统开源 k-means聚类算法及matlab代码 项目名称:数据挖掘课作业 项目组成 1. exp1 实验一 《多源数据集成、清洗和统计》 题目 广州大学某班有同学100人,现要从两个数据源汇总学生数据。第一个数据源在数据库中,第二个数据源在txt文件中,两个数据源课程存在缺失、冗余和不一致性,请用C/C++/Java程序实现对两个数据源的一致性合并以及每个学生样本的数值量化。 两个数据源合并后读入内存,并统计: 学生中家乡在Beijing的所有课程的平均成绩。 学生中家乡在广州,课程1在80分以上,且课程9在9分以上的男同学的数量。(备注:该处做了修正,课程10数据为空,更改为课程9) 比较广州和上海两地女生的平均体能测试成绩,哪个地区的更强些? 学习成绩和体能测试成绩,两者的相关性是多少?(九门课的成绩分别与体能成绩计算相关性) 实验一__目录结构 --data1.xlsx 插入数据库的原始数据 --data2.txt 从文件读入的原始数据 --data3.csv 清洗完毕的数据 --data4.csv 清洗完毕的经过特意处理数据 --insertData.py 插入数据库的完整代码 --
【文件预览】:
dataMining-main
----exp2()
--------exp2.py(9KB)
--------data3.csv(7KB)
--------C1成绩直方图.png(13KB)
--------correlation_matrix .csv(274KB)
--------.idea()
--------每个点距离最近3个点的ID.txt(2KB)
--------README.md(640B)
--------C1成绩和体能成绩散点图.png(19KB)
--------归一化矩阵.csv(26KB)
--------每个点距离从近到远的ID.csv(77KB)
--------confusion_matrix.png(69KB)
----exp3()
--------exp3.py(5KB)
--------归一化数据:k等于4的聚类.png(43KB)
--------归一化数据:k等于3的聚类.png(42KB)
--------[2,6]的所属簇:k=3.png(7KB)
--------测试数据:k等于2的聚类.png(22KB)
--------测试数据.csv(197B)
--------归一化二维矩阵.csv(5KB)
--------测试数据:k等于3的聚类.png(28KB)
--------测试数据:k等于4的聚类.png(31KB)
--------pca.py(846B)
--------README.md(1KB)
--------[2,6]的所属簇:k=4.png(7KB)
--------测试数据:k等于5的聚类.png(34KB)
--------[2,6]的所属簇:k=5.png(6KB)
--------[2,6]的所属簇:k=2.png(7KB)
--------归一化数据:k等于5的聚类.png(50KB)
--------归一化数据:k等于2的聚类.png(30KB)
--------归一化矩阵.csv(26KB)
----README.md(8KB)
----exp1()
--------process.py(11KB)
--------data1.xlsx(16KB)
--------data2.txt(6KB)
--------data3.csv(7KB)
--------data4.csv(6KB)
--------README.md(360B)
--------实验结果.png(17KB)
--------insertData.py(2KB)

网友评论