Python实现K-Means聚类

时间:2022-06-29 15:40:22
【文件属性】:
文件名称:Python实现K-Means聚类
文件大小:3KB
文件格式:PY
更新时间:2022-06-29 15:40:22
python 一、实验目的 1.了解K-Means算法的基本原理 2.编程实现K-Means算法,实现数据集的无监督学习 二、实验任务内容 K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标(从而使其与该组中的其他项目相似,但与其他组中的项目不同)。 三、实验步骤 1、导入numpy、matplotlib(绘图)模块,定义欧氏距离公式,定义kmeans函数,生成 一个m阶的方阵,定义列的长度,初始化K个质心,创建(k,n)个以零填充的矩阵,计算列的质心 2、遍历所有数据找到距离每个点最近的质心,循环样本,找到距离最小的质心,如果任意一点的簇分配结果发生改变,则更新sanmpleTagChanged标志,遍历所有质心,更新取值,返回质心和点的分配结果 四、实验心得 对于kmeans算法,初始均值的设置和数据的输入顺序都会影响迭代的次数,但是不影响聚类的结果。k值的选取至关重要。 优点:原理简单、聚类效果优、可解释度强。

网友评论