kmeans算法文本聚类java源码（分词，TF/IDF等）

时间：2014-07-23 09:57:15

【文件属性】：

文件名称：kmeans算法文本聚类java源码（分词，TF/IDF等）

文件大小：29KB

文件格式：ZIP

更新时间：2014-07-23 09:57:15

JAVA kmeans 文本聚类

算法思想：提取文档的TF/IDF权重，然后用余弦定理计算两个多维向量的距离来计算两篇文档的相似度，用标准的k-means算法，整个工程可以直接运行，

立即下载

【文件预览】：
textcluster
----src()
--------com()
----.classpath(340B)
----.mymetadata(306B)
----.myeclipse()
----.project(1013B)
----WebRoot()
--------META-INF()
--------index.jsp(831B)
--------WEB-INF()

网友评论

请问怎么运行啊，我运行全是-0-0-0-0-0-0
用面向对象的方法做的，还是很不错很清楚的，文档也很规范
用面向对象的方法做的，还是很不错很清楚的，文档也很规范
代码还可以，用来参考
还可以，适合初学者
根本没有中文分词功能，不值10分
谢谢分享!理解代码还行!!
大规模文档聚类时不适用，只是用来理解文本聚类的，楼主要10分有点狮子大开口了。
代码还可以，可以借鉴，分也太高了吧
说实话，不是很好用！
一般般，还好吧
代码不错~~
代码可以运行，不过需要改。
代码我以前已经下载过了，聚类效果不好，聚类很快就达到局部最优，但算法没有错，只是需要改进。还是满具有参考价值的。
基本还行，谢谢分享
基本还可以，能运行不过意义不大
不错的材料，注释的也很好，楼主大大给力。
性价比不高啊~~
分值太高了内容也不详细代码乱
效果很一般
聚类效果一般啊，这个分值要的也太高了啊
这代码我以前已经下载过了，聚类效果不好，聚类很快就达到局部最优，但算法没有错，只是需要改进。
通用性不怎么样，没有什么用处。
虽然感觉有点乱，但仔细看看还是很有参考价值的，要是有个说明文档就更好了，，，O(∩_∩)O~
感觉有点乱。。。不过还是谢谢分享了
恩，我本来想找点儿实验的程序，不太适用哇
不错的材料，注释也很详尽，谢谢楼主的分享
很好，我经过修改完全可以很好的实现文本聚类！
分值太高了内容也不详细代码乱
这个还不错，聚类虽然不是很精确，但已经很接近正确的，有误差那是不可避免的

秒客网

kmeans算法文本聚类java源码（分词，TF/IDF等）

网友评论

相关文章