kmeans算法文本聚类java源码(分词,TF/IDF等)

时间:2014-07-23 09:57:15
【文件属性】:

文件名称:kmeans算法文本聚类java源码(分词,TF/IDF等)

文件大小:29KB

文件格式:ZIP

更新时间:2014-07-23 09:57:15

JAVA kmeans 文本聚类

算法思想:提取文档的TF/IDF权重,然后用余弦定理计算两个多维向量的距离来计算两篇文档的相似度,用标准的k-means算法,整个工程可以直接运行,


【文件预览】:
textcluster
----src()
--------com()
----.classpath(340B)
----.mymetadata(306B)
----.myeclipse()
----.project(1013B)
----WebRoot()
--------META-INF()
--------index.jsp(831B)
--------WEB-INF()

网友评论

  • 请问怎么运行啊,我运行全是-0-0-0-0-0-0
  • 用面向对象的方法做的,还是很不错很清楚的,文档也很规范
  • 用面向对象的方法做的,还是很不错很清楚的,文档也很规范
  • 代码还可以,用来参考
  • 还可以,适合初学者
  • 根本没有中文分词功能,不值10分
  • 谢谢分享!理解代码 还行!!
  • 大规模文档聚类时不适用,只是用来理解文本聚类的,楼主要10分有点狮子大开口了。
  • 代码还可以,可以借鉴,分也太高了吧
  • 说实话,不是很好用!
  • 一般般,还好吧
  • 代码不错~~
  • 代码可以运行,不过需要改。
  • 代码我以前已经下载过了,聚类效果不好,聚类很快就达到局部最优,但算法没有错,只是需要改进。还是满具有参考价值的。
  • 基本还行,谢谢分享
  • 基本还可以,能运行不过意义不大
  • 不错的材料 ,注释的也很好,楼主大大给力。
  • 性价比不高啊~~
  • 分值太高了 内容也不详细 代码乱
  • 效果很一般
  • 聚类效果一般啊,这个分值要的也太高了啊
  • 这代码我以前已经下载过了,聚类效果不好,聚类很快就达到局部最优,但算法没有错,只是需要改进。
  • 通用性不怎么样,没有什么用处。
  • 虽然感觉有点乱,但仔细看看还是很有参考价值的,要是有个说明文档就更好了,,,O(∩_∩)O~
  • 感觉有点乱。。。不过还是谢谢分享了
  • 恩,我本来想找点儿实验的程序,不太适用哇
  • 不错的材料 ,注释也很详尽,谢谢楼主的分享
  • 很好,我经过修改完全可以很好的实现文本聚类!
  • 分值太高了 内容也不详细 代码乱
  • 这个还不错,聚类虽然不是很精确,但已经很接近正确的,有误差那是不可避免的