网页查重算法Shingling和Simhash研究

时间:2015-11-07 04:19:28
【文件属性】:
文件名称:网页查重算法Shingling和Simhash研究
文件大小:107KB
文件格式:CAJ
更新时间:2015-11-07 04:19:28
网页查重算法 Shingling Simhash 对比介绍了网页查重算法Shingling和Simhash的优劣,提出了两者适用的不同领域,是文本相似度计算的重要参考资料

网友评论

  • 虽然最终没有派上用场,但还是感谢
  • 这是原文,很不错,感谢分享