【文件属性】:
文件名称:php搜索引擎中文分词例子
文件大小:683KB
文件格式:RAR
更新时间:2011-11-06 19:49:06
php 中文分词
说明:本技术用于搜索引擎中文分词
程序使用自建词库,存储15多万(免费版10万左右)词,未压缩词库仅1.13M
程序自动过滤了诸如:█♀♂卍※
平均每个词查找词库次数为2
使用分词类中的add_word方法可以很轻易扩展词库,稍加扩展可使程序具有学习功能
程序未对RMM和MM分词进行结果组合与筛选
【文件预览】:
test.php
HJ_SegWord_GBK.dat
HJ_SegWord_Class.php
网友评论
- 不能用垃圾
- 本以为下载个简单改一下,就能用上,谁知道错误一大堆,没时间进行大改动的,请略过吧,你会心碎的
- 很不错哟,这个分词还挺好用
- 很不错哟,代码自己再改改就可以用
- 这个分词还挺好用
- 分词是好用的
- 恩,这个分词还挺好用的,检索出基本内容,不是特别精准
- 分词不是特别准
- 分词不是特别准,不过还是挺实用的
- 已经做的很不错了...就是还有很多不足的地方。