学习笔记CB011:lucene搜索引擎库、IKAnalyzer中文切词工具、检索服务、查询索引、导流、word2vec
影视剧字幕聊天语料库特点,把影视剧说话内容一句一句以回车换行罗列三千多万条中国话,相邻第二句很可能是第一句最好回答。一个问句有很多种回答,可以根据相关程度以及历史聊天记录所有回答排序,找到最优,是一个搜索排序过程。lucene+ik。lucene开源免费搜索引擎库,java语言开发。ikIKAnal...
中文搜索引擎数据库TngouDB 0.2 beta 发布
今日TngouDB 中文索引数据库 0.2 beta 版本发布了,该版本的数据库重新整合了一下数据的存储和其他的功能等,接下来随脚本之家一起去学习下吧
ElasticSearch搜索引擎安装配置中文分词器IK插件
近几篇ElasticSearch系列:1、阿里云服务器Linux系统安装配置ElasticSearch搜索引擎2、Linux系统中ElasticSearch搜索引擎安装配置Head插件3、ElasticSearch搜索引擎安装配置中文分词器IK插件4、ElasticSearch搜索引擎安装配置拼音插...