【文件属性】:
文件名称:word源码java-elasticsearch:springboot整合ElasticSearch
文件大小:66KB
文件格式:ZIP
更新时间:2021-06-05 23:28:38
系统开源
word源码java
全文检索:
数据结构:
数据总体分为两种:
结构化数据:
有固定格式或有限长度的数据
如:数据库中的数据、元数据(文件、文件夹...)等
非结构化数据:
不定长或无固定格式的数据
如:邮件,word文档等磁盘上的文件
数据的搜索方式:
结构化数据:
数据库中数据通过sql语句可以搜索
元数据(windows中的)通过windows提供的搜索栏进行搜索
非结构化数据:
顺序扫描法:
拿到搜索的关键字,去文档中,逐字匹配,直到找到和关键字一致的内容为止
优点:
如果文档中存在要找的关键字就一定能找到想要的内容
缺点:
慢,
效率低
全文检索:Full-text
Search
先建立索引,再对索引进行搜索的过程就叫全文检索
如:字典(有拼音和部首索引)
相当于字典,分为目录和正文两部分
查询的时候通过先查目录,然后通过目录上标注的页数去正文页查找需要的内容
分词:
去掉停用词(a,
an,
the
,的,
地,
得,
啊,
嗯
,呵呵)
因
【文件预览】:
elasticsearch-master
----.gitignore(276B)
----gradle()
--------wrapper()
----README.md(9KB)
----build.gradle(937B)
----gradlew.bat(2KB)
----gradlew(5KB)
----src()
--------test()
--------main()
----settings.gradle(35B)