【文件属性】:
文件名称:WebSearchEngineThree:优先级
文件大小:10.94MB
文件格式:ZIP
更新时间:2021-06-28 18:01:05
Java
网页搜索引擎
我们正在尝试构建一个功能齐全的网络搜索引擎。 我们已经实现了搜索引擎的几个关键组件,包括
排名者
索引器
评估员
索引器
索引器将检查语料库并为每个术语构建发布列表。 主要功能包括:
简单的外部排序
字节编码/解码
术语的线性和二分搜索
词干
排名者
我们已经建立了几个排名器,包括:
余弦相似度排名器
查询可能性排名
队员
杨元仪许志远沉凯文
【文件预览】:
WebSearchEngineThree-master
----conf()
--------engine.conf(843B)
----.project(379B)
----common-english-words.txt(564B)
----parts()
--------parts.txt(52B)
----src()
--------edu()
----script(233B)
----lib()
--------guava-18.0.jar(2.15MB)
--------http-20070405.jar(80KB)
--------jsoup-1.8.1.jar(294KB)
----web()
--------index.html(3KB)
--------searchEngine.css(610B)
----README.md(595B)
----queries.tsv(34B)
----hw(284B)
----data()
--------log()
--------index()
--------simple()
----.classpath(401B)
----.gitignore(121B)