Book-Search-Engine:图书搜索引擎(Java,Apache Lucene,crawler4j,Apache Spark)

时间:2021-04-29 03:52:48
【文件属性】:
文件名称:Book-Search-Engine:图书搜索引擎(Java,Apache Lucene,crawler4j,Apache Spark)
文件大小:8KB
文件格式:ZIP
更新时间:2021-04-29 03:52:48
search-engine apache-spark apache pagerank indexing 图书搜索引擎 图书搜索引擎(Java,Apache Lucene,crawler4j,Apache Spark) 使用crawler4j爬行了大约100,000个网页,并通过使用Apache Spark的Graphx在Web图表上实现PageRank来执行链接分析。 使用Apache Lucene对爬网的文档建立索引,并通过PageRank和TF / IDF分数的组合对每个查询的文档进行排序。
【文件预览】:
Book-Search-Engine-master
----Book Search Engine.iml(80B)
----src()
--------main()
----README.md(384B)
----pom.xml(2KB)
----.gitignore(288B)

网友评论