【文件属性】:
文件名称:pageRank:Hadoop中PageRank的实现
文件大小:27KB
文件格式:ZIP
更新时间:2021-06-26 13:55:50
Java
##MapReduce 编程:使用 hadoop 计算*文章的内部 PageRank。
本课程将向您介绍编程和数据操作的MapReduce模型。 它将提供分析真实数据源的有限实践经验:。
###数据:
出于本次作业的目的,您已获得一组荷兰语*文章,这些文章存储为单个.xml文档。
文档格式如下:
< mediawiki>
< page>... page>
< page>
< title >Foo</ title >
< text>Lorem ipsum dolor sit amet... text>
page>
< page>
< title >Bar</ title >
< text>Lorem ipsum dolor sit [[Foo|
【文件预览】:
pageRank-master
----src()
--------test()
--------main()
----example-input.xml(10KB)
----LICENSE(11KB)
----README.md(9KB)
----pom.xml(2KB)
----PageRank_Output.txt(2KB)
----.gitignore(563B)
----results_test01.txt(1KB)