【文件属性】:
文件名称:Wiki:Spark探索全文Wikipedia文章
文件大小:5KB
文件格式:ZIP
更新时间:2021-03-16 04:57:15
*
计算编程语言的排名
1.您需要下载数据(133 MB): :
2.您需要将wikipedia.dat文件放在项目目录中的src/main/resources/wikipedia文件夹中。
3.安装JDK-8
4.安装sbt-1.4.7
5.打开Intellij IDEA并安装Scala插件
[ ]
6.选择导入项目,然后打开项目的build.sbt文件。
7.使用sbt.version = 1.4.7
8.运行*排名
9.转到SparkUI
http://localhost:4040/
出去:
郎
数数
JavaScript
1692
C#
705
Java
586
CSS
372
C ++
334
的MATLAB
295
Python
286
PHP
279
Perl
144
Ruby
120
哈斯克尔
54
物镜
47
Sc
【文件预览】:
Wiki-master
----src()
--------main()
----build.sbt(185B)
----.gitignore(64B)
----project()
--------build.properties(19B)
----README.md(2KB)