【文件属性】:
文件名称:spark-in-practice-scala:Spark,Spark流,Spark SQL和DataFrame入门
文件大小:3.01MB
文件格式:ZIP
更新时间:2021-05-19 04:06:16
Scala
讲习班实践
在本研讨会中,练习集中于使用和 API,以及数据处理中的 。 我的github帐户(此处为scala)中的和Scala均提供了练习。 您只需要克隆项目就可以了! 如果需要帮助,请查看解决方案分支。
原始博客文章就。
为了帮助您实现每节课,我们引入了单元测试。
使用的框架:
星火1.4.0
Scala2.10
sbt
最卑鄙的
所有练习均作为独立程序在本地模式下运行。
要动手操作,请通过以下命令行检索代码:
$ git clone https://github.com/nivdul/spark-in-practice-scala.git
然后,您可以在IntelliJ或Eclipse中导入项目(添加用于Scala的SBT和Scala插件),或使用崇高的文本。
如果要使用交互式spark-shell(仅限scala / python),则需要下载。
【文件预览】:
spark-in-practice-scala-master
----sbt()
--------sbt(171B)
--------sbt-launch.jar(1.09MB)
----src()
--------test()
--------main()
----img()
--------streaming.png(1004KB)
--------dataframe.png(510KB)
----build.sbt(811B)
----README.md(5KB)
----data()
--------wordcount.txt(5KB)
--------reduced-tweets.json(1.55MB)
----.gitignore(39B)