Spark实时流处理编程指南

时间:2021-08-05 13:52:10
【文件属性】:
文件名称:Spark实时流处理编程指南
文件大小:1.21MB
文件格式:PDF
更新时间:2021-08-05 13:52:10
spark Spark Streaming是Spark 核心API的一种扩展,它实现了对实时流数据的高吞吐量,低容错率的流处理。数据可以有许多来源,如Kafka, Flume, Twitter,ZeroMQ或传统TCP套接字,可以使用复杂算法对其处理实现高层次的功能,如map,reduce,join和window。最后,经处理的数据可被输出到文件系统,数据库,和实时仪表盘。事实上,你可以申请使用Spark公司在内置 机器学习算法,以及 图形处理的数据流算法。

网友评论