【文件属性】:
文件名称:Apache Spark3.0特性介绍.pdf
文件大小:1.54MB
文件格式:PDF
更新时间:2020-06-08 09:42:52
Spark3.0 动态分区裁剪 自适应查询执行
本pdf是对spark3.0新增特性的讲解描述,主要包括以下几个方面:
1,Dynamic Partition Pruning(动态分区裁剪)
2,Adaptive Query Execution(自适应查询执行)
3,Accelerator-aware Scheduling(加速器感知调度)
4,Apache Spark DataSource V2(数据源API稳定版)
5,SparkR向量化读写
6,更好的 ANSI SQL 兼容
7,其他
8,参考文献
9,扩展(数据湖)