【文件属性】:
文件名称:hudi-mirror
文件大小:3.04MB
文件格式:ZIP
更新时间:2021-03-10 06:01:16
Java
阿帕奇·胡迪(Apache Hudi)
Apache Hudi(发音为Hoodie)代表Hadoop Upserts Deletes and Incrementals 。 Hudi管理DFS(云存储,HDFS或任何Hadoop FileSystem兼容存储)上的大型分析数据集的存储。
特征
快速,可插入索引的Upsert支持
通过回滚支持以原子方式发布数据
编写器和查询之间的快照隔离
数据恢复的保存点
使用统计信息管理文件大小,布局
行和列数据的异步压缩
时间轴元数据以跟踪血统
通过聚类优化数据湖布局
Hudi支持三种查询类型:
快照查询-使用基于列和基于行的存储(例如 + )的组合,提供实时数据的快照查询。
增量查询-提供变更流,其中包含在某个时间点之后插入或更新的记录。
读取优化查询-通过纯列存储(例如 )提供出色的快照查询性能。
通过了解有关Hudi的更多信息
从源代码构