【文件属性】:
文件名称:parquet-mr:Apache Parquet
文件大小:2.04MB
文件格式:ZIP
更新时间:2021-02-03 20:12:46
java big-data parquet JavaJava
实木复合地板
Parquet-MR包含的java实现。 Parquet是Hadoop一种列式存储格式; 它提供了有效的数据存储和编码。 Parquet使用Dremel论文中描述的来表示嵌套结构。
您可以在我们的找到有关格式和预期用例的一些详细信息
建造
Parquet-MR使用Maven构建并依赖于节俭的编译器(协议现在由maven插件管理)。
安装Thrift
要构建并安装节俭的编译器,请运行:
wget -nv http://archive.apache.org/dist/thrift/0.13.0/thrift-0.13.0.tar.gz
tar xzf thrift-0.13.