Hadoop 之Impala

时间:2023-03-09 19:32:19
Hadoop 之Impala

impala 是基于hive的大数据实时分析查询引擎,直接使用Hive的元数据库metadata意味着impala元数据都存储在hive的metadstore中并且impala兼容hive的

sql解析,实现了hive得sql语义子集,功能还在不断完善中。

shell命令

impala-shell 命令用法:

Ø -h 万能帮助

Ø -r 刷新整个元数据*

Ø -B 去格式化,查询大数据量时可以提高性能*