Hive面试题:Hive分区表和分桶表的区别

时间:2025-01-23 09:22:00

分区在HDFS上的表现形式是一个目录, 分桶是一个单独的文件

分区:  细化数据管理,直接读对应目录,缩小mapreduce程序要扫描的数据量

分桶:   1、提高join查询的效率(用分桶字段做连接字段)    

              2、提高采样的效率