文件名称:数据文件处理-impala介绍ppt
文件大小:1.15MB
文件格式:PPT
更新时间:2024-05-16 04:07:31
impala
数据文件处理 加载数据: 1、insert语句:插入数据时每条数据产生一个数据文件,不建议用此方式加载批量数据 2、load data方式:再进行批量插入时使用这种方式比较合适 3、来自中间表:此种方式使用于从一个小文件较多的大表中读取文件并写入新的表生产少量的数据文件。也可以通过此种方式进行格式转换。 空值处理: impala将“\n”表示为NULL,在结合sqoop使用是注意做相应的空字段过滤, 也可以使用以下方式进行处理: alter table name set tblproperties (“serialization.null.format”=“null”) Impala 数据处理 07