• Gzip,BZip2,Lzo,Snappy总结

    时间:2022-04-29 05:00:44

    gzip,bzip2,lzo,snappy是hadoop中比较常见的文件压缩格式,可以节省很多硬盘存储,以下是Gzip,BZip2,LzoSnappy四种方式的优缺点和使用场景 Gzip优点:1.压缩解压速度快,压缩率高,hadoop本身支持2.处理压缩文件时方便,和处理文本一样3.大部分linux...

  • hive建表没使用LZO存储格式,但是数据是LZO格式时遇到的问题

    时间:2022-02-19 12:19:56

        今天微博大数据平台发邮件来说,他们有一个hql运行失败,但是从gateway上面的日志看不出来是什么原因导致的,我帮忙看了一下,最后找到了问题的原因,以下是分析过程:1、运行失败的hql:INSERTOVERWRITETABLEbrand_ad_user_with_interact_scor...