mapreduce如何自定义reduce输出的文件名

时间:2024-04-07 10:01:54

mapreduce如何自定义reduce输出的文件名

  1. 跟随源码找到设置输出文件的方法
    org.apache.hadoop.mapreduce.lib.output.FileOutputFormat.getDefaultWorkFile(TaskAttemptContext, String)

    mapreduce如何自定义reduce输出的文件名
    继续跟进这个方法
    org.apache.hadoop.mapreduce.lib.output.FileOutputFormat<K, V>

    mapreduce如何自定义reduce输出的文件名
  2. 发现是使用此方法返回的文件路径,我们只需要自定义一个类继承TextOutputFormat,然后重写getDefaultWorkFile(job, extension)方法,如下
    mapreduce如何自定义reduce输出的文件名
    在job中设置自定义输出类
    mapreduce如何自定义reduce输出的文件名
  3. 效果
    mapreduce如何自定义reduce输出的文件名