大数据知识脉络总结

时间:2021-11-03 15:32:43
【文件属性】:
文件名称:大数据知识脉络总结
文件大小:4.33MB
文件格式:XMIND
更新时间:2021-11-03 15:32:43
hadoop 分布式计算框架 编程模型 InputFormat Map 输入:偏移量、一行数据 输出:Text,Text 自定义对象 shuffle 数据从map端拉取 归并(汇总) 排序 Reduce 输入:Text,list 输出:Text,Text OutputForamt 特殊组件 partitioner 数据分区 key.hashcode % reduceTaskNum combiner 本地reduce,在map阶段运行 看情况使用 排序&TopN; 共同好友计算 分布式资源调度框架 架构 原理 分配流程

网友评论