MapReduce1.doc

时间:2022-07-10 04:42:08
【文件属性】:
文件名称:MapReduce1.doc
文件大小:754KB
文件格式:DOC
更新时间:2022-07-10 04:42:08
云计算 mapreduce复习资料,供学习下载1. 文件处理 1 2. 概要模式 2 2.1 数值概要 2 2.1.1 最大值最小值与计数 2 2.1.2 平均值 6 2.1.3 中位数与标准差 10 2.2 倒排索引概要 14 2.3 计数器计数 17 3. 过滤模式 21 3.1 过滤 21 3.1.1 分布式grep 21 3.1.2 简单随机抽样SRS 22 3.2 布隆过滤 24 3.3 TOP10 28 4. 数据组织模式 32 4.1 分层 32 4.2 分区 37 4.3 分箱 41 4.4 全排序 43 4.5 混排 47 5. 连接模式 50 5.1 Reduce端连接 51 5.2 复制连接 56 5.3 组合连接 59 5.4 笛卡儿积 60

网友评论