【文件属性】:
文件名称:MapReduce分布式计算平台编程示例
文件大小:176KB
文件格式:DOC
更新时间:2015-09-11 07:29:24
MapReduce hadoop
1. MapReduce介绍 1
1.1 编程模式 1
2.2 简单例子 1
2 用户自定义接口 3
2.1 map函数 3
2.2 Reduce函数 3
2.3输入和输出格式 4
2.4 partitioner函数 4
2.5 Combiner函数 4
3 Hadoop MapReduce平台使用 5
3.1 streaming介绍 5
3.2 C语言Map-Reduce程序示例 6
3.2.1计算任务 6
3.2.2 Mapper算法设计 7
3.2.3 Reducer算法设计 8
3.2.4 作业提交命令 9
3.3 shell Map-Reduce程序示例 9
3.3.1计算任务 9
3.3.2 map实现 10
3.3.3 reduce实现 11
3.3.4 作业提交命令 11
4技巧 12
4.1 顺序保证 12
4.2 本地执行 12
4.3 状态信息 13
5 实际经验 13
5.1 spider rubbish-mine全库挖掘项目 13
5.2 Rank组page共现信息计算 14
5.3 PS日志分析计算 15
5.4 用户访问信息展现 16
6 参考资料 17
附录一 18
网友评论
- 很好用,谢谢
- 文档很长,部分程序也写进了文档里。
- 很好用,谢谢。