【文件属性】:
文件名称:java大数据作业_5Mapreduce、数据挖掘
文件大小:16KB
文件格式:DOCX
更新时间:2021-02-13 03:01:21
java 大数据 Mapreduce 数据挖掘
课后作业
1.请找出日志中的访问者ip,访问时间,来源地址,访问
地址
日志内容如下:
192.168.170.111—[20/Jan/2014:16:35:27 +0800]
“GET /examples/servlets/images/code.gif HTTP/1.1” 200
292 “http://192.168.170.152/examples/servlets/” “Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/31.0.1650.63 Safari/537.36” “-”
2.使用代码简述迭代式、组合式的job执行方法
3.HBASE的Map、Reduce继承类和序列化类是什么
4.简述容量调度的配置方法
5.简述mapreduce流程
6.简述二次排序算法
有输入数据如下所示:
1 2
2 3
2 1
4 6
3 1
3 8
3 2
需要使用二次排序算法,得到如下处理结果:
1 2
2 1
2 3
3 1
3 2
3 8
4 6
请简述处理过程
网友评论
- 垃圾,骗积分的,0分