基于Hadoop集群的多表并行关联算法及应用

时间:2020-10-17 23:11:25
【文件属性】:
文件名称:基于Hadoop集群的多表并行关联算法及应用
文件大小:208KB
文件格式:PDF
更新时间:2020-10-17 23:11:25
Hadoop集群 针对因特网环境下并行数据库实现多个大数据表关联存在的计算瓶颈,基于 Hadoop集群设计了一个并行关联多个大数据表的简便算法MR_Join。以商业网站凡客诚品的销售数据为例进行实验,验证算法的可行性并做出应用实例。实验结果表明,MR_Join算法可以有效地实现大数据表的快速关联,具有显著的并行效率。

网友评论