Hadoop 简介时间:2023-03-09 00:53:12 一个开源的,高可靠,可扩展的分布式计算框架 解决的问题 1 海量数据的存储(HDFS) 2海量数据的分析(Mapreduce) 3 分布式资源调度 (Yarn) 应用场景 日志分析,基于海量数据的在线应用,推荐系统,计算广告,复杂算法,网盘,搜素引擎,,,, 一 HDFS 动态增加,自动备份 二 mapreduce 分而治之,并行计算框架 三 Yarn CPU 内存的分配,资源调度和任务调度管理