大数据笔记02:大数据之Hadoop的生态系统和版本

时间:2023-03-08 22:01:45
大数据笔记02:大数据之Hadoop的生态系统和版本

1.Hadoop的生态系统:

(1)图1:

大数据笔记02:大数据之Hadoop的生态系统和版本

(2)图2:

大数据笔记02:大数据之Hadoop的生态系统和版本

图1 和 图2 都是形象说明了Hadoop的生态圈。

2.举例介绍Hadoop生态圈的小工具:

(1)Hive工具(中文意思:小蜜蜂)

利用Hive这个工具,不用编写复杂的Hadoop程序,只需要编写一个SQL语句,Hive就会把你编写的SQL语句转化为Hadoop任务去执行。

这样降低使用Hadoop的门槛。

大数据笔记02:大数据之Hadoop的生态系统和版本

(2)hbase 存储结构化数据的分布式数据库

图1:

大数据笔记02:大数据之Hadoop的生态系统和版本

图2:

大数据笔记02:大数据之Hadoop的生态系统和版本

(3)zookeeper(中文意思:动物管理员)

zookeeper监控Hadoop管理集群的每个节点状态,管理整个集群的配置,维护节点间数据的依次性等等

大数据笔记02:大数据之Hadoop的生态系统和版本

3.Hadoop的版本

Hadoop版本发展到现在已经有很多种,最近的版本是如下:

大数据笔记02:大数据之Hadoop的生态系统和版本

但是版本Version2.xx不太稳定,初学者学习Hadoop最好使用Version1.2