Hadoop 新生报道(三) hadoop基础概念

时间:2024-05-22 22:07:44

  一.NameNode,SeconderyNamenode,DataNode

  NameNode,DataNode,SeconderyNamenode都是进程,运行在节点上。

  1.NameNode:hadoop的主节点, 保存HDFS的元数据信息

Hadoop 新生报道(三) hadoop基础概念

     1.fsimage - 它是在NameNode启动时对整个文件系统的快照
     2.edit logs - 它是在NameNode启动后,对文件系统的改动序列
  2.SeconderyNamenode:  职责是合并NameNode的edit logs到fsimage文件中,帮助NameNode
   Hadoop 新生报道(三) hadoop基础概念

  3.DataNode : 响应来自 HDFS 客户机的读写请求。它们还响应来自 NameNode 的创建、删除和复制块的命令。NameNode 依赖来自每个 DataNode 的定期心跳(heartbeat)消息。每条消息都包含一个块报告,NameNode 可以根据这个报告验证块映射和其他文件系统元数据。如果 DataNode 不能发送心跳消息,NameNode 将采取修复措施,重新复制在该节点上丢失的块。

  一.HDFS相关概念  

  1.HDFS : Hadoop分布式文件系统(Hadoop Distributed File System)
  2.数据块:存储时为了方便传输和提高容错率,把文件分为多个数据块,hadoop1.x 是64M,hadoop2.x 是128M
  3.复制因子:hdfs文件会在多个节点进行备份,默认数量为3(现在配置的是伪分布式,只有一个)
        在hdfs-site.xml 中配置
  <property>
          <name>dfs.replication</name>
        <value>1</value>  
  </property>
  4.fsimage文件: FSImage文件是HDFS中名字节点NameNode上文件/目录元数据在特定某一时刻的持久化存储文件。
  5.edits文件: 操作日志文件,由NameNode或者SeconderyNamenode读取对fsimage文件进行更改
  6.安全模式: 安全模式是hadoop的一种保护机制,用于保证集群中的数据块的安全性。
  当集群启动的时候,会首先进入安全模式。当系统处于安全模式时会检查数据块的完整性。
  这时,不允许客户端进行任何修改文件的操作,包括上传文件,删除文件,重命名,创建文件夹等操作。
  正常情况下,安全模式会运行一段时间自动退出的,只需要我们稍等一会就行了,到底等多长时间呢,我们可以通过50070端口查看安全模式退出的剩余时间

  

  三.常见HDFS shell命令

  1.查看目录 hadoop fs -ls hdfs目录(根目录为 /)
  2.创建目录 hadoop fs -mkdir -p hdfs路径 (-p是可以创建多级目录)
  3.删除目录 hadoop fs -rmdir hdfs目录 (只能删除空目录)
  4.删除文件 hadoop fs -rm -r hdfs路径 (加-r可循环删除非空目录)
  5.上传文件 hadoop fs -put 文件在本机的路径  hdfs路径
  6.下载文件 hadoop fs -get 文件在hdfs路径  文件在本机要放置的路径
  7.查看文件 hadoop fs -cat 文件在hdfs的路径
  8.查看健康模式 hdfs dfsadmin -safemode get