hadoop2.5.2学习及实践笔记（四）—— namenode启动过程源码概览

对namenode启动时的相关操作及相关类有一个大体了解，后续深入研究时，再对本文进行补充

>实现类

HDFS启动脚本为$HADOOP_HOME/sbin/start-dfs.sh，查看start-dfs.sh可以看出，namenode是通过bin/hdfs命令来启动

$ vi  start-dfs.sh

# namenodes

NAMENODES=$($HADOOP_PREFIX/bin/hdfs getconf -namenodes)

echo "Starting namenodes on [$NAMENODES]"

"$HADOOP_PREFIX/sbin/hadoop-daemons.sh" \

  --config "$HADOOP_CONF_DIR" \

  --hostnames "$NAMENODES" \

  --script "$bin/hdfs" start namenode $nameStartOpt

#---------------------------------------------------------

查看$HADOOP_HOME/bin/hdfs，可以找到namenode启动所调用的java类。

$ vi bin/hdfs:

if [ "$COMMAND" = "namenode" ] ; then

  CLASS='org.apache.hadoop.hdfs.server.namenode.NameNode'

  HADOOP_OPTS="$HADOOP_OPTS $HADOOP_NAMENODE_OPTS"

>源码查看

按照前文hadoop2.5.2学习及实践笔记（二）——编译源代码及导入源码至 eclipse步骤，源码已经导入到eclipse中，快捷键ctrl+shift+R搜索并打开NameNode.java查看源码

NameNode类中有一个静态代码块，表示在加载器加载NameNode类过程中的准备阶段，就会执行代码块中的代码。HdfsConfiguration的init()方法的方法体是空的，这里的作用是触发对HdfsConfiguration的主动调用，从而保证在执行NameNode类相关调用时，如果HdfsConfiguration类没有被加载和初始化，先触发HdfsConfiguration的初始化过程。

//org.apache.hadoop.hdfs.server.namenode.NameNode.java

static{

     //HdfsConfiguration类init()方法：public static void init() {}

    HdfsConfiguration.init();

}

查看其main方法，可以看出namenode相关操作的主要入口方法是createNameNode(String argv[], Configuration conf)方法。

//org.apache.hadoop.hdfs.server.namenode.NameNode.java

public static void main(String argv[]) throws Exception {

    if (DFSUtil.parseHelpArgument(argv, NameNode.USAGE, System.out, true)) {

      System.exit(0);

    }

    try {

      //打印namenode启动或关闭日志信息

      StringUtils.startupShutdownMessage(NameNode.class, argv, LOG);

     //namenode相关主要操作

      NameNode namenode = createNameNode(argv, null);

      if (namenode != null) {

          //向客户端和datanode提供RPC服务，直到RPC服务器结束运行

        namenode.join();

      }

    } catch (Throwable e) {

      LOG.fatal("Exception in namenode join", e);

      terminate(1, e);

    }

  }

createNameNode方法中通过一个switch语句对不同的命令执行不同的操作。比如搭建环境时格式化文件系统时的操作，可以查看FORMAT分支。

//org.apache.hadoop.hdfs.server.namenode.NameNode.java

public static NameNode createNameNode(String argv[], Configuration conf)

      throws IOException {

    LOG.info("createNameNode " + Arrays.asList(argv));

    if (conf == null)

      conf = new HdfsConfiguration();

    //参数为空时默认： -regular

    StartupOption startOpt = parseArguments(argv);

    if (startOpt == null) {

      printUsage(System.err);

      return null;

    }

    setStartupOption(conf, startOpt);

    switch (startOpt) {

      case FORMAT: {//格式化文件系统，伪分布式环境搭建时调用过namenode -format命令

        boolean aborted = format(conf, startOpt.getForceFormat(),

            startOpt.getInteractiveFormat());

        terminate(aborted ? 1 : 0);

        return null; // avoid javac warning

      }

      case GENCLUSTERID: {

        System.err.println("Generating new cluster id:");

        System.out.println(NNStorage.newClusterID());

        terminate(0);

        return null;

      }

      case FINALIZE: {

        System.err.println("Use of the argument '" + StartupOption.FINALIZE +

            "' is no longer supported. To finalize an upgrade, start the NN " +

            " and then run `hdfs dfsadmin -finalizeUpgrade'");

        terminate(1);

        return null; // avoid javac warning

      }

      case ROLLBACK: {

        boolean aborted = doRollback(conf, true);

        terminate(aborted ? 1 : 0);

        return null; // avoid warning

      }

      case BOOTSTRAPSTANDBY: {

        String toolArgs[] = Arrays.copyOfRange(argv, 1, argv.length);

        int rc = BootstrapStandby.run(toolArgs, conf);

        terminate(rc);

        return null; // avoid warning

      }

      case INITIALIZESHAREDEDITS: {

        boolean aborted = initializeSharedEdits(conf,

            startOpt.getForceFormat(),

            startOpt.getInteractiveFormat());

        terminate(aborted ? 1 : 0);

        return null; // avoid warning

      }

      case BACKUP:

      case CHECKPOINT: {//backupnode和checkpointnode启动

        NamenodeRole role = startOpt.toNodeRole();

        DefaultMetricsSystem.initialize(role.toString().replace(" ", ""));

          //backupnode继承NameNode类，代码最终执行的还是NameNode的构造方法

        return new BackupNode(conf, role);

      }

      case RECOVER: {

        NameNode.doRecovery(startOpt, conf);

        return null;

      }

      case METADATAVERSION: {

        printMetadataVersion(conf);

        terminate(0);

        return null; // avoid javac warning

      }

      default: {

        DefaultMetricsSystem.initialize("NameNode");

          //启动时startOpt=“-regular”，代码执行default分支，通过构造函数返回一个namenode实例

        return new NameNode(conf);
      }

    }

  }

namenode的构造方法

//org.apache.hadoop.hdfs.server.namenode.NameNode.java

 public NameNode(Configuration conf) throws IOException {

    this(conf, NamenodeRole.NAMENODE);

  }

 protected NameNode(Configuration conf, NamenodeRole role)

      throws IOException {

    this.conf = conf;

    this.role = role;

    //获取fs.defaultFS，设置namenode地址

    setClientNamenodeAddress(conf);

    String nsId = getNameServiceId(conf);

    String namenodeId = HAUtil.getNameNodeId(conf, nsId);

    //是否启用HA

    this.haEnabled = HAUtil.isHAEnabled(conf, nsId);

    //HA状态：启用/备用

    state = createHAState(getStartupOption(conf));

    //读取dfs.ha.allow.stale.reads，设置namenode在备用状态时是否允许读操作,默认为false

    this.allowStaleStandbyReads = HAUtil.shouldAllowStandbyReads(conf);

    this.haContext = createHAContext();

    try {

     //联邦环境下，使用该方法配置一系列使用一个逻辑上的nsId组合在一起的namenode

      initializeGenericKeys(conf, nsId, namenodeId);

    //namenode初始化
    initialize(conf);
try {

        haContext.writeLock();

        state.prepareToEnterState(haContext);

        //namenode进入相应状态：active state/backup state/standby state

       state.enterState(haContext);

      } finally {

        haContext.writeUnlock();

      }

    } catch (IOException e) {

      this.stop();

      throw e;

    } catch (HadoopIllegalArgumentException e) {

      this.stop();

      throw e;

    }

  }

namenode初始化方法代码

//org.apache.hadoop.hdfs.server.namenode.NameNode.java

protected void initialize(Configuration conf) throws IOException {

    if (conf.get(HADOOP_USER_GROUP_METRICS_PERCENTILES_INTERVALS) == null) {

      String intervals = conf.get(DFS_METRICS_PERCENTILES_INTERVALS_KEY);

      if (intervals != null) {

        conf.set(HADOOP_USER_GROUP_METRICS_PERCENTILES_INTERVALS,

          intervals);

      }

    }

    //设置权限，根据hadoop.security.authentication获取认证方式及规则

    UserGroupInformation.setConfiguration(conf);

    //登录：如果认证方式为simple则退出该方法

    //否则调用UserGroupInformation.loginUserFromKeytab进行登陆，登陆使用dfs.namenode.kerberos.principal作为用户名

    loginAsNameNodeUser(conf);

    //初始化度量系统，用于度量namenode服务状态

    NameNode.initMetrics(conf, this.getRole());

    StartupProgressMetrics.register(startupProgress);

    if (NamenodeRole.NAMENODE == role) {

      //启动http服务器

      startHttpServer(conf);

    }

    //根据命令对命名空间进行操作，如：前文所述启动时加载本地命名空间镜像和应用编辑日志，在内存中建立命名空间的映像
    loadNamesystem(conf);

    //创建RPC服务器

    rpcServer = createRpcServer(conf);

    if (clientNamenodeAddress == null) {

      // This is expected for MiniDFSCluster. Set it now using

      // the RPC server's bind address.

      clientNamenodeAddress =

          NetUtils.getHostPortString(rpcServer.getRpcAddress());

      LOG.info("Clients are to use " + clientNamenodeAddress + " to access"

          + " this namenode/service.");

    }

    if (NamenodeRole.NAMENODE == role) {

      httpServer.setNameNodeAddress(getNameNodeAddress());

      httpServer.setFSImage(getFSImage());

    }

    pauseMonitor = new JvmPauseMonitor(conf);

    pauseMonitor.start();

    metrics.getJvmMetrics().setPauseMonitor(pauseMonitor);

    //启动活动状态和备用状态的公共服务：RPC服务和namenode的插件程序启动

    startCommonServices(conf);

  }

loadNamesystem(Configuration conf)方法调用FSNamesystem类的loadFromDisk(Configuration conf)。前文提到的，namenode启动时从本地文件系统加载镜像并重做编辑日志，都在此方法中实现。

//org.apache.hadoop.hdfs.server.namenode.FSNamesystem.java

static FSNamesystem loadFromDisk(Configuration conf) throws IOException {

    //必须的编辑日志目录检查

    checkConfiguration(conf);

    //设在NNStorage，并初始化编辑日志目录。NNStorage主要功能是管理namenode使用的存储目录

    FSImage fsImage = new FSImage(conf,

        FSNamesystem.getNamespaceDirs(conf),

        FSNamesystem.getNamespaceEditsDirs(conf));

    //根据指定的镜像创建FSNamesystem对象

    FSNamesystem namesystem = new FSNamesystem(conf, fsImage, false);

    StartupOption startOpt = NameNode.getStartupOption(conf);
    if (startOpt == StartupOption.RECOVER) {

      namesystem.setSafeMode(SafeModeAction.SAFEMODE_ENTER);

    }

    long loadStart = now();

    try {

      //加载镜像、重做编辑日志，并打开一个新编辑文件都在此方法中
      namesystem.loadFSImage(startOpt);
    } catch (IOException ioe) {

      LOG.warn("Encountered exception loading fsimage", ioe);

      fsImage.close();

      throw ioe;

    }

    long timeTakenToLoadFSImage = now() - loadStart;

    LOG.info("Finished loading FSImage in " + timeTakenToLoadFSImage + " msecs");

    NameNodeMetrics nnMetrics = NameNode.getNameNodeMetrics();

    if (nnMetrics != null) {

      nnMetrics.setFsImageLoadTime((int) timeTakenToLoadFSImage);

    }

    return namesystem;

  }

private void loadFSImage(StartupOption startOpt) throws IOException {

    final FSImage fsImage = getFSImage();

    // format before starting up if requested

    if (startOpt == StartupOption.FORMAT) {

      fsImage.format(this, fsImage.getStorage().determineClusterId());// reuse current id

      startOpt = StartupOption.REGULAR;

    }

    boolean success = false;

    writeLock();

    try {

      // We shouldn't be calling saveNamespace if we've come up in standby state.

      MetaRecoveryContext recovery = startOpt.createRecoveryContext();
final boolean staleImage

          = fsImage.recoverTransitionRead(startOpt, this, recovery);
if (RollingUpgradeStartupOption.ROLLBACK.matches(startOpt)) {

        rollingUpgradeInfo = null;

      }

      final boolean needToSave = staleImage && !haEnabled && !isRollingUpgrade();

      LOG.info("Need to save fs image? " + needToSave

          + " (staleImage=" + staleImage + ", haEnabled=" + haEnabled

          + ", isRollingUpgrade=" + isRollingUpgrade() + ")");

      if (needToSave) {

        fsImage.saveNamespace(this);

      } else {

        // No need to save, so mark the phase done.

        StartupProgress prog = NameNode.getStartupProgress();

        prog.beginPhase(Phase.SAVING_CHECKPOINT);

        prog.endPhase(Phase.SAVING_CHECKPOINT);

      }

      // This will start a new log segment and write to the seen_txid file, so

      // we shouldn't do it when coming up in standby state

      if (!haEnabled || (haEnabled && startOpt == StartupOption.UPGRADE)) {
fsImage.openEditLogForWrite();
      }

      success = true;

    } finally {

      if (!success) {

        fsImage.close();

      }

      writeUnlock();

    }

    imageLoadComplete();

  }

hadoop2.5.2学习及实践笔记（四）—— namenode启动过程源码概览的更多相关文章

hadoop2&period;5&period;2学习及实践笔记（二）—— 编译源代码及导入源码至eclipse
生产环境中hadoop一般会选择64位版本,官方下载的hadoop安装包中的native库是32位的,因此运行64位版本时,需要自己编译64位的native库,并替换掉自带native库. 源码包下的 ...
hadoop2&period;5&period;2学习及实践笔记（五）—— HDFS shell命令行常见操作
附:HDFS shell guide文档地址 http://hadoop.apache.org/docs/r2.5.2/hadoop-project-dist/hadoop-common/FileSy ...
hadoop2&period;5&period;2学习及实践笔记（三）—— HDFS概念及体系结构
注:文中涉及的文件路径或配置文件中属性名称是针对hadoop2.X系列,相对于之前版本,可能有改动. 附: HDFS用户指南官方介绍: http://hadoop.apache.org/docs/r2 ...
hadoop2&period;5&period;2学习及实践笔记（六）—— Hadoop文件系统及其java接口
文件系统概述 org.apache.hadoop.fs.FileSystem是hadoop的抽象文件系统,为不同的数据访问提供了统一的接口,并提供了大量具体文件系统的实现,满足hadoop上各种数据访 ...
hadoop2&period;5&period;2学习及实践笔记（一）—— 伪分布式学习环境搭建
软件工具:vmware 10 系统:centOS 6.5 64位 Apache Hadoop: 2.5.2 64位 Jdk: 1.7.0_75 64位安装规划 /opt/softwares ...
kafka原理和实践（四）spring-kafka消费者源码
系列目录 kafka原理和实践(一)原理:10分钟入门 kafka原理和实践(二)spring-kafka简单实践 kafka原理和实践(三)spring-kafka生产者源码 kafka原理和实践( ...
Spring IOC容器启动流程源码解析(四)——初始化单实例bean阶段
目录 1. 引言 2. 初始化bean的入口 3 尝试从当前容器及其父容器的缓存中获取bean 3.1 获取真正的beanName 3.2 尝试从当前容器的缓存中获取bean 3.3 从父容器中查找b ...
【后台管理系统】—— Ant Design Pro入门学习&amp&semi;项目实践笔记（三）
前言:前一篇记录了[后台管理系统]目前进展开发中遇到的一些应用点,这一篇会梳理一些自己学习Ant Design Pro源码的功能点.附:Ant Design Pro 在线预览地址. Dashboard ...
Hadoop源码学习笔记之NameNode启动场景流程四：rpc server初始化及启动
老规矩,还是分三步走,分别为源码调用分析.伪代码核心梳理.调用关系图解. 一.源码调用分析根据上篇的梳理,直接从initialize()方法着手.源码如下,部分代码的功能以及说明,已经在注释阐述了. ...

随机推荐

Linux SVN 搭建(YUM)安装
安装说明系统环境:CentOS安装方式:yum install (源码安装容易产生版本兼容的问题)安装软件:系统自动下载SVN软件 Linux svn服务端配置检查已安装版本 #检查是否安装了低版 ...
动手写一个Remoting接口测试工具（附源码下载）
基于.NET开发分布式系统,经常用到Remoting技术.在测试驱动开发流行的今天,如果针对分布式系统中的每个Remoting接口的每个方法都要写详细的测试脚本,无疑非常浪费时间.所以,我想写一个能自 ...
1&period;2 中国象棋将帅问题进一步讨论与扩展：如何用1个变量实现N重循环&quest;[chinese chess]
[题目] 假设在中国象棋中只剩下将帅两个棋子,国人都知道基本规则:将帅不能出九宫格,只能上下左右移动,不能斜向移动,同时将帅不能照面.问在这样条件下,所有可能将帅位置.要求在代码中只能使用一个字节存储 ...
JavaScipt选取文档元素的方法
摘自JavaScript权威指南(jQuery根据样式选择器查找元素的终极方式是先用getElementsByTagName(*)获取所有DOM元素,然后根据样式选择器对所有DOM元素进行筛选) 选 ...
百度 LBS 开放平台，开发人员众測计划正式启动
Hi各位亲爱滴开发人员: 你是否以前-- 期望第一时间率先接触到百度LBS开放平台的最新功能? 期望被邀请作为最最尊贵的首批试用志愿者感受志愿者的特权? 期望自己的意见被产品经理採纳.优化功能.从 ...
dubbo的简单实现
一是什么一般网站架构随着业务的发展,逻辑越来越复杂,数据量越来越大,交互越来越多,dubbo使前后端分离,完成负载均衡. dubbo架构图节点角色说明: Provider: 暴露服务的服务提供方 ...
NDK 与 JNI 的关系
简介 JNI是java语言提供的Java和C/C++相互沟通的机制,Java可以通过JNI调用本地的C/C++代码,本地的C/C++的代码也可以调用java代码.JNI 是本地编程接口,Java和C/ ...
为你详解Linux安装GCC方法
下载: http://ftp.gnu.org/gnu/gcc/gcc-4.5.1/gcc-4.5.1.tar.bz2浏览: http://ftp.gnu.org/gnu/gcc/gcc-4.5.1/查 ...
[echarts] 同指标对比柱状图
需求:对比课程通过率最高的8个课程和最低的8个课程以及全校的平均通过率 http://echarts.baidu.com/echarts2/doc/example/bar1.html option = ...
Openstack网络相关概念比较复杂，经常使人混淆，本文进行相关说明。
Openstack网络相关概念比较复杂,经常使人混淆,本文进行相关说明. 文中相关术语与缩写英文缩写中文 Virtual Local Area Network VLAN 虚拟局域网 Virtua ...