HDFS 2中Namenode启动时WebUI的变化

时间:2021-09-15 20:07:16
 
在HDFS1中NameNode启动顺序是这样的:
1. 读取Fsimage文件
2. 读取edit logs文件,逐行执行里面的操作
3. 写checkpoint,生成新的Fsimage(老的Fsimage + editlogs)
4. 进入safe mode,等待datanodes的block reports,直到达到最小的replication数的block百分比才退出
在安全模式期间,client是不能修改namespace信息,也不允许复制blocks,client基本上是被block住的
而且有些问题导致从namenode启动到client能请求request会耗费很长时间
1. 如果editlogs变得很大(比如由于secondary namenode服务挂了,没有及时merge一个比较新的fsimage),导致读入很大的editlogs,执行操作会比较慢
2. 一般fsimage和editlogs的文件都会做raid 1镜像, 在写新的fsimage checkpoint的时候会写多份,这就要求多份都写成功后这个操作才算成功,所以任何一块盘有性能瓶颈,都会导致延迟

另外一个问题是Namenode的Web UI Server是在写checkpoint之后才会启动的,这就导致了如果长时间在startup期间,管理员是无法直观通过WwebUI来看到整个启动进度,只能通过namenode.hadoop.log来看。

不过在2.1.0beta中已经加上了一个feature,能在WebUI上查看NM startup status(
https://issues.apache.org/jira/browse/HDFS-4249),它的做法是将Web UI Server启动放到NM启动顺序的很前面,让用户可以尽早看到。而且在UI上,增加了不同stage的详细信息,包括加载的fsimage在NM节点上的绝对路径,它的文件大小,加载的inode的个数等,在safe mode的时候,也有显示已经收到的block数和block总数的占比,用户能大致估算出退出safe mode的时间。HDFS不仅仅是内部变得更健壮和稳定,在外围的用户体验也在变得越来越棒啊.
 

NM Startup progress:
HDFS 2中Namenode启动时WebUI的变化

除了WebUI,用户还可以wget http://namenode-address:50070/startupProgress ,获取JSON格式StartUp信息
{
"elapsedTime": 35866,
"percentComplete": 1,
"phases": [
{
"name": "LoadingFsImage",
"status": "COMPLETE",
"percentComplete": 1,
"elapsedTime": 165,
"file": "/data/yarn/name/current/fsimage_0000000000000002434",
"size": 22763,
"steps": [
{
"name": "Inodes",
"count": 215,
"total": 215,
"percentComplete": 1,
"elapsedTime": 25
},
{
"name": "DelegationKeys",
"count": 0,
"total": 0,
"percentComplete": 1,
"elapsedTime": 0
},
{
"name": "DelegationTokens",
"count": 0,
"total": 0,
"percentComplete": 1,
"elapsedTime": 0
}
]
},
{
"name": "LoadingEdits",
"status": "COMPLETE",
"percentComplete": 1,
"elapsedTime": 171,
"steps": [
{
"count": 1,
"file": "/data/yarn/name/current/edits_0000000000000002435-0000000000000002435",
"size": 1048576,
"total": 1,
"percentComplete": 1,
"elapsedTime": 15
},
{
"count": 1044,
"file": "/data/yarn/name/current/edits_0000000000000002436-0000000000000003479",
"size": 1048576,
"total": 1044,
"percentComplete": 1,
"elapsedTime": 155
}
]
},
{
"name": "SavingCheckpoint",
"status": "COMPLETE",
"percentComplete": 1,
"elapsedTime": 77,
"steps": [
{
"name": "Inodes",
"count": 299,
"file": "/data/yarn/name",
"total": 299,
"percentComplete": 1,
"elapsedTime": 14
},
{
"name": "DelegationKeys",
"count": 0,
"file": "/data/yarn/name",
"total": 0,
"percentComplete": 1,
"elapsedTime": 0
},
{
"name": "DelegationTokens",
"count": 0,
"file": "/data/yarn/name",
"total": 0,
"percentComplete": 1,
"elapsedTime": 0
}
]
},
{
"name": "SafeMode",
"status": "COMPLETE",
"percentComplete": 1,
"elapsedTime": 35118,
"steps": [
{
"name": "AwaitingReportedBlocks",
"count": 218,
"total": 218,
"percentComplete": 1,
"elapsedTime": 0
}
]
}
]
}
参考jira:

HDFS 2中Namenode启动时WebUI的变化的更多相关文章

  1. web.xml中配置启动时加载的servlet,load-on-starup

    web.xml中配置启动时加载的servlet,load-on-starup 使用servlet来初始化配置文件数据: 在servlet的配置当中,<load-on-startup>1&l ...

  2. HDFS中NameNode启动过程

    移动到hadoop文件目录下 NameNode启动命令:sbin/hadoop-daemon.sh start namenode DataNode启动命令:sbin/hadoop-daemon.sh ...

  3. java中服务器启动时,执行定时任务

    package com.ripsoft.util; import java.util.Calendar; import java.util.Timer; import javax.servlet.Se ...

  4. hadoop中namenode启动失败

    jps发现namenode启动失败 每次开机都要重新格式化一下namenode才可以 其实问题出现自tmp文件上,因为每次开机就会被清空,所以现在我们配置一个tmp文件目录. 如果之前没有配置过,默认 ...

  5. HDFS中namenode启动失败

    1.环境配置: -1.core-site.xml文件 <configuration> <property> <name>fs.defaultFS</name& ...

  6. VSCode 在&period;vscode&sol;launch&period;json中设置启动时的参数

    如下脚本设置启动参数,如题,在.vscode/launch.json文件中,红色部分设置运行参数 { // Use IntelliSense to learn about possible attri ...

  7. VMware中Linux启动时&ast;&ast;&ast;Host SMBus controller not enabled的解决方法

    Ubuntu18.04 64位 1.1如果能进入图形界面 在终端输入sudo su 键入root密码 //切换到root用户 1.2 如果不能进入图形界面,在VMware进入界面时按下shift进入G ...

  8. HDFS中NameNode和Secondary NameNode工作机制

    NameNode工作机制 0)启动概述 Namenode启动时,首先将映像文件(fsimage)载入内存,并执行编辑日志(edits)中的各项操作.一旦在内存中成功建立文件系统元数据的映像,则创建一个 ...

  9. HDFS中NameNode工作机制

    引言 NameNode: 存储元数据 管理整个HDFS集群 DataNode: 存储数据的block SecondaryNameNode: 辅助HDFS完成一些事情 NameNode和Secondar ...

随机推荐

  1. SSIS Destination 组件使用Fast-Load mode出错

    查看一个Package的历史Message 数据,发现 DataFlow Task 经常出错,错误信息的Description是: Description: "While reading c ...

  2. 微信小程序之数据绑定&lpar;五&rpar;

    [未经作者本人允许,请勿以任何形式转载] 前几篇讲述微信小程序开发工具使用.生命周期和事件. 本次讲述微信小程序数据和视图绑定 >>>数据视图绑定 做前端开发的同学,尤其是WEB前端 ...

  3. jQuery原型属性和方法总结

    从大四下学期开始了解jquery源码相关的东西,在回校参加毕业典礼(准确的说是参加补考挂科太多)期间便开始借着<jQuery>内幕学习jquery源码,然后在博客园写笔记也已经两个月了,也 ...

  4. css position属性

    absolute, 屏幕为参照, 但固定在页面上,随页面滚动而动. fixed, 父元素没有指定position属性(或position属性为static时)==>屏幕为参照,固定在屏幕的某个位 ...

  5. AngularJs 简单实现全选,多选操作

    很多时候我们在处理CURD(增删改查)的时候需要实现批量操作数据,这时候就必须使用多选操作. Angular 中实现如下(当然还有很多种比笔者写的更好的方法,这里只是简单的实现.) demo 演示地址 ...

  6. Oracle DBA从小白到入职实战应用

    现如今Oracle依然是RDBMS的王者,在技术上和战略上,Oracle仍然一路高歌猛进,并且全面引领行业迈入了云时代,伴随着12cR2即将在2016年正式发布,学习Oracle之路依旧任重道远,目前 ...

  7. 斐讯K2 V22&period;X&period;X&period;X 新版固件 刷机教程 &lpar;开telnet&comma;安装SSH&comma;adbyby&comma;刷breed&comma;华硕Padavan&rpar;

    源:http://www.right.com.cn/forum/thread-191833-1-1.html 属于我的上一个帖子的升级版,基本属于无脑操作,点击恢复就可以自动刷好breed,浏览上传新 ...

  8. 在SSIS中使用自定义的DLL文件

    原文:在SSIS中使用自定义的DLL文件 步骤1.开发dll(需要签名) using System;using System.Collections.Generic;using System.Text ...

  9. 【转】【Egit】如何将eclipse中的项目上传至Git

    1.下载egit插件 打开Eclipse,git需要eclipse授权,通过网页是无法下载egit的安装包的.在菜单栏依次打开eclipse→help→install new software→add ...

  10. jquery----data使用

    - .data() - .data("key", value) 保存值,value可以是字符串,也可以是数组,也可以是jquery对象- .data("key" ...