#+hadoop相关文章

（十）大数据实战——hadoop常用命令合集及集群启动关停自定义脚本执行脚本构建
时间：2023-04-06 09:53:27
前言本节内容我们主要是总结一下hadoop集群中常用的一些命令，以及通过自定义脚本，实现hadoop集群的启动、停止、状态查询等，便于hadoop集群的使用。正文 hadoop常用命令 hadoop模块命令命令功能start-dfs.sh启动HDFSstop-dfs.sh停止HDFSstar...
标签：大数据 # hadoop 大数据 hadoop
Hbase：报错ERROR: ..hadoop.hbase.Server is not running yet
时间：2023-03-30 12:07:15
今天遇到2个问题 ERROR: ..hadoop.hbase.Server is not running yet ERROR: NoNode for /hbase/master 按照步骤运行zk,hadoop,hbase 然后hbase shell进入查看list 提示：到网上搜了一下，说是ha...
标签：大数据问题整理 hbase hadoop 大数据
图文讲解基于centos虚拟机的Hadoop集群安装，并且使用Mahout实现贝叶斯分类实例（7）
时间：2023-02-25 15:29:10
接下来，我们开启hadoop集群。如果之前打开过Hadoop，可能会发生lock的问题，解决方案：http://blog.csdn.net/caoshichaocaoshichao/article/details/12880335首先HDFS 格式化文件系统： hadoop namenode –fo...
Ubuntu 14.10 下ZooKeeper+Hadoop2.6.0+HBase1.0.0 的HA机群高可用配置
时间：2023-02-25 13:59:38
1 硬件环境Ubuntu 14.10 64位2 软件环境openjdk-7-jdkhadoop 2.6.0zookeeper-3.4.6hbase-1.0.03 机群规划3.1 zookeeper配置-机器结点192.168.1.100 1421-0000192.168.1.106 1421-0...
2.6、CDH 搭建Hadoop在安装(安装CDH和其他软件)
时间：2023-02-24 15:40:59
第6步：安装CDH和其他软件设置Cloudera Manager数据库后，启动Cloudera Manager Server，然后登录Cloudera Manager Admin Console：启动Cloudera Manager Server：RHEL 7兼容：sudo systemctl st...
使用Windows Azure的VM安装和配置CDH搭建Hadoop集群
时间：2023-02-24 15:27:04
本文主要内容是使用Windows Azure的VIRTUAL MACHINES和NETWORKS服务安装CDH (Cloudera Distribution Including Apache Hadoop)搭建Hadoop集群。项目中在私有云中使用CDH (Cloudera Distribution...
大数据测试之hadoop集群配置和测试
时间：2023-02-22 09:03:37
大数据测试之hadoop集群配置和测试一、准备（所有节点都需要做）：系统：Ubuntu12.04java版本：JDK1.7SSH（ubuntu自带）三台在同一ip段的机器，设置为静态IP机器分配：一台master,两台slave主机信息是(hosts文件添加如下信息)：192.168.88.123...
Centos7搭建hadoop3.3.4分布式集群
时间：2023-02-21 14:12:18
目录1、背景2、集群规划2.1 hdfs集群规划2.2 yarn集群规划3、集群搭建步骤3.1 安装JDK3.2 修改主机名和host映射3.3 配置时间同步3.4 关闭防火墙3.5 配置ssh免密登录3.5.1 新建hadoop部署用户3.5.2 配置hadoopdeploy用户到任意一台机器都免...
标签：hadoop
Hadoop 及Spark 分布式HA运行环境搭建
时间：2023-02-21 12:09:29
作者：京东物流秦彪工欲善其事必先利其器，在深入学习大数据相关技术之前，先手动从0到1搭建一个属于自己的本地Hadoop和Spark运行环境，对于继续研究大数据生态圈各类技术具有重要意义。本文旨在站在研发的角度上通过手动实践搭建运行环境，文中不拖泥带水过多讲述基础知识，结合Hadoop和Spar...
Centos7系统编译Hadoop3.3.4
时间：2023-02-20 13:07:03
最近在学习hadoop，此篇文章简单记录一下通过源码来编译hadoop。为什么要重新编译hadoop源码，是因为为了匹配不同操作系统的本地库环境。2、编译源码2.1 下载并解压源码[root@hadoop01 ~]# mkdir /opt/hadoop[root@hadoop01 ~]# cd /o...
标签：hadoop
SLF4J: Hbase和Flume的slf4j-log4j12-x.x.xx.jar与hadoop的slf4j-log4j12-x.x.xx.jar冲突
时间：2023-02-19 13:09:00
SLF4J: Hbase和Flume的slf4j-log4j12-x.x.xx.jar与hadoop的slf4j-log4j12-x.x.xx.jar冲突一、实验环境二、报错信息三、报错分析及解决方案一、实验环境Ubuntu16.04Flume1.7.0Hbase1.1.5H...
标签：jar hbase flume 大数据 Hadoop 大数据 yyds干货盘点
Hadoop JAVA 开发说明
时间：2023-02-18 07:52:33
作为Hadoop程序员，他要做的事情就是：1、定义Mapper，处理输入的Key-Value对，输出中间结果。2、定义Reducer，可选，对中间结果进行规约，输出最终结果。3、定义InputFormat 和OutputFormat，可选，InputFormat将每行输入文件的内容转换为Java类供...
hadoop错误org.apache.hadoop.util.DiskChecker$DiskErrorException Could not find any valid local directory for
时间：2023-02-14 16:03:21
错误： org.apache.hadoop.util.DiskChecker$DiskErrorException: Could not find any valid local directory for 原因：两种可能，hadoop.tmp.dir或者data目录存储空间不足 ...
使用Maven构建Hadoop工程并实现词频统计案例(详细篇)
时间：2023-02-14 12:04:18
使用Maven构建Hadoop工程并实现词频统计案例(详细篇)一、实验环境：Hadoop3.1.3IDEACentOS7.5Maven3.6.3伪分布式二、使用Maven构建Hadoop工程1.解压Maven到自己的安装目录tar -zxvf ./apache-maven-3.6.3-bin.tar...
标签：hadoop maven 大数据 Hadoop 大数据 yyds干货盘点
在虚拟机上配置安装hadoop集群
时间：2023-02-13 19:24:20
原本以为有大神已经总结的很清楚了，就不自己在写了，但是在自己安装的过程中还是出现了一些问题，所以打算以自己的方式重新总结一下。参考https://blog.csdn.net/hliq5399/article/details/78193113完全分布式安装对于hadoop的本地模式，伪分布...
Hadoop集群WordCount运行详解（转）
时间：2023-02-13 10:01:40
原文链接：Hadoop集群（第6期）_WordCount运行详解1、MapReduce理论简介1.1 MapReduce编程模型MapReduce采用"分而治之"的思想，把对大规模数据集的操作，分发给一个主节点管理下的各个分节点共同完成，然后通过整合各个节点的中间结果，得到最终结果。简单地说，Map...
Hadoop中OutputFormat解析
时间：2023-02-12 23:08:25
一、OutputFormatOutputFormat描述的是MapReduce的输出格式，它主要的任务是：1.验证job输出格式的有效性，如：检查输出的目录是否存在。2.通过实现RecordWriter，将输出的结果写到文件系统的文件中。OutputFormat的主要是由三个抽象方法组成，下面根据源...
hadoop调度程序时出现“Error opening job jar”错误
时间：2023-02-12 21:30:57
提示出现的问题：Exception in thread "main" java.io.IOException: Error opening job jar: /home/deploy/recsys/workspace/ouyangyewei/recommender-dm-1.0-SNAPSHOT-l...
Hadoop高可用平台搭建
时间：2023-02-12 17:09:36
文章概览：1、机器规划和预配置2、软件安装3、集群文件配置4、启动集群5、HA验证6、注意事项7、小结机器规划和预配置主机/进程NNDNRMNMZK(QP)ZKFCJNnna√ √ √ √ nns √ √ √ √ dn1 √ √ √ √dn2 √ √ √dn3 √ ...
hadoop集群部署
时间：2023-02-12 05:28:07
1) 安装jdk 下载jdk-6u21-linux-i586.bin 然后修改/etc/profile：export JAVA_HOME=/usr/local/jdkexport CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATHexport PA...

1 2 3 4 5