Ubuntu下hadoop环境的搭建(伪分布模式)

时间:2023-03-08 16:29:09
Ubuntu下hadoop环境的搭建(伪分布模式)

Ubuntu下hadoop环境的搭建(伪分布模式)

一、必要资源的下载

1、Java jdk(jdk-8u25-linux-x64.tar.gz)的下载

具体链接为:

http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

2、Hadoop(我们在这里选用hadoop0.20.2.tar.gz)的下载

具体链接为:

http://vdisk.weibo.com/s/zNZl3

二、软件的安装(将下载好的文件放在home文件夹下)

1、Java的安装(解压)

在命令行下输入

sudo tar xzvf jdk-8u25-linux-x64.tar.gz

注意:可能会提示你输入用户密码

Ubuntu下hadoop环境的搭建(伪分布模式)

解压完毕,Java安装完成

2、hadoop的安装(解压)

在命令行输入

sudo tar xzvf hadoop0.20.2.tar.gz

注意:可能会提示你输入用户密码

Ubuntu下hadoop环境的搭建(伪分布模式)

解压完毕,hadoop0.20.2安装完成

3、ssh的安装

在系统联网的情况下,在命令行输入

sudo apt-get install ssh

注意:可能提示输入用户密码

Ubuntu下hadoop环境的搭建(伪分布模式)

4、rsync的安装

在系统联网的情况下,在命令行输入

sudo apt-get install rsync

Ubuntu下hadoop环境的搭建(伪分布模式)

三、环境的配置

1、ssh的配置

ssh需要配置成为免密码登录状态

在命令行输入两句话:

ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

cat ~/.ssh/id_rsa.pub >>~/.ssh/authorized_keys

Ubuntu下hadoop环境的搭建(伪分布模式)

配置完毕,验证ssh是否需要密码,在命令行输入:

ssh localhost

Ubuntu下hadoop环境的搭建(伪分布模式)

以下操作在hadoop-0.20.2文件夹中的conf下进行,在命令行输入 cd Hadoop-0.20.2/conf

如果不能修改下面的文件的话,在home目录下命令行输入:

sudo chmod 777 * -R

以下的文件修改还可以用vi修改不熟悉vi的同学,请先学一下vi操作

以下的文件修改也可以在文件目录直接用gedit打开修改

2、修改hadoop-env.sh中的配置

先找到Java安装目录

Ubuntu下hadoop环境的搭建(伪分布模式)

将JAVA_HOME改成你安装Java JDK的绝对路径

gedit hadoop-env.sh

Ubuntu下hadoop环境的搭建(伪分布模式)

3、修改hadoop核心配置文件core-site.xml

gedit core-site.xml

<configuration>

<property>

<name>fs.default.name</name>

<value>hdfs://localhost:9000</value>

</property>

</configuration>

Ubuntu下hadoop环境的搭建(伪分布模式)

4、修改hadoop中HDFS的配置,修改replication

gedit hdfs-site.xml

<configuration>

<property>

<name>dfs.data.dir</name>

<value>/home/mrchor/hadoop-0.20.2/data</value>

</property>

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

</configuration>

Ubuntu下hadoop环境的搭建(伪分布模式)

5、修改hadoop中MapReduce的配置文件,配置的是JobTracker的地址和端口

gedit mapred-site.xml

<configuration>

<property>

<name>mapred.job.tracker</name>

<value>localhost:9001</value>

</property>

</configuration>

Ubuntu下hadoop环境的搭建(伪分布模式)

四、hadoop的启动

以下操作在hadoop-0.20.2文件夹下进行,在命令行输入:cd hadoop-0.20.2

1、格式化hadoop中的文件系统HDFS

bin/hadoop namenode –format

Ubuntu下hadoop环境的搭建(伪分布模式)

2、启动hadoop环境

bin/start-all.sh

Ubuntu下hadoop环境的搭建(伪分布模式)

五、验证

需要在浏览器中输入localhost:50030和localhost:50070验证hadoop是否安装完成

Ubuntu下hadoop环境的搭建(伪分布模式)

Ubuntu下hadoop环境的搭建(伪分布模式)

至此,hadoop的环境搭建完毕。