參考自：大資料技能競賽之hadoop完全分布式集群搭建（三）

練習內容：

安裝并配置Hadoop相關環境；
相關組態檔，并確定master為namenode，slave1和slave2為datanode；
配置Yarn運行環境；
設定Yarn核心引數；
格式化HDFS，開啟Hadoop完全分布式集群，

1. 將對應軟體包解壓到指定路徑/usr/hadoop：

在master、slave1、slave2上操作以下三個步驟:

創建 /usr/hadoop 目錄： mkdir /usr/hadoop
切換至hadoop安裝包所在目錄： cd /usr/package/
解壓縮至指定路徑：tar -zxvf hadoop-2.7.3.tar.gz -C /usr/hadoop

2. 配置Hadoop環境變數

在master、slave1、slave2上操作:

vim /etc/profile

=== 添加以下內容 ===

#HADOOP_HOME
export HADOOP_HOME=/usr/hadoop/hadoop-2.7.3
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

使檔案生效：source /etc/profile

3. 配置Hadoop運行環境hadoop-env.sh

在master、slave1、slave2上操作:

切換至Hadoop環境目錄：cd /usr/hadoop/hadoop-2.7.3/etc/hadoop
修改hadoop-env.sh內容: vim hadoop-env.sh
將第25行處修改為當前的JAVA_HOME路徑（集群基礎配置中JAVA_HOME路徑）：

	export JAVA_HOME=/usr/java/jdk1.8.0_171

在這里插入圖片描述

4. 設定全域引數，指定NN（NameNode）的IP為master（映射名），埠為9000：

在master、slave1、slave2上操作:

修改 core-site.xml 檔案（還是在 /usr/hadoop/hadoop-2.7.3/etc/hadoop 路徑下）

vim core-site.xml

在<configuration></configuration>中添加如下內容

<!-- 配置NameNode節點的地址和埠號 -->
<property>
	<name>fs.default.name</name>
	<value>hdfs://master:9000</value>
</property>

在這里插入圖片描述

5. 指定存放臨時資料的目錄為hadoop安裝目錄下/hdfs/tmp(絕對路徑):

在master、slave1、slave2上操作:

還是修改 core-site.xml 檔案，

vim core-site.xml

（hadoop安裝目錄： /usr/hadoop/hadoop-2.7.3）

在<configuration></configuration>中添加如下內容：

<!-- 指定存放臨時資料的目錄 -->
<property>
	<name>hadoop.tmp.dir</name>
	<value>/usr/hadoop/hadoop-2.7.3/hdfs/tmp</value>
</property>

在這里插入圖片描述

6. 設定HDFS引數：

在master、slave1、slave2上操作:

修改 hdfs-site.xml 檔案以設定HDFS引數：

vim hdfs-site.xml

指定備份文本數量為2：

<!-- 指定備份文本數量 -->
<property>
	<name>dfs.replication</name>
	<value>2</value>
</property>

指定NameNode存放元資料資訊路徑為hadoop目錄下/hdfs/name:

<!-- 指定NameNode存放元資料資訊路徑 -->
<property>
	<name>dfs.namenode.name.dir</name>
	<value>file:/usr/hadoop/hadoop-2.7.3/hdfs/name</value>
</property>

指定DataNode存放元資料資訊路徑為hadoop安裝目錄下/hdfs/data:

<!-- 指定DataNode存放元資料資訊路徑 -->
<property>
	<name>dfs.datanode.data.dir</name>
	<value>file:/usr/hadoop/hadoop-2.7.3/hdfs/data</value>
</property>

在這里插入圖片描述

7. 設定YARN運行環境：

在master、slave1、slave2上操作:

vim yarn-env.sh

修改yarn-env.sh中的第23行為JAVA_HOME路徑：

export JAVA_HOME=/usr/java/jdk1.8.0_171

在這里插入圖片描述

8. 設定YARN核心引數，指定ResourceManager行程所在主機為master，埠為18141：

在master、slave1、slave2上操作:

vim yarn-site.xml

在<configuration></configuration>中添加如下內容：

<!-- 指定ResourceManager行程所在主機 -->
<property>
	<name>yarn.resourcemanager.admin.address</name>
	<value>master:18141</value>
</property>

在這里插入圖片描述

9. 設定YARN核心引數，指定NodeManager上運行的附屬服務為shuffle：

在master、slave1、slave2上操作:

vim yarn-site.xml

在<configuration></configuration>中添加如下內容：

<!-- 指定NodeManager上運行的附屬服務 -->
<property>
	<name>yarn.nodemanager.aux-services</name>
	<value>mapreduce_shuffle</value>
</property>

在這里插入圖片描述

10. 設定計算框架引數，指定MR運行在yarn上：

在master、slave1、slave2上操作:

Hadoop集群中沒有mapred-site.xml這個檔案，因此需要把mapred-site.xml.template復制為mapred-site.xml

cp mapred-site.xml.template mapred-site.xml
vim mapred-site.xml

在<configuration></configuration>中添加如下內容：

<!-- 指定MR運行在yarn上 -->
<property>
	<name>mapreduce.framework.name</name>
	<value>yarn</value>
</property>

在這里插入圖片描述

11. 設定節點檔案，要求master為主節點； slave1、slave2為子節點：

在master、slave1、slave2上操作:

還是在 /usr/hadoop/hadoop-2.7.3/etc/hadoop 路徑下，修改master、slaves檔案：

vim master

=== 寫入 ===

master

vim slaves

=== 寫入 ===

slave1
slave2

在這里插入圖片描述

12. 檔案系統格式化：

在master上操作：

hadoop namenode -format

出現以下界面即代表格式化成功：
在這里插入圖片描述

13. 啟動Hadoop集群：

在master上操作：

start-all.sh start

然后輸入 yes 即可啟動：
在這里插入圖片描述

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/319660.html

標籤：其他

上一篇：list構建資料庫父子關系

下一篇：三分鐘實作 Spring Boot 集成 RabbitMQ，實作訊息佇列服務

大資料分析師實操練習（Hadoop完全分布式集群搭建）

練習內容：

1. 將對應軟體包解壓到指定路徑/usr/hadoop：

2. 配置Hadoop環境變數

3. 配置Hadoop運行環境hadoop-env.sh

4. 設定全域引數，指定NN（NameNode）的IP為master（映射名），埠為9000：

5. 指定存放臨時資料的目錄為hadoop安裝目錄下/hdfs/tmp(絕對路徑):

6. 設定HDFS引數：

7. 設定YARN運行環境：

8. 設定YARN核心引數，指定ResourceManager行程所在主機為master，埠為18141：

9. 設定YARN核心引數，指定NodeManager上運行的附屬服務為shuffle：

10. 設定計算框架引數，指定MR運行在yarn上：

11. 設定節點檔案，要求master為主節點； slave1、slave2為子節點：

12. 檔案系統格式化：

13. 啟動Hadoop集群：