手把手教你搭建HADOOP集群-有解無憂

準備作業：

準備三臺虛擬機，關閉防火墻，修改他們的主機名，第一臺虛擬機為master 剩下兩臺分別是slave1和slave2，修改hosts檔案修改他們的主機映射，三臺進行免密操作，

基礎配置：

修改主機名

永久修改：vim /etc/hostname

重啟 restart

零時修改: hostnamectl set-hostname name

重繪 bash

關閉防火墻，配置主機映射

1.判斷防火墻是否關閉 systemctl status firewalld

2.關閉防火墻 systemctl stop firewalld ps:我們只需要關閉防火墻即可，三臺都要關閉

3.開啟 systemctl start firewalld

修改host檔案

vim /etc/hosts

ip地址填你們自己的上面的圖的ip地址是我的，

免密登入：

ssh-keygen 生成公鑰之后三次回車

出現這個表示秘鑰生成成功

進行配置免密登入：

ssh-copy-id master #對master進行免密 
ssh-copy-id slave1 #對slave1進行免密 
ssh-copy-id slave2 #對slave2進行免密 
shh localhost #內回環

如果顯示無法找到hostname 就去hosts檔案看一下是不是自己的單詞或者ip寫錯了
或者可以直接使用ssh-copy-id （192.xx.xx.xxx）ip地址 #對指定虛擬機進行免密

第一步安裝JDK

首先解壓檔案jdk壓縮包到指定目錄

tar -zxvf 壓縮包名字 -C 解壓路徑

配置系統環境變數

vim /etc/profile

配置代碼

JAVA_HOME=/usr/java/jdk1.8.0_221

CLASSPATH=$JAVA_HOME/lib

PATH=$PATH:$JAVA_HOME/bin

export JAVA_HOME CLASSPATH PATH

分發給slave1 slave2-

分發命令：
scp -r /分發的檔案夾路徑地址 分發ip地址或者主機名:/上一級路徑地址



示例代碼：
scp -r /usr/java/ slave1:/usr/ 
scp -r /usr/java/ slave2:/usr/

 分發系統變數 
scp -r /etc/profile/ slave1:/etc/
scp -r /etc/profile/ slave2:/etc/

JDK分發過去之后，環境變數也要記得分發過去，

在另外兩個節點

source /etc/profile

之后查看是否配置成功

java -version

出現版本號則配置成功

HADOOP集群搭建：

解壓檔案jdk壓縮包到指定路徑

示例代碼： tar -zxvf hadoop-2.7.7.tar.gz -C /usr/hadoop/

配置hadoop系統環境變數

vim /etc/profile

配置系統環境變數代碼

#hadoop 
export HADOOP_HOME=/usr/hadoop/hadoop-2.7.7
export CLASSPATH=$CLASSPATH:$HADOOP_HOME/lib 
export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin

上面是我的hadoop安裝地址 HADOOP_HOME的安裝路徑需要替換成你自己hadoop安裝目錄

source /etc/profile

查看服務

hadoop version

來到組態檔目錄下

cd /usr/hadoop/hadoop-2.7.7/etc/hadoop/

cd 進入你安裝的hadoop的目錄/etc/hadoop/

然后可以ls 查看下面的檔案

1.編輯hadoop-env.sh檔案

往里面添加java_home就行了，可以在環境變數里面復制過來 /etc/profile

export JAVA_HOME=/usr/java/jdk1.8.0_221

2.vim yarn-evn.sh

同樣添加java_home進去

export JAVA_HOME=/usr/java/jdk1.8.0_221

3.設定全域引數，指定NN的IP為master，埠為9000

vim core-site.xml

<property>
  <name>fs.default.name</name>
   <value>hdfs://master:9000</value>
</property>
<property>
  <name>hadoop.tmp.dir</name>
   <value>/usr/hadoop/hadoop-2.7.7/hdfs/tmp</value>
</property>

4.設定HDFS引數

vim hdfs-site.xml

<configuration>
<property>
  <name>dfs.replication</name>
   <value>2</value>
</property>
<property>
  <name>dfs.namenode.name.dir</name>
   <value>file:/root/hadoopData/name</value>
</property>
<property>
  <name>dfs.datanode.data.dir</name>
   <value>file:/root/hadoopData/data</value>
</property>
</configuration>

5.配置yarn核心引數'

vim yarn-site.xml

<configuration>
<property>
  <name>yarn.resourcemanager.admin.address</name>
   <value>master:18141</value>
</property>
<property>
  <name>yarn.nodemanager.aux-services</name>
   <value>mapreduce_shuffle</value>
</property>
<!-- Site specific YARN configuration properties -->
</configuration>

6 vim mapred-site.xml 這個檔案只有模板檔案

需要cp mapred-site.xml.template mapred-site.xml

然后編輯剛剛cp過的檔案

<configuration>
<property>
  <name>mapreduce.framework.name</name>
   <value>yarn</value>
</property>
</configuration>

7.編輯slaves檔案

往里面添加另外兩個虛擬機的主機名，如果主機名沒有配置好可以輸入另外兩臺的ip地址

slave1
slave2

8.編輯master檔案

添加主節點虛擬機的名字進去就好了，

master

9.分發集群，系統環境變數到slave1 slave2

ps：分發hadoop過去同時也要分發環境變數過去，另外兩臺別忘記source一下，

10.初始化hadoop 在master節點

初始化命令為： hadoop namenode -format

11.啟動集群查看節點

start-all.sh

然后可以輸入jps命令查看節點看看是否啟動成功，

可以在瀏覽器輸入

192.xxx.xxx.xx (你的master節點的ip地址):/50070 進入web頁面

示例代碼：192.168.10.100:50070

如果進不去則是沒有關閉防火墻，或者節點沒有開啟，節點開不起來可以重新輸入啟動命令，如果還是起不來，則要去檢查hadoop的組態檔是否寫正確，這東西熟能生巧，多搭建就好了，嘿嘿，到此教程結束了，小編第一次發教程可能寫的不是太好，請多多擔待，

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/438674.html

標籤：其他

上一篇：Flink學習中之time、watermark、state

下一篇：Elasticsearch到底是什么？