文章目錄

系統與版本
集群結構
宣告
準備
- 修改hosts和hostname
- 關閉防火墻
- 關閉selinux
- 安裝ntpdate同步服務器時間
- 安裝java
- 添加hadoop用戶
- 設定免密通信
安裝（均使用hadoop用戶）
- 配置環境變數
- 安裝hadoop
- - 修改 core-site.xml
  - 修改 hadoop-env.sh
  - 修改hdfs-site.xml
  - 修改 mapred-site.xml
  - 修改yarn-site.xml
  - 修改workers
  - 修改start-dfs.sh和 stop-dfs.sh檔案
  - start-yarn.sh檔案和 stop-yarn.sh檔案
- 安裝zookeeper
- - 配置zoo.cfg
  - 創建myid
- 安裝hbase
- - 修改配置hbase-env.sh
  - 修改hbase-site.xml
  - 修改regionservers
- 安裝spark
- - 修改組態檔
- 安裝pheonix
- - 復制phoenix的jar包
  - 復制hbase-site.xml
  - 復制core-site.xml hdfs-site.xml
克隆服務器
啟動順序
- 格式化namenode
- master節點啟動hadoop
- 啟動zookeeper
- master節點啟動hbase
- master節點啟動spark
- 啟動phoenix

系統與版本

在vSphere ESXI服務器中安裝大資料集群，系統鏡像為CentOS-7-x86_64-Minimal-1908.iso

版本
CentOS-7-x86_64-Minimal-1908.iso
jdk-8u211-linux-x64
apache-phoenix-5.0.0-HBase-2.0-bin
apache-zookeeper-3.5.5-bin
hadoop-3.1.2
hbase-2.0.5
spark-2.3.3-bin-hadoop2.7

集群結構

	行程
master	NameNode，NodeManager，ResourceManager，journalNode，SecondaryNameNode，QuorumPeerMain，HMaster，HRegionServer
slave1	DataNode，NodeManager，QuorumPeerMain，HRegionServer
slave2	DataNode，NodeManager，QuorumPeerMain，HRegionServer

宣告

借鑒下面這篇博客完成了分布式安裝
大資料環境單點安裝(hadoop,hbase,zookeeper,phoenix,spark)_Sword1996的博客-CSDN博客
此次安裝程序是安裝CentOS-7-x86_64-Minimal后，master節點安裝配置，通過vSphere client克隆master服務器節點后更改各個節點配置實作的，
所以在克隆完后需要修改：

/etc/hostname
/etc/hosts
zookeeper目錄下的/data/myid
spark目錄下的/conf/spark-env.sh 的SPARK_LOCAL_IP

在配置master程序中，注意加入slave1，slave2

準備

此時為root用戶

修改hosts和hostname

需要注意的是，克隆出來的slave1、slave2需要更改、添加成對應內容

vim /etc/hostname
#將localhost更改為master
vim /etc/hosts
#不建議修改127.0.0.1行，需要在后面添加ip映射

關閉防火墻

minimal版本的centos沒有iptables

systemctl stop firewalld.service
systemctl disable firewalld.service

關閉selinux

vim /etc/selinux/config

將SELinux status引數設定為關閉狀態

SELinux status: disabled

安裝ntpdate同步服務器時間

安裝ntpdate

yum install ntpdate -y

測驗是否正常

ntpdate cn.ntp.org.cn

設定定時任務每天自動同步

crontab -e
59 23 * * * ntpdate cn.ntp.org.cn

安裝java

解壓后放至：/usr/local/java/jdk1.8.0_211

vim /etc/profile

將java目錄添加進環境

#java 1.8
JAVA_HOME=/usr/local/java/jdk1.8.0_211
CLASSPATH=.:$JAVA_HOME/lib.tools.jar
PATH=$JAVA_HOME/bin:$PATH
export JAVA_HOME CLASSPATH PATH

source  /etc/profile

添加hadoop用戶

useradd -m hadoop
passwd hadoop  #一直回車不設定密碼，忽略警告
usermod -a -G hadoop hadoop   # 將hadoop用戶移進hadoop用戶組
cat  /etc/group    #查看用戶組

設定免密通信

切換用戶

su hadoop

生成rsa密鑰

ssh-keygen -t rsa

將生成的rsa追加寫入授權檔案

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

給授權檔案權限

chmod 600 ~/.ssh/authorized_keys

對本機ssh測驗(第一次需要密碼)

ssh master

安裝（均使用hadoop用戶）

將下述軟體解壓直/home/hadoop

版本
apache-phoenix-5.0.0-HBase-2.0-bin
apache-zookeeper-3.5.5-bin
hadoop-3.1.2
hbase-2.0.5
spark-2.3.3-bin-hadoop2.7

配置環境變數

vim ~/.bashrc

# User specific aliases and functions
#java 1.8
JAVA_HOME=/usr/local/java/jdk1.8.0_211
CLASSPATH=.:$JAVA_HOME/lib.tools.jar
PATH=$JAVA_HOME/bin:$PATH
export JAVA_HOME CLASSPATH PATH

#hadoop
export HADOOP_HOME=/home/hadoop/hadoop-3.1.2
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

#zookeeper
export ZOOKEEPER_HOME=/home/hadoop/apache-zookeeper-3.5.5-bin
export PATH=.:$HADOOP_HOME/bin:$ZOOKEEPER_HOME/bin:$JAVA_HOME/bin:$PATH

#hbase 
export HBASE_HOME=/home/hadoop/hbase-2.0.5
export PATH=$HBASE_HOME/bin:$PATH

#phoenix
export PHOENIX_HOME=/home/hadoop/apache-phoenix-5.0.0-HBase-2.0-bin
export PHOENIX_CLASSPATH=$PHOENIX_HOME
export PATH=$PATH:$PHOENIX_HOME/bin

#spark
export SPARK_HOME=/home/hadoop/spark-2.3.3-bin-hadoop2.7
export SPARK_CLASSPATH=$SPARK_HOME
export PATH=$PATH:$SPARK_HOME/bin

source ~/.bashrc

安裝hadoop

在目錄/home/hadoop/hadoop-3.1.2/etc/hadoop下：

修改 core-site.xml

<configuration>
    <!-- 指定 namenode 的通信地址 默認 8020 埠 -->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://master:9000/</value>
    </property>

    <!-- 指定 hadoop 運行時產生檔案的存盤路徑 -->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/home/hadoop/hadoop-3.1.2/tmp</value>
    </property>

        <!-- 安裝zookeeper需要，否則不要-->
    <!-- 指定zookeeper地址，clientPort=2181 -->
    <property>
        <name>ha.zookeeper.quorum</name>
        <value>master:2181,slave1:2181,slave2:2181</value>
    </property>
</configuration>

修改 hadoop-env.sh

添加pid檔案生成路徑

export HADOOP_PID_DIR=/home/hadoop/hadoop-3.1.2/tmp/pid

修改hdfs-site.xml

<configuration>
    <!-- namenode 上存盤 hdfs 名字空間元資料-->
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>/home/hadoop/hadoop-3.1.2/namenode</value>
    </property>

    <!-- datanode 上資料塊的物理存盤位置-->  
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>/home/hadoop/hadoop-3.1.2/datanode</value>
    </property>

    <!-- 設定 hdfs 副本數量 -->
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>

</configuration>

修改 mapred-site.xml

<configuration>

    <!-- 指定yarn運行-->
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>

    <property>
        <name>yarn.app.mapreduce.am.env</name>
        <value>HADOOP_MAPRED_HOME=/home/hadoop/hadoop-3.1.2</value>
    </property>

    <property>
        <name>mapreduce.map.env</name>
        <value>HADOOP_MAPRED_HOME=/home/hadoop/hadoop-3.1.2</value>
    </property>

    <property>
        <name>mapreduce.reduce.env</name>
        <value>HADOOP_MAPRED_HOME=/home/hadoop/hadoop-3.1.2</value>
    </property>

</configuration>

修改yarn-site.xml

<configuration>
<!-- Site specific YARN configuration properties -->
    <!-- 指定ResourceManager的地址 -->
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>master</value>
    </property>
    <!-- reducer取資料的方式是mapreduce_shuffle -->  
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>	
	<!-- 安裝zookeeper需要 --> 
	<!-- 指定zk集群地址 --> 
    <property> 
        <name>yarn.resourcemanager.zk-address</name> 
        <value>master:2181,slave1:2181,slave2:2181</value> 
    </property>
</configuration>

修改workers

修改為：

master
slave1
slave2

修改start-dfs.sh和 stop-dfs.sh檔案

這兩個檔案在hadoop-3.1.2/sbin/中，分別在 start-dfs.sh 和 stop-dfs.sh中添加如下內容

HDFS_JOURNALNODE_USER=root
HDFS_ZKFC_USER=hadoop

HDFS_DATANODE_USER=hadoop
HDFS_DATANODE_SECURE_USER=hdfs
HDFS_NAMENODE_USER=hadoop
HDFS_SECONDARYNAMENODE_USER=hadoop

start-yarn.sh檔案和 stop-yarn.sh檔案

這兩個檔案在 hadoop-3.1.2/sbin/ 中，分別在 start-yarn.sh 和 stop-yarn.sh 中添加如下內容

YARN_RESOURCEMANAGER_USER=hadoop
HADOOP_SECURE_DN_USER=yarn
YARN_NODEMANAGER_USER=hadoop

安裝zookeeper

配置zoo.cfg

需要將 $ZOOKEEPER_HOME/conf目錄下的zoo_sample.cfg重命名為 zoo.cfg

cp $ZOOKEEPER_HOME/conf/zoo_sample.cfg $ZOOKEEPER_HOME/conf/zoo.cfg

在zoo.cf里注釋dataDir并添加：

dataDir=/home/hadoop/apache-zookeeper-3.5.5-bin/data 
dataLogDir=/home/hadoop/apache-zookeeper-3.5.5-bin/logs 
server.1=master:2888:3888
server.2=slave1:2888:3888
server.3=slave2:2888:3888

創建myid

zookeeper目錄下創建data檔案夾，并生成myid在data檔案夾中

mkdir data
cd data
echo “1” > myid

slave1中myid為2，slave2中myid為3，注意更改

安裝hbase

修改配置hbase-env.sh

修改 hbase-2.0.5conf目錄下的hbase-env.sh檔案

export JAVA_HOME=/usr/local/java/jdk1.8.0_211
export HBASE_MANAGES_ZK=false

其中HBASE_MANAGES_ZK=false表示我們使用自己安裝zookeeper集群而不是hbase自帶的zookeeper集群

修改hbase-site.xml

修改hbase-2.0.5/conf目錄下的hbase-site.xml檔案

<configuration>
    <property>
        <name>hbase.rootdir</name>
        <value>hdfs://master:9000/hbase</value>
    </property>
    <property>
        <name>hbase.cluster.distributed</name>
        <value>true</value>
    </property>
    <property>
        <name>hbase.zookeeper.quorum</name>
        <value>master,slave1,slave2</value>
    </property>
    <property>
        <name>hbase.zookeeper.property.dataDir</name>
        <value>/home/hadoop/apache-zookeeper-3.5.5-bin/data</value>
    </property>
    <property>
		<name>hbase.unsafe.stream.capability.enforce</name>
		<value>false</value>
	</property>
</configuration>

修改regionservers

修改hbase-2.0.5/conf目錄下的regionservers

vim regionservers

將localhost洗掉，修改為附節點(注意一個節點占一行)

master
slave1
slave2

安裝spark

修改組態檔

在安裝目錄下的conf檔案夾中

將spark-env.sh.template修改為spark-env.sh，并編輯

cp spark-env.sh.template spark-env.sh

vim spark-env.sh

在spark-env.sh中添加(不同的slave中SPARK_LOCAL_IP需要對應的修改)：

SPARK_LOCAL_IP=master                                 #本機ip或hostname
SPARK_MASTER_IP=master                                #master節點ip或hostname
export HADOOP_CONF_DIR=/home/hadoop/hadoop-3.1.2   #hadoop的配置路徑
export YARN_CONF_DIR=/home/hadoop/hadoop-3.1.2     #yarn路徑配置

將slaves.template修改為slaves，并編輯

cp slaves.template slaves

vim slaves

洗掉原有的localhost，添加：

master
slave1
slave2

安裝pheonix

復制phoenix的jar包

復制phoenix的jar包到hbase的lib目錄,jar包就在phoenix目錄下

cp phoenix-core-5.0.0-HBase-2.0.jar phoenix-5.0.0-HBase-2.0-server.jar /home/hadoop/hbase-2.0.5/lib/

復制hbase-site.xml

復制hbase安裝目錄下的conf目錄下hbase-site.xml到phoenix安裝目錄下的bin中：

cp hbase-site.xml /home/hadoop/apache-phoenix-5.0.0-HBase-2.0-bin/bin/

復制core-site.xml hdfs-site.xml

復制 hadoop安裝目錄即/home/hadoop/hadoop-3.1.2/etc/hadoop目錄下的core-site.xml hdfs-site.xml到phoenix安裝目錄下的bin中：

cp core-site.xml hdfs-site.xml /home/hadoop/apache-phoenix-5.0.0-HBase-2.0-bin/bin/

克隆服務器

vSphere Client | 克隆虛擬機_我是一塊小石頭-CSDN博客

所以在克隆完后需要修改：

/etc/hostname # master,slave1,slave2
/etc/hosts # ip master/ip slave1/ip slave2 之類的
zookeeper目錄下的/data/myid # 1,2,3
spark目錄下的/conf/spark-env.sh 的SPARK_LOCAL_IP # 改成對應master,slave1,slave2

啟動順序

格式化namenode

啟動 hadoop 之前在 master 上 format 名稱節點（namenode節點，只需要第一次啟動時進行）

cd $$HADOOP_HOME//bin
hdfs namenode -format

master節點啟動hadoop

start-all.sh

啟動zookeeper

安裝了zookeeper的所有節點啟動zookeeper

zkServer.sh start

master節點啟動hbase

start-hbase.sh

master節點啟動spark

cd $SPARK_HOME/sbin
start-all.sh

啟動phoenix

sqlline.py master,slave1,slave2:2181

可能文章有疏漏，如果有人照著我的博客沒法完成部署，請留言，我有時間會修改相應內容，免得誤人子弟，

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/49069.html

標籤：其他

上一篇：broadcast 出現OOM

下一篇：Application application_1528268043578_0246 finished with failed status

hadoop | 服務器分布式安裝hadoop,hbase,zookeeper,phoenix,spark | 集群啟動順序