[atguigu@hadoop102 hadoop-3.1.3]$
hdfs dfsadmin -refreshNodes
Refresh nodes successful
9
)在
web
瀏覽器上查看
DN
,
http://hadoop102:9870/dfshealth.html#tab-datanode
服役新服務器
1
)需求
隨著公司業務的增長,資料量越來越大,原有的資料節點的容量已經不能滿足存盤資料
的需求,需要在原有集群基礎上動態添加新的資料節點,
2
)環境準備
(
1
)在
hadoop100
主機上再克隆一臺
hadoop105
主機
(2)修改
IP
地址和主機名稱
(3)
拷貝
hadoop102
的
/opt/module
目錄和
/etc/profile.d/my_env.sh
到
hadoop105

(4)洗掉 hadoop105 上 Hadoop 的歷史資料,data 和 log 資料
[atguigu@hadoop105 hadoop-3.1.3]$ rm -rf data/ logs/
(5)配置
hadoop102
和
hadoop103
到
hadoop105
的
ssh
無密登錄
[atguigu@
hadoop102
.ssh]$ ssh-copy-id hadoop105
[atguigu@
hadoop103
.ssh]$ ssh-copy-id hadoop105
3
)服役新節點具體步驟
(
1
)直接啟動
DataNode
,即可關聯到集群

4)在白名單中增加新服役的服務器
(
1
)在白名單
whitelist
中增加
hadoop104
、
hadoop105
,并重啟集群
[atguigu@hadoop102 hadoop]$ vim whitelist
修改為如下內容
hadoop102
hadoop103
hadoop104
hadoop105
(2)分發
[atguigu@hadoop102 hadoop]$ xsync whitelist
(3)重繪
NameNode
[atguigu@hadoop102 hadoop-3.1.3]$
hdfs dfsadmin -refreshNodes
Refresh nodes successful
5
)在
hadoop105
上上傳檔案
[atguigu@hadoop105 hadoop-3.1.3]$ hadoop
fs
-put
/opt/module/hadoop-3.1.3/LICENSE.txt /
服務器間資料均衡
1
)企業經驗:
在企業開發中,如果經常在
hadoop102
和
hadoop104
上提交任務,且副本數為
2
,由于
資料本地性原則,就會導致
hadoop102
和
hadoop104
資料過多,
hadoop103
存盤的資料量小,
另一種情況,就是新服役的服務器資料量比較少,需要執行集群均衡命令
2)開啟資料均衡命令:
[atguigu@hadoop105 hadoop-3.1.3]$ sbin/start-balancer.sh -
threshold 10
對于引數
10
,代表的是集群中各個節點的磁盤空間利用率相差不超過
10%
,可根據實
際情況進行調整,
3
)停止資料均衡命令:
[atguigu@hadoop105 hadoop-3.1.3]$ sbin/stop-balancer.sh
注意:由于
HDFS
需要啟動單獨的
Rebalance Server
來執行
Rebalance
操作,所以盡量
不要在
NameNode
上執行
start-balancer.sh
,而是找一臺比較空閑的機器,
4.4
黑名單退役服務器
黑名單:表示在黑名單的主機
IP
地址不可以,用來存盤資料,
企業中:配置黑名單,用來退役服務器,
黑名單配置步驟如下:
1
)編輯
/opt/module/hadoop-3.1.3/etc/hadoop
目錄下的
blacklist
檔案
[atguigu@hadoop102 hadoop] vim blacklist
添加如下主機名稱(要退役的節點)
hadoop105
注意:如果白名單中沒有配置,需要在
hdfs-site.xml
組態檔中增加
dfs.hosts
配置引數
2
)分發組態檔
blacklist
,
hdfs-site.xml
[atguigu@hadoop104 hadoop]$ xsync hdfs-site.xml blacklist
3
)第一次添加黑名單必須重啟集群,不是第一次,只需要重繪
NameNode
節點即可
[atguigu@hadoop102 hadoop-3.1.3]$
hdfs dfsadmin -refreshNodes
Refresh nodes successful
4
)檢查
Web
瀏覽器,退役節點的狀態為
decommission in progress
(退役中),說明資料
節點正在復制塊到其他節點
5
)等待退役節點狀態為
decommissioned
(所有塊已經復制完成),停止該節點及節點資源
管理器,注意:如果副本數是
3
,服役的節點小于等于
3
,是不能退役成功的,需要修改
副本數后才能退役
6)如果資料不均衡,可以用命令實作集群的再平衡
[atguigu@hadoop102 hadoop-3.1.3]$ sbin/start-balancer.sh -
threshold 10