解決Hadoop HA集群 NameNode 無法自動故障轉移(切換active)
在學習 HA 自動化配置,按照hadoop官網:https://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html 配置,最后所有的節點都啟動正常,
用 kill -9 行程號 殺死了當前處于active狀態的NameNode后,其他的 Standby 狀態的NameNode 并沒有自動切換為 Active狀態,而且重啟殺死的 NameNode 后,可能出現所有NameNode節點都變成了 Standby狀態的情況,一個Active狀態的都沒有,
查看日志:${HADOOP_HOME}/logs/hadoop-root-zkfc-hadoop2.log ,發現報錯了
2020-01-03 19:21:13,636 WARN org.apache.hadoop.ha.FailoverController: Unable to gracefully make NameNode at hadoop3/192.168.137.13:8020 standby (unable to connect)
java.net.ConnectException: Call From hadoop2/192.168.137.12 to hadoop3:8020 failed on connection exception: java.net.ConnectException: 拒絕連接; For more details see: http://wiki.apache.org/hadoop/ConnectionRefuse
at sun.reflect.GeneratedConstructorAccessor8.newInstance(Unknown Source
at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45)
at java.lang.reflect.Constructor.newInstance(Constructor.java:423
at org.apache.hadoop.net.NetUtils.wrapWithMessage(NetUtils.java:792)
這是因為沒有 fuster 程式,導致無法進行 fence,根據官網上的配置,是在 hdfs-ite.xml 中配置過相關配置:
<property>
<name>dfs.ha.fencing.methods</name>
<value>sshfence</value>
</property>
解決方法:安裝包含fuster程式的軟體包Psmisc(每個機器上都要安裝):
yum -y install psmisc
轉載請註明出處,本文鏈接:https://www.uj5u.com/caozuo/249270.html
標籤:Linux
