主頁 > 軟體設計 > HDFS 集群的機架感知

HDFS 集群的機架感知

2021-03-06 10:21:21 軟體設計

HDFS 集群的機架感知

  • 1、背景
    • 1.1、Hadoop 的設計目的
    • 1.2、Hadoop 的設計考慮
    • 1.3、副本存放策略
  • 2、配置機架感知
    • 2.1、修改組態檔 core-site.xml
    • 2.2、驗證機架感知
  • 3、補充
    • 3.1、增加 datanode 節點
    • 3.2、節點間距離計算
  • 4、學習內容

1、背景

1.1、Hadoop 的設計目的

解決海量大檔案的處理問題,主要指大資料的存盤和計算問題,
其中,HDFS 解決資料的存盤問題;MapReduce 解決資料的計算問題,

1.2、Hadoop 的設計考慮

設計分布式的存盤和計算解決方案架構在廉價的集群之上,所以,服務器節點出現宕機的情況是常態,資料的安全是重要考慮點,HDFS 的核心設計思路就是對用戶存進 HDFS 里的所有資料都做冗余備份,以此保證資料的安全,

那么 Hadoop 在設計時考慮到資料的安全,資料檔案默認在 HDFS 上存放三份,顯然,這三份副本肯定不能存盤在同一個服務器節點,那怎么樣的存盤策略能保證資料既安全也能保證資料的存取高效呢?

1.3、副本存放策略

HDFS 分布式檔案系統的內部有一個副本存放策略:以默認的副本數=3 為例:
(1)第一個副本塊存本機;
(2)第二個副本塊存跟本機同機架內的其他服務器節點;
(3)第三個副本塊存不同機架的一個服務器節點上;

好處:
(1)如果本機資料損壞或者丟失,那么客戶端可以從同機架的相鄰節點獲取資料,速度肯定要比跨機架獲取資料要快,
(2)如果本機所在的機架出現問題,那么之前在存盤的時候沒有把所有副本都放在一個機架內,這就能保證資料的安全性,此種情況出現,就能保證客戶端也能取到資料,

HDFS 為了降低整體的網路帶寬消耗和資料讀取延時,HDFS 集群一定會讓客戶端盡量去讀取近的副本,那么按照以上頭解釋的副本存放策略的結果:
(1)如果在本機有資料,那么直接讀取;
(2)如果在跟本機同機架的服務器節點中有該資料塊,則直接讀取;
(3)如果該 HDFS 集群跨多個資料中心,那么客戶端也一定會優先讀取本資料中心的資料,

但是 HDFS 是如何確定兩個節點是否是統一節點,如何確定的不同服務器跟客戶端的遠近呢?答案就是機架感知,!!!!

在默認情況下,HDFS 集群是沒有機架感知的,也就是說所有服務器節點在同一個默認機架中,那也就意味著客戶端在上傳資料的時候,HDFS 集群是隨機挑選服務器節點來存盤資料塊的三個副本的,

那么假如,datanode1 和 datanode3 在同一個機架 rack1,而 datanode2 在第二個機架 rack2,那么客戶端上傳一個資料塊 block_001,HDFS 將第一個副本存放在 dfatanode1,第二個副本存放在 datanode2,那么資料的傳輸已經跨機架一次(從 rack1 到 rack2),然后 HDFS 把第三個副本存 datanode3,此時資料的傳輸再跨機架一次(從 rack2 到 rack1),顯然,當 HDFS 需要處理的資料量比較大的時候,那么沒有配置機架感知就會造成整個集群的網路帶寬的消耗非常嚴重,

下圖是沒有配置機架感知的 HDFS 集群拓撲:
在這里插入圖片描述

2、配置機架感知

2.1、修改組態檔 core-site.xml

給 NameNode 節點的 core-site.xml 組態檔增加一項配置:

<property>
	<name>topology.script.file.name</name>
	<value>/home/hadoop/apps/hadoop-2.6.5/etc/hadoop/topology.sh</value>
</property>

這個配置項的 value 通常是一個執行檔案,該執行檔案是一個 shell 腳本 topology.sh,該腳本接收一個引數,輸出一個值,
接收的引數:datanode 節點的 IP 地址,比如:192.168.123.102
輸出值:datanode 節點所在的機架配置資訊,比如:/switch1/rack1

Namenode 啟動時,會判斷該配置選項是否為空,如果非空,則表示已經啟用機架感知的配置,此時 namenode 會根據配置尋找該腳本,并在接收到每一個 datanode 的 heartbeat(心跳) 時,將該 datanode 的 ip 地址作為引數傳給該腳本運行,并將得到的輸出作為該 datanode 所屬的機架 ID,保存到記憶體的一個 map 中,

至于腳本的撰寫,就需要將真實的網路拓樸和機架資訊了解清楚后,通過該腳本能夠將機器的 ip 地址和機器名正確的映射到相應的機架上去,一個簡單的實作如下:

#!/bin/bash
HADOOP_CONF=/home/hadoop/apps/hadoop-2.6.5/etc/hadoop
while [ $# -gt 0 ] ;
do
	nodeArg=$1
	exec<${HADOOP_CONF}/topology.data
	result=""
	while read line
	do
		ar=( $line )
		if [ "${ar[0]}" = "$nodeArg" ]||[ "${ar[1]}" = "$nodeArg" ]
		then
			result="${ar[2]}"
		fi
	done
	shift
	if [ -z "$result" ]
	then
		echo -n "/default-rack"
	else
		echo -n "$result"
	fi
done

那么通過閱讀腳本內容知道,我們需要準備一個 topology.data 的檔案,topology.data 的內容如下:

192.168.123.102 hadoop02 /switch1/rack1
192.168.123.103 hadoop03 /switch1/rack1
192.168.123.104 hadoop04 /switch2/rack2
192.168.123.105 hadoop05 /switch2/rack2

其中 switch 表示交換機,rack 表示機架,

需要注意的是,在 Namenode 上,該檔案中的節點必須使用 IP,使用主機名無效,而 ResourceManager 上,該檔案中的節點必須使用主機名,使用 IP 無效,所以,最好 IP 和主機名都配上,
**
注意:以上兩個檔案都需要添加可執行權限

chmod 777 topology.data topology.sh

**

2.2、驗證機架感知

以上配置做好之后,啟動集群,啟動完集群之后,在使用命令:

hdfs dfsadmin -printTopology

查看整個集群的拓撲圖:
在這里插入圖片描述

3、補充

3.1、增加 datanode 節點

增加 datanode 節點,不需要重啟 namenode,
非常簡單的做法:
在 topology.data 檔案中加入新加 datanode 的資訊,然后啟動起來就 OK,

3.2、節點間距離計算

有了機架感知,NameNode就可以畫出下圖所示的datanode網路拓撲圖,D1,R1都是交換機,最底層是 datanode,則 H1 的 rackid=/D1/R1/H1,H1 的 parent 是 R1,R1 的是 D1,這些 rackid 資訊可以通過 topology.script.file.name 配置,有了這些 rackid 資訊就可以計算出任意兩臺 datanode 之間的距離,得到最優的存放策略,優化整個集群的網路帶寬均衡以及資料最優分配,

計算結果:
distance(/D1/R1/H1,/D1/R1/H1)=0 相同的 datanode
distance(/D1/R1/H1,/D1/R1/H2)=2 同一 rack 下的不同 datanode
distance(/D1/R1/H1,/D1/R2/H4)=4 同一 IDC 下的不同 datanode
distance(/D1/R1/H1,/D2/R3/H7)=6 不同 IDC 下的 datanode

4、學習內容

上節學習內容:Hadoop2.7.5 高可用(HA)集群搭建
下節學習內容:Hive 基本概念(特點,架構,資料存盤,OLTP,OLAP)

轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/266651.html

標籤:其他

上一篇:Java微服務面試題:SpringCloud+Eureka快速搭建微服架構

下一篇:GO語言學習—基礎概念

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 面試突擊第一季,第二季,第三季

    第一季必考 https://www.bilibili.com/video/BV1FE411y79Y?from=search&seid=15921726601957489746 第二季分布式 https://www.bilibili.com/video/BV13f4y127ee/?spm_id_fro ......

    uj5u.com 2020-09-10 05:35:24 more
  • 第三單元作業總結

    1.前言 這應該是本學期最后一次寫作業總結了吧。總體來說,對作業的節奏也差不多掌握了,作業做起來的效率也更高了。雖然和之前的作業一樣,作業中都要用到新的知識,但是相比之前,更加懂得了如何利用工具以及資料。雖然之間卡過殼,但總體而言,這幾次作業還算完成的比較好。 2.作業程序總結 相比前兩個單元,此單 ......

    uj5u.com 2020-09-10 05:35:41 more
  • 北航OO(2020)第四單元博客作業暨課程總結博客

    北航OO(2020)第四單元博客作業暨課程總結博客 本單元作業的架構設計 在本單元中,由于UML圖具有比較清晰的樹形結構,因此我對其中需要進行查詢操作的元素進行了包裝,在樹的父節點中存盤所有孩子的參考。考慮到性能問題,我采用了快取機制,一次查詢后盡可能快取已經遍歷過的資訊,以減少遍歷次數。 本單元我 ......

    uj5u.com 2020-09-10 05:35:48 more
  • BUAA_OO_第四單元

    一、UML決議器設計 ? 先看下題目:第四單元實作一個基于JDK 8帶有效性檢查的UML(Unified Modeling Language)類圖,順序圖,狀態圖分析器 MyUmlInteraction,實際上我們要建立一個有向圖模型,UML中的物件(元素)可能與同級元素連接,也可與低級元素相連形成 ......

    uj5u.com 2020-09-10 05:35:54 more
  • 6.1邏輯運算子

    邏輯運算子 1. && 短路與 運算式1 && 運算式2 01.運算式1為true并且運算式2也為true 整體回傳為true 02.運算式1為false,將不會執行運算式2 整體回傳為false 03.只要有一個運算式為false 整體回傳為false 2. || 短路或 運算式1 || 運算式2 ......

    uj5u.com 2020-09-10 05:35:56 more
  • BUAAOO 第四單元 & 課程總結

    1. 第四單元:StarUml檔案決議 本單元采用了圖模型決議UML。 UML檔案可以抽象為圖、子圖、邊的邏輯結構。 在實作中,圖的節點包括類、介面、屬性,子圖包括狀態圖、順序圖等。 采用了三次遍歷UML元素的方法建圖,第一遍遍歷建點,第二、三次遍歷設定屬性、連邊,實作圖物件的初始化。這里借鑒了一些 ......

    uj5u.com 2020-09-10 05:36:06 more
  • 談談我對C# 多型的理解

    面向物件三要素:封裝、繼承、多型。 封裝和繼承,這兩個比較好理解,但要理解多型的話,可就稍微有點難度了。今天,我們就來講講多型的理解。 我們應該經常會看到面試題目:請談談對多型的理解。 其實呢,多型非常簡單,就一句話:呼叫同一種方法產生了不同的結果。 具體實作方式有三種。 一、多載 多載很簡單。 p ......

    uj5u.com 2020-09-10 05:36:09 more
  • Python 資料驅動工具:DDT

    背景 python 的unittest 沒有自帶資料驅動功能。 所以如果使用unittest,同時又想使用資料驅動,那么就可以使用DDT來完成。 DDT是 “Data-Driven Tests”的縮寫。 資料:http://ddt.readthedocs.io/en/latest/ 使用方法 dd. ......

    uj5u.com 2020-09-10 05:36:13 more
  • Python里面的xlrd模塊詳解

    那我就一下面積個問題對xlrd模塊進行學習一下: 1.什么是xlrd模塊? 2.為什么使用xlrd模塊? 3.怎樣使用xlrd模塊? 1.什么是xlrd模塊? ?python操作excel主要用到xlrd和xlwt這兩個庫,即xlrd是讀excel,xlwt是寫excel的庫。 今天就先來說一下xl ......

    uj5u.com 2020-09-10 05:36:28 more
  • 當我們創建HashMap時,底層到底做了什么?

    jdk1.7中的底層實作程序(底層基于陣列+鏈表) 在我們new HashMap()時,底層創建了默認長度為16的一維陣列Entry[ ] table。當我們呼叫map.put(key1,value1)方法向HashMap里添加資料的時候: 首先,呼叫key1所在類的hashCode()計算key1 ......

    uj5u.com 2020-09-10 05:36:38 more
最新发布
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:20:47 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:20:25 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:20:17 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:20:10 more
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:19:44 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:19:07 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:18:57 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:18:49 more
  • 05單件模式

    #經典的單件模式 public class Singleton { private static Singleton uniqueInstance; //一個靜態變數持有Singleton類的唯一實體。 // 其他有用的實體變數寫在這里 //構造器宣告為私有,只有Singleton可以實體化這個類! ......

    uj5u.com 2023-04-19 08:42:51 more
  • 【架構與設計】常見微服務分層架構的區別和落地實踐

    軟體工程的方方面面都遵循一個最基本的道理:沒有銀彈,架構分層模型更是如此,每一種都有各自優缺點,所以請根據不同的業務場景,并遵循簡單、可演進這兩個重要的架構原則選擇合適的架構分層模型即可。 ......

    uj5u.com 2023-04-19 08:42:41 more