主頁 > 後端開發 > 【深入淺出 Yarn 架構與實作】5-2 Yarn 三種調度器

【深入淺出 Yarn 架構與實作】5-2 Yarn 三種調度器

2023-03-23 22:25:19 後端開發

本篇文章將深入介紹 Yarn 三種調度器,Yarn 本身作為資源管理和調度服務,其中的資源調度模塊更是重中之重,下面將介紹 Yarn 中實作的調度器功能,以及內部執行邏輯,

一、簡介

Yarn 最主要的功能就是資源管理與分配,本篇文章將對資源分配中最核心的組件調度器(Scheduler)進行介紹,
調度器最理想的目標是有資源請求時,立即滿足,然而由于物理資源是有限的,就會存在資源如何分配的問題,針對不同資源需求量、不同優先級、不同資源型別等,很難找到一個完美的策略可以解決所有的應用場景,因此,Yarn提供了多種調度器和可配置的策略供我們選擇,
Yarn 資源調度器均實作 ResourceScheduler 介面,是一個插拔式組件,用戶可以通過配置引數來使用不同的調度器,也可以自己按照介面規范撰寫新的資源調度器,在 Yarn 中默認實作了三種調速器:FIFO Scheduler 、Capacity Scheduler、Fair Scheduler,
官方對三種調度器的介紹圖,看個大概意思就行,隨著調度器的不斷更新迭代,這個圖不再符合當下的情況,
image.png

二、FIFO

最簡單的一個策略,僅做測驗用,
用一個佇列來存盤提交等待的任務,先提交的任務就先分資源,有剩余的資源就給后續排隊等待的任務,沒有資源了后續任務就等著之前的任務釋放資源,
優點:
簡單,開箱即用,不需要額外的配置,早些版本的 Yarn 用 FIFO 作為默認調度策略,后續改為 CapacityScheduler 作為默認調度策略,
缺點:
除了簡單外都是缺點,無法配置你各種想要的調度策略(限制資源量、限制用戶、資源搶奪等),

三、CapacityScheduler

一)CS 簡介

Capacity Scheduler(后以 CS 簡寫代替)以佇列為單位劃分資源,會給每個佇列配置最小保證資源和最大可用資源,最小配置資源保證佇列一定能拿到這么多資源,有空閑可共享給其他佇列使用;最大可用資源限制佇列最多能使用的資源,防止過度消耗,
佇列內部可以再嵌套,形成層級結構,佇列內資源默認采用 FIFO 的方式分配,如下圖所示,
image.png

優點:

  • 佇列最低資源保障,防止小應用餓死;
  • 空閑容量共享,當佇列配置資源有空閑時可共享給其他佇列使用

缺點:

  • 佇列配置繁瑣,父佇列、子佇列都要單獨配置優先級、最大資源、最小資源、用戶最大資源、用戶最小資源、用戶權限配置等等,工程中會寫個程式,自動生成該配置;

二)CS 特征

  • 分層佇列 (Hierarchical Queues):支持佇列分層結構,子佇列可分配父佇列可用資源,
  • 容量保證 (Capacity Guarantees):每個佇列都會配置最小容量保證,當集群資源緊張時,會保證每個佇列至少能分到的資源,
  • 彈性 (Elasticity):當佇列配置資源有空閑時,可以分配給其他有資源需求的佇列,當再次需要這些資源時可以搶奪回這些資源,
  • 安全性 (Security):每個佇列都有嚴格的 ACL,用于控制哪些用戶可以向哪些佇列提交應用程式,
  • 多租戶 (Multi-tenancy):提供全面的限制以防止單個應用程式、用戶和佇列從整體上獨占佇列或集群的資源,
  • 優先級調度 (Priority Scheduling):此功能允許以不同的優先級提交和調度應用程式,同時佇列間也支持優先級配置(2.9.0 后支持),
  • 絕對資源配置 (Absolute Resource Configuration):管理員可以為佇列指定絕對資源,而不是提供基于百分比的值(3.1.0 后支持),
  • 資源池配置:可將 NodeManager 分割到不同的資源池中,資源池中配置佇列,進行資源隔離,同時資源池有共享和獨立兩種模式,在共享情況下,多余的資源會共享給 default 資源池,

三)CS 配置

假設佇列層級如下:

root
├── prod
└── dev
    ├── eng
    └── science

可以通過配置 capacity-scheduler.xml 來實作:

<configuration>
  <property>
    <name>yarn.scheduler.capacity.root.queues</name>
    <value>prod,dev</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.dev.queues</name>
    <value>eng,science</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.prod.capacity</name>
    <value>40</value>
  </property>

  <property>
    <name>yarn.scheduler.capacity.root.dev.capacity</name>
    <value>60</value>
  </property>

  <property>            
    <name>yarn.scheduler.capacity.root.dev.eng.capacity</name>
    <value>50</value>
  </property>

  <property>            
    <name>yarn.scheduler.capacity.root.dev.science.capacity</name>
    <value>50</value>
  </property>
</configuration>

除了容量配置外,還可以配置單個用戶或者程式能夠使用的最大資源數,同時可以運行幾個應用,權限ACL控制等,不是本篇重點,不再展開,可參考:cloudera - Capacity Scheduler、Hadoop doc - Capacity Scheduler、Hadoop: Capacity Scheduler yarn容量調度配置,

四)CS 實作

這里僅關注 CS 資源分配的程序,
CS 分配的是各 NM 節點上的空閑資源,NM 資源匯報請到之前的文章《4-3 RM 管理 NodeManager》中了解,

1、資源請求描述

AM 通過心跳匯報資源請求,包含的資訊如下,

message ResourceRequestProto {
  optional PriorityProto priority = 1;  // 優先級
  optional string resource_name = 2;		// 期望資源所在節點或機架
  optional ResourceProto capability = 3;	// 資源量
  optional int32 num_containers = 4;		// Container 數目
  optional bool relax_locality = 5 [default = true]; 	// 是否松弛本地性
  optional string node_label_expression = 6;	// 所在資源池
}

2、資源更新入口

NM 發送心跳給 RM 后,RM 會發送 NODE_UPDATE 事件,這個事件會由 CapacityScheduler 進行處理,

    case NODE_UPDATE:
    {
      NodeUpdateSchedulerEvent nodeUpdatedEvent = (NodeUpdateSchedulerEvent)event;
      RMNode node = nodeUpdatedEvent.getRMNode();
      setLastNodeUpdateTime(Time.now());
      nodeUpdate(node);
      if (!scheduleAsynchronously) {
        // 重點
        allocateContainersToNode(getNode(node.getNodeID()));
      }
    }

重點在 allocateContainersToNode(),內部邏輯如下:

  • 從根佇列往下找,找到 most 'under-served' 佇列(即 已分配資源/配置資源 最小的);
  • 先滿足已經預留資源(RESERVED)的容器
  • 再處理未預留的資源請求,如果資源不夠,則進行 RESERVE,等待下次分配

這里有個預留的概念(之后會有文章專門介紹 reserve 機制):

  • RESERVED 是為了防止容器餓死;
  • 傳統調度:比如一堆 1G 和 2G 的容器請求,當前集群全被 1G 的占滿了,當一個 1G 的容器完成后,下一個還是會調度 1G,因為 2G 資源不夠;
  • RESERVED 就是為了防止這種情況發生,所以先把這個資源預留出來,誰也別用,等下次有資源了再補上,直到滿足這個容器資源請求,

四、FairScheduler

一、Fair 簡介

同 Capacity Seheduler 類似,Fair Scheduler 也是一個多用戶調度器,它同樣添加了多層級別的資源限制條件以更好地讓多用戶共享一個 Hadoop 集群,比如佇列資源限制、用戶應用程式數目限制等,
在 Fair 調度器中,我們不需要預先占用一定的系統資源,Fair 調度器會為所有運行的 job 動態的調整系統資源,如下圖所示,當第一個大 job 提交時,只有這一個 job 在運行,此時它獲得了所有集群資源;當第二個小任務提交后,Fair 調度器會分配一半資源給這個小任務,讓這兩個任務公平的共享集群資源,
image.png

Fair 調度器的設計目標是為所有的應用分配公平的資源(對公平的定義可以通過引數來設定),
優點:

  • 分配給每個應用程式的資源取決于其優先級;
  • 它可以限制特定池或佇列中的并發運行任務,

二)Fair 特征

  • 公平調度器,就是能夠共享整個集群的資源
  • 不用預先占用資源,每一個作業都是共享的
  • 每當提交一個作業的時候,就會占用整個資源,如果再提交一個作業,那么第一個作業就會分給第二個作業一部分資源,第一個作業也就釋放一部分資源,再提交其他的作業時,也同理,也就是說每一個作業進來,都有機會獲取資源,
  • 權重屬性,并把這個屬性作為公平調度的依據,如把兩個佇列權重設為 2 和 3,當調度器分配集群 40:60 資源給兩個佇列時便視作公平,
  • 每個佇列內部仍可以有不同的調度策略,佇列的默認調度策略可以通過頂級元素 進行配置,如果沒有配置,默認采用公平調度,

三)Fair 配置

在 FairScheduler 中是通過在 fair-scheduler.xml 中配置佇列權重,來實作「公平」的,
計算時是看(當前佇列權重 / 總權重)得到當前佇列能分得資源的百分比,
更詳細引數配置,可參考:Yarn 調度器Scheduler詳解

<queue name="first">
  <minResources>512mb, 4vcores</minResources>
  <maxResources>30720nb, 30vcores</maxResources>
  <maxRunningApps>100</maxRunningApps>
  <schedulingMode>fair</schedulingMode>
  <weight>2.0</weight>
</queue>

<queue name="second">
  <minResources>512mb, 4vcores</minResources>
  <maxResources>30720nb, 30vcores</maxResources>
  <maxRunningApps>100</maxRunningApps>
  <schedulingMode>fair</schedulingMode>
  <weight>1.0</weight>
</queue>

五、Fair Scheduler與Capacity Scheduler區別

image.png

相同點

  • 都支持多用戶多佇列,即:適用于多用戶共享集群的應用環境
  • 都支持層級佇列
  • 支持配置動態修改,更好的保證了集群的穩定運行,
  • 均支持資源共享,即某個佇列中的資源有剩余時,可共享給其他缺資源的佇列
  • 單個佇列均支持優先級和FIFO調度方式

不同點

  • Capacity Scheduler的調度策略是,可以先選擇資源利用率低的佇列,然后在佇列中通過FIFO或DRF進行調度,
  • Fair Scheduler的調度策略是,可以使用公平排序演算法選擇佇列,然后再佇列中通過Fair(默認)、FIFO或DRF的方式進行調度,

六、小結

本篇介紹了 Yarn 中組重要的資源調度模塊 ResourceScheduler,作為一個可插拔組件,默認有三種實作方式 Fifo、CapacityScheduler、FairScheduler,
文中對三個調度器的功能、特征、配置、實作進行了較為詳細的分析,各位同學若對其中實作細節有興趣可深入原始碼,進一步探究,


參考文章:
YARN Capacity Scheduler (容量調度器) 不完全指南 | Bambrow's Blog - 對 CS 中配置屬性有較詳細講解
Capacity Scheduler - vs - Fair Scheduler
Yarn 調度器Scheduler詳解 - 對 Fair 佇列配置有較詳細講解
YARN調度器(Scheduler)詳解
詳解Yarn中三種資源調度器(FIFO Scheduler、Capacity Scheduler、Fair Scheduler)和配置自定義佇列實作任務提交不同佇列
Yarn Fair Scheduler詳解 - 原始碼分析
Yarn原始碼分析6-Reserve機制 | 亞坤的博客 (yoelee.github.io)
YARN資源調度原理剖析
Hadoop 三大調度器原始碼分析及撰寫自己的調度器

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/547885.html

標籤:其他

上一篇:GO實作Redis:GO實作TCP服務器(1)

下一篇:多執行緒

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • Rust中的智能指標:Box<T> Rc<T> Arc<T> Cell<T> RefCell<T> Weak

    Rust中的智能指標是什么 智能指標(smart pointers)是一類資料結構,是擁有資料所有權和額外功能的指標。是指標的進一步發展 指標(pointer)是一個包含記憶體地址的變數的通用概念。這個地址參考,或 ” 指向”(points at)一些其 他資料 。參考以 & 符號為標志并借用了他們所 ......

    uj5u.com 2023-04-20 07:24:10 more
  • Java的值傳遞和參考傳遞

    值傳遞不會改變本身,參考傳遞(如果傳遞的值需要實體化到堆里)如果發生修改了會改變本身。 1.基本資料型別都是值傳遞 package com.example.basic; public class Test { public static void main(String[] args) { int ......

    uj5u.com 2023-04-20 07:24:04 more
  • [2]SpinalHDL教程——Scala簡單入門

    第一個 Scala 程式 shell里面輸入 $ scala scala> 1 + 1 res0: Int = 2 scala> println("Hello World!") Hello World! 檔案形式 object HelloWorld { /* 這是我的第一個 Scala 程式 * 以 ......

    uj5u.com 2023-04-20 07:23:58 more
  • 理解函式指標和回呼函式

    理解 函式指標 指向函式的指標。比如: 理解函式指標的偽代碼 void (*p)(int type, char *data); // 定義一個函式指標p void func(int type, char *data); // 宣告一個函式func p = func; // 將指標p指向函式func ......

    uj5u.com 2023-04-20 07:23:52 more
  • Django筆記二十五之資料庫函式之日期函式

    本文首發于公眾號:Hunter后端 原文鏈接:Django筆記二十五之資料庫函式之日期函式 日期函式主要介紹兩個大類,Extract() 和 Trunc() Extract() 函式作用是提取日期,比如我們可以提取一個日期欄位的年份,月份,日等資料 Trunc() 的作用則是截取,比如 2022-0 ......

    uj5u.com 2023-04-20 07:23:45 more
  • 一天吃透JVM面試八股文

    什么是JVM? JVM,全稱Java Virtual Machine(Java虛擬機),是通過在實際的計算機上仿真模擬各種計算機功能來實作的。由一套位元組碼指令集、一組暫存器、一個堆疊、一個垃圾回收堆和一個存盤方法域等組成。JVM屏蔽了與作業系統平臺相關的資訊,使得Java程式只需要生成在Java虛擬機 ......

    uj5u.com 2023-04-20 07:23:31 more
  • 使用Java接入小程式訂閱訊息!

    更新完微信服務號的模板訊息之后,我又趕緊把微信小程式的訂閱訊息給實作了!之前我一直以為微信小程式也是要企業才能申請,沒想到小程式個人就能申請。 訊息推送平臺🔥推送下發【郵件】【短信】【微信服務號】【微信小程式】【企業微信】【釘釘】等訊息型別。 https://gitee.com/zhongfuch ......

    uj5u.com 2023-04-20 07:22:59 more
  • java -- 緩沖流、轉換流、序列化流

    緩沖流 緩沖流, 也叫高效流, 按照資料型別分類: 位元組緩沖流:BufferedInputStream,BufferedOutputStream 字符緩沖流:BufferedReader,BufferedWriter 緩沖流的基本原理,是在創建流物件時,會創建一個內置的默認大小的緩沖區陣列,通過緩沖 ......

    uj5u.com 2023-04-20 07:22:49 more
  • Java-SpringBoot-Range請求頭設定實作視頻分段傳輸

    老實說,人太懶了,現在基本都不喜歡寫筆記了,但是網上有關Range請求頭的文章都太水了 下面是抄的一段StackOverflow的代碼...自己大修改過的,寫的注釋挺全的,應該直接看得懂,就不解釋了 寫的不好...只是希望能給視頻網站開發的新手一點點幫助吧. 業務場景:視頻分段傳輸、視頻多段傳輸(理 ......

    uj5u.com 2023-04-20 07:22:42 more
  • Windows 10開發教程_編程入門自學教程_菜鳥教程-免費教程分享

    教程簡介 Windows 10開發入門教程 - 從簡單的步驟了解Windows 10開發,從基本到高級概念,包括簡介,UWP,第一個應用程式,商店,XAML控制元件,資料系結,XAML性能,自適應設計,自適應UI,自適應代碼,檔案管理,SQLite資料庫,應用程式到應用程式通信,應用程式本地化,應用程式 ......

    uj5u.com 2023-04-20 07:22:35 more