我們今天常說的大資料技術，它的理論基礎來自于2003年 Google 發表的三篇論文，《The Google File System》、《MapReduce: Simplified Data Processing on Large Clusters》、《Bigtable: A Distributed Storage System for Structured Data》，這三篇論文分別對應后來出現的 HDFS，MapReduce， HBase，

在大資料的發展歷史上，還有一個名字是無論如何都繞不開的，那就是 Doug Cutting，Doug是 Apache Lucene、Nutch、Hadoop、Avro 專案的創始人，2006 年 Docu Cutting 開源了 Hadoop，名字取自于他兒子的玩具小象 Hadoop，

那么就從 Hadoop 起，我們開始本文的分享，

Taier & Yarn

Hadoop

新生事物的成長往往是螺旋上升的，Hadoop 也是如此，Hadoop 1.0 是指 MapReduce + HDFS，其中 MapReduce 是一個離線處理框架，由編程模型（新舊API）、運行時環境（JobTracker 和 TaskTracker）和資料處理引擎（MapTask和ReduceTask）三部分組成，早期的 MapReduce 非常臃腫，有著很明顯的缺點，JobTracker 有單點故障問題、框架設計只能執行 MapReduce 任務，不能跑 Storm，Flink 等計算框架的任務，

file

之后迎來的 Hadoop 2.0 是指 MapReduce + HDFS + Yarn，其中 YARN 是一個資源管理系統，負責集群資源管理和調度， MapReduce 則是運行在 YARN 上的離線處理框架，Hadoop 2.0 很好地解決了單點問題，它將 JobTracker 中的資源管理和作業控制分開，分別由 ResourceManager 負責所有應用程式的資源分配，ApplicationMaster 負責管理一個應用程式，并且解決了擴展問題，包括針對 Hadoop 1.0 中的 MapReduce 在擴展性和多框架支持等方面的不足，

file

MapReduce 2.0

MapReduce 1.0的作業機制中，角色主要包括客戶端，Jobtracker，Tasktracker，Jobtracker 主要是協調作業的運行，而 Tasktracker 是負責運行作業劃分之后的任務，網上關于 MR 1.0 的內容很多，這里就不再過多贅述，流程圖如下：

file

到了 MapReduce 2.0，核心思想則是將 MR 1.0 中 JobTracker 的資源管理和任務調度兩個功能分開，分別由 ResourceManager 和 ApplicationMaster 行程實作，

MR 2.0 的作業流程主要分為以下6個執行程序（請將圖片和文字對照起來看）：

file

一、作業的提交

1)客戶端向 ResourceManager 請求一個新的作業ID，ResourceManager 收到后，回應一個 ApplicationID，見第2步

2)計算作業的輸入分片，將運行作業所需要的資源(包括jar檔案、組態檔和計算得到的輸入分片)復制到一個(HDFS)，見第3步

3)告知 ResourceManager 作業準備執行，并且呼叫 submitApplication() 提交作業，見第4步

二、作業的初始化

ResourceManager收到對其 submitApplication() 方法的呼叫后，會把此呼叫放入一個內部佇列中，交由作業調度器進行調度，并對其初始化，然后為該其分配一個 contain 容器，見第5步

5)并與對應的 NodeManager 通信，見第5a步；要求它在 Contain 中啟動 ApplicationMaster ，見第5b步

ApplicationMaster 啟動后，會對作業進行初始化，并保持作業的追蹤，見第6步
ApplicationMaster 從 HDFS 中共享資源，接受客戶端計算的輸入分片為每個分片，見第7步

三、任務的分配

ApplicationMaster 向 ResourceManager 注冊，這樣就可以直接通過 RM 查看應用的運行狀態，然后為所有的 map 和 reduce 任務獲取資源，見第8步

四、任務的執行

ApplicationMaster 申請到資源后，與 NodeManager 進行互動，要求它在 Contain 容器中啟動執行任務，見第9a、9b步

五、進度和狀態的更新

10)各個任務通過 RPC 協議 umbilical 介面向 ApplicationMaster 匯報自己的狀態和進度，方便 ApplicationMaster 隨時掌握各個任務的運行狀態，用戶也可以向 ApplicationMaster 查詢運行狀態

六、作業的完成

11)應用完成后，ApplicationMaster 向 ResourceManager 注銷并關閉自己

手寫一個 Yarn 程式

如果想要將一個新的應用程式運行在 YARN 之上，通常需要撰寫兩個組件：客戶端和 ApplicationMaster，

· 客戶端撰寫需要注意：客戶端通常只需與 ResourceManager 互動，期間涉及到多個資料結構和一個 RPC 協議，

· ApplicationMaster 撰寫需要注意：ApplicationMaster 需要與 ResoureManager 和 NodeManager 互動，以申請資源和啟動 Container，期間涉及到多個資料結構和兩個 RPC 協議，

手寫一個 YARN Application 程式對理解 YARN 的運行原理非常有幫助，熟悉 Spark 、Flink 計算組件的同學也可以參考 Spark on Yarn、Flink on Yarn 的源代碼，

Taier&Yarn

洋洋灑灑，回過頭來，現在來給大家介紹一下 Taier 和 Yarn 之間的關系，

Taier 作為一站式大資料任務調度引擎，是數堆疊資料中臺整體架構的重要樞紐，負責調度日常龐大的任務量，它旨在降低ETL開發成本，提高大資料平臺穩定性，讓大資料開發人員可以在 Taier 直接進行業務邏輯的開發，而不用關心任務錯綜復雜的依賴關系與底層的大資料平臺的架構實作，將作業的重心更多地聚焦在業務之中，

為了更好地實作讓資料開發人員關注業務的目標，Taier 主要在控制臺中展示了 Hadoop Yarn的相關資訊，分為以下3點：Yarn 配置管理、Yarn 資源管理、任務 on Yarn 的相關配置，

file