在了解HDFS寫資料流程之前,我們先來了解HDFS是什么,干什么用的,
HDFS可以實作大資料的存盤,并處理巨大的檔案,而HDFS處理巨大檔案的思路是將巨大的檔案割成小塊檔案進行存盤,稱為”資料塊分布式處理“,

接下來讓我們看一下HDFS的寫資料流程!其中Namenode(nn)是名稱節點用來管理檔案系統的命名空間,Datenode(dn)資料節點是分布式檔案系統HDFS的作業節點,負責資料的存盤和讀取,
1.客戶端向Namenode發出寫資料請求,
2.nn檢查目錄,
3.可以上傳,
4.查詢dn資訊,發送可以上傳的dn.
5.客戶端向dn發送請求上傳的檔案,
6.dn相互之間建立pipelin(管道:為后面傳輸black準備),
7.上傳資料,并向客戶端,nn發送已上傳完成資訊,

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/337630.html
標籤:其他
上一篇:03-Eureka學習
