1.大資料計算體系可歸納三個基本層次:
資料應用系統,資料處理系統,資料存盤系統



2.計算的總體架構

HDFS(Hadoop 分布式檔案系統)
(1)設計思想:分而治之,將大檔案大批量檔案,分布式存放在大量服務器上,以便于采取分而治之的方式對海量資料進行運算分析,
(2)首先,它是一個檔案系統,用于存盤檔案,通過統一的命名空間–目錄樹來定位檔案,然后,它是分布式的,又很多服務器聯合起來實作其功能,集群中的服務器有各自的角色,有namenode和datanode兩部分,有點類似索引結構,并采用備份的方式,例如第二namenode和b1出現3次,

資料處理系統的比較
主要看mapreduce和spark的兩個極端,包括時延和硬體的需求,

mapreduce計算模型


3.計算模型和計算架構
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/250658.html
標籤:其他
上一篇:框架3 Spring Boot
