HBase是什么
HBase是一種分布式、可擴展、支持海量資料存盤的NoSQL資料庫,
適用于隨機讀寫或者隨機訪問大規模資料集時
HBase資料模型
- 邏輯結構

- 物理結構

- 資料模型
- namespace(命名空間)
- region:類似于關系資料庫中表的概念,HBase定義表時只需宣告列族
- Row:每行資料 都由一個Rowkey和多個Column組成
- Column:每個Column都由列族和列限定符進行限定例如info:name,info:age
- timestamp(時間戳):用于標識資料的不同版本
- cell(單元):由{rowkey,column Family: column Qualifier, timestamp}唯一確定的,資料是沒有型別的,全都是位元組碼形式存盤
HBase基本架構
- Region Server:是region的管理者,實作類是
HRegionServer,主要作用是- 對資料的操作:
get、put、delete; - 對于Region的操作:
splitRegion、compactRegion
- 對資料的操作:
- Master:是所有RegionServer的管理者,實作類是
HMaster,主要作用- 對表的操作:
create、delete、alter - 對于RegionServer的操作:分配Regions到每個RegionServer,監控每個RegionServer的狀態,負載均衡和故障轉移
- 對表的操作:
- Zookeeper:HBase通過Zookeeper來做Master的高可用、RegionServer的監控、元資料的入口以及集群配置的維護等作業
- HDFS: 為HBase 提供最終底層資料存盤服務
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/438664.html
標籤:其他
下一篇:hive深入知識(二)
