- 采集層,就是ODS(原始資料)層
- DWD層,離線數倉中在這一層當中分為了兩塊內容,一個是DWD,還有一個叫DIM,主要是針對于這個業務資料而言的,那如果說行為資料很簡單,就都是DWD,把它資料分開就好了,對于業務資料而言咱們DWD里面放的是事實,而DIM放的是維度資料,在離線數倉中這兩個層區分的必要性不高,都是放在HIVE里面的,實時數倉的主要是資料的明細層
就關于我們看到這個叫, - DWM: 離線數倉實際上并沒有這個DWM層,那這個DWM干什么事呢?稍微做一點解釋,我們主要說這一層他是怎么來的啊?為什么會有這一層,首先我們正常的在離線數倉當中,大家是從這個dwd到dws對吧,但是這個當中呢會存在一個這樣的事情,什么事呢?那大家想啊,DWS層咱們是一個寬表,對不對?

DWS可能對DWD層的表進行“加工”再使用,如圖1、2如果加工方式相同,那么就有了重復作業了,這就是DWM(中間層,介于明細資料和服務資料中間的資料 )層的來源提取了DWS層對DWD層共同的加工操作
- DWS層:按照維度建模,維度資料形成了DWS層寬表,為了方便后續查詢的;
ClickHouse:存盤DWS層的資料
(尚硅谷實時數倉第二集記錄)
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/400491.html
標籤:其他
