我曾是一個數倉的從業人員,但做這么多年數倉,一直有個概念不清楚。
通常我們說數倉,會說是采用比較經典的關系建模或是維度建模的一個方法論,但最近經常在一些企業招聘的jd資訊里面看到【主題建模】這樣一個詞,
我不確定這個【主題建模】是什么樣的一個理論?
我只知道,我們在構建資料倉庫,做具體的模型設計的時候,是要【面向主題】然后再根據應用的場景和實際的系統環境選擇具體的創建方法,比如在維度建模時是采用星型還是雪花(通常是二者混合),所以我有些迷惑。
還請大神能給我解解惑。
我的理解是,這只是一個業務層面的說法,與我們說的面向主題類似,在實際操作中就是在應用層的模型中的組織形式,不知對不對呢?
望賜教,請不要百度復制粘貼,我已經在百度查閱了很多資料,盡量說得通俗一點,感謝~
uj5u.com熱心網友回復:
關于面向主題1. 它的目的就是支持能夠在不同領域分析,能夠實作跨領域事務評估方案;
2. 集中提供有關業務物件的資料(主題)。
關于星形模型、雪花模型、銀河模型
正如你所說的,我們通常會使用星形與雪花的混合方式,即Galaxie-Schema。而且在一定條件下,無所謂你選擇星形,雪花還是銀河,因為這都取決于我們分析的資料、我們的關注點和我們想要達到的效果。
比如,如果我們需要考慮存盤花銷,那么維度數量、分類級數在超過一定量的時候,雪花模型將會是幾十倍于星形模型。但我們又不需要過于復雜的分析,那么星形自然是最好的。而分類級數較少的時候,存盤花銷幾乎沒有區別。
根據需求的變化,著重點的不同,選擇也在變化,還是需要根據現實條件來衡量具體選擇的模式。
可能有些詞不達意,但希望能幫到你
轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/147678.html
標籤:數據倉庫
