Hadoop資料倉庫之資料治理-有解無憂

🌸資料治理這個問題對于我一個小白來說，好像有點寬泛，從我自己的感覺來說，資料治理應該是有過很多資料體系建設經驗之后的一些總結，今天我們就參考一些大佬的建議，對談一談資料治理，對以往內容感興趣的同學可以參考👇：

??從資料治理的理念上來看，“治”不應只在事后，更應在事前，“理”考驗的是業務與技術能力的結合，從實際內容上來看，資料治理是一套方法體系+工具集，旨在幫助企業合理的架構資料、規范的定義與加工資料、清晰的管理資料、安全的應用資料，促使資料從成本中心變成價值中心，驅動企業數字化轉型，

1.資料治理是什么？

資料治理：為公司業務越來越復雜而帶來的資料越來越臟、亂、差的問題，而提出一套治理資料的方法+工具集

這一部分，我將從六個方面來講解資料治理的內容，

資料維度及指標需要清晰的、統一的、標準的定義，（這里的部分參考Hadoop數倉建設之指標管理的文章，我這里列舉一些例子）

按業務領域拆解業務程序，根據業務程序設計資料模型，高內聚低耦合，盡量能夠支撐未來擴展，一般采用維度建模+寬表模型，記得資料分層，一般模型確定程序如下：

在資料開發程序中有幾點需要注意：編程規范，代碼質量、運行穩定，SQL效率，如大資料之路中所述，程序一般分為以下幾個部分：
開發、測驗、CodeReview、[修改優化、測驗、CodeReview]、審批、上線，

《大資料之路》
《hadoop構建資料倉庫》

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/350857.html

標籤：其他