資料標準
資料標準:保障資料的內外部使用和交換的一致性、準確性的規范性約束(如命名、型別、值域等),通常包括了基礎指標和計算指標
計算指標:即計算口徑,如下單轉化率、獲客成本、復購率的具體計算的方式
如怎么定義一個人的性別、婚姻狀況、健康狀況,在不同的業務系統中定義的可能千差萬別,資料標準就是將這些定義進行統一化、規范化,
資料標準用于指導系統的資料結構定義及值域的選擇
在國家標準全文公開系統中,定義了各行各業方方面面的標準,可在實際資料建模時進行參考
資料標準分為:
- 國家標準: 如國家標準全文公開系統中定義的資料標準,又為了強制性國家標準、推薦性國家標準
- 行業標準: 如交通運輸行業標準–交通資訊基礎資料元
- 企業標準
如在國家標準GB/T 2261中規范了人的性別代碼、婚姻狀況代碼、健康狀況代碼等


元資料
- 元資料 是描述資料的資料,版本化管理資料結構
其核心作用如下:- 追溯資料的生成程序,做資料的“血緣分析”
- 評估資料變更造成的影響
- 做全鏈路資料正確性核查
- 對比資料的結構
元資料又細化為:
- 業務元資料: 與業務規則、流程相關的描述性資料
- 技術元資料:與存盤、訪問等技術底層的描述性資料
- 操作元資料:與資料操作相關的描述性資料
- 管理元資料:與資料管理相關的描述性資料
以 2020年統計的全國成年男性平均身高 175cm為例,描述175cm這個資料,可以從下圖的這些描述項進行描述,用來描述175的資料稱之為元資料

主資料
主資料:描繪企業核心業務物體的資料,被企業多條業務線、多個流程階段重復使用、共享的高價值資料,
示例如下:
- 電商平臺的主資料是商品的sku資料、訂單資料、用戶資料、供應商的資料
- CRM客戶管理系統的主資料是用戶資料
- 銀行系統的主資料是卡bin碼、開戶行、賬號、理財產品
- 二手房平臺的主資料是房源資訊
可以看到,主資料可以按與人相關、與物相關、與地址相關、與規則相關等進行分類
主資料是關鍵業務物體的最權威、最準確、價值最大的資料,用于建立交易倍訓,,Master Data 可翻譯為核心資料
阿里的One ID就是主資料理念的結果
主資料的核心思想是全域唯一的標準資料,
因此主資料一般會完成以下作業:
- 確定核心業務環節
- 識別主資料
- 定義和維護主資料匹配規則(代碼規則、ID Mapping)
- 建立及發布資料標準
- 主資料的后續維護及更新
資料模型
資料模型 是現實資料特征的抽象,用于表示一組資料和概念的定義,即資料的資料結構,如資料庫的ER圖【物體-聯系圖(Entity Relationship Diagram)】,用來描述各種業務主體的結構和它們之間的關系
百度百科的定義如下:
資料模型(Data Model)是資料特征的抽象,它從抽象層次上描述了系統的靜態特征、動態行為和約束條件,為資料庫系統的資訊表示與操作提供一個抽象的框架,資料模型所描述的內容有三部分,分別是資料結構、資料操作和資料約束
資料模型落地體現在資料庫的資料結構中
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/357054.html
標籤:其他
上一篇:天然氣專題研究報告(合集)
