一、資料庫技術發展概述
資料庫是管理資料的技術,發展了以資料建模和資料庫管理系統核心技術為主,內容豐富、領域寬廣的一門學科,帶動 了一類巨大的軟體產業——資料庫管理系統(DBMS)產品 及其相關工具和解決方案
資料模型是資料庫系統的核心和基礎,
資料庫技術的發展階段
第一代資料庫系統
層次模型資料庫管理系統:1969年IBM公司研制的層次模型資料庫管理系統IMS
網狀模型資料庫管理系統:DBTG所提議的方法是基于網狀結構的,是網狀模型 資料庫系統的典型代表
共同特點
(1)支持三級模式(外模式、模式、內模式)的體系結構,
(2)用存取路徑來表示資料之間的聯系,
(3)獨立的資料定義語言,
(4)導航的資料操縱語言,
第二代資料庫系統(20世紀70年代稱 為資料庫時代):關系資料庫系統
關系資料庫是以關系模型為基礎, 關系模型是由資料結構、關系操作和資料完整性三部分組成, 關系代數作為語言基礎,由關系資料理論作為理論基礎,
20世紀70年代是關系資料庫理論研究和原型開發的時代,其 主要成果有:
(1)奠定了關系模型的理論基礎,給出了人們一致接受的關 系模型的規范說明,
(2)研究了關系資料語言,有關系代數、關系演算、SQL語 言及QBE等,
(3)研制了大量的RDBMS的原型,攻克了系統實作中查詢優 化、并發控制、故障恢復等一系列關鍵技術,
關系資料庫系統 特點: ? 模型簡單清晰 ? 理論基礎好 ? 資料獨立性強 ? 資料庫語言非程序化 ? 標準化
新一代資料庫系統
特點:
- 應支持資料管理、物件管理和知識管理
- 必須保持或繼承第二代資料庫系統的技術
- 必須對其他系統開放
二、資料倉庫與資料挖掘
計算機資料處理作業的型別:
- 操作型處理:“也稱為聯機事務處理(OLTP) 針對具體業務在資料庫聯機的日常操作
- 分析型處理:也稱為聯機分析處理(OLAP) 通常是對海量的歷史資料查詢和分析
傳統的資料庫技術 VS 資料倉庫
傳統的資料庫特點:操作型處理
資料倉庫特點:分析型處理
資料倉庫(Data Warehouse,DW):是面向主題的、集成的、穩定的、 隨時間變化的資料集合,用以支持管理決策的程序, 資料倉庫不是可以買到的產品,而是一種面向分析的資料存盤方案,
特點:面向主題、 集成性、資料的非 易失性、資料的時 變性
資料倉庫的三個概念:
- 粒度:粒度是指資料倉庫的資料單位中保存資料的細化或綜合程度的級別,細化程 度越高,粒度級就越小,相反地,細化程度越低,粒度級就越大
- 分割:
- 維:
什么是資料挖掘:資料挖掘是從大量的、不完全的、有噪 聲的、模糊的、隨機的實際應用資料中 發現并提取隱藏在其中的、人們事先不 知道的、但又是潛在有用的資訊和知識 的一種技術,又被稱為知識發現
OLAP:資料匯總/聚集工具,可簡化資料分析 資料挖掘、簡化和支持互動式資料分析
資料挖掘:自動地發現隱藏在大量資料中的隱含模式和有趣知識、盡可能自動處理
資料挖掘的功能
- 概念描述
- 關聯分析
- 分類與預測
- 聚類
- 孤立點檢測
- 趨勢和演變分析
三、大資料管理技術
大資料及其特征:大資料是指無法在可容忍的時間內用現有資訊技術和軟、硬體工具對其進 行感知、獲取、管理、處理的服務的資料集合,
特點:大量化、多樣化、快速化 、價值密度低
大資料管理技術典型代表
大資料存盤 、NoSQL 資料管理系統、MapReduce技術
資料倉庫的建立將操作型處理和分析型處理區分開來,資料倉庫為(分析型 處理)服務,傳統的資料庫技術為(操作型處理)服務
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/236424.html
標籤:其他
上一篇:【JDBC】工具類的抽取
