一·大資料概述
隨著資訊技術發展的巨大變革,企業和學識訓構紛紛加大技術、資金和人員投入,加強對大資料關鍵技術的研發與運用,
大資料的發展歷程總體上劃分為三個重要階段:萌芽期、成熟期和大規模應用期,
二.大資料概念
大資料的4個特點:資料量大、資料型別繁多、處理速度快和價值密度低,
三.大資料與云計算、物聯網的關系
大資料為云計算機提供了用武之地,云計算為大資料提供了技識訓礎,
物聯網是大資料的重要來源,大資料技術為物聯網資料分析提供支撐,
云計算為物聯網提供海量資料存盤能力,物聯網為云計算技術提供了廣闊的應用空間,
四.大資料處理架構Hadoop
1.Hadoop簡介
Hadoop是Apache旗下的一個開源分布式計算平臺,是基于Java語言開發的,具有很好的跨平臺性,并可以部署在一般的計算機集群中,Hadoop的核心是分布式檔案系統HDFS和MapReduce,HDFS具有較高的讀寫速度、很好的容錯性和可伸縮性,很好的保證了資料的安全性,
其中YARN是資源調動,MapReduce是計算框架,
2.Hadoop的特性
高可靠性、高效性、高擴展性、容錯性、成本低、運行在Linux平臺上、支持多種編程語言,
3.Hadoop生態圈
/*圖片來源于網路*/

轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/52364.html
標籤:大數據
上一篇:sql2005用戶權限設定
