(1)大資料和應用場景介紹
(2)大資料技術綜述總結
(3)Hadoop原理和應用背景介紹
1.大資料基本特征
-
Volume :從資料量上來說,傳統資料規模相對較小,最大維持在GB-TB,而大資料領域中我們需要處理的資料集規模基本都是在TB、乃至PB級別以上;
-
Variety :速度方面,從兩個方面來說,第一、從資料的增長速度來說,隨著互聯網以及物理網的帶動,資料量增長非常迅猛;第二、從資料的處理速度上來說,現實場景中我們需要更低延時的高效分析,例如一些秒級別、毫秒級別的實時分析,
-
Velocity :多樣化,在資料型別上,除了傳統的結構化資料,大資料場景下非結構化資料占比會大很多,其實非結構化資料在傳統的架構當中也會有存在,但是因為受限于傳統模式下技術較差、他的價值密度較低,資料存盤下來無法帶來更多的價值,所以傳統方式僅僅只是把它存盤下來、或者考慮到存盤的成本都有可能不去存盤,而如今在大資料架構當中,首先資料存盤的成本非常之低,其次目前有很多專門針對于非結構化資料的處理技術支持,對于非結構化資料我們可以對其進行做更加深度的分析挖掘,得出更加有價值的內容,
-
Value :價值,大資料可以做的不僅僅只是一些統計報表,更可以去做資料挖掘,因為要做資料挖掘,首先得有足夠多的資料,另一方面大資料領域有很多相關的技術的支持,性能相比于傳統的架構會非常的好,
2.大資料應用場景
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/295116.html
標籤:其他
上一篇:Dubbo
