學習大資料并不是一蹴而就的事情,及時作業多年的開發工程師都需要不斷的補充新鮮的知識內容,目前學習大資料知識可以通過視頻和圖書兩種方式學習,視頻的優勢在于能夠將老師的個人開發經驗傳授給學習者,而圖書的優勢在于能夠隨時翻閱,內容比較豐富,這里為大家推薦零基礎學習大資料的8本經典圖書,希望同學們能夠通過不同的學習途徑充分掌握大資料開發技能,

1、大資料時代
《大資料時代》是國外大資料系統研究的先河之作,本書作者維克托·邁爾·舍恩伯格被譽為“大資料商業應用一人”,擁有在哈佛大學、牛津大學、耶魯大學和新加坡國立大學等多個互聯網研究重鎮任教的經歷,早在2010年就在《經濟學人》上發布了長達14頁對大資料應用的前瞻性研究,《大資料時代》認為大資料的核心就是預測,大資料將為人類的生活創造前所未有的可量化的維度,書中展示了谷歌、微軟、IBM、蘋果、facebook、twitter、VISA等大資料先鋒們具價值的應用案例,作者圍繞“要全體不要抽樣、要效率不要絕對精確、要相關不要因果”三大理念,通過數十個商業和學術案例,剖析了萬事萬物資料化和資料復用挖掘的巨大價值,

2、一本書讀懂大資料
進入大資料時代,讓資料開口說話將成為司空見慣的事情,本書將從大資料時代的前因后果講起,全面分析大資料時代的特征、企業實踐的案例、大資料的發展方向、未來的機遇和挑戰等內容,展現一個客觀立體、自由開放的大資料時代,

3、Hadoop權威指南
Hadoop是大資料技術中的核心內容之一,本書內容豐富,展示了如何使用Hadoop構建可靠、可伸縮的分布式系統,程式員可從中探索如何分析海量資料集,管理員可以了解如何建立與運行Hadoop集群,

4、Hive編程指南
Hive是基于Hadoop的一個資料倉庫工具,一本ApacheHive的編程指南,旨在介紹如何使用Hive的SQL方法,通過大量的實體,首先介紹如何在用戶環境下安裝和配置Hive,并對Hadoop和Map Reduce進行詳盡闡述,演示Hive如何在Hadoop生態系統進行作業,

5、HBase權威指南
HBase是一個分布式的面向列的開源資料庫,如何通過使用與HBase高度集成的Hadoop將HBase的可伸縮性變得簡單;把大型資料集分布到相對廉價的商業服務器集群中;了解HBase架構的細節,包括存盤格式、預寫日志、后臺行程等;在HBase中集成MapReduce框架;了解如何調節集群、設計模式、拷貝表、匯入批量資料和洗掉節點等,

6、Flink入門與實戰
Flink是一款開源處流處理框架,其河西是Java和Scala編程的分布式流資料流引擎,這是一本Flink入門級圖書,力求詳細而完整地描述Flink基礎理論與實際操作,旨在幫助讀者從零開始快速掌握Flink的基本原理與核心功能,

7、Kafka入門與實踐
Kafka是一種高吞吐量的分布式發布訂閱訊息系統,它可以處理消費者在網站中的所有動作流資料,本書是基于Kafka 0.10.1.1版本,深入剖析Kafka原始碼與框架,書中的大量實體來源于作者在實際作業中的實踐,具有現實指導意義,

8、Spark快速大資料分析
這是一本為Spark 初學者準備的書,它沒有過多深入實作細節,而是更多關注上層用戶的具體用法,不過,本書絕不僅僅限于Spark 的用法,它對Spark 的核心概念和基本原理也有較為全面的介紹,讓讀者能夠知其然且知其所以然,

9、大資料技術全解:基礎、設計、開發與實踐
可以作為計算機軟體專業的本科生和研究生的大資料技術教材,也可作為大資料技術開發培訓、大資料系統咨詢規劃培訓的教材,更是大資料領域內一線的需求分析人員、系統分析人員、高級開發人員和開發管理人員的必備參考書,重點不在于對大資料技術的原理性介紹,而是從實戰角度出發,系統地闡述如何基于hadoop開源軟體為客戶設計、安裝和開發一個大資料系統,《大資料技術全解:基礎、設計、開發與實踐》還著重分享了具體實踐中的一些案例,不僅對于從事大資料系統開發的it技術人員具有珍貴的參考價值,而且對準備實施大資料系統專案的企業級客戶也具有指導作用,

10、大資料專案實戰與機器學習
本書適合Hadoop的初學者閱讀,讀者不僅能夠通過專案實戰鞏固基礎知識的學習效果,還能學習商業案列實戰為主

以上10本書基本覆寫了目前大資料領域的大部分的常用技術,無論是對于零基礎入門大資料,還是初級大資料開發工程師都是非常有用的,當然也不止這些,歡迎補充

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/281434.html
標籤:其他
