前言
大家好,我是程式員Manor,我希望自己能成為國家復興道路的鋪路人,大資料領域的耕耘者,平凡但不甘于平庸的人,
前兩天有學妹私信我說,她已經上完大一,大資料專業的,只學過大資料導論,問我大資料該如何入門?我不禁感慨普通高校擅長培養演算法人才,但在工程人才的培養上存在很多的問題,

恰好期末考完,在等待回家這段有時間,manor為大家整理了一份我學大資料學習路線,在B站均能找到視頻:
學習路線思維導圖:

第一部分大資料技術(離線)
0.快速體驗大資料:8天零基礎入門大資料

這段課程我是疫情在家學習的,當時黑馬線上基礎班免費,當時就報名(白嫖 ),能從0開始學習大資料課程,了解linux、kettle、BI、mysql、從基礎到實踐,快速體驗完整的大資料預處理+ETL+BI展示全鏈路程序
缺點是B站上沒有給到配套資料,這里安利一下我的公眾號:大資料智能ai
基礎班的配套資料虛擬機已經更新到公眾號了,關注后自行獲取即可,
1.掌握一門語言,首選Java
大資料開發有三種語言可選,Java,Python和Scala,Scala后期是必學的,Java在開發中好比是屠龍刀,而Python是隨身匕首,適合寫寫腳本,所以強烈推薦先學Java,這里推薦黑馬的Java基礎課程視頻,
黑馬最新JavaSE零基礎入門到入土(idea版)

如果學習周期太長的話,只要能完成控制臺上的增刪改查就可以了
B站上還有其他視頻
例如:
動力節點的JavaSE課程:缺點是用Eclipse講的
狂神的SE入門課程:優點:學習編程的一些前置知識,相當貼近實戰,
2.hadoop零基礎學習(HDFS、MapReduce、Yarn、Hive)
Hadoop學習,黑馬和尚硅谷兩家機構都不錯,我這里由于自學的時候主要學了黑馬的,便貼出黑馬的鏈接
Hadoop從零到精通完整版

前置知識還要學習Linux,manor為大家準備好了Linux最全學習筆記:
大資料開發工程師基本功修煉之史上最全Linux學習筆記
另外學有余力,還想進一步提升可學:
新出的hadoop3*0
Hadoop3.0-MapReduce從入門到精通
尚硅谷講的最新Hive版本
3.Hive離線數倉專案
這里推薦的是黑馬的離線專案:
黑馬大資料專案——電商流量分析專案實戰
缺點是不給配套資料
尚硅谷的離線數倉
尚硅谷的配套資料全,學的人也多
我個人學的是另一個專案,在線教育數倉專案
由于特殊原因視頻無法分享,各位可看我寫的筆記,自行研究一番
補充:其他的小組件如zookeeper、Flume、Impala和sqoop等建議花2~3個小時自學
這些組件都是作業中不經常用的,建議只花少量的時間學習,快速入門即可
這里貼出部分視頻
sqoop
Flume
Azkaban
到此為止,大資料離線階段就學完了,完結撒花🎉·🎉·
我們進入到第二部分大資料離線+實時技術階段~
第二部分大資料技術(離線+實時)
0.海量資料存盤HBase從入門到精通

Hbase公司用的很多,Kudu與其相似
1.訊息佇列Kafka從入門到精通

大資料必須掌握的快取中間件
2.大資料-語言-scala

同樣是搞大資料開發必學的語言,原因是Spark是基礎scala開發的
3.大資料-框架-Spark

4.Spark離線實時專案

學完Spark后,可做一個專案實戰檢驗一下學習成果,
5.大資料-框架-Flink

進階:
FlinkSQL
Flink原始碼決議課程
6.Flink實時專案
這也是我將要學的Flink專案,暑假必拿下~
進階:
推薦系統專案、
機器學習的書籍:稍后為各位整理出來,在我的公眾號領取
可適當閱讀一些數倉書籍,有益于理論深化
如:
《阿里巴巴的大資料之路》
《資料倉庫工具箱—維度建模的完全指南》
總結
到這里恭喜你把
大資料的主流技術學完了,如果你還有什么不懂,可隨時問我,私信我,如果C站沒有回復你,可在公眾號后臺加我好友,備注:C站來的,
希望以上能夠幫到剛入門大資料的你!

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/289528.html
標籤:其他
上一篇:端點科技 面經
