校招生應屆生寫的大資料上岸程序比較少,很多應屆畢業生想從事大資料開發,但是網上搜不到太多完整的上岸的程序,大部分都是面經之類的,所以想總結一下,不知道是否能幫助到有需要的人,

本文來自核心技術群優秀群友投稿: louwin
個人背景
我覺得有必要寫一下個人背景,沒有個人背景的上岸程序就是耍流氓,有些人一開始說無競賽,無論文,我一想那我來學習一下,最后知道是復旦本碩,這你不是搞我心態么,(狗頭,如有冒犯,不要打我)
自己是雙非本碩,大資料一年的練習生,喜歡rap籃球,
上岸程序
靠自己的熱愛學習,拿到大廠暑期實習,然后秋招上岸,賊簡單的一句話需要細細展開來講,
首先你需要熱愛大資料,熱愛是第一驅動力,我知道很多本碩選擇大資料,是覺得后端或者別的太卷了,選擇大資料是一種逃避手段,那我只能說對于大廠而言,大資料也很不容易,原因如下:
- 作業崗位比后端少得多
- 很需要你實際的作業經驗
- 自己學習和作業脫軌的很嚴重
- 很多大廠崗位分的極其細致,可能你看到的資料開發根本不適合你
我個人覺得在大廠應屆生及其卷的情況下,大資料逐漸神仙打架,如果是一線城市,那不好意思了,神仙下凡,那作為一個雙非如何上岸呢?
- 第一,你是否真的喜歡大資料
這一點很矛盾,雖然說越努力越熱愛,但是一開始學習后是否很喜歡大資料對你的幫助真的很大,你能否接受從0開始接觸一堆組件,而且可能是你本科完全沒聽過的東西,如果接觸了以后很喜歡,那么恭喜你,你的起跑線和別人一樣,但跑的速度可太快了,每天學自己熱愛的東西,是多么幸福的事情,能讓你最后堅持下來,如果不是真的喜歡,只是想找個作業,卷后端/前端/客戶端靠譜多了,既然都卷,選崗位多,容易進的嘛,
- 第二,打扎實你的基礎
注意,我這里指的基礎并不是大資料的基礎,而是你計算機的基礎,通俗的說就是科班素養,再具體點就是考研408科目(資料結構+作業系統+計算機網路+計算機組成原理),為啥喜歡科班的,就是因為再不怎么學,至少在腦子里留下一丟丟的印象,這些科目為我打下的基礎讓我受益匪淺,會對我的思考方式有幫助,甚至對解決問題的也有幫助,還有看計算機論文,看檔案,畫圖的能力,都是平時鍛煉出來的,
那如果非科班,或者平時真的學的不好怎么辦呢,那當然是趕緊彌補,不過如果確定從事大資料的話,我覺得資料結構+作業系統足夠了,可以稍微偷個懶,這兩門課的重要性時時刻刻影響著我,他的思路在計算機很多領域都有影子,
其余的基礎那就多了,編程語言,大資料思想,學了什么框架等等,校招生和社招生最大的區別就是,校招生最主要的是展示自己的潛力值得培養,你所學的一切東西在面試的時候都是為了展示這一點,我舉一個面試遇到的問題:c在處理垃圾堆快和java自身靠jvm處理,你覺得有什么區別,這個問題是面試官結合人物背景和之前的聊天臨時問的,如果你全靠背八股直接涼了,需要你當場思考給出回答,他不需要你回答標準答案,甚至這個問題就沒有答案,但是面試官會通過你的當場思考來判斷你的思維能力,如何思考并回答呢,答案就一個,基礎是否扎實,
所以,如果還有幾年才畢業的同學,好好打基礎喲~
-
想不到吧,秋招其實三月份就開始了
雙非進大廠現在老難了,最好要找個暑期實習,不斷是不是大公司,但需要找一個,基本上大廠的暑期實習3月份就開始了,而且有些其實就是秋招,默認你可以轉正,我當時面試的有幾個大廠直接就和我說,這個其實就是秋招直接轉正的,所以會問的難一點,秋招不放hc了,
有實習經驗對自己幫助很大,主要識訓有以下幾點:
1)工程能力,github/maven/shell/linux,這些常見的工程模塊平時用的比較少,還以一些測驗交接的流程熟悉以后,知道現實中作業是怎么樣的,
2)結束實際中的海量資料,平時練習幾十萬條資料最多了,集群上的機器也很少,實習讓你實際感受幾十億,幾百億的資料量,和龐大的集群,識訓很多,會遇到很多想不到的問題,算是徹底入門了大資料,
3)對你的秋招幫助很大,尚且不說大廠實習如果轉正,那你秋招有很大的底氣,關鍵是如果沒轉正出去找作業,別人一看,實習過,那說明你具備一些實際的作業經驗,同時有公司相信的潛力,這也讓我有信心自己可以相信你的潛力,
所以,對于校招的大資料而言,不光是大資料,還有很多別的,但最終就是個展示自身潛力的程序,
學習的內容
- 編程語言類:java, scala(皮毛),python(皮毛),shell(皮毛)
其實主要就是 java,面試的時候遇到的也是java,并發編程,jvm gc,基礎的 collection 都問到了
-
資料結構!!!!:力扣不刷直接掛,除非學歷很好
-
基礎:要是非科班,有條件的話還是盡可能看一下資料結構和作業系統吧
-
hadoop組件:hadoop(會個基礎的mr job,了解相關原理,看一下google的三駕馬車),hbase(基礎應用),hive(hql還是需要練習一下的)
-
spark:sparkcore(可以看一下常用算子的原始碼),sparksql,主要就這兩個,其余的有條件可以看一下spark streaming
-
flink:時間足夠的話可以看(推薦入門書籍flink基礎教程,以及flink官方檔案),之后自己做個簡單的專案上手還是快的
-
訊息佇列:kafka,了解并使用一下,自己練專案也會用到
-
做專案帶到的工具:flume,sqoop,datax,redis,說實話,專案做完我知道我用過,重新用的話還是對著檔案寫
-
專案:可視化小專案(java ssm框架基礎實用),離線數倉(主要是hive),實時數倉(flink簡單實用)
剩下的還是一些別的內容是實習程序中學到的,就暫時不寫了,
面試遇到的內容
比較有意思的場景題或著開放題
1)假如要一個沒有存盤上限的arraylist,怎么設計
2)c語言回收堆快時,和jvm相比你覺得有哪些不同
3)兩個超級大表做關聯,如果不用sql,讓你直接設計計算程序怎么設計
4)常規的百萬級別資料blablabla……
5)你調研一個框架是如何調研的
6)java有單元測驗,如果對sql做單元測驗怎么設計
7)實際更新spark3之后,對比spark2在實際作業中全部是優點么
8)如何判斷出現了shuffle,如何快速定位哪里出了問題
問題已經有寫記不全了,選擇了一些有意思的,我這里沒有給出我當時的回答,每個人有每個人的思考方式,希望大家的思維可以發散,
結尾
投稿本文的讀者把春招實習/秋招遇到的問題放一起了,做一個簡單概括,對于想轉型大資料開發的小伙伴們具有一定的指導意義,大家也可以多去牛客上看看其他人寫的面經,如果真的熱愛大資料,請一起堅持下去,還是很有意思的,
對了,如果想跟投稿本文的優秀群友一樣,加入我的核心技術交流群,與更多優秀的小伙伴學習,交流,歡迎大家掃碼添加我的微信 zwj_bigdataer ,記得備注【昵稱-城市-崗位】,我看到后會第一時間通過,
另外,我可以送上自己私藏的一份大資料禮包,對于99%的程式員學習大資料都是相當有幫助和指導意義的,
108套企業真題

大資料面試寶典

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/321151.html
標籤:其他
上一篇:2021年CS保研經歷(三):清華大學自動化學院大資料專碩預推免
下一篇:Hadoop面試連環炮
