雙非本碩，成功上岸大資料開發！！！-有解無憂

校招生應屆生寫的大資料上岸程序比較少，很多應屆畢業生想從事大資料開發，但是網上搜不到太多完整的上岸的程序，大部分都是面經之類的，所以想總結一下，不知道是否能幫助到有需要的人，

在這里插入圖片描述

本文來自核心技術群優秀群友投稿: louwin

個人背景

我覺得有必要寫一下個人背景，沒有個人背景的上岸程序就是耍流氓，有些人一開始說無競賽，無論文，我一想那我來學習一下，最后知道是復旦本碩，這你不是搞我心態么，（狗頭，如有冒犯，不要打我）

自己是雙非本碩，大資料一年的練習生，喜歡rap籃球，

上岸程序

靠自己的熱愛學習，拿到大廠暑期實習，然后秋招上岸，賊簡單的一句話需要細細展開來講，

首先你需要熱愛大資料，熱愛是第一驅動力，我知道很多本碩選擇大資料，是覺得后端或者別的太卷了，選擇大資料是一種逃避手段，那我只能說對于大廠而言，大資料也很不容易，原因如下：

作業崗位比后端少得多
很需要你實際的作業經驗
自己學習和作業脫軌的很嚴重
很多大廠崗位分的極其細致，可能你看到的資料開發根本不適合你

我個人覺得在大廠應屆生及其卷的情況下，大資料逐漸神仙打架，如果是一線城市，那不好意思了，神仙下凡，那作為一個雙非如何上岸呢？

第一，你是否真的喜歡大資料

這一點很矛盾，雖然說越努力越熱愛，但是一開始學習后是否很喜歡大資料對你的幫助真的很大，你能否接受從0開始接觸一堆組件，而且可能是你本科完全沒聽過的東西，如果接觸了以后很喜歡，那么恭喜你，你的起跑線和別人一樣，但跑的速度可太快了，每天學自己熱愛的東西，是多么幸福的事情，能讓你最后堅持下來，如果不是真的喜歡，只是想找個作業，卷后端/前端/客戶端靠譜多了，既然都卷，選崗位多，容易進的嘛，

第二，打扎實你的基礎

注意，我這里指的基礎并不是大資料的基礎，而是你計算機的基礎，通俗的說就是科班素養，再具體點就是考研408科目（資料結構+作業系統+計算機網路+計算機組成原理），為啥喜歡科班的，就是因為再不怎么學，至少在腦子里留下一丟丟的印象，這些科目為我打下的基礎讓我受益匪淺，會對我的思考方式有幫助，甚至對解決問題的也有幫助，還有看計算機論文，看檔案，畫圖的能力，都是平時鍛煉出來的，

那如果非科班，或者平時真的學的不好怎么辦呢，那當然是趕緊彌補，不過如果確定從事大資料的話，我覺得資料結構+作業系統足夠了，可以稍微偷個懶，這兩門課的重要性時時刻刻影響著我，他的思路在計算機很多領域都有影子，

其余的基礎那就多了，編程語言，大資料思想，學了什么框架等等，校招生和社招生最大的區別就是，校招生最主要的是展示自己的潛力值得培養，你所學的一切東西在面試的時候都是為了展示這一點，我舉一個面試遇到的問題：c在處理垃圾堆快和java自身靠jvm處理，你覺得有什么區別，這個問題是面試官結合人物背景和之前的聊天臨時問的，如果你全靠背八股直接涼了，需要你當場思考給出回答，他不需要你回答標準答案，甚至這個問題就沒有答案，但是面試官會通過你的當場思考來判斷你的思維能力，如何思考并回答呢，答案就一個，基礎是否扎實，

所以，如果還有幾年才畢業的同學，好好打基礎喲～

想不到吧，秋招其實三月份就開始了

雙非進大廠現在老難了，最好要找個暑期實習，不斷是不是大公司，但需要找一個，基本上大廠的暑期實習3月份就開始了，而且有些其實就是秋招，默認你可以轉正，我當時面試的有幾個大廠直接就和我說，這個其實就是秋招直接轉正的，所以會問的難一點，秋招不放hc了，

有實習經驗對自己幫助很大，主要識訓有以下幾點：

1）工程能力，github/maven/shell/linux，這些常見的工程模塊平時用的比較少，還以一些測驗交接的流程熟悉以后，知道現實中作業是怎么樣的，

2）結束實際中的海量資料，平時練習幾十萬條資料最多了，集群上的機器也很少，實習讓你實際感受幾十億，幾百億的資料量，和龐大的集群，識訓很多，會遇到很多想不到的問題，算是徹底入門了大資料，

3）對你的秋招幫助很大，尚且不說大廠實習如果轉正，那你秋招有很大的底氣，關鍵是如果沒轉正出去找作業，別人一看，實習過，那說明你具備一些實際的作業經驗，同時有公司相信的潛力，這也讓我有信心自己可以相信你的潛力，

所以，對于校招的大資料而言，不光是大資料，還有很多別的，但最終就是個展示自身潛力的程序，

學習的內容

編程語言類：java, scala（皮毛）,python（皮毛）,shell（皮毛）

其實主要就是 java，面試的時候遇到的也是java，并發編程，jvm gc，基礎的 collection 都問到了

資料結構！！！！：力扣不刷直接掛，除非學歷很好
基礎：要是非科班，有條件的話還是盡可能看一下資料結構和作業系統吧
hadoop組件：hadoop（會個基礎的mr job，了解相關原理，看一下google的三駕馬車），hbase（基礎應用），hive（hql還是需要練習一下的）
spark：sparkcore（可以看一下常用算子的原始碼），sparksql，主要就這兩個，其余的有條件可以看一下spark streaming
flink：時間足夠的話可以看（推薦入門書籍flink基礎教程，以及flink官方檔案），之后自己做個簡單的專案上手還是快的
訊息佇列：kafka，了解并使用一下，自己練專案也會用到
做專案帶到的工具：flume,sqoop,datax,redis，說實話，專案做完我知道我用過，重新用的話還是對著檔案寫
專案：可視化小專案（java ssm框架基礎實用），離線數倉（主要是hive），實時數倉（flink簡單實用）

剩下的還是一些別的內容是實習程序中學到的，就暫時不寫了，

面試遇到的內容

比較有意思的場景題或著開放題

1）假如要一個沒有存盤上限的arraylist，怎么設計

2）c語言回收堆快時，和jvm相比你覺得有哪些不同

3）兩個超級大表做關聯，如果不用sql，讓你直接設計計算程序怎么設計

4）常規的百萬級別資料blablabla……

5）你調研一個框架是如何調研的

6）java有單元測驗，如果對sql做單元測驗怎么設計

7）實際更新spark3之后，對比spark2在實際作業中全部是優點么

8）如何判斷出現了shuffle，如何快速定位哪里出了問題

問題已經有寫記不全了，選擇了一些有意思的，我這里沒有給出我當時的回答，每個人有每個人的思考方式，希望大家的思維可以發散，

結尾

投稿本文的讀者把春招實習/秋招遇到的問題放一起了，做一個簡單概括，對于想轉型大資料開發的小伙伴們具有一定的指導意義，大家也可以多去牛客上看看其他人寫的面經，如果真的熱愛大資料，請一起堅持下去，還是很有意思的，

對了，如果想跟投稿本文的優秀群友一樣，加入我的核心技術交流群，與更多優秀的小伙伴學習，交流，歡迎大家掃碼添加我的微信 zwj_bigdataer ，記得備注【昵稱-城市-崗位】，我看到后會第一時間通過，

另外，我可以送上自己私藏的一份大資料禮包，對于99%的程式員學習大資料都是相當有幫助和指導意義的，

108套企業真題
在這里插入圖片描述
大資料面試寶典

在這里插入圖片描述

👇🏻 關注下方公眾號： 大資料夢想家👇🏻，回復 “ 大資料高頻面試題” 即可獲得

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/321151.html

標籤：其他

上一篇：2021年CS保研經歷（三）：清華大學自動化學院大資料專碩預推免

下一篇：Hadoop面試連環炮

雙非本碩，成功上岸大資料開發 ！！！

個人背景

上岸程序

學習的內容

面試遇到的內容

比較有意思的場景題或著開放題

結尾

雙非本碩，成功上岸大資料開發！！！