本人是一個雙非碩士在讀地研二狗,非科班出身,最近也是參加了大資料開發地面試,已拿到了嗶哩嗶哩和順豐的大資料開發崗實習offer,現在把自己的面試經歷分撥記錄下來,記錄了面試各個公司的問題和心經,給正在面試的你做一些適當的參考
如果這篇文章對你有所幫助,可以點一下關注作者支持一下,對于這段時間的面試,作者也是參考和總結了一些面試中常常問到的問題,可以關注作者私信“大資料面試”,我看到后會一一為大家發送資料的

一、一家天使輪公司
面試時間:1月14日
面試時長:32min
面試形式:電話面試
1、首先還是自我面試
有了上次位元組的教訓,這次自我介紹明顯控制了不少
2、問我專案相關的
介紹了我們實驗室承接的專案
3、問為什么用kafka
因為這個時候還沒有真正按照面試形式組織知識,所以將自己在使用kafka的心得體會和他說了,講解了一下自己理解的為什么用kafka
4、問了hdfs的讀寫機制
這個也是按照自己當時使用時候了解的講解了一下,最后重新復盤了一下,發現自己理解的還是不夠全面
5、問了Yarn的作業流程
給他講了一個任務從開始到結束怎么作業的,以及yarn的調度機制
6、問在專案中是否使用到了yarn去調度一些任務
怎么會,實驗室專案和企業專案還有很大的區別,怎么會用yarn去調度任務,我們都是人工智能解決方法(人工+智能,就是人+計算機)
7、問了hive的一些知識
hive因為使用的比較多,但還是處于怎么用,作業原理一問到就蒙圈
8、問了hive的優化
當時并不知道什么叫優化,在使用的時候優化了也不知道,哦?原來這就是優化了啊,回答了更換了計算引擎,變成了spark
9、然后就問為什么用spark
我說spark比mr快,他問我為什么會比mr快,我想,本來就比mr快啊,設計的時候就比mr快,這讓我咋給你說,就好像問我汽車為啥比自行車快,我說就是比自行車快,當時也是不知道回答問題的套路,著實是吃了不少虧啊
10、問了我spark處理延遲資料
我說watermark,他還不滿意,繼續問,問的我都懷疑你是不是平時用的時候都不知道哪是哪了,問的和延遲資料也不相關啊
11、問了flink怎么實作的流式處理
我聽到了有點蒙圈,又像是問汽車是怎么跑起來的,真是不知道該如何下嘴,現在想想,應該是想問我flink的流式計算api這些
12、問了flink和spark的區別
flink是準實時,spark更像是微批處理,方式想到的就是這個,就說了這個,相比較肯定是差了不少
13、flink怎么保證的容錯機制
我說checkpoint,他說不是,我納悶,不是checkpoint能是啥保證容錯,他就說不是checkpoint,最后面試完我還專門去查了flink的容錯機制,也都是checkpoint,不知道他為啥說不是
14、flink的視窗函式
那就給他介紹一下視窗函式,他又問我怎么實作的,我從代碼層面給他說了怎么使用的,他說他想知道flink的視窗函式底層怎么做到的,我不知道
15、反問
問了對面試的反饋,大概說了幾點,但是覺得并不是特別中肯,也沒有采納
此次面試總結:這次面試雖然是電話面試,但是和大資料息息相關,在這次面試也是識訓了很多,但是有一點該說不說,對于這種公司的面試官,準確說業務水平真的有些差距,我不確定他自己是不是知道自己要問的問題答案,但是總結下來,這次面試也是知道了關于大資料方面自己的哪些不足
二、一家上市中型公司面試
一個上市的中型公司
面試時間:21.1.15
面試時間:43min
面試形式:騰訊會議
1、自我介紹
因為有了前兩次的經驗積累,這一次明顯順暢多了,介紹也是游刃有余,可以根據時間隨時結束,他讓我30s,我就花了30s把情況介紹了結束
2、問了我得論文
這個問題一出來,我很蒙圈,沒見過這樣問的,事實證明,所有的面試這是唯一一個問我論文的,大概給他講了講論文
3、接著問論文
問我論文中用了什么大資料相關的知識,這個讓我說我能給你說8000字,寫的就是大資料相關的,那不整篇都是大資料相關嗎
4、問了hdfs的讀寫流程
給他說了一遍,怎么讀怎么寫
5、yarn的調度機制
fifo、容量/能力、公平;apache用的容量、CDH用的公平
6、kafka怎么不丟資料
怎么不丟,生產、消費、broke都又不丟的保證
7、資料庫的維度建模模型
星型、雪花、星座
8、資料庫怎么保證資料一致性
這個真的不會,專案中也沒考慮過,以為我們專案主要不在資料庫,而且資料也不是進一行出一行,是會變化的,面試后查了一下,確實有好多確保資料一致性的方案,也是補充了這一方面的知識
9、flink的遲到資料
watermark機制,
10、接著問對于超過遲到時間的資料怎么處理?是不是允許遲到時間越久越好?
有一個什么玩意可以保存超過設定時間的資料,不是越久越好
11、作業崗位規劃和想要從事的作業崗位?
我說了離線處理和實時計算
12、對數倉開發感不感興趣
挺感興趣的
13、能不能接受加班
我一聽完了,這么問的,多半是不行啊,但也算誠實,我說能,通宵都行,給他樂屁了
14、介紹了他們的公司和崗位需求
介紹了他們部門屬于公司的研究所,等等一些情況,資料規模、業務等等
15、反問
問了具體的作業內容,一共幾輪面試
本次面試總結:這次面試基本情況就是比著前兩次有著明顯的提高,多了一些經驗,總結了前兩次的教訓之后,也知道了應該怎么回答面試官的問題,在這次面試中的不足也是體現出來,在面試結束后也是彌補了一下,總之識訓也是很大
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/423181.html
標籤:其他
上一篇:JUC并發編程-生產者消費者實體
