前言:
記錄一下9月秋招情況,八月初開始一直進行筆試面試,幾乎每天都有,從七月面試涼了后就開始海投(投了70家左右了),大致的進展如下,感覺今年池子尤其的深,
崗位:大資料開發,資料開發
順豐科技: 1-2-HR,已OC
貝殼找房:1-2-HR,已接到HR電話
阿里菜鳥:1-2-3-HR,等結果
快手科技: 1-2-3-HR,等結果
京東:1-2-HR,等結果
網易云:1-2-HR,開獎沒開到
一點資訊: 1-2-3-HR,等結果
有贊:1-2-HR,等結果
VIPKID: 1-2-HR(今天HR)
本文分享給需要面試刷題的朋友,也祝愿大家順利拿到自己想要的offer,這份資料主要包含了Java基礎,資料結構,jvm,多執行緒等等,由于篇幅有限,以下只展示小部分面試題,有需要完整版的朋友可以點一點鏈接跳轉領取:鏈接:點擊即可!!!暗號:CSDN
小米:一面涼
騰訊pcg后端:一面涼,沒看到大資料崗,投的后端,一直問后端涼, 手撕代碼也寫不出來
跟誰學:一面涼,也問好多后端,手撕代碼也寫不出來
其他的就是:筆試后沒結果的,拼多多,老虎證券,嗶哩嗶哩,科大訊飛,滴滴,愛奇藝,攜程,4399,等等好多筆試都掛掉
還有簡歷掛掉的:猿輔導,百度,作業幫,好未來等
個人情況:
本科黑龍江末流二本,研究生末流985,實習主要寫SQL
技術相關:JAVA,MySQL,Linux,Hadoop,Hive,HBase,Flume,Kafka,Kylin,對離線數倉熟悉,Spark和Flink了解一點點,簡歷上幾乎沒怎么寫
面經:
有10多天沒整理面經了,上午整理了一些,可能有好多問題,大概整理一下,還有的沒整理出來
順豐科技: 一面
專案介紹
技術選型
維度,指標,講了二期三期主題
Kylin和Presto和Druid區別看一看
報表可視化
資料小為啥不用關系型資料庫
Kylin的雪崩
遇到過得比較大的挑戰?業務對接,Kylin的Bug
對大資料的理解
資料倉庫,Hive的執行引擎mr,Tez,Spark
mr和Tez會出現啥問題,適合什么樣的場景,Tez底層
資料傾斜
Hbase的rowkey設計
排序演算法
Java基礎,執行緒上下問切換,資源消耗問題
垃圾回收演算法
二面
介紹專案
Kylin的優勢,構建Cube非常復雜
Presto和Druid
Kylin的Cube存在Hbase上
Shuffle的程序
資料傾斜問題,
Group by 和 Reduce by?
Group by 和 Order by 執行程序
Group by 和 Distinct的區別
Flume和Kafka用在專案中
數倉介紹一下,數倉分層,每層做什么事
資料的實效性,
Hadoop集群的規模
資料量大小
資料的版本,發版策略
未來三年的規劃,三年能達到什么的高度?
反問環節
大資料的幾個方向
你想做啥?
資料量幾十個T左右
作業地點考慮
三面
個人介紹
接觸大資料技術?平常自主學習?
數學建模和挑戰杯的內容?
讀研究生給你帶來的最大識訓?
為什么選擇順豐科技?發展?
城市選擇問題?
家人對作業地點有什么意見嗎?
行業的選擇?
順豐科技的了解?為什么選擇?
手中有別的offer嗎?
家人給你帶來的幫助?識訓?
職業規劃?
反問?
貝殼 : 一面(8.15. 23分鐘)
1.資料倉庫相關,主要是問專案中的
2.資料倉庫橫向(是指分層),他問我縱向怎么劃分(是主題嗎?我就把實習專案中做的主題和他說了說)
3.寫SQL(rank 函式) 公司人員成本表a,有三個欄位 月份date( 格式:2020-05) 、成員name、成本amt.2019年各成員成本排名
4.寫SQL(連表,然后group by) 公司部門表 b 有兩個欄位 人名name、部門department ;部門每月的成本,
5.問專案中表的情況
6.實習中用的kylin,構建,還有優化(使用維度聚合之類,我只知道簡單的)
7.問clickhouse,我不知道,presto我實習中用的是kylin也不知道,
8.遇到的問題,社區版kylin有很多bug(在7070的web界面寫SQL,遇到過的一些例外,零除和連表的一些問題)
9.做的系統給誰用,給集團和各個事業部的
10.專案中資料的校對,怎么做的,
11.反問環節
二面(8.15. 31分鐘)
1.問實習專案中做的作業,我主要寫建資料模型,寫kylin SQL
2.圍繞專案展開的,實習專案中數倉相關,為什么分層,維度建模,什么是維度(讓我解釋,懵逼)
3.寫下面的執行順序
select
from
where
group by
having
order by
limit
執行順序
我當時寫的有些問題,然后我就按照自己想法解釋了一通,大致沒問題
4.讓我把上面的SQL對應到MR里面
就是MR的輸入輸出對應啥,
我把MR中的分組,排序大概說了說對應上,要對MR中map(),reduce()和shuffle熟悉,之前18年寫MR程式寫的多,寫過的話就會知道了
5.Hive的優化,常用的說,我大概說了6-7條,有說了2條Hadoop
6.資料傾斜解決,我大概說了3條
反問環節
HR面(8.15. 18分鐘)
1.為什么做大資料,想做那個方向?
2.專案中做了啥,識訓
3.專案擔任角
4.問本科期間做的比賽,數學建模和挑戰杯
5.作業地點
6.選擇公司考慮什么
7.面了哪些公司
8.對貝殼的了解
9.反問環節
10.對薪資的期望
11.能不能實習
快手:一面:8.10
1.說一下shuffle程序
2.磁區是根據啥磁區的,自定義磁區
3.資料傾斜產生
4.做join的傾斜問題
5.map join 的原理
6. 調整map數和reduce數,怎么調?
7.數倉建模的問題,自己說
8.HashMap的實作
9.快速排序 實作,時間復雜度,穩定性,
10,區間合并的題,LeetCode
反問環節
二面:8.11
自我介紹
1.比較有挑戰的事情?
2.專案問題
3.核心指標,從每一期指標說了說
4.指標對不上問題,資料對不上
5.數倉整個程序
6.資料量大小
7.數倉,寫SQL
作業地點
反問作業
面試到45分鐘
三面 8.18(1個小時)
都是自己說
1.java基礎封裝繼承多型
2.集合相關,list和map那些
3.執行緒相關,自己說
4.資料庫
5.HDFS
6.MR
7.Hive
8.專案介紹
9.大資料學習程序
10.
現在有大學考試成績如下表A:
id,subject,score
找出每一科都是這一科前30%的學生的id
HR面8.26
一開始約的牛客面,后來公司網路問題,那邊改成電話,正常問題,忘記錄音
網易云大資料 : 一面(8.14. 46分鐘)
不自我介紹直接開始
Hadoop
存盤
MR和shuffle
reduce分三個階段,你怎么分
資源調度
Hive執行流程(SQL轉MR程序)
ZK的原理 paxos一致性演算法
行程和執行緒區別
記憶體模型
鎖的機制,什么時候用到鎖,
寫代碼:
1.洗掉無序鏈表中值重復出現的節點 選擇換題
2.單鏈表的選擇排序 選擇換題
3.翻轉字串(2) AC
4.括號字串的有效性 AC
二面(8.18. 31分鐘)
不自我介紹直接開始
1.直接問專案,做了啥,問一下資料建設情況
2.對Kylin的了解
3.做的系統給誰用,可視化用的啥
4.實習中開發作業的流程
5.Cube的優化,減少膨脹率
6.專案中主要做的作業寫SQL
7.寫SQL,我記得一個是用rank求排名的,一個是用explode函式,把陣列炸裂開,讓一行變多行的,然后連表
8.hive優化相關,SQL書寫優化,連表優化等,hive的調引數優化等
9.每天跑數的時候,任務掛掉了,怎么搞?(實習中沒搞過,一頓瞎扯)
10.HBase,寫資料流程
11.大資料啥時候學的,為什么往這個發展
12.另一個專案的資料來源,我爬蟲得到的
13.職業規劃,反問
三面(8.20. 25分鐘)
1.實習專案參與情況
2.有成就感的事情,順著吧專案說了說
3.專案組開發人員情況
4.遇到困哪
5.平常的學習程序
6.專案中那些需要改進和提升
7.為什么往大資料發展
8.職業規劃
9.興趣愛好
10.聽音樂的型別
11.用網易云聽
12.最大的挫折
13.有什么優點,缺點
14.面試了那些
15.作業地點,有沒有女朋友
16.反問
京東 : 一面:8.12
就10分鐘面試
1.自我介紹
2.專案
3.崗位要做什么
4.資料庫的原理,關系型資料庫理論知識
5.轉到數倉,分倉
6.學生干部經歷
7.實習情況?
8.反問環節?
二面:8.18
沒錄音,記不太清了
1.最有成就感事情
2.數倉建模
3. 累計快照事實表
HR面,8.27
把我鴿了,第二天又面得,也沒錄音,8分鐘結束,正常問題
郵箱收到通知說審批,審批過了就有,沒過就感謝信
總結:
8月份也面了不少,感覺現在手里沒面得大廠剩美團,百度這些了,還有別的歡迎補充,
祝大家能識訓心儀的offer,
覺得有用的點贊,收藏支持一下,面經后續整理繼續更新,
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/7686.html
標籤:其他
