1、scala 語言有什么特點,相比java有什么優點?
2、什么是Scala的伴生類和伴生物件?
3、spark有什么特點,處理大資料有什么優勢?
4、Spark技術堆疊有哪些組件,每個組件都有什么功能,適合什么應用場景?
5、Apache Spark有哪些常見的穩定版本,Spark1.6.0的數字分別代表什么意思?
6、Mapreduce和Spark有什么區別與聯系?
7、簡單說一下hadoop和spark的shuffle相同和差異?
8、Spark為什么比mapreduce快?
9、簡要描述Spark分布式集群搭建的步驟?
10、spark的有幾種部署模式,每種模式特點?
11、spark集群運算的模式有哪些?
12、Spark有哪些算子,列舉幾個你熟悉的?
13、spark中的RDD是什么,有哪些特性?
14、談談spark中的寬窄依賴?
15、cache和pesist有什么區別?
16、spark rdd 如何區分寬依賴和窄依賴?
17、RDD中reduceBykey與groupByKey哪個性能好,為什么?
18、spark streming在實時處理時會發生什么故障,如何停止,解決?
19、spark streaming 讀取kafka資料的兩種方式?
20、spark 如何防止記憶體溢位?
21、如何解決spark中的資料傾斜問題?
22、spark中的資料傾斜的現象、原因、后果?
23、Spark有哪些優化方法?
24、spark中如何劃分stage?
25、spark有哪些組件? ?
26、Spark中Work的主要作業是什么?
27、Spark driver的功能是什么?
28、如何配置spark master的HA?
29、Spark master HA 主從切換程序不會影響集群已有的作業運行,為什么?
30、Spark master使用zookeeper進行HA的,有哪些元資料保存在Zookeeper?
31、Spark master HA 主從切換程序不會影響集群已有的作業運行,為什么?
32、Spark master使用zookeeper進行HA的,有哪些元資料保存在Zookeeper?
33、spark-submit的時候如何引入外部jar包?
34、spark面試需要儲備哪些知識?
35、Spark on Mesos中,什么是的粗粒度分配,什么是細粒度分配,各自的優點和缺點是什么?
答案參考:Spark常見面試題
uj5u.com熱心網友回復:
uj5u.com熱心網友回復:
好東西,感謝!uj5u.com熱心網友回復:
內容一晚上好的不行uj5u.com熱心網友回復:
面試秘籍,如何在面試程序中游刃有余!拿走不謝!
https://mp.weixin.qq.com/s/sCkvAJClgjlTk0BaTeFlUQ
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/33963.html
標籤:Spark
上一篇:Harbor鏡像倉庫使用精簡指南
