一面
- 簡單介紹一下自己以及自己做過的專案;
- Java HashMap 是不是執行緒安全的?為什么?
- 請用 Java 寫個單例模式
- 知道幾種 GC 演算法?
- 如何實作一個高效的單項串列逆向輸出?
- 資料湖和資料倉庫有什么區別?
- 詳細介紹下 Flink 的 Checkpoint 執行機制(分布式快照)
- 演算法題:尋找兩個正序陣列的中位數
二面
- 如何在兩個行程間共享資料?執行緒呢?
- 如何在 main 函式里面等待一個執行緒執行完畢?
- 用MapReduce手寫一個wordcount,
- 用 MapReduce TopK 怎么實作?
- Hudi、Iceberg 和 Delta Lake 哪個熟悉?它們之前有什么區別知道嗎?
- 請簡述 Hudi 的讀寫流程,
- 布隆過濾器的原理知道嗎?(在回答 Hudi 寫資料的時候提到布隆過濾器,所以面試官問了),
- 演算法題:合并兩個有序鏈表,三個有序鏈表合并?K 個呢?
三面
- Spark Shuffle 讀寫原理說下,和 MapReduce 的 Shuffle 有什么區別?
- Hudi 支持流批一起處理嗎?他是怎么實作的?
- Iceberg 知道嗎?實作原理你知道嗎?
- Iceberg 的時間旅行是怎么實作的?什么場景下要使用它?
- Hudi 和 Iceberg 你怎么選?為什么,
- 演算法題:一輛公交車,有 m 站,最多坐 n 人,輸入一路上的票資訊(即上車下車站),輸出會不會超載,
四面
- 說一下你熟悉的設計模式?
- synchronized 和 ReentrantLock 區別是什么?
- 都知道哪些分布式一致性演算法?挑一個你熟悉的說下其原理,
- Join 的實作有哪幾種?場景是哪些?
- 一條 SQL 從提交到拿到結果都經歷了什么?
- 說下你理解的資料湖?
- Hudi、Iceberg 和 Delta Lake 怎么選擇?
- 請簡述一下 Flink CDC 原理
歡迎關注,《大資料成神之路》系列文章
歡迎關注,《大資料成神之路》系列文章
歡迎關注,《大資料成神之路》系列文章
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/251378.html
標籤:Java
