前言
大家好,我是
manor,相信大家和我一樣,都有一個大廠夢,作為一名大資料專業學生、愛好者,深知面試重要性,很多學生已經進入暑假模式,暑假也不能懈怠,正值金九銀十的秋招
接下來我準備用30天時間,基于大資料開發崗面試中的高頻面試題,以每日5題的形式,帶你過一遍熱門面試題及恰如其分的解答,相信只要一路走來,榷訓月累,我們侄訓在最高處見,
以古人的話共勉:道阻且長,行則將至;行而不輟,未來可期!

本欄目大資料開發崗高頻面試題主要出自
大資料技術專欄的各個小專欄,由于個別筆記上傳太早,排版雜亂,后面會進行原文美化、增加,
文章目錄
- 前言
- 面試題 01 Kafka中消費者與消費者組的關系是什么?
- 面試題02、Kafka中Topic和Partition是什么,如何保證Partition資料安全?
- 面試題 03 Kafka中的Segment是什么?
- 面試題04、Kafka中的Offset是什么?
- 面試題05、請簡述如何使用Kafka Simple Java API 實作資料生產?描述具體的類及方法
- 總結
面試題 01 Kafka中消費者與消費者組的關系是什么?

?消費者組負責訂閱Topic,消費者負責消費Topic磁區的資料
?消費者組中可以包含多個消費者,多個消費者共同消費資料,增加消費并行度,提高消費性能
?消費者組的id由開發者指定,消費者的id由Kafka自動分配
面試題02、Kafka中Topic和Partition是什么,如何保證Partition資料安全?
?Topic:邏輯上實作資料存盤的分類,類似于資料庫中的表概念
?Partition:Topic中用于實作分布式存盤的物理單元,一個Topic可以有多個磁區
–每個磁區可以存盤在不同的節點,實作分布式存盤
?保證資料安全通過副本機制:Kafka中每個磁區可以構建多個副本【副本個數 <= 機器的個數】
–將一個磁區的多個副本分為兩種角色
–leader副本:負責對外提供讀寫請求
–follower副本:負責與leader同步資料,如果leader故障,follower要重新選舉一個成為leader
?選舉:由Kafka Crontroller來決定誰是leader
面試題 03 Kafka中的Segment是什么?
?Segment是對磁區內部的資料進行更細的劃分,磁區段,檔案段
?規則:按照檔案產生的時間或者大小
?目的:提高寫入和查詢性能
–檔案名稱可以用于檢索資料:用offset命名的
?組成:每個Segment由兩個檔案組成
–.log:存盤的資料
–.index:對應.log檔案的索引資訊
面試題04、Kafka中的Offset是什么?
?Offset是kafka中存盤資料時給每個資料做的標記或者編號
?磁區級別的編號,每個磁區從0開始編號
?功能:消費者根據offset來進行消費,保證順序消費以及消費資料的一次性語意
面試題05、請簡述如何使用Kafka Simple Java API 實作資料生產?描述具體的類及方法
?step1:構建生產者連接物件:KafkaProducer
–需要配置物件:管理配置,例如連接地址:Properties
?step2:KafkaProducer:send:生產資料到Kafka中
–需要構建一個生產的資料物件:ProducerRecord
–ProducerRecord(Topic,Value)
–ProducerRecord(Topic,Key,Value)
–ProducerRecord(Topic,Partition,Key,Value)
總結
今天我們復習了面試中常考的Kakfa相關的五個問題,你做到心中有數了么?
其實做這個專欄我也有私心,就是希望借助每天寫一篇面試題,督促自己學習,以免在吹水群甚至都沒有談資!
對了,如果你的朋友也在準備面試,請將這個系列扔給他,
好了,今天就到這里,學廢了的同學,記得在評論區留言:打卡,給同學們以激勵,

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/289526.html
標籤:其他
上一篇:zookeeper概述和部署
下一篇:端點科技 面經
