前言
大家好,我是程式員
manor,作為一名大資料專業學生、愛好者,深知面試重要性,很多學生已經進入暑假模式,暑假也不能懈怠,正值金九銀十的秋招
接下來我準備用30天時間,基于大資料開發崗面試中的高頻面試題,以每日5題的形式,帶你過一遍常見面試題及恰如其分的解答,相信只要一路走來,榷訓月累,我們侄訓在最高處見,
以古人的話共勉:道阻且長,行則將至;行而不輟,未來可期!

本欄目大資料開發崗高頻面試題主要出自
大資料技術專欄的各個小專欄,由于個別筆記上傳太早,排版雜亂,后面會進行原文美化、增加,
歷史回顧:
大資料開發崗大廠面試30天沖刺 - 榷訓月累,每日五題【Day01】——Hive1
大資料開發崗大廠面試30天沖刺 - 榷訓月累,每日五題【Day02】——Hive2
大資料開發崗大廠面試30天沖刺 - 榷訓月累,每日五題【Day03】——Kafka1
大資料開發崗大廠面試30天沖刺 - 榷訓月累,每日五題【Day04】——Kafka2
大資料開發崗常見面試復習30天沖刺 - 榷訓月累,每日五題【Day05】——Kafka3
大資料開發崗面試復習30天沖刺 - 榷訓月累,每日五題【Day06】——Kafka4
大資料開發崗面試復習30天沖刺 - 榷訓月累,每日五題【Day07】——Hbase1
大資料開發崗面試復習30天沖刺 - 榷訓月累,每日五題【Day08】——Hbase2
大資料開發崗面試復習30天沖刺 - 榷訓月累,每日五題【Day09】——Hbase3
大資料開發崗面試復習30天沖刺 - 榷訓月累,每日五題【Day10】——Hbase4
文章目錄
- 前言
- 面試題 01、什么是全域索引?
- 面試題02、什么是覆寫索引?
- 面試題 03、什么是本地索引?
- 面試題04、請簡述Hbase寫入資料的流程
- 面試題05、請簡述Hbase讀取資料的流程
- 總結
停🤚
不要往下滑了,
默默想5min,
看看這5道面試題你都會嗎?
面試題 01、什么是全域索引?
面試題02、什么是覆寫索引?
面試題 03、什么是本地索引?
面試題04、請簡述Hbase寫入資料的流程
面試題05、請簡述Hbase讀取資料的流程


以下答案僅供參考:
面試題 01、什么是全域索引?
?創建全域索引,會自動構建一張索引表
?索引表結構
–Rowkey:索引欄位+原表的rowkey
–列:占位置x
?特點:如果查詢欄位或者查詢條件不是索引欄位,就不會走索引
?應用:適合于讀多寫少
面試題02、什么是覆寫索引?
?創建覆寫索引,會自動構建一張索引表
?索引表結構
–Rowkey:索引欄位+原表的rowkey
–列:將include中的列放入索引表
?特點
–如果查詢欄位或者查詢條件不是索引欄位,就不會走索引
–如果查詢的欄位在索引表中,直接從索引表回傳結果
面試題 03、什么是本地索引?
?創建覆寫索引,會自動基于原表構建一個列族來實作索引存盤
?原表的資料中:多了一個索引列族
?特點
–不論查詢欄位是否是索引欄位,都會走索引
–將索引與資料存盤在同一臺RegionServer,提高索引讀寫性能
?注意
–本地索引會修改原資料表,對于本地索引只能使用Phoenix來操作表的資料
–鹽表不能使用本地索引
面試題04、請簡述Hbase寫入資料的流程
?step1:獲取元資料
–客戶端請求Zookeeper,獲取meta表所在的regionserver的地址
–讀取meta表的資料:獲取所有表的元資料
?step2:找到對應的Region
–根據meta表中的元資料,找到表對應的所有的region
–根據region的范圍和寫入的Rowkey,判斷需要寫入具體哪一個Region
–根據region的Regionserver的地址,請求對應的RegionServer
?step3:寫入資料
–請求RegionServer寫入對應Region:根據Region的名稱來指定寫入哪個Region
–根據列族判斷寫入哪一個具體的Store
?先寫入WAL:Hlog預寫日志中
–寫入對應Store的MemStore中
?MemStore
面試題05、請簡述Hbase讀取資料的流程
?step1:獲取元資料
–客戶端請求Zookeeper,獲取meta表所在的regionserver的地址
–讀取meta表的資料
–注意:客戶端會快取meta表的資料,只有第一次會連接ZK,讀取meta表的資料,快取會定期失效,要重新快取
?避免每次請求都要先連接zk,再讀取meta表
?step2:找到對應的Region
–根據meta表中的元資料,找到表對應的region
–根據region的范圍和寫入的Rowkey,判斷需要寫入具體哪一個Region
–根據region的Regionserver的地址,請求對應的RegionServer
?step3:讀取資料
–先查詢memstore
–如果查詢的列族開啟了快取機制,就讀取BlockCache
–如果沒有,就讀取StoreFile,并將結果放入BlockCache中
總結
今天我們復習了面試中常考的Hbase相關的五個問題,你做到心中有數了么?
其實做這個專欄我也有私心,就是希望借助每天寫一篇面試題,督促自己學習,以免在吹水群甚至都沒有談資!
對了,如果你的朋友也在準備面試,請將這個系列扔給他,
好了,今天就到這里,學廢了的同學,記得在評論區留言:打卡,給同學們以激勵,

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/291424.html
標籤:其他
