主頁 > 軟體設計 > Kafka檔案存盤機制

Kafka檔案存盤機制

2021-01-08 10:55:12 軟體設計

1、Kafka部分名詞解釋

在一套 Kafka 架構中有多個 Producer,多個 Broker,多個 Consumer,每個 Producer 可以對應多個 Topic,每個 Consumer 只能對應一個 Consumer Group,

整個 Kafka 架構對應一個 ZK 集群,通過 ZK 管理集群配置,選舉 Leader,以及在 Consumer Group 發生變化時進行 Rebalance
在這里插入圖片描述

  • Broker:訊息中間件處理結點,一個Kafka節點就是一個broker,多個broker可以組成一個Kafka集群,
  • Topic:一類訊息,例如page view日志、click日志等都可以以topic的形式存在,Kafka集群能夠同時負責多個topic的分發,
  • Partition:topic物理上的分組,一個topic可以分為多個partition,每個partition是一個有序的佇列,
  • Segment:partition物理上由多個segment組成,

2、分析程序

  • topic中partition存盤分布
  • partiton中檔案存盤方式
  • partiton中segment檔案存盤結構
  • 在partition中如何通過offset查找message

3、topic中partition存盤分布

只有一個broker的情況

假設實驗環境中kafka集群只有一個broker,xxx/message-folder為資料檔案存盤根目錄,在Kafka的broker中server.properties檔案配置(引數log.dirs=xxx/message-folder),例如創建2個topic名 稱分別為info_add、info_update, partitions數量都為partitions=4,

存盤路徑和目錄規則為:

|–info_add-0
|–info_add-1
|–info_add-2
|–info_add-3
|–info_update-0
|–info_update-1
|–info_update-2
|–info_update-3

在Kafka檔案存盤中,同一個topic下有多個不同partition,每個partition為一個目錄,partiton命名規則為topic名稱+有序序號,第一個partiton序號從0開始,序號最大值為partitions數量減1,

多broker分布的情況

Kafka集群partition replication,默認自動分配

(1)下面以一個Kafka集群中4個Broker舉例,創建1個topic包含4個Partition,2 Replication;資料Producer流動如圖所示:

在這里插入圖片描述
(2)當集群中新增2個節點,Partition增加到6個節點時的分布情況如下:

在這里插入圖片描述

副本分配邏輯規則

在Kafka集群中,每個Broker都有均等分配Partition的Leader機會,

上述圖中的Broker Partition中,箭頭指向為副本,以Partition-0為例:broker1中parition-0為Leader,Broker2中Partition-0為副本,

上述圖中每個Broker(按照BrokerId有序)依次分配主Partition,下一個Broker為副本,如此回圈迭代分配,多副本都遵循此規則,

副本分配演算法

將所有N個Broker和待分配的i個Partition排序,

將第i個Partition分配到第(i mod n)個Broker上,

將第i個Partition的第j個副本分配到第((i + j) mod n)個Broker上,

4、partiton中檔案存盤方式

下面示意圖形象說明了partition中檔案存盤方式:

在這里插入圖片描述
每個partion(目錄)相當于一個巨型檔案被平均分配到多個大小相等segment(段)資料檔案中,但每個段segment file訊息數量不一定相等,這種特性方便old segment file快速被洗掉,

每個partiton只需要支持順序讀寫就行了,segment檔案生命周期由服務端配置引數決定,

這樣做的好處就是能快速洗掉無用檔案,有效提高磁盤利用率,

5、partition中segment檔案存盤結構

下面深入分析partition中segment file組成和物理結構,

segment file組成:由2大部分組成,分別為index file和data file,此2個檔案一一對應,成對出現,后綴".index"和“.log”分別表示為segment索引檔案、資料檔案,

segment檔案命名規則:partion全域的第一個segment從0開始,后續每個segment檔案名為上一個全域partition的最大offset(偏移message數),數值最大為64位long大小,19位數字字符長度,沒有數字用0填充,

在Kafka broker上做一個實驗,創建一個topicXXX包含1 partition,設定每個segment大小為500MB,并啟動producer向Kafka broker寫入大量資料,如下圖所示的segment檔案串列正好形象說明了上述2個規則:

在這里插入圖片描述
以上述圖中的一對segment file檔案為例,說明segment中index<—->data file對應關系物理結構如下:
在這里插入圖片描述
上述圖中的索引檔案存盤大量元資料,資料檔案存盤大量訊息,索引檔案中元資料指向對應資料檔案中message的物理偏移地址,其中以索引檔案中元資料3,497為例,依次在資料檔案中表示第3個message(在全域partiton表示第368772個message)、以及該訊息的物理偏移地址為497,

segment data file由許多message組成,下面詳細說明message物理結構:
在這里插入圖片描述
引數說明:
在這里插入圖片描述

6、在partition中如何通過offset查找message

例如讀取offset=368776的message,需要通過下面2個步驟查找,

(1)查找segment file

00000000000000000000.index表示最開始的檔案,起始偏移量(offset)為0,第二個檔案00000000000000368769.index的訊息量起始偏移量為368770 = 368769 + 1,同樣,第三個檔案00000000000000737337.index的起始偏移量為737338=737337 + 1,其他后續檔案依次類推,以起始偏移量命名并排序這些檔案,只要根據offset 二分查找檔案串列,就可以快速定位到具體檔案,

當offset=368776時定位到00000000000000368769.index|log,

(2)通過segment file 查找message

通過第(1)步定位到segment flie,當offset=368776時,依次定位到00000000000000368769.index的元資料物理位置和 00000000000000368769.log的物理偏移地址,然后再通過00000000000000368769.log順序查找直到 offset=368776為止,

這樣做的優點,segment index file采取稀疏索引存盤方式,它減少索引檔案大小,通過mmap可以直接記憶體操作,稀疏索引為資料檔案的每個對應message設定一個元資料指標,它比稠密索引節省了更多的存盤空間,但查找起來需要消耗更多的時間,

7、Kafka服務端配置及其優化

每個kafka broker中組態檔server.properties默認必須配置的屬性如下:

broker.id=0
num.network.threads=2
num.io.threads=8
socket.send.buffer.bytes=1048576
socket.receive.buffer.bytes=1048576
socket.request.max.bytes=104857600
log.dirs=/tmp/kafka-logs
num.partitions=2
log.retention.hours=168
 
log.segment.bytes=536870912
log.retention.check.interval.ms=60000
log.cleaner.enable=false
 
zookeeper.connect=localhost:2181
zookeeper.connection.timeout.ms=1000000

server.properties中所有配置引數說明(解釋)如下串列:

在這里插入圖片描述

8、Kafka檔案存盤機制–實際運行效果

實驗環境:

Kafka集群:由2臺虛擬機組成
cpu:4核
物理記憶體:8GB
網卡:千兆網卡
jvm heap: 4GB

在這里插入圖片描述

從上述圖中可以看出基本沒有大量讀磁盤的操作,只有(定期批量)寫磁盤操作,之所以操作磁盤這么高效,這跟Kafka檔案存盤設計中讀寫message是息息相關的,

Kafka中讀寫message有如下特點:

寫message

(1)訊息從java堆轉入Page Cache(即物理記憶體),
(2)由異步執行緒刷盤,訊息從pagacache刷入磁盤,

讀message

(1)訊息直接從Page Cache(資料在虛擬記憶體)轉入socket發送出去,
(2)當從Page Cache沒有找到相應資料時,此時會產生磁盤IO,從磁盤Load訊息到Page Cache,然后直接從socket發出去,

9、總結

Kafka高效檔案存盤設計特點

(1)Kafka把topic中一個parition大檔案分成多個小檔案段,通過多個小檔案段,就容易定期清除或洗掉已經消費完檔案,減少磁盤占用,
(2)通過索引資訊可以快速定位message和確定response的最大大小,
(3)通過index元資料全部映射到memory,可以避免segment file的IO磁盤操作,
(4)通過索引檔案稀疏存盤,可以大幅降低index檔案元資料占用空間大小,

參考:

https://www.open-open.com/lib/view/open1421150566328.html

轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/246150.html

標籤:其他

上一篇:2021 自編譯最新穩定版 128M WNDR4300V1 Openwrt Lean韌體

下一篇:【騰訊開發者大會】天刀手游開發歷程(筆記)

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 面試突擊第一季,第二季,第三季

    第一季必考 https://www.bilibili.com/video/BV1FE411y79Y?from=search&seid=15921726601957489746 第二季分布式 https://www.bilibili.com/video/BV13f4y127ee/?spm_id_fro ......

    uj5u.com 2020-09-10 05:35:24 more
  • 第三單元作業總結

    1.前言 這應該是本學期最后一次寫作業總結了吧。總體來說,對作業的節奏也差不多掌握了,作業做起來的效率也更高了。雖然和之前的作業一樣,作業中都要用到新的知識,但是相比之前,更加懂得了如何利用工具以及資料。雖然之間卡過殼,但總體而言,這幾次作業還算完成的比較好。 2.作業程序總結 相比前兩個單元,此單 ......

    uj5u.com 2020-09-10 05:35:41 more
  • 北航OO(2020)第四單元博客作業暨課程總結博客

    北航OO(2020)第四單元博客作業暨課程總結博客 本單元作業的架構設計 在本單元中,由于UML圖具有比較清晰的樹形結構,因此我對其中需要進行查詢操作的元素進行了包裝,在樹的父節點中存盤所有孩子的參考。考慮到性能問題,我采用了快取機制,一次查詢后盡可能快取已經遍歷過的資訊,以減少遍歷次數。 本單元我 ......

    uj5u.com 2020-09-10 05:35:48 more
  • BUAA_OO_第四單元

    一、UML決議器設計 ? 先看下題目:第四單元實作一個基于JDK 8帶有效性檢查的UML(Unified Modeling Language)類圖,順序圖,狀態圖分析器 MyUmlInteraction,實際上我們要建立一個有向圖模型,UML中的物件(元素)可能與同級元素連接,也可與低級元素相連形成 ......

    uj5u.com 2020-09-10 05:35:54 more
  • 6.1邏輯運算子

    邏輯運算子 1. && 短路與 運算式1 && 運算式2 01.運算式1為true并且運算式2也為true 整體回傳為true 02.運算式1為false,將不會執行運算式2 整體回傳為false 03.只要有一個運算式為false 整體回傳為false 2. || 短路或 運算式1 || 運算式2 ......

    uj5u.com 2020-09-10 05:35:56 more
  • BUAAOO 第四單元 & 課程總結

    1. 第四單元:StarUml檔案決議 本單元采用了圖模型決議UML。 UML檔案可以抽象為圖、子圖、邊的邏輯結構。 在實作中,圖的節點包括類、介面、屬性,子圖包括狀態圖、順序圖等。 采用了三次遍歷UML元素的方法建圖,第一遍遍歷建點,第二、三次遍歷設定屬性、連邊,實作圖物件的初始化。這里借鑒了一些 ......

    uj5u.com 2020-09-10 05:36:06 more
  • 談談我對C# 多型的理解

    面向物件三要素:封裝、繼承、多型。 封裝和繼承,這兩個比較好理解,但要理解多型的話,可就稍微有點難度了。今天,我們就來講講多型的理解。 我們應該經常會看到面試題目:請談談對多型的理解。 其實呢,多型非常簡單,就一句話:呼叫同一種方法產生了不同的結果。 具體實作方式有三種。 一、多載 多載很簡單。 p ......

    uj5u.com 2020-09-10 05:36:09 more
  • Python 資料驅動工具:DDT

    背景 python 的unittest 沒有自帶資料驅動功能。 所以如果使用unittest,同時又想使用資料驅動,那么就可以使用DDT來完成。 DDT是 “Data-Driven Tests”的縮寫。 資料:http://ddt.readthedocs.io/en/latest/ 使用方法 dd. ......

    uj5u.com 2020-09-10 05:36:13 more
  • Python里面的xlrd模塊詳解

    那我就一下面積個問題對xlrd模塊進行學習一下: 1.什么是xlrd模塊? 2.為什么使用xlrd模塊? 3.怎樣使用xlrd模塊? 1.什么是xlrd模塊? ?python操作excel主要用到xlrd和xlwt這兩個庫,即xlrd是讀excel,xlwt是寫excel的庫。 今天就先來說一下xl ......

    uj5u.com 2020-09-10 05:36:28 more
  • 當我們創建HashMap時,底層到底做了什么?

    jdk1.7中的底層實作程序(底層基于陣列+鏈表) 在我們new HashMap()時,底層創建了默認長度為16的一維陣列Entry[ ] table。當我們呼叫map.put(key1,value1)方法向HashMap里添加資料的時候: 首先,呼叫key1所在類的hashCode()計算key1 ......

    uj5u.com 2020-09-10 05:36:38 more
最新发布
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:20:47 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:20:25 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:20:17 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:20:10 more
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:19:44 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:19:07 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:18:57 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:18:49 more
  • 05單件模式

    #經典的單件模式 public class Singleton { private static Singleton uniqueInstance; //一個靜態變數持有Singleton類的唯一實體。 // 其他有用的實體變數寫在這里 //構造器宣告為私有,只有Singleton可以實體化這個類! ......

    uj5u.com 2023-04-19 08:42:51 more
  • 【架構與設計】常見微服務分層架構的區別和落地實踐

    軟體工程的方方面面都遵循一個最基本的道理:沒有銀彈,架構分層模型更是如此,每一種都有各自優缺點,所以請根據不同的業務場景,并遵循簡單、可演進這兩個重要的架構原則選擇合適的架構分層模型即可。 ......

    uj5u.com 2023-04-19 08:42:41 more