前言
分布式,是程式員必備技能之一,在面試程序中屬于必備類的,在作業中更是會經常用到,而Kafka是一個分布式的基于發布訂閱的訊息佇列,目前它的魅力是無窮的,對于Kafka的奧秘,還需要我們細細去探尋,
要談對Kafka有多熟悉,我相信還是阿里的大佬們最有發言權,所以今天分享的內容,就是Alibaba內部供應的“限量筆記”,關于Kafka的精髓全部寫在這里面了,不得不感嘆:不愧是Alibaba的技術官啊,真的服了!
關于這份Kafka限量筆記,我只能在文章中展示部分的章節內容和核心截圖,如果你需要完整的pdf版本,可以在文末免費領取哦,

一、對Kafka的認識
1.Kafka的基本概念

2.安裝與配置

3.生產與消費

4.服務端引數配置

二、生產者
1.客戶端開發
- 必要的引數配置
- 訊息的發送
- 序列化
- 磁區器
- 生產者攔截器

2.原理分析
- 整體架構
- 元資料的更新

3.重要的生產者引數

三、消費者
1.消費者與消費組

2.客戶端開發
- 必要的引數配置
- 訂閱主題與磁區
- 反序列化
- 訊息消費
- 位移提交
- 控制或關閉消費
- 指定位移消費
- 再均衡
- 消費者攔截器
- 多執行緒實作
- 重要的消費者引數

四、主題與磁區
1.主題的管理
- 創建主題
- 磁區副本的分配
- 查看主題
- 修改主題
- 配置管理
- 主題端引數
- 洗掉主題

2.初識KafkaAdminCilent
- 基本使用
- 主題合法性驗證

3.磁區的管理
- 優先副本的選舉
- 磁區重分配
- 復制限流
- 修改副本因子

4.如何選擇合適的磁區數
- 性能測驗工具
- 磁區數越多吞吐量就越高嗎
- 磁區數的上限
- 考量因素

五、日志存盤
1.檔案目錄布局

2.日志格式的演變
- v0版本
- v1版本
- 訊息壓縮
- 變長欄位
- v2版本

3.日志索引
- 偏移量索引
- 時間戳索引

4.日志清理
- 日志洗掉
- 日志壓縮

5.磁盤存盤
- 頁快取
- 磁盤I/O流程
- 零拷貝

六、深入服務端
1.協議設計

2.時間輪

3.延時操作

4.控制器

5.引數解密

七、深入客戶端
1.磁區分配策略

2.消費者協調器和組協調器

3._consumer_offsets剖析

4.事務

八、可靠性探究
1.副本剖析

2.日志同步機制

3.可靠性分析

九、Kafka應用
1.命令列工具

2.Kafka Connect

3.Kafka Mirror Maker

4.Kafka Streams

十、Kafka監控
1.監控資料的來源

2.消費滯后

3.同步失效磁區

4.監控指標說明

5.監控模塊

十一、高級應用
1.過期時間(TTL)

2.延時佇列

3.死信佇列和重試佇列

4.訊息路由

5.訊息軌跡

6.訊息審計

7.訊息代理

8.訊息中間件選型

十二、Kafka與Spark的集成
1.Spark的安裝及簡單應用

2.Spark編程模型

3.Spark的運行結構

4.Spark Streaming簡介

5.Kafka與Spark Streaming的整合

6.Spark SQL

7.Structured Streaming

8.Kafka與Structured Streaming的整合

總結
我們總是喜歡瞻仰大廠的大神們,但實際上大神也不過凡人,與菜鳥程式員相比,也就多花了幾分心思,如果你再不努力,差距也只會越來越大,實際上,作為程式員,豐富自己的知識儲備,提升自己的知識深度和廣度是很有必要的,在我看來,自己付出多少,回報就有多少,
Kafka的學習,并沒有想象中那么難,這份Kafka限量筆記里面的內容,對你學習Kafka必有啟發和幫助,如果你需要這份完整版的Kafka筆記,只需你多多支持我這篇文章

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/124844.html
標籤:其他
