在這里插入圖片描述

作者Jay Kreps是前LinkedIn的Principle Staff Engineer，現Confluent CEO，在大資料處理領域深耕多年，我感覺這本書還是很好的，雖然只有40多頁，但是我覺得內容挺多的，沒湊字數的廢話，

整理下我個人的takeaway：

對日志的認知

"log"這個詞吃了命名的虧，以為人們習慣把代碼里調錯的各種print當成log，所以沒把它當回事，但事實上log的核心是資料，不應該是給人看的，而是給機器讀的，log記錄的是什么時候發生了什么——而這恰恰就是分布式系統最核心要處理的內容，

log在分布式系統中可以用于兩種場景：

日志服務應該作為一個獨立的服務，并以此可以成為以下系統的基礎：

基于日志服務的系統建設

對日志的需求遵循以下“Maslov需求金字塔”的順序，上層建筑依賴于下層基礎：

如何使用一套資料服務現代公司形形色色各種team的各種各樣的需求？- 使用log結合pub/sub的模式，不同team可以訂閱自己關注的事件，這樣也能實作互相之間的獨立，

為了兼顧實時性和資料的完整性，很多人是如下使用一套批處理一套流處理的方式處理資料（http://bit.ly/beat-cap)：
在這里插入圖片描述
但是這樣維護成本很大，其實可以都使用流的處理方式，如下圖所示，新的一批處理好把請求導向新的，把舊的洗掉就好了（即部署資料如同部署服務一樣？）：

轉載請註明出處，本文鏈接：https://www.uj5u.com/ruanti/259695.html

標籤：其他