主頁 > 後端開發 > Rocksdb原理簡介

Rocksdb原理簡介

2023-05-26 07:55:59 後端開發

本文分享自天翼云開發者社區《Rocksdb原理簡介》,作者:l****n

Rocksdb作為當下nosql中性能的代表被各個存盤組件(mysql、tikv、pmdk、bluestore)作為存盤引擎底座,其基于LSM tree的核心存盤結構(將隨機寫通過資料結構轉化為順序寫)來提供高性能的寫吞吐時保證了讀性能,同時大量的并發性配置來降低compaction的影響,

涉及到的幾個核心檔案:

WAL

WriteAheadLog,rocksdb的日志,保存memtable中的資訊,當memtable轉化為immutable memtable并且Flush到L0層之后,之前WAL的會被清理,即于洗掉DB目錄下的log檔案,

RocksDB中每一次資料的更新都會涉及到兩個結構,一個是記憶體中的memtable(后續會重繪到磁盤成為SST),第二個是WAL,

WAL主要的功能是當RocksDB例外退出后,能夠恢復出錯前的記憶體中(memtable)資料,因此RocksDB默認是每次用戶寫都會重繪資料到WAL,每次當當前WAL對應的記憶體資料(memtable)重繪到磁盤之后,都會新建一個WAL,

所有的WAL檔案都是保存在WAL目錄(options.wal_dir),為了保證資料的狀態,所有的WAL檔案的名字都是按照順序的(log_number),

MANIFEST

RocksDB中MANIFEST保存了存盤引擎的內部的一些狀態元資料,簡單來說當系統例外重啟,或者程式例外被退出之后,RocksDB需要有一種機制能夠恢復到一個一致性的狀態, 而這個一致性的狀態就是靠MANIFEST來保證的.

MANIFEST在RocksDB中是一個單獨的檔案,而這個檔案所保存的資料基本是來自于VersionEdit這個結構.

MANIFEST包含了兩個檔案,一個log檔案一個包含最新MANIFEST檔案名的檔案,Manifest的log檔案名是這樣 MANIFEST-(seq number),這個seq會一直增長.只有當 超過了指定的大小之后,MANIFEST會重繪一個新的檔案,當新的檔案重繪到磁盤(并且檔案名更新)之后,老的檔案會被洗掉掉,這里可以認為每一次MANIFEST的更新都代表一次snapshot,

CURRENT

記錄當前最新的MANIFEST檔案編號

Memtable

常駐于記憶體中,在WAL寫之后,記錄具體的key-value資料,在RocksDB中,每個ColumnFamily都有自己的Memtable,Column Family之間互不影響,而在RocksDB中Memtable有多種實作,SkipList/HashSkipList/HashLinkList/Vector,默認的實作為SkipList(只有skiplist可以并發插入),memtable大小以及個數可以由指定的引數進行控制:

write_buffer_size表示memtable的大小

max_write_buffer_number表示記憶體中最多可以同時存在多少個memtable的個數

Immutable memtable

memtable被寫滿之后會生成一個新的memtable繼續接受IO,舊的memtable就會變成immutable memtable,為只讀的狀態,且開始由后臺執行緒Flush到磁盤的L0層sst,

SST

核心key-value的存盤檔案,比如DB目錄下的000023.sst檔案,默認分為L0~L7層,當滿足一定條件時(本層sst總大小超過配置大小、WAL檔案超過一定值)后臺開啟compaction任務,從當前層和下一層選取若干sst,做合并,并寫入新的sst檔案,

CcolumnFamily
RocksDB 3.0中加入了Column Family特性,加入這個特性之后,每一個KV對都會關聯一個Column Family,其中默認的Column Family是 "default",Column Family主要是提供給RocksDB一個邏輯的磁區,從實作上來看不同的Column Family共享WAL,而都有自己的memtable和SST,同時擁有自己的配置,這就意味著我們可以快速方便的設定不同的屬性的Column Family以及快速洗掉對應的Column Family,但是因為Column Family共享WAL,可能會咬住WAL,讓WAL快速增長從而觸發memtable的強制Flush,

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/553408.html

標籤:其他

上一篇:用go封裝一下封禁功能

下一篇:返回列表

標籤雲
其他(159696) Python(38169) JavaScript(25452) Java(18129) C(15231) 區塊鏈(8268) C#(7972) AI(7469) 爪哇(7425) MySQL(7211) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5873) 数组(5741) R(5409) Linux(5341) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4576) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2434) ASP.NET(2403) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1976) 功能(1967) Web開發(1951) HtmlCss(1944) C++(1922) python-3.x(1918) 弹簧靴(1913) xml(1889) PostgreSQL(1878) .NETCore(1861) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • Rocksdb原理簡介

    Rocksdb作為當下nosql中性能的代表被各個存盤組件(mysql、tikv、pmdk、bluestore)作為存盤引擎底座,其基于LSM tree的核心存盤結構(將隨機寫通過資料結構轉化為順序寫)來提供高性能的寫吞吐時保證了讀性能。同時大量的并發性配置來降低compaction的影響。 ......

    uj5u.com 2023-05-26 07:55:59 more
  • 用go封裝一下封禁功能

    本篇為[用go設計開發一個自己的輕量級登錄庫/框架吧]的封禁業務篇,會講講封禁業務的實作,給庫/框架增加新的功能。原始碼:https://github.com/weloe/token-go ......

    uj5u.com 2023-05-26 07:50:53 more
  • 它來了!真正的 python 多執行緒

    哈嘍大家好,我是咸魚 幾天前,IBM 工程師 Martin Heinz 發文表示 python 3.12 版本回引入"Per-Interpreter GIL”,有了這個 Per-Interpreter 全域解釋器鎖,python 就能實作真正意義上的并行/并發 我們知道,python 的多執行緒/行程 ......

    uj5u.com 2023-05-26 07:50:49 more
  • ThreadLocal的應用及原理

    ## 1. ThreadLocal 是什么 JDK 對`ThreadLocal`的描述為: > 此類提供執行緒區域變數。這些變數與普通變數的不同之處在于,每個訪問一個變數的執行緒(通過其get或set方法)都有自己的、獨立初始化的變數副本。ThreadLocal 實體通常是類中的私有靜態欄位,這些欄位希 ......

    uj5u.com 2023-05-26 07:45:35 more
  • Java的CompletableFuture,Java的多執行緒開發

    # 三、Java8的CompletableFuture,Java的多執行緒開發 ## 1、CompletableFuture的常用方法 - 以后用到再加 ```properties runAsync() :開啟異步(創建執行緒執行任務),無回傳值 supplyAsync() :開啟異步(創建執行緒執行任務 ......

    uj5u.com 2023-05-26 07:35:06 more
  • Maven的核心解壓與配置

    ? # Maven的核心解壓與配置 @[toc] ## 1. Maven 官網地址 首頁:[Maven – Welcome to Apache Maven(opens new window)](https://maven.apache.org/) ![在這里插入圖片描述](https://img20 ......

    uj5u.com 2023-05-26 07:29:23 more
  • AQS原始碼解讀----AbstractQueuedSynchronizer

    36 package cn.com.pep; 37 import java.util.concurrent.TimeUnit; 38 import java.util.concurrent.locks.AbstractOwnableSynchronizer; 39 import java.util. ......

    uj5u.com 2023-05-26 07:28:40 more
  • < Python全景系列-7 > 提升Python編程效率:模塊與包全面解讀

    Python全景系列的第七篇,本文將深入探討Python模塊與包的基本概念,使用方法以及其在實際專案中的應用。我們也會揭示一些鮮為人知,卻又實用的技術細節。 ......

    uj5u.com 2023-05-26 07:28:06 more
  • Netty實戰(三)

    [toc](目錄) # 一、Channel、EventLoop 和 ChannelFuture 上一篇博文我們在構建服務端和客戶端中出現了一些新的類,可能有些同學還有些不了解它們的具體功能。沒關系,接下來我們對于 Channel、EventLoop 和 ChannelFuture 類進行的討論增添更 ......

    uj5u.com 2023-05-25 12:11:19 more
  • MyBatis體系筆記(未完結)

    MyBatis 什么是MyBatis MyBatis是優秀的持久層框架 MyBatis使用XML將SQL與程式解耦,便于維護 MyBatis學習簡單,執行高效,是JDBC的延伸 1.MyBatis開發流程 引入MyBatis依賴 創建核心組態檔 創建物體(Entity)類 創建Mapper映射檔案 ......

    uj5u.com 2023-05-25 11:58:15 more