主頁 >  其他 > Redis資料結構(一)-Redis的資料存盤及String型別的實作

Redis資料結構(一)-Redis的資料存盤及String型別的實作

2022-10-26 08:47:46 其他

1 引言

Redis作為基于記憶體的非關系型的K-V資料庫,因讀寫回應快速、原子操作、提供了多種資料型別String、List、Hash、Set、Sorted Set、在專案中有著廣泛的使用,今天我們來探討下下Redis的資料結構是如何實作的,

2 資料存盤

2.1 RedisDB

Redis將資料存盤在redisDb中,默認0~15共16個db,每個庫都是獨立的空間,不必擔心key沖突問題,可通過select命令切換db,集群模式使用db0

typedef struct redisDb {
dict *dict; /* The keyspace for this DB */
dict *expires; /* Timeout of keys with a timeout set */
...
} redisDb;
  • dict:資料庫鍵空間,保存著資料庫中的所有鍵值對
  • expires:鍵的過期時間,字典的鍵為鍵,字典的值為過期事件UNIX時間戳

2.2 Redis哈希表實作

2.2.1 哈希字典dict

K-V存盤我們最先想到的就是map,在Redis中通過dict實作,資料結構如下:

typedef struct dict {
    dictType *type;
    void *privdata;
    dictht ht[2];
    long rehashidx; /* rehashing not in progress if rehashidx == -1 */
    unsigned long iterators; /* number of iterators currently running */
} dict;
  • type:型別特定函式是一個指向dictType結構的指標,每個dictType結構保存了一簇用于操作特定型別鍵值對的函式,Redis會為用途不同的字典設定不同的型別特定函式,
  • privdata:私有資料保存了需要傳給那些型別特定函式的可選引數
  • ht[2]:哈希表一個包含兩個項的陣列,陣列中的每個項都是一個dictht哈希表,一般情況下,字典只使用ht[0] 哈希表,ht[1]哈希表只會在對ht[0]哈希表進行rehash時使用
  • rehashidx:rehash 索引,當rehash不在進行時,值為 -1

hash資料存在兩個特點:

  • 任意相同的輸入一定能得到相同的資料
  • 不同的輸入,有可能得到相同的輸出

針對hash資料的特點,存在hash碰撞的問題,dict通過dictType中的函式能夠解決這個問題

typedef struct dictType {
uint64_t (*hashFunction)(const void *key);
int (*keyCompare)(void *privdata, const void *key1, const void *key2);
...
} dictType;
  • hashFunction:用于計算key的hash值的方法
  • keyCompare:key的值比較方法

2.2.2 哈希表 dictht

dict.h/dictht表示一個哈希表,具體結構如下:

typedef struct dictht {
    dictEntry **table;
    unsigned long size;
    unsigned long sizemask;
    unsigned long used;
} dictht;
  • table:陣列指標,陣列中的每個元素都是一個指向dict.h/dictEntry結構的指標,每個dictEntry結構保存著一個鍵值對,
  • size:記錄了哈希表的大小,也就是table陣列的大小,大小總是2^n
  • sizemask:總是等于size - 1,這個屬性和哈希值一起決定一個鍵應該被放到table陣列的哪個索引上面,
  • used:記錄了哈希表目前已有節點(鍵值對)的數量,

鍵值對dict.h/dictEntry

typedef struct dictEntry {
    void *key;
    union {
        void *val;
        uint64_t u64;
        int64_t s64;
        double d;
    } v;
    struct dictEntry *next;
} dictEntry;
  • key:保存著鍵值對中的鍵(SDS型別物件)
  • val:保存著鍵值對中的值,可以是一個uint64_t整數,或者是一個int64_t整數,又或者是一個指標指向一個被redisObject包裝的值
  • next:指向下個哈希表節點,形成鏈表指向另一個哈希表節點的指標,這個指標可以將多個哈希值相同的鍵值對連接在一次,以此來解決鍵沖突(collision)的問題

使用hash表就一定會存在hash碰撞的問題,hash碰撞后在當前陣列節點形成一個鏈表,在資料量超過hash表長度的情況下,就會存在大量節點稱為鏈表,極端情況下時間復雜度會從O(1)變為O(n);如果hash表的資料再不斷減少,會造成空間浪費的情況,Redis會針對這兩種情況根據負載因子做擴展與收縮操作:

  • 負載因子:哈希表已保存節點數量/哈希表大小,load_factor = ht[0].used/ht[0].size
  • 擴展操作:
  • 服務器目前沒有在執行BGSAVE命令或者BGREWRITEAOF命令,并且哈希表的負載因子大于等于 1;
  • 服務器目前正在執行BGSAVE命令或者BGREWRITEAOF命令,并且哈希表的負載因子大于等于5;

收縮操作:

  • 當哈希表的負載因子小于 0.1 時, 程式自動開始對哈希表執行收縮操作,

Redis在擴容時如果全量擴容會因為資料量問題導致客戶端操作短時間內無法處理,所以采用漸進式 rehash進行擴容,步驟如下:

  1. 同時持有2個哈希表
  2. 將rehashidx的值設定為0,表示rehash作業正式開始
  3. 在rehash進行期間, 每次對字典執行添加、洗掉、查找或者更新操作時,程式除了執行指定的操作以外,還會順帶將ht[0]哈希表在rehashidx索引上的所有鍵值對rehash到ht[1] ,當rehash作業完成之后,程式將rehashidx屬性的值增一
  4. 某個時間點上,ht[0]的所有鍵值對都會被rehash至ht[1] ,這時程式將rehashidx屬性的值設為-1, 表示rehash操作已完成

在漸進式 rehash 進行期間,字典的洗掉(delete)、查找(find)、更新(update)等操作會在兩個哈希表上進行;在字典里面查找一個鍵的話, 程式會先在 ht[0] 里面進行查找,如果沒找到的話,就會繼續到ht[1]里面進行查找;新添加到字典的鍵值對一律會被保存到 ht[1] 里面,而ht[0]則不再進行任何添加操作:這一措施保證了ht[0]包含的鍵值對數量會只減不增(如果長時間不進行操作時,事件輪詢進行這種操作),并隨著rehash操作的執行而最終變成空表,

dict.h/redisObject

Typedef struct redisObject {
unsigned type:4;
unsigned encoding:4;
unsigned lru:LRU_BITS;
int refcount;
void *ptr;
}
  • type:4:約束客戶端操作時存盤的資料型別,已存在的資料無法修改型別,4bit
  • encoding:4:值在redis底層的編碼模式,4bit
  • lru:LRU_BITS:記憶體淘汰策略
  • refcount:通過參考計數法管理記憶體,4byte
  • ptr:指向真實存盤值的地址,8byte

完整結構圖如下:

3 String型別

3.1 String型別使用場景

String 字串存在有三種型別:字串,整數,浮點,主要有以下使用場景

1)頁面動態快取
比如生成一個動態頁面,首次可以將后臺資料生成頁面,并且存盤到redis字串中,再次訪問,不再進行資料庫請求,直接從redis中讀取該頁面,特點是:首次訪問比較慢,后續訪問快速,

2)資料快取
在前后分離式開發中,有些資料雖然存盤在資料庫,但是更改特別少,比如有個全國地區表,當前端發起請求后,后臺如果每次都從關系型資料庫讀取,會影響網站整體性能,
我們可以在第一次訪問的時候,將所有地區資訊存盤到redis字串中,再次請求,直接從資料庫中讀取地區的json字串,回傳給前端,

3)資料統計
redis整型可以用來記錄網站訪問量,某個檔案的下載量,(原子自增自減)

4)時間內限制請求次數
比如已登錄用戶請求短信驗證碼,驗證碼在5分鐘內有效的場景,當用戶首次請求了短信介面,將用戶id存盤到redis 已經發送短信的字串中,并且設定過期時間為5分鐘,當該用戶再次請求短信介面,發現已經存在該用戶發送短信記錄,則不再發送短信,

5)分布式session
當我們用nginx做負載均衡的時候,如果我們每個從服務器上都各自存盤自己的session,那么當切換了服務器后,session資訊會由于不共享而會丟失,我們不得不考慮第三應用來存盤session,通過我們用關系型資料庫或者redis等非關系型資料庫,關系型資料庫存盤和讀取性能遠遠無法跟redis等非關系型資料庫,

3.2 String型別的實作——SDS結構

Redis并沒有直接使用C字串實作String型別,在Redis3.2版本之前通過SDS實作

Typedef struct sdshdr {
int len;
int free;
char buf[];
};
  • len:分配記憶體空間
  • free:剩余可用分配空間
  • char[]:value值實際資料

3.3 SDS與C字串之間的區別

3.3.1 查詢時間復雜度

C獲取字串長度的復雜度為O(N),而SDS通過len記錄長度,從C的O(n)變為O(1),

3.3.2 緩沖區溢位

C字串不記錄自身長度容易造成緩沖區溢位(buffer overflow),SDS的空間分配策略完全杜絕了發生緩沖區溢位的可能性,當需要對SDS進行修改時,會先檢查SDS的空間是否滿足修改所需的要求,如果不滿足的話SDS的空間擴展至執行修改所需的大小,然后才執行實際的修改操作,所以使用SDS既不需要手動修改SDS的空間大小,也不會出現緩沖區溢位問題,

在SDS中,buf陣列的長度不一定就是字符數量加一,陣列里面可以包含未使用的位元組,而這些位元組的數量就由SDS的free屬性記錄,通過未使用空間,SDS實作了空間預分配和惰性空間釋放兩種優化策略:

  • 空間預分配:當對一個SDS進行修改,并且需要對SDS進行空間擴展的時候,程式不僅會為SDS分配修改所必須要的空間,還會為SDS分配額外的未使用空間,擴展SDS 空間之前,會先檢查未使用空間是否足夠, 如果足夠的話,就會直接使用未使用空間,而無須執行記憶體重分配,如果不夠根據(len + addlen(新增位元組)) * 2的方式進行擴容,大于1M時,每次只會增加1M大小,通過這種預分配策略,SDS將連續增長N次字串所需的記憶體重分配次數從必定N次降低為最多N次,
  • 惰性空間釋放:惰性空間釋放用于優化SDS的字串縮短操作:當需要縮短SDS保存的字串時,程式并不立即使用記憶體重分配來回收縮短后多出來的位元組,而是使用free屬性將這些位元組的數量記錄起來,并等待將來使用,

3.3.3 二進制安全

C字串中的字符必須符合某種編碼(比如 ASCII,并且除了字串的末尾之外,字串里面不能包含空字符, 否則最先被程式讀入的空字符將被誤認為是字串結尾,

SDS的API都是二進制安全的(binary-safe):都會以處理二進制的方式來處理SDS存放在buf陣列里的資料,程式不會對其中的資料做任何限制、過濾、或者假設 —— 資料在寫入時是什么樣的,它被讀取時就是什么樣,redis不是用這個陣列來保存字符,而是用它來保存一系列二進制資料,

3.4 SDS結構優化

String型別所存盤的資料可能會幾byte存在大量這種型別資料,但len、free屬性的int型別會占用4byte共8byte存盤,3.2之后會根據字串大小使用sdshdr5、sdshdr8、sdshdr16、sdshdr32、sdshdr64資料結構存盤,具體結構如下:

struct __attribute__ ((__packed__)) sdshdr5 {
unsigned char flags; /* 3 lsb of type, and 5 msb of string length */
char buf[];
};
struct __attribute__ ((__packed__)) sdshdr8 {
uint8_t len; /* used */
uint8_t alloc; /* excluding the header and null terminator */
unsigned char flags; /* 3 lsb of type, 5 unused bits */
char buf[];
};
struct __attribute__ ((__packed__)) sdshdr16 {
uint16_t len; /* used */
uint16_t alloc; /* excluding the header and null terminator */
unsigned char flags; /* 3 lsb of type, 5 unused bits */
char buf[];
};
struct __attribute__ ((__packed__)) sdshdr32 {
uint32_t len; /* used */
uint32_t alloc; /* excluding the header and null terminator */
unsigned char flags; /* 3 lsb of type, 5 unused bits */
char buf[];
};
struct __attribute__ ((__packed__)) sdshdr64 {
uint64_t len; /* used */
uint64_t alloc; /* excluding the header and null terminator */
unsigned char flags; /* 3 lsb of type, 5 unused bits */
char buf[];
};
  • unsign char flags:3bit表示型別,5bit表示未使用長度
  • len:表示已使用長度
  • alloc:表示分配空間大小,剩余空間大小可以使用alloc - len獲得

3.5 字符集編碼

redisObject包裝存盤的value值,通過字符集編碼對資料存盤進行優化,string型別的編碼方式有如下三種:

  • embstr:
    CPU每次按Cache Line 64byte讀取資料,一個redisObject物件為16byte,為填充64byte大小,會向后再讀取48 byte資料,但獲取實際資料時還需要再通過*ptr指標讀取對應記憶體地址的資料,而一個sdshdr8屬性的資訊占用4byte,其余44byte可以用來存盤資料,如果value值小于44,byte可以通過一次讀取快取行獲取資料,
  • int:
    如果SDS小于20位,并且能夠轉換成整型數字,redisObject的*ptr指標會直接進行存盤,
  • raw:
    SDS

4 總結

redis作為k-v資料存盤,因查找和操作的時間復雜度都是O(1)和豐富的資料型別及資料結構的優化,了解了這些資料型別和結構更有利于我們平時對于redis的使用,下一期將對其它常用資料型別List、Hash、Set、Sorted Set所使用的ZipList、QuickList、SkipList做進一步介紹,對于文章中不清晰不準確的地方歡迎大家一起討論交流,


作者:盛旭

轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/519290.html

標籤:其他

上一篇:云原生愛好者周刊:買個藍牙列印機實時列印新提交的 PR 吧 | 2022-10-24

下一篇:盤它!基于CANN的輔助駕駛AI實戰案例,輕松搞定車輛檢測和車距計算!

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 網閘典型架構簡述

    網閘架構一般分為兩種:三主機的三系統架構網閘和雙主機的2+1架構網閘。 三主機架構分別為內端機、外端機和仲裁機。三機無論從軟體和硬體上均各自獨立。首先從硬體上來看,三機都用各自獨立的主板、記憶體及存盤設備。從軟體上來看,三機有各自獨立的作業系統。這樣能達到完全的三機獨立。對于“2+1”系統,“2”分為 ......

    uj5u.com 2020-09-10 02:00:44 more
  • 如何從xshell上傳檔案到centos linux虛擬機里

    如何從xshell上傳檔案到centos linux虛擬機里及:虛擬機CentOs下執行 yum -y install lrzsz命令,出現錯誤:鏡像無法找到軟體包 前言 一、安裝lrzsz步驟 二、上傳檔案 三、遇到的問題及解決方案 總結 前言 提示:其實很簡單,往虛擬機上安裝一個上傳檔案的工具 ......

    uj5u.com 2020-09-10 02:00:47 more
  • 一、SQLMAP入門

    一、SQLMAP入門 1、判斷是否存在注入 sqlmap.py -u 網址/id=1 id=1不可缺少。當注入點后面的引數大于兩個時。需要加雙引號, sqlmap.py -u "網址/id=1&uid=1" 2、判斷文本中的請求是否存在注入 從文本中加載http請求,SQLMAP可以從一個文本檔案中 ......

    uj5u.com 2020-09-10 02:00:50 more
  • Metasploit 簡單使用教程

    metasploit 簡單使用教程 浩先生, 2020-08-28 16:18:25 分類專欄: kail 網路安全 linux 文章標簽: linux資訊安全 編輯 著作權 metasploit 使用教程 前言 一、Metasploit是什么? 二、準備作業 三、具體步驟 前言 Msfconsole ......

    uj5u.com 2020-09-10 02:00:53 more
  • 游戲逆向之驅動層與用戶層通訊

    驅動層代碼: #pragma once #include <ntifs.h> #define add_code CTL_CODE(FILE_DEVICE_UNKNOWN,0x800,METHOD_BUFFERED,FILE_ANY_ACCESS) /* 更多游戲逆向視頻www.yxfzedu.com ......

    uj5u.com 2020-09-10 02:00:56 more
  • 北斗電力時鐘(北斗授時服務器)讓網路資料更精準

    北斗電力時鐘(北斗授時服務器)讓網路資料更精準 北斗電力時鐘(北斗授時服務器)讓網路資料更精準 京準電子科技官微——ahjzsz 近幾年,資訊技術的得了快速發展,互聯網在逐漸普及,其在人們生活和生產中都得到了廣泛應用,并且取得了不錯的應用效果。計算機網路資訊在電力系統中的應用,一方面使電力系統的運行 ......

    uj5u.com 2020-09-10 02:01:03 more
  • 【CTF】CTFHub 技能樹 彩蛋 writeup

    ?碎碎念 CTFHub:https://www.ctfhub.com/ 筆者入門CTF時時剛開始刷的是bugku的舊平臺,后來才有了CTFHub。 感覺不論是網頁UI設計,還是題目質量,賽事跟蹤,工具軟體都做得很不錯。 而且因為獨到的金幣制度的確讓人有一種想去刷題賺金幣的感覺。 個人還是非常喜歡這個 ......

    uj5u.com 2020-09-10 02:04:05 more
  • 02windows基礎操作

    我學到了一下幾點 Windows系統目錄結構與滲透的作用 常見Windows的服務詳解 Windows埠詳解 常用的Windows注冊表詳解 hacker DOS命令詳解(net user / type /md /rd/ dir /cd /net use copy、批處理 等) 利用dos命令制作 ......

    uj5u.com 2020-09-10 02:04:18 more
  • 03.Linux基礎操作

    我學到了以下幾點 01Linux系統介紹02系統安裝,密碼啊破解03Linux常用命令04LAMP 01LINUX windows: win03 8 12 16 19 配置不繁瑣 Linux:redhat,centos(紅帽社區版),Ubuntu server,suse unix:金融機構,證券,銀 ......

    uj5u.com 2020-09-10 02:04:30 more
  • 05HTML

    01HTML介紹 02頭部標簽講解03基礎標簽講解04表單標簽講解 HTML前段語言 js1.了解代碼2.根據代碼 懂得挖掘漏洞 (POST注入/XSS漏洞上傳)3.黑帽seo 白帽seo 客戶網站被黑帽植入劫持代碼如何處理4.熟悉html表單 <html><head><title>TDK標題,描述 ......

    uj5u.com 2020-09-10 02:04:36 more
最新发布
  • 2023年最新微信小程式抓包教程

    01 開門見山 隔一個月發一篇文章,不過分。 首先回顧一下《微信系結手機號資料庫被脫庫事件》,我也是第一時間得知了這個訊息,然后跟蹤了整件事情的經過。下面是這起事件的相關截圖以及近日流出的一萬條資料樣本: 個人認為這件事也沒什么,還不如關注一下之前45億快遞資料查詢渠道疑似在近日復活的訊息。 訊息是 ......

    uj5u.com 2023-04-20 08:48:24 more
  • web3 產品介紹:metamask 錢包 使用最多的瀏覽器插件錢包

    Metamask錢包是一種基于區塊鏈技術的數字貨幣錢包,它允許用戶在安全、便捷的環境下管理自己的加密資產。Metamask錢包是以太坊生態系統中最流行的錢包之一,它具有易于使用、安全性高和功能強大等優點。 本文將詳細介紹Metamask錢包的功能和使用方法。 一、 Metamask錢包的功能 數字資 ......

    uj5u.com 2023-04-20 08:47:46 more
  • vulnhub_Earth

    前言 靶機地址->>>vulnhub_Earth 攻擊機ip:192.168.20.121 靶機ip:192.168.20.122 參考文章 https://www.cnblogs.com/Jing-X/archive/2022/04/03/16097695.html https://www.cnb ......

    uj5u.com 2023-04-20 07:46:20 more
  • 從4k到42k,軟體測驗工程師的漲薪史,給我看哭了

    清明節一過,盲猜大家已經無心上班,在數著日子準備過五一,但一想到銀行卡里的余額……瞬間心情就不美麗了。最近,2023年高校畢業生就業調查顯示,本科畢業月平均起薪為5825元。調查一出,便有很多同學表示自己又被平均了。看著這一資料,不免讓人想到前不久中國青年報的一項調查:近六成大學生認為畢業10年內會 ......

    uj5u.com 2023-04-20 07:44:00 more
  • 最新版本 Stable Diffusion 開源 AI 繪畫工具之中文自動提詞篇

    🎈 標簽生成器 由于輸入正向提示詞 prompt 和反向提示詞 negative prompt 都是使用英文,所以對學習母語的我們非常不友好 使用網址:https://tinygeeker.github.io/p/ai-prompt-generator 這個網址是為了讓大家在使用 AI 繪畫的時候 ......

    uj5u.com 2023-04-20 07:43:36 more
  • 漫談前端自動化測驗演進之路及測驗工具分析

    隨著前端技術的不斷發展和應用程式的日益復雜,前端自動化測驗也在不斷演進。隨著 Web 應用程式變得越來越復雜,自動化測驗的需求也越來越高。如今,自動化測驗已經成為 Web 應用程式開發程序中不可或缺的一部分,它們可以幫助開發人員更快地發現和修復錯誤,提高應用程式的性能和可靠性。 ......

    uj5u.com 2023-04-20 07:43:16 more
  • CANN開發實踐:4個DVPP記憶體問題的典型案例解讀

    摘要:由于DVPP媒體資料處理功能對存放輸入、輸出資料的記憶體有更高的要求(例如,記憶體首地址128位元組對齊),因此需呼叫專用的記憶體申請介面,那么本期就分享幾個關于DVPP記憶體問題的典型案例,并給出原因分析及解決方法。 本文分享自華為云社區《FAQ_DVPP記憶體問題案例》,作者:昇騰CANN。 DVPP ......

    uj5u.com 2023-04-20 07:43:03 more
  • msf學習

    msf學習 以kali自帶的msf為例 一、msf核心模塊與功能 msf模塊都放在/usr/share/metasploit-framework/modules目錄下 1、auxiliary 輔助模塊,輔助滲透(埠掃描、登錄密碼爆破、漏洞驗證等) 2、encoders 編碼器模塊,主要包含各種編碼 ......

    uj5u.com 2023-04-20 07:42:59 more
  • Halcon軟體安裝與界面簡介

    1. 下載Halcon17版本到到本地 2. 雙擊安裝包后 3. 步驟如下 1.2 Halcon軟體安裝 界面分為四大塊 1. Halcon的五個助手 1) 影像采集助手:與相機連接,設定相機引數,采集影像 2) 標定助手:九點標定或是其它的標定,生成標定檔案及內參外參,可以將像素單位轉換為長度單位 ......

    uj5u.com 2023-04-20 07:42:17 more
  • 在MacOS下使用Unity3D開發游戲

    第一次發博客,先發一下我的游戲開發環境吧。 去年2月份買了一臺MacBookPro2021 M1pro(以下簡稱mbp),這一年來一直在用mbp開發游戲。我大致分享一下我的開發工具以及使用體驗。 1、Unity 官網鏈接: https://unity.cn/releases 我一般使用的Apple ......

    uj5u.com 2023-04-20 07:40:19 more