本篇內容基于 Redis v7.0 的闡述；官網：https://redis.io/

本篇計劃用 Docker 容器輔助部署，所以需要了解點 Docker 知識；官網：https://www.docker.com

系列目錄：

微服務 - 概念 · 應用 · 通訊 · 授權 · 跨域 · 限流

微服務 - 集群化 · 服務注冊 · 健康檢測 · 服務發現 · 負載均衡

微服務 - Redis快取 · 資料結構 · 持久化 · 分布式 · 高并發

一、分布式解決 Session 的問題

在單站點中，可以將在線用戶資訊存盤在Session中，隨時變更獲取資訊；在多站點分布式集群如何做到Session共享呢？架設一個Session服務，供多服務使用，

頻繁使用的資料存在DB端，頻繁的DB連接，頻繁的IO；資料存于記憶體中更能減少性能的消耗，更能提高使用效率，

集群化分布式時，為解決以上現象，建立快取服務顯得尤為重要，

建立快取服務選擇性很多，如：Redis、MongoDB等，以下以 Redis 為例：

作者：[Sol·wang] - 博客園，原文出處：https://www.cnblogs.com/Sol-wang/

二、記憶體資料庫 Redis

Remote Dictionary Server；
遠程字典服務，Key/Value 存盤系統、列存盤、檔案型存盤等，NoSQL開源記憶體資料庫，最多的使用場景是作為資料快取，存在于應用與DB之間，減少對DB的訪問，提高資料操作的性能，

下圖展示了快取服務在整體架構中的位置：
Redis 記憶體資料庫在整體架構中的位置

2.1 Redis 特性

高性能 / 高可用 / 持久化 / 集群化，單實體每秒讀寫達10萬次；

豐富的資料型別：String / Hash / Set / Zset / 佇列 / 訂閱 / 發布；

高性能資料結構：SDS / Intset / ziplist / listpack / quicklist / skiplist；

支持 ACL：Access Control List；精細化的權限管理策略；

單執行緒處理事務：順序執行，容易上鎖；

多執行緒處理輔助功能：連接請求 / 持久化等；

單執行緒處理事務的優缺點

優點：順序執行，不存在臟讀臟寫幻讀等情況，不存在死鎖，不存在執行緒管理的開銷，
缺點：單執行緒的性能瓶頸，多處理器的資源浪費，

2.2 單執行緒IO多路復用

通常情況下，同時連接 Redis 的客戶端有成千上萬的，但 Redis 只有一個主執行緒處理事務，那如何做到多路連接集中到一個執行緒處理呢？

當多個客戶端同時發起連接后，這也是需要一個程序的，也是有連接完成的先后，誰連接完成就會告訴 Redis，這里的告訴用的是回呼方式，Redis就會把他的任務放到單一的佇列中，佇列的另一頭連接著主執行緒，

在這個程序當中，多路的連接匯集到一個有足夠處理能力的佇列中進行傳輸；是不是可以理解為：多路連接重復利用了單個管道；我想...這里也是體現了 Redis 的多路復用技術，當然，單單就多路復用來講，也會是多路集中到一路，然后這一路又分成了多路到各各目標，

多路復用也有不同的演算法：select、poll、epoll，Redis用的是epoll演算法，所以其中有回呼的動作，目前而言，epoll是最高效的；關于每個具體的演算法，有興趣的同學可以繼續研究一下，

2.3 啟動 Redis

用 Docker 啟動 Redis 簡單示例：

1、拉取鏡像docker pull redis

2、運行容器 docker run -d --name=some-redis redis

3、連接到 Redis docker exec -it some-redis redis-cli

Redis Docker版默認是沒有組態檔的，官網說：可以再生成鏡像方式解決...

既然沒有組態檔，那 Redis 啟動完全是按所有配置項的默認值運行的；如下傳參啟動：

# 啟動 redis-server，多引數配置
docker run -d --name some-redis -p 6379:6379 redis redis-server \
    --bind 0.0.0.0 \        # 支持任意的連接
    --save 60 1 \           # 每60秒 持久化一次
    --protected-mode no \   # 取消保護模式
    --requirepass 123456    # 登錄密碼 123456；連接后用 auth {passwd} 方式登錄

傳參也就是覆寫了配置項的默認值，以下查看覆寫后的配置項效果：config get *列出所有配置項

Redis 啟動后，都包含 redis-server / redis-client；
所以任意 Redis 都可用 redis-client 連接到其它 redis-server：docker exec -it some-redis redis-cli -h {目標IP} -p {目標埠}

2.4 重要配置項

通常配置引數于組態檔中；比如：/etc/redis/redis.conf

配置項	說明
bind	可訪問限制，白名單；注釋后不限制
port	對外埠
timeout	連接后，沒有通信任務的空閑時間，超出此時長后自動斷開
daemonize	后臺運行（容器運行時忽略）
protected-mode	只能本地訪問的保護模式
tcp-backlog	網路連接佇列最大連接數（對應Linux內核引數 net.core.somaxconn，有關命令`sysctl`）
tcp-keepalive	網路通信檢測間隔，網路是否已斷開（當timeout為0才起效吧）
pidfile	存放ProcessID編號的檔案Pid的存放目錄（后臺運行時才會產生pid檔案，容器時是否忽略）
loglevel	日志級別
logfile	日志檔案目錄
database	資料庫個數
requirepass	Client 連接密碼
maxclients	客戶端同時最大連接數（對應Linux user openfile limit，必設；有關命令`ulimit`）
maxmemory	記憶體最大使用量，推薦70%

三、資料型別 / 常用命令

Key/Value 的存盤系統，Key相當于區分的變數名稱，型別區別在于Value；常用資料型別有：

String：字符，基礎型別，過期時長，遞增

SET/GET key value寫入/取值
GET key key key取多個值
INCR/DECR key遞增1/遞減1

List：佇列，先進先出，先進后出

LPUSH/RPUSH key value頭/尾添加
LPOP/RPOP key頭/尾移除
LLEN key佇列長度

Set：無序集合，可查詢交集、并集、差集等

SADD|SREM key member member member插入/移除元素
SISMEMBER key member是否存在成員
SINTER key1 key2多集合取交集
SCARD key元素個數總數

ZSet：帶排序的Set集合；比Set多出一個專用的score值，又可排出名次列

ZADD key score member score member新增成員及序列數，可覆寫
ZRANGE key start stop按序列范圍取集合
ZRANK key member取正序排名；從0開始的名次
ZREVRANK key member取倒序排名；從0開始的名次

Hash：可同時設定/獲取多個屬性值

HSET key field value field value成對設定多個屬性與值
HMGET key field [field field]取多個列的值
HINCRBY key field -5指定屬性的值，遞增/遞減

四、資料結構

為什么 Redis 要有自己的資料結構

查詢要快：體現在單條Key用了連續性的記憶體空間
占用空間少，節約記憶體：體現在了集合的資料壓縮

Redis 中有這么幾種資料結構：sds (動態字串)、hashtable (字典)、linkedlist (鏈表)、intset (整數集合)、ziplist (壓縮串列)、listpack (緊湊串列)、quicklist (混合串列)、skiplist (跳表)；它們分別應用于Redis各資料型別中，使得Redis在資源利用和運行效率上有著明顯的效果，

以下列出了資料型別與資料結構的應用關系圖：
Redis 資料型別應用資料結構關系圖
關于 Listpack；未來作為 Ziplist 的升級替代品，v7.0版本也會有 Ziplist 的存在，后續版本中逐漸被替代，

資料結構的自動切換

每種資料型別也會有多種資料結構，至于何種資料型別在什么情況下用何種資料結構，取決于存盤的資料；
比如：List 每元素小于8KB時，自動使用 Ziplist，否則自動切換為 Quicklist；
比如：Set 每元素為數字，元素小于512個時，自動使用 Intset，否則自動切換為 Hashtable；
比如：Hash 元素小于512個，每元素長度小于64位元組，自動使用 Ziplist；否則自動切換為 Hashtable，

影響資料結構轉換的配置項

# 組態檔中 各資料型別中的資料結構
# 能承載的最大長度/個數/容量
# 超出最大限制后，變更為其它資料結構
hash-max-listpack-value 64
hash-max-listpack-entries 512
list-max-listpack-size -2(8KB)
set-max-intset-entries 512
set-max-listpack-value 64
set-max-listpack-entries 128
zset-max-listpack-value 64
zset-max-listpack-entries 128

以下主要以 sds / ziplist / listpack / skiplist 為例的闡述，基本涵蓋了重要的資料結構，一些擴展性的資料結構有興趣的同學再深入了解下，

4.1 動態字串 - SDS

很多計算機語言都一樣，Redis 也是基于C語言寫的；對于String型別，當給一個變數拼接一個字串時，都是以一個新物件在記憶體中重新開辟新的更長的連續空間來存盤；重新開辟/釋放舊空間這樣的記憶體損耗，，，所以為什么開發人員會避免strname + "xxx"這樣的拼接方式；字串長度也是底層每次通過遍歷得出的結果，，，Redis為了避免這樣的損耗，于是就有了 Simple Dynamic Strings 這樣的解決方案 SDS，

Redis String 會事先分配好比實際字串更長的記憶體空間，并記錄實際字串的長度，也記錄存盤后剩余的空間長度，

取字串長度時，直接回傳記錄的長度值
追加字串時，直接使用空閑的剩余空間

預分配空間有多長？總有用完的時候：

當實際字串長度<1M時，預分配實際字串兩倍的連續長度，相當于本次只會占用一半
當實際字串長度>1M時，每次預分配多出1M的長度空間，便于下次直接存盤
當字串減少縮短時，多出的剩余空間保留，便于下次追加，或手動命令清除空閑空間

這種空間預分配策略和惰性洗掉策略就是SDS的性能優勢，

4.2 壓縮串列 - ziplist

一塊連續性的記憶體空間存放了整個Value，也就是一個ziplist，如何做的呢？一個集合的示例：

ziplist結構圖
bytes：記錄 ziplist 的總長度
tail：記錄最后一個 entry 的偏移量，便于快速定位
len：記錄 entry 的總個數
entry：串列元素，資料存放的元素
end：單個 ziplist 的結束符
prevlen：記錄上個 entry 的總長度；這里記錄值所占用的空間長度，取決于上個 entry 的長度，所以1-5會自動切換
encoding：記錄 data 的實際資料型別及長度；如：int時占空間小，可直接存到 encoding，就不用 data 了
data：實際資料；占用空間小的資料型別，可直接放到 encoding 中，所以這時候沒有 data 的存在，省空間，

ziplist 的取值：
結構圖中，有總長/個數/偏移量/結束符/上個元素長度；所以 ziplist 正序倒序是都可以算出每個 entry 具體位置并取出資料，

ziplist 的寫入，插/改/刪統一為覆寫方式：
1、為新元素找到被覆寫元素的位置，位置之前的元素 + 新元素 + 位置之后的元素 = 新的ziplist的完整結構
2、申請新ziplist所需長度的記憶體連續空間，并存入新空間
3、釋放舊空間

看起來挺不錯的，相比鏈表的非連續性存盤所帶來的性能提升明顯，，那為什么還會有新的改進版本 listpack 的出現？

ZIPLIST 的弊端

ziplist 的問題出在 prevlen；
也就是上面藍色部分的描述，存了相鄰 entry 的長度；如果 entry 長度過長，相鄰的 prevlen 所占空間長度就會從1變為5；也就是說 entry 資料變更，會影響到相鄰的 entry；最嚴重的情況是很多entry長度恰好都在一個臨界值，會導致相鄰prevlen長度的變化，連鎖反應是之后位置上的entry級聯性的連續重復多次變更；
上面提到，變更：就是重新申請新的記憶體連續空間，釋放舊空間；那么級聯性的連鎖反應呢？一個寫操作，引發的惡性災難事件！！！

4.3 緊湊串列 - listpack

listpack 是 ziplist 的升級版于v7.0中，作為替代品都有什么變化，listpack結構如下圖：
listpack 結構圖
上圖看出，listpack 與 ziplist 的區別在于：
1、header 取消 tail
2、entry 取消 prevlen
3、當前 entry 中增加 encoding + data 的總長度 element-total-len
4、element-total-len 中的首位會標識出左側是否還有值，主要用于逆序讀

element-total-len 編碼
長度 1-5 bytes 是可變的，不固定長度如何讀出整個 element-total-len？這其中0/1標識了左側是否有資料；
element-total-len 示意圖

listpack 的讀，假設逆序讀出每個元素的值，已知end固定長度，跳過 1 bytes 到 element-total-len 中讀固定(7)位數，就會知道左側是否有值，這樣會把 element-total-len 整個讀下來，也就知道了當前 entry 長度，那么也就知道了相鄰 entry 的起始位置；繼續這樣按序把每個 entry 讀出來就完成逆序讀資料，

listpack 的寫入，同樣是基于 ziplist 的方式，新元素替換舊元素組成新的長度，存盤到新申請的記憶體連續空間，釋放舊空間；由于未影響到其它元素，申請一次新空間后完成寫入操作，

這樣以來，listpack 任何寫入的操作，entry 都是在變更自己，不會牽連到其它 entry，這就是對 ziplist 改善的地方，

4.4 跳躍串列 - skiplist

跳表是在鏈表的基礎上追加了更多指標的存盤；鏈表的指標指向了相鄰元素的地址，但跳表又追加了指向間隔元素的指標；這使得跳表在查詢元素的效率上更快，

下表 Linkedlist 與 Skiplist 的查詢區別：
skiplist 結構圖
上圖：兩種查詢的路徑不同，影響到的元素數量也不同，鏈表搜了11次才找到指定的元素，而跳表僅搜了5次就找到了指定的元素，
比如：元素1 既存了指向下個元素2 的指標，也存了指向元素4 的指標；所以跳表多存的指標讓其可以跳躍搜索，相對于鏈表減少了搜索次數，這就體現了相比鏈表搜索的高效率，

其它資料結構

除以上幾種資料結構外，Redis也會有Intset、quicklist、Hashtable等，由于基本原理相識，這里簡單描述：
Intset：與ziplist、listpack相似的連續性集合，主要區別在于Intset僅支持數字型；
quicklist：在 ziplist 基礎上擴展的資料結構，其中每個成員是一個ziplist，插入元素時：插入到前個元素ziplist中的末尾、后ziplist的開頭、或獨立的ziplist，

五、持久化

5.1 RDB 模式

Redis Database：持久化以指定的時間間隔執行資料集的時間點的快照整庫備份，

觸發RDB配置：save 36000 1 600 10 30 100
以上從右往左，成對解釋：
??當30秒內寫入了100次，觸發持久化，如果未滿足條件，繼續下一對；
??當600秒內寫入了10次，觸發持久化，如果未滿足條件，繼續下一對；
??當36000秒內寫入了1次，觸發持久化，

持久化程序：記憶體 -> 臨時檔案 -> 磁盤，

影響RDB效率的配置項：
??stop-writes-on-bgsave-error yes當持久化失敗后強制停止寫入
??rdbcompression yes快照資料壓縮，損耗CPU
??rdbchecksum yes是否檢測備份檔案，損耗CPU≈10%

關閉RDB持久化模式：save ""

模式優劣

優勢：體積小，占用磁盤少，
劣勢：當持久化發生例外時，最后一次的持久化有可能失效，不能確保整體資料的絕對完整性，

5.2 AOF 模式

Append Only File：追加記錄服務器接收到的每個寫入命令，增量保存；如果寫入錯誤，Redis 也會具有自動修復受損的AOF檔案；恢復時，重新按序執行指令，從而重建記憶體庫，

配置開啟AOF模式：appendonly yes

持久化頻率策略配置：appendfysnc always|everysec|no

每次命令追加：每次寫命令立刻記錄，太頻繁，太耗性能
每秒追加一次：每秒集中記錄一次，依然有可觀的性能表現

檔案壓縮 Rewrite
主行程 redis-server 創建出一個子行程 bgrewriteaof 對 AOF檔案的重新整理，先整理出一個臨時檔案，再覆寫原AOF檔案，

Rewrite 的重寫策略：

只針對寫入命令的整理
相同資料只記錄最后寫入命令
過期資料不記錄
多命令合并記錄

多命令合并示例：如累加命令 Incrby 的累加總和合并成一次累加；如集合命令 rpush 的多次追加合并成一次追加多個，

手動觸發執行重寫命令：bgrewriteaof，

自動觸發重寫相關配置：
no-appendfsync-on-rewrite no重寫開關
auto-aof-rewrite-min-size 64mb重寫觸發條件，檔案超過指定大小
auto-aof-rewrite-percentage 100重寫觸發條件，檔案超過已使用%

AOF檔案64MB是不是顯得太小了，可適當增加容量如3GB，以防止過多的觸發壓縮重寫后影響性能；也不可過大，影響資料恢復效率，

模式優劣

優勢：丟失率低，資料較完整，
劣勢：AOF占用磁盤空間大；恢復時重新全部執行一遍命令，恢復速度慢了點；持久化失敗時，最后一秒寫入命令可能丟失，

Redis 默認開啟 RDB，可同時開啟 RDB + AOF，恢復資料時以 AOF 為優先，

由于是單執行緒方式，Redis 會創建子執行緒負責持久化處理，不管是哪種持久化方式，在創建子行程的瞬間，都會有阻塞的現象，

六、分布式集群

6.1 虛擬插槽

Redis 分布式給出一個 16384 長度的集合，每個元素稱為一個 Slot，將所有 Slots 分段平均映射到各個 Master 節點上；資料通過對 Key 的演算法映射到各Slot，也就存到了對應的 Master 節點上，所以每個節點實體負責其中一部分的Slot讀寫，

通過控制節點與槽 Slot 的關系，決定每個 Master 節點所承載的資料量；這在集群節點維護的時候非常有用，

6.2 創建集群

集群必須了解的conf配置項：

# 每個節點必須的配置項
cluster-enabled yes
# 節點失去連接超時時間
cluster-node-timeout 15000
# 節點間傳輸效率 默認 no（yes:單次多量發送/no:單次少量多次發送）
tcp-nodelay no
# DOCKER/NAT support
# (地址埠可能被轉發)靜態配置公共地址
cluster-announce-ip <外部訪問IP>
cluster-announce-port <外部訪問埠>
cluster-announce-bus-port <節點互通外部埠>

按 Redis 要求的最低 Master 節點數量3實體，多主多從的模式，需要創建6個運行實體：(6371-6376,16371-16376)

# 實體示例1（6371,16371）
docker run -d --name clu-rds-1 \
    -p 6371:6371 -p 16371:16371 \        # 容器分別開放 對外連接埠 和 節點間通信埠
    redis \
    redis-server \                       # 啟動 Redis 服務命令
    --bind 0.0.0.0 \                     # 不限連接的客戶端來源
    --port 6371 \                        # 實體對外連接埠
    --protected-mode no \                # 非保護模式
    --cluster-enabled yes \              # 開啟集群
    --cluster-announce-ip 13.13.1.16 \   # 對外的訪問IP
    --cluster-announce-port 6371 \       # 集群對外的連接埠
    --cluster-announce-bus-port 16371    # 集群節點間通訊埠（通常為：10000+Port）

Docker 查看6個容器實體：

Docker 3主3從模式創建集群：

docker exec -it clu-rds-1 \
    # 連接到任意實體
    redis-cli -p 6371 \
    # 創建集群 并指定 1主幾從
    --cluster create --cluster-replicas 1 \
    # 要包含的所有(6個)運行實體<ip:port>
    13.13.1.16:6371 13.13.1.16:6372 13.13.1.16:6373 \
    13.13.1.16:6374 13.13.1.16:6375 13.13.1.16:6376

連接到任意容器節點，查看集群成員：docker exec -it <container-name> redis-cli -p <container-port> cluster nodes

6.3 節點管理

# 集群資訊
redis-cli -p <port> cluster info
# 查看現有節點成員
redis-cli -p <port> cluster nodes
# 加入新成員，從節點
redis-cli --cluster add-node <new-node-ip:port> <cluster-member-ip:port> \
    --cluster-slave --cluster-master-id <to-master-id>
# 洗掉集群成員節點
redis-cli --cluster del-node <del-ip:port> <del-node-id>
# 重新分配節點與插槽映射
redis-cli --cluster reshard <member-ip:port>
# 查看某節點同步資訊
redis-cli -p <port> info replication
# 停止某節點實體運行
redis-cli -p <port> shutdown

分布式帶來的影響

事務支持有限；
跨節點的多Key操作有限；如：SET集合不能計算兩KEY的交集等

6.4 分布式鎖

6.4.1 為什么會需要鎖？

??場景 A：

多用戶對同一產品下單購買，庫存有10個，同一時間進來100個用戶各買一個；
購買前都會看下庫存是否夠買，才會生成訂單，否則提醒無貨；
當前10個用戶還沒有下單成功并未扣庫存完成時，后90個用戶看到有庫存，也繼續生成訂單；
最后賣出100各產品，實際庫存不夠，，，

如何確保有庫存，不超買，
對庫存加鎖，每個用戶按序進來扣庫存，當前用戶扣完庫存后，釋放自己加的鎖，以視完成操作繼續后續用戶，下個用戶再進來看庫存是否能購買，

??場景 B：

當某個用戶下單扣庫存時，倘若發送了例外，導致未能釋放自己加上去的鎖，那么，，，沒人負責釋放此鎖了，后續不能查扣庫存，誰也不能下單了，

如何確保防止不能解鎖，
對庫存鎖加過期時間，時間超出后，自動強制解鎖，

是的，加鎖、過期自動解鎖，是確保以上場景能夠順利進行的必要條件，共享資料被多用戶處理的時候，同一時間點，只能被一個用戶訪問處理，多用戶有序訪問處理，及時更新處理結果，

共享鎖：資料統一放快取中做業務處理，在快取中加鎖，供所有服務利用，

6.4.2 SET NX EX 命令

SET：String 型別的KV操作
NX：Key唯一，僅當沒有Key時才能寫入
EX：Key 的有效時長，到期后自動洗掉

所以完整的命令為：set {business-key} {value} nx ex {過期時長}
回傳失敗，表示上個用戶正使用
回傳成功，表示自己已開始使用

符合分布式鎖的必要條件

1、當 get {business-key} 有值時，表示已有用戶在占用，需要等待
2、當占用用戶處理完成后，正常釋放自己加的鎖，del {business-key}
3、當占用用戶處理發生例外退出時，等ex {過期時長}后，系統自動解鎖，后續用戶繼續購買

命令演示案例：(ttl：剩余過期時間秒)

也可以在 Value 中保存用戶的標識，解鎖的時候只能解除自己的鎖，防止某些場景下解鎖錯誤，

分布式Id

由于 Redis Incrment (Incr/Incrby)，過期時長等，可以限制用戶短時間內的下單量等場景，也可以生成唯一標識，用到各服務中，

6.4.3 Lua 腳本

持續更新，，，

七、高并發帶來的問題

7.1 快取穿透

現象：

DB沒有查詢結果或為NULL，導致查詢結果沒有進入到快取；當大批量的這種請求時，就會每次“穿透”快取“直抵”DB，引發DB的高并發查詢導致宕機，這種現象就叫快取穿透，

方案：

黑名單策略（IP/用戶名），防止惡意行為

對結果為空的DB查詢，給出默認值于快取中

7.2 快取擊穿

現象：

單個訪問量大的 Key (熱門資料)過期后，快取需要重建該Key，大量的訪問到DB引發高并發查詢，導致DB宕機，這種情況稱為快取擊穿，

方案：

當然也可以使用佇列，就降低了并發的性能；也可以設定過期時間為永不過期；以下的重點是快取重建Key的程序：雙重鎖機制

雙重鎖邏輯闡述：(也常應用于單例模式中)
第一把鎖處理首個請求動作是否已有快取，并擋住了第二或大量的后續請求動作；
當首個請求動作處理完成后結果于快取中，并釋放鎖，處于等待的大量的請求動作會陸續進來，這就不對了，等待的請求動作應該直接用首個請求處理的結果才對；
所以，后續的請求進來后應該再次鎖驗證快取中是否已有資料，也就是第二次的鎖是為了解決并發時被阻塞的請求動作，防止重復查詢DB更新快取，

7.3 快取雪崩

現象：

快取中的熱門 Key 短時間內大批量的同時過期，快取運行正常，導致DB查詢壓力短時間內上升至宕機的現象，

方案：

隨機的過期時間，分散過期時間，避免統一生成過期時間

為熱度追加排名，時時調整熱度資料，自動延長過期時間

鄙人拙見，有不妥望指出，萬分感謝，
作者：Sol·wang - 博客園
出處：https://www.cnblogs.com/Sol-wang/p/17329270.html
宣告：本文著作權歸作者和[博客園]共有，未經作者同意，不得轉載，

轉載請註明出處，本文鏈接：https://www.uj5u.com/shujuku/550492.html

標籤：其他

上一篇：資料庫測驗指南

下一篇：Linux作業系統網路模塊