面試中經常問到的Redis七種資料型別，你都真正了解嗎？-有解無憂

前言

Redis不是一個簡單的鍵值對存盤，它實際上是一個支持各種型別資料結構的存盤，在傳統的鍵值存盤中，是將字串鍵關聯到字串值，但是在Redis中，這些值不僅限于簡單的字串，還可以支持更復雜的資料結構，下面就是Redis支持的資料結構：

字串（String）：二進制安全字串，
串列（List）：根據插入順序排序的字串元素串列，基于鏈表實作，
集合（Set）：唯一的亂序的字串元素的集合，
有序集合（Sorted Set）：與集合類似，但是每個字串元素都與一個稱為score的數字相關聯，元素總是按其score排序，并且可以檢索一定score范圍的元素，
哈希（Hash）：由欄位與值相關聯組成的映射，欄位和值都是字串，
位圖（Bitmap）:像操作位陣列一樣操作字串值，可以設定和清除某個位，對所有為1的位進行計數，找到第一個設定1的位，找到第一個設定0的位等等，
HyperLogLogs：一種概率資料結構，使用較小的記憶體空間來統計唯一元素的數量，誤差小于1％，

歡迎關注微信公眾號：萬貓學社，每周一分享Java技術干貨，

鍵（Key）

鍵是二進制安全的，這意味著您可以使用任何二進制序列作為鍵，可以是OneMoreStudy這樣的字串，也可以使圖片檔案的內容，空字串也是有效的鍵，不過，還有一些其他規則：

不要使用過長的鍵，比如一個1KB的鍵，不僅是多占記憶體方面的問題，而是在資料集中查找鍵可能需要進行一些耗時的鍵比較，如果真的有比較大的鍵，先對它進行哈希（比如：MD5、SHA1）是一個好主意，
也不要使用過短的鍵，比如：OMS100f，相對于one-more-study:100:fans，后者更具有可讀性，可能會占用更多記憶體，但是相對于值所占的記憶體，鍵所增加的記憶體還是小很多的，我們要找到一個平衡點，不長也不短，
多個欄位以冒號分隔，一個欄位內多個單詞以連詞符或點分隔，比如：one-more-study:100:fans，或者one.more.study:100:fans，
鍵允許的最大值為512MB，

歡迎關注微信公眾號：萬貓學社，每周一分享Java技術干貨，

字串（String）

字串型別是和鍵關聯的最簡單的型別，它是Memcached中唯一的資料型別，因此對于新手來說，在Redis中使用它也是很容易的，鍵是字串型別，當我們也使用字串型別作為值時，我們會可以從一個字串映射到另一個字串，字串資料型別有很多應用場景，例如快取HTML片段或頁面，

下面簡單介紹一下字串的命令（在redis-cli中使用）：

> set one-more-key OneMoreStudy
OK
> get one-more-key
"OneMoreStudy"

使用SET和GET命令來設定和查詢字串值的方式，需要注意的是，如果當前鍵已經和字串值相關聯，SET命令將會替換已存盤在鍵中的現有值，字串可以是任意的二進制資料，比如jpeg影像，字串最多不能大于512MB，SET命令還有一些實用的可選引數，比如：

> set one-more-key Java nx   #如果key存在，則設定失敗，
(nil)
> set one-more-key Java xx   #如果key存在，才設定成功，
OK

歡迎關注微信公眾號：萬貓學社，每周一分享Java技術干貨，

雖然字串是Redis的基本值，但也可以使用它們執行一些實用的操作，比如：

> set one-more-counter 50
OK
> incr one-more-counter   #自增加1
(integer) 51
> incr one-more-counter   #自增加1
(integer) 52
> incrby one-more-counter 5   #自增加5
(integer) 57

INCR命令將字串值決議為整數，將其自增加1，最后將獲得的值設定為新值，還有其他類似的命令，例如INCRBY，DECR和DECRBY等命令， INCR命令是原子操作，即時有多個客戶端同時同一個key的INCR命令，也不會進入競態條件，比如，上面的例子先設定one-more-counter的值為50，即使兩個客戶端同時發出INCR命令，那么最后的值也肯定是52，

可以使用MSET和MGET命令在單個命令中設定或查詢多個鍵的值，對于減少延遲也很有用，比如：

> mset a 1 b 2 c 3
OK
> mget a b c
1) "1"
2) "2"
3) "3"

使用MGET命令時，Redis回傳一個值的陣列，

歡迎關注微信公眾號：萬貓學社，每周一分享Java技術干貨，

使用DEL命令可以洗掉鍵和相關聯的值，存在指定的鍵則回傳1，不存在指定的鍵則回傳0，使用EXISTS命令判斷Redis中是否存在指定的鍵，存在指定的鍵則回傳1，不存在指定的鍵則回傳0，比如：

> set one-more-key OneMoreStudy
OK
> exists one-more-key
(integer) 1
> del one-more-key
(integer) 1
> exists one-more-key
(integer) 0

使用TYPE命令，可以回傳存盤在指定key的值的資料型別，比如：

> set one-more-key OneMoreStudy
OK
> type one-more-key
string
> del one-more-key
(integer) 1
> type one-more-key
none

在討論更復雜的資料結構之前，我們需要討論另一個功能，該功能無論值型別是什么都適用，它就是EXPIRE命令，它可以為鍵設定到期時間，當超過這個到期時間后，該鍵將自動銷毀，就像對這個鍵呼叫了DEL命令一樣，比如：

> set one-more-key OneMoreStudy
OK
> expire one-more-key 5
(integer) 1
> get one-more-key #立刻呼叫
"OneMoreStudy"
> get one-more-key #5秒鐘后呼叫
(nil)

上面的例子，適用了EXPIRE命令設定了過期時間，也可以使用PERSIST命令移除鍵的過期時間，這個鍵將持久保持，除了EXPIRE命令，還可以使用SET命令設定過期時間，比如：

> set one-more-key OneMoreStudy ex 10 #設定過期時間為10秒
OK
> ttl one-more-key
(integer) 9

上面的例子，設定了一個字串值OneMoreStudy的one-more-key，該鍵的到期時間為10秒，之后，呼叫TTL命令以檢查該鍵的剩余生存時間，

歡迎關注微信公眾號：萬貓學社，每周一分享Java技術干貨，

到期時間可以使用秒或毫秒精度進行設定，但到期時間的解析度始終為1毫秒，實際上，Redis服務器上存盤的不是到期時間長度，而是該鍵到期的時間，

歡迎關注微信公眾號：萬貓學社，每周一分享Java技術干貨，

串列（List）

Redis串列是使用鏈表實作的，這就意味著在頭部或尾部增加或洗掉一個的元素的時間復雜度是O(1)，非常快的，不過，按索引查詢對應元素的時間復雜度就是O(n)，慢很多，如果想快速查詢大量資料，可以使用有序集合，后面會有介紹，

LPUSH命令將一個新元素添加到串列的左側（頂部），而RPUSH命令將一個新元素添加到串列的右側（底部），最后，LRANGE命令可以從串列中按范圍提取元素，比如：

> rpush one-more-list A
(integer) 1
> rpush one-more-list B
(integer) 2
> lpush one-more-list first
(integer) 3
> lrange one-more-list 0 -1
1) "first"
2) "A"
3) "B"

LRANGE命令需要另外兩個引數，要回傳的第一個元素的索引和最后一個元素的索引，如果索引為負值，Redis將從末尾開始計數，-1是串列的最后一個元素，-2是串列的倒數第二個元素，依此類推，

LPUSH和RPUSH命令支持多個引數，可以使用一次命令添加多個元素，比如：

> rpush one-more-list 1 2 3 4 5 "last"
(integer) 9
> lrange one-more-list 0 -1
1) "first"
2) "A"
3) "B"
4) "1"
5) "2"
6) "3"
7) "4"
8) "5"
9) "last"

在Redis串列上，也可以移除并回傳元素，與LPUSH和RPUSH命令，對應的就是LPOP和RPOP命令，LPOP命令是將串列的左側（頂部）的元素移除并回傳，RPOP命令是將串列的右側（底部）的元素移除并回傳，比如：

> rpush one-more-list a b c
(integer) 3
> rpop one-more-list
"c"
> rpop one-more-list
"b"
> rpop one-more-list
"a"

我們添加了三個元素，并移除并回傳了三個元素，此時串列為空，沒有任何元素，如果再使用RPOP命令，會回傳一個NULL值：

> rpop one-more-list
(nil)

使用RPUSH和RPOP命令，或者LPUSH和LPOP命令可以實作堆疊的功能，使用LPUSH和RPOP命令，或者RPUSH和LPOP命令可以實作佇列的功能，也可以實作生產者和消費者模式，比如多個生產者使用LPUSH命令將任務添加到串列中，多個消費者使用RPOP命令將任務從串列中取出，但是，有時串列可能為空，沒有任何要處理的任務，因此RPOP命令僅回傳NULL，在這種情況下，消費者被迫等待一段時間，然后使用RPOP命令重試，這就暴露了有幾個缺點：

客戶端和服務端之間可以處理無用的命令，因為在串列為空時的所有請求將無法完成任何實際作業，它們只會回傳NULL，
由于消費者在收到NULL之后會等待一段時間，因此會增加任務處理的延遲，為了減小延遲，我們可以在兩次呼叫RPOP之間等待更少的時間，這就擴大了更多對Redis的無用呼叫，

有什么辦法可以解決呢？使用BRPOP和BLPOP的命令，它們和RPOP和LPOP命令類似，唯一的區別是：如果串列為空時，命令會被阻塞，直到有新元素添加到串列中，或指定的超時時間到了時，它們才會回傳到呼叫方，比如：

> brpop tasks 5

它含義是，串列為空時，等待串列中的元素，但如果5秒鐘后沒有新的元素被添加，則回傳，您可以將超時時間傳入0，表示永遠等待元素添加，也可以傳入多個串列，這時會按引數先后順序依次檢查各個串列，回傳第一個非空串列的尾部元素，另外還有以下3點需要注意的：

當串列為空，并且有多個客戶端在等待時，有一個新的元素被添加到串列中，它會被第一個等待的客戶端獲取到，以此類推，
回傳值與RPOP命令相比有所不同，它是一個包含兩個元素的陣列，包含key和對應的元素，因為BRPOP和BLPOP命令能夠阻止等待來自多個串列的元素，
超過了超時時間，會回傳NULL，

歡迎關注微信公眾號：萬貓學社，每周一分享Java技術干貨，

串列的創建和洗掉都是由Redis自動完成的，當嘗試向不存在的鍵添加元素時，Redis會自動創建一個空的串列；當最后一個元素被移除時，Redis會自動洗掉這個串列，這不是特定于串列的，它適用于由多個元素組成的所有Redis資料型別，比如集合、有序集合、哈希，它們都有3條規則：

當我們將元素添加到聚合資料型別時，如果目標鍵不存在，則在添加元素之前會創建一個空的聚合資料型別，比如：

> del one-more-list
(integer) 1
> lpush one-more-list 1 2 3
(integer) 3

歡迎關注微信公眾號：萬貓學社，每周一分享Java技術干貨，

但是，在鍵存在時，就不能操作錯誤的資料型別了，比如：

> set one-more-key OneMoreStudy
OK
> lpush one-more-key 1 2 3
(error) WRONGTYPE Operation against a key holding the wrong kind of value
> type one-more-key
string

當我們從聚合資料型別中洗掉元素時，如果該值保持為空，則key將自動銷毀，比如：

> lpush one-more-list 1 2 3
(integer) 3
> exists one-more-list
(integer) 1
> lpop one-more-list
"3"
> lpop one-more-list
"2"
> lpop one-more-list
"1"
> exists one-more-list
(integer) 0

當對應key不存在，并且呼叫只讀命令（如LLEN命令，獲取串列長度）或寫命令（如LPOP命令）時，都會回傳空聚合資料型別的結果，比如：

> del one-more-list
(integer) 0
> llen one-more-list
(integer) 0
> lpop one-more-list
(nil)

Redis為了追求高性能，串列的內部實作不是一個簡單的鏈表，這里先賣個關子，后續的文章會詳細介紹，

歡迎關注微信公眾號：萬貓學社，每周一分享Java技術干貨，

集合（Set）

集合是一個字串的無序集合，SADD命令可以將新元素添加到集合中，還可以對集合進行許多其他操作，例如：判斷給定元素是否已存在、執行多個集合之間的交集、并集或差等等，比如：

> sadd one-more-set 1 2 3
(integer) 3
> smembers one-more-set
1) "1"
2) "3"
3) "2"

在上面的例子中，在集合中添加了三個元素，并讓Redis回傳所有元素，正如你所見，回傳的元素是沒有排序的，在每次呼叫時，元素的順序都有可能不一樣，

還可以使用SISMEMBER命令判斷給定元素是否已存在，比如：

> sismember one-more-set 3
(integer) 1
> sismember one-more-set 30
(integer) 0

在上面的例子中，3在集合中，所以回傳1；而30不在集合中，所以回傳0，

可以使用SINTER命令，計算出多個集合的交集；使用SUNION命令，計算多個集合的并集；使用SPOP命令，移除并回傳集合中的一個隨機元素；使用SCARD命令，計算集合中的元素的數量，比如：

> sadd one-more-set1 1 2 3
(integer) 3
> sadd one-more-set2 2 3 4
(integer) 3
> sinter one-more-set1 one-more-set2 #交集
1) "3"
2) "2"
> sunion one-more-set1 one-more-set2 #并集
1) "1"
2) "3"
3) "2"
4) "4"
> spop one-more-set1 #隨機移除一個元素
"3"
> scard one-more-set1 #元素數量
(integer) 2

歡迎關注微信公眾號：萬貓學社，每周一分享Java技術干貨，

有序集合（Sorted Set）

有序集合是一種類似于集合和哈希之間混合的資料型別，像集合一樣，有序集合中由唯一的、非重復的字串元素組成，因此從某種意義上說，有序集合也是一個集合，但是集合中的元素是沒有排序的，而有序集合中的每個元素都與一個稱為分數（score）的浮點值相關聯，這就是為什么有序集合也類似于哈希的原因，因為每個元素都映射到一個值，有序集合的排序規則如下：

如果A和B是兩個具有不同分數的元素，那么如果A.分數>B.分數，則A>B，
如果A和B的分數完全相同，那么如果A字串在字典排序上大于B字串，則A>B， A和B字串不能相等，因為有序集合中的元素都是唯一的，

我們來舉個例子，把王者榮耀戰隊的名字和積分添加到有序集合中，其中把戰隊的名字作為值，把戰隊的積分作為分數，

> zadd kpl 12 "eStarPro"
(integer) 1
> zadd kpl 12 "QGhappy"
(integer) 1
> zadd kpl 10 "XQ"
(integer) 1
> zadd kpl 8 "EDG.M"
(integer) 1
> zadd kpl 8 "RNG.M"
(integer) 1
> zadd kpl 4 "TES"
(integer) 1
> zadd kpl 2 "VG"
(integer) 1

如上所示，ZADD命令和SADD命令相似，但是多了一個額外的引數（在要添加的元素的前面）作為分數，ZADD命令也支持多個引數，雖然在上面的例子中未使用它，但你也可以指定多個分數和值對，使用有序集合，快速地回傳按其積分排序的戰隊串列，因為實際上它們已經被排序了，

需要注意的是，為了快速獲取有序集合中的元素，每次添加元素的時間復雜度都為O(log(N))，這是因為有序集合是同時使用跳躍表和字典來實作的，具體原理這里先賣個關子，后續的文章會詳細介紹，

可以使用ZRANGE命令按照升序獲取對應的值，比如：

> zrange kpl 0 -1
1) "VG"
2) "TES"
3) "EDG.M"
4) "RNG.M"
5) "XQ"
6) "QGhappy"
7) "eStarPro"

0和-1代表查詢從第一個到最后一個的元素，還可以使用ZREVRANGE命令按照降序獲取對應的值，比如：

> zrevrange kpl 0 -1
1) "eStarPro"
2) "QGhappy"
3) "XQ"
4) "RNG.M"
5) "EDG.M"
6) "TES"
7) "VG"

加上WITHSCORES引數，就可以連同分數一起回傳，比如：

> zrange kpl 0 -1 withscores
 1) "VG"
 2) "2"
 3) "TES"
 4) "4"
 5) "EDG.M"
 6) "8"
 7) "RNG.M"
 8) "8"
 9) "XQ"
10) "10"
11) "QGhappy"
12) "12"
13) "eStarPro"
14) "12"

有序集合還有更強大的功能，比如在分數范圍內操作，讓我們獲取小于10（含）的戰隊，使用ZRANGEBYSCORE命令：

> zrangebyscore kpl -inf 10
1) "VG"
2) "TES"
3) "EDG.M"
4) "RNG.M"
5) "XQ"

這就是獲取分數從負無窮到10所對應的值，同樣的我們也可以獲取分數從4到10所對應的值：

> zrangebyscore kpl 4 10
1) "TES"
2) "EDG.M"
3) "RNG.M"
4) "XQ"

另外有用的命令：ZRANK命令，它可以回傳指定值的升序排名（從0開始）；ZREVRANK命令，它可以回傳指定值的降序排名（從0開始），比如：

> zrank kpl "EDG.M"
(integer) 2
> zrevrank kpl "EDG.M"
(integer) 4

有序集合的分數是隨時更新的，只要對已有的有序集合呼叫ZADD命令，就會以O(log(N))時間復雜度更新其分數和排序，這樣，當有大量更新時，有序集合是合適的，由于這種特性，常見的場景是排行榜，可以方便地顯示排名前N位的用戶和用戶在排行榜中的排名，

歡迎關注微信公眾號：萬貓學社，每周一分享Java技術干貨，

哈希（Hash）

Redis的哈希和人們期望的“哈希”結構是一樣的，它是一個無序哈希，內部存盤了很多鍵值對，比如：

> hmset one-more-fans:100 name Lily age 25
OK
> hget one-more-fans:100 name
"Lily"
> hget one-more-fans:100 age
"25"
> hgetall one-more-fans:100
1) "name"
2) "Lily"
3) "age"
4) "25"

盡管哈希很容易用來表示物件，但是實際上可以放入哈希中的欄位數是沒有實際限制的，因此您可以以更多種的不同方式使用哈希，除了HGET命令獲取單個欄位對應的值，也可以使用HMSET命令獲取多個欄位及對應的值，它回傳的是一個陣列，比如：

> hmget one-more-fans:100 name age non-existent-field
1) "Lily"
2) "25"
3) (nil)

還可以使用HINCRBY命令，為指定欄位的值做增量，比如：

> hget one-more-fans:100 age
"25"
> hincrby one-more-fans:100 age 3
(integer) 28
> hget one-more-fans:100 age
"28"

Redis哈希的實作結構，和Java中的HashMap是一樣的，也是“陣列+鏈表”的結構，當發生陣列位置碰撞是，就會將碰撞的元素用鏈表串起來，不過Redis為了追求高性能，rehash的方式不太一樣，這里先賣個關子，后續的文章會詳細介紹，

歡迎關注微信公眾號：萬貓學社，每周一分享Java技術干貨，

位圖（Bitmap）

位圖不是實際的資料型別，而是在String型別上定義的一組面向位的操作，由于字串是二進制安全的，并且最大長度為512MB，因此可以設定多達2^32個不同的位，位圖操作分為兩類：固定單個位操作，比如將一個位設定為1或0或獲取其值；對位組的操作，比如計算給定位范圍內設定位的數量，

位圖的最大優點之一是，它們在存盤資訊時通常可以節省大量空間，例如，在以增量用戶ID位標識表示用戶是否要接收新聞通訊，僅使用512 MB記憶體就可以記住40億用戶的一位資訊，

使用SETBIT和GETBIT命令來設定和獲取指定位，比如：

> setbit one-more-key 10 1
(integer) 0
> getbit one-more-key 10
(integer) 1
> getbit one-more-key 11
(integer) 0

SETBIT命令將位號作為其第一個引數，將其設定為1或0的值作為其第二個引數，如果位號超出當前字串長度，該命令將會自動擴大字串，GETBIT命令只是回傳指定位號的位的值，如果位號超出存盤的字串長度則會回傳0，

對位組的操作有以下3個命令：

BITOP命令可以在不同的字串之間執行按位運算，提供的位運算有與、或、非和異或，
BITCOUNT命令可以統計指定范圍內位數為1的個數，
BITPOS命令可以查找指定范圍內為0或1的第一位，

> set one-more-key "\x13\x7f" #二進制為0001 0011 0111 1111
OK
> bitcount one-more-key #整個字串中1的位數
(integer) 10
> bitcount one-more-key 0 0 #第一個字符（0001 0011）中1的位數
(integer) 3
> bitcount one-more-key 1 1 #第二個字符（0111 1111）中1的位數
(integer) 7
> bitpos one-more-key 0 #整個字串中第一個0位
(integer) 0
> bitpos one-more-key 1 #整個字串中第一個1位
(integer) 3
> bitpos one-more-key 1 0 0 #第一個字符（0001 0011）中第一個1位
(integer) 3
> bitpos one-more-key 1 1 1 #第二個字符（0111 1111）中第一個1位
(integer) 9

位圖可以應用于各類實時分析，也可以節省空間高效地存盤位資訊，比如，記錄用戶每天的簽到資料，每一個位表示用戶是否簽到過，這樣就可以計算出某個時間段用戶簽到了幾次，某個時間段用戶第一次簽到是哪一天，

歡迎關注微信公眾號：萬貓學社，每周一分享Java技術干貨，

HyperLogLogs

HyperLogLog是一種概率資料結構，用于統計唯一元素的數量，也可以理解為估計集合中元素的個數，

通常情況下，對唯一元素進行統計數量時，需要使用與要統計的元素數量成比例的記憶體量，因為需要記住過去已經看到的元素，以避免多次對其進行統計，但是，有一組演算法可以以記憶體換取精度，最侄訓得到帶有標準誤差的估計數量，在Redis的HyperLogLogs中，該誤差小于1％，

這個演算法的神奇之處在于，不再需要使用與所統計元素數量成比例的記憶體量，而可以使用恒定數量的記憶體，在最壞的情況下占據12KB的記憶體空間，Redis對HyperLogLog的存盤進行了優化，在計數比較少時，占據的記憶體空間會更小，這里先賣個關子，后續的文章會詳細介紹其中原理，

在集合中，可以將每個元素添加到集合中，并使用SCARD命令獲取集合中的元素數量，因為SADD命令不會重新添加現有元素，所以元素都是唯一的，HyperLogLog的操作和集合比較類似，使用PFADD命令將元素添加到HyperLogLog中，類似于集合的SADD命令；使用PFCOUNT命令獲取HyperLogLog中的唯一元素的當前近似值數量，類似于集合的SCARD命令，比如：

> pfadd one-more-hll a b c d e
(integer) 1
> pfcount one-more-hll 
(integer) 5

Redis中的HyperLogLog盡管在技術上是不同的資料結構，但被編碼為字串，因此可以呼叫GET命令來序列化HyperLogLog，然后呼叫SET命令來將其反序列化回服務器，

歡迎關注微信公眾號：萬貓學社，每周一分享Java技術干貨，

總結

Redis提供更加豐富的資料結構，鍵（Key）和字串（String），都是二進制安全的字串；串列（List），根據插入順序排序的字串元素串列，基于鏈表實作；集合（Set），唯一的亂序的字串元素的集合；有序集合（Sorted Set），與集合類似，但是每個字串元素都與一個稱為score的數字相關聯；哈希（Hash），由欄位與值相關聯組成的映射，欄位和值都是字串；位圖（Bitmap），像操作位陣列一樣操作字串值，可以設定和清除某個位，對所有為1的位進行計數，找到第一個設定1的位，找到第一個設定0的位等等；HyperLogLogs，一種概率資料結構，使用較小的記憶體空間來統計唯一元素的數量，誤差小于1％，

歡迎關注微信公眾號：萬貓學社，每周一分享Java技術干貨，

轉載請註明出處，本文鏈接：https://www.uj5u.com/qita/228709.html

標籤：其他

上一篇：windows本地安裝Oracle資料庫

下一篇：【自考】資料結構第四章樹和二叉樹，期末不掛科指南，第6篇