前言
Redis是一個開源的使用ANSI C語言撰寫、支持網路、可基于記憶體亦可持久化的日志型、Key-Value資料庫,并提供多種語言的API。在這篇文章中,我們將闡述 Redis 最常用的使用場景,以及那些影響我們選擇的不同特性。
Redis 的 5 個常見使用場景
1、會話快取(Session Cache)
最常用的一種使用Redis的情景是會話快取(session cache)。用Redis快取會話比其他存盤(如Memcached)的優勢在于:Redis提供持久化。當維護一個不是嚴格要求一致性的快取時,如果用戶的購物車資訊全部丟失,大部分人都會不高興的,現在,他們還會這樣嗎?
幸運的是,隨著 Redis 這些年的改進,很容易找到怎么恰當的使用Redis來快取會話的檔案。甚至廣為人知的商業平臺Magento也提供Redis的插件。
2、全頁快取(FPC)
除基本的會話token之外,Redis還提供很簡便的FPC平臺。回到一致性問題,即使重啟了Redis實體,因為有磁盤的持久化,用戶也不會看到頁面加載速度的下降,這是一個極大改進,類似PHP本地FPC。
再次以Magento為例,Magento提供一個插件來使用Redis作為全頁快取后端。
此外,對WordPress的用戶來說,Pantheon有一個非常好的插件 wp-redis,這個插件能幫助你以最快速度加載你曾瀏覽過的頁面。
3、佇列
Reids在記憶體存盤引擎領域的一大優點是提供 list 和 set 操作,這使得Redis能作為一個很好的訊息佇列平臺來使用。Redis作為佇列使用的操作,就類似于本地程式語言(如Python)對 list 的 push/pop 操作。
如果你快速的在Google中搜索“Redis queues”,你馬上就能找到大量的開源專案,這些專案的目的就是利用Redis創建非常好的后端工具,以滿足各種佇列需求。例如,Celery有一個后臺就是使用Redis作為broker,你可以從這里去查看。
4、排行榜/計數器
Redis在記憶體中對數字進行遞增或遞減的操作實作的非常好。集合(Set)和有序集合(Sorted Set)也使得我們在執行這些操作的時候變的非常簡單,Redis只是正好提供了這兩種資料結構。所以,我們要從排序集合中獲取到排名最靠前的10個用戶–我們稱之為“user_scores”,我們只需要像下面一樣執行即可:
當然,這是假定你是根據你用戶的分數做遞增的排序。如果你想回傳用戶及用戶的分數,你需要這樣執行:
ZRANGE user_scores 0 10 WITHSCORES
Agora Games就是一個很好的例子,用Ruby實作的,它的排行榜就是使用Redis來存盤資料的,你可以在這里看到。
5、發布/訂閱
最后(但肯定不是最不重要的)是Redis的發布/訂閱功能。發布/訂閱的使用場景確實非常多。我已看見人們在社交網路連接中使用,還可作為基于發布/訂閱的腳本觸發器,甚至用Redis的發布/訂閱功能來建立聊天系統!(不,這是真的,你可以去核實)。
Redis提供的所有特性中,我感覺這個是喜歡的人最少的一個,雖然它為用戶提供如果此多功能。
詳解 Redis 應用場景及應用實體
1. MySql+Memcached架構的問題
實際MySQL是適合進行海量資料存盤的,通過Memcached將熱點資料加載到cache,加速訪問,很多公司都曾經使用過這樣的架構,但隨著業務資料量的不斷增加,和訪問量的持續增長,我們遇到了很多問題:
1.MySQL需要不斷進行拆庫拆表,Memcached也需不斷跟著擴容,擴容和維護作業占據大量開發時間。
2.Memcached與MySQL資料庫資料一致性問題。
3.Memcached資料命中率低或down機,大量訪問直接穿透到DB,MySQL無法支撐。
4.跨機房cache同步問題。
眾多NoSQL百花齊放,如何選擇
最近幾年,業界不斷涌現出很多各種各樣的NoSQL產品,那么如何才能正確地使用好這些產品,最大化地發揮其長處,是我們需要深入研究和思考的問題,實際歸根結底最重要的是了解這些產品的定位,并且了解到每款產品的tradeoffs,在實際應用中做到揚長避短,總體上這些
NoSQL主要用于解決以下幾種問題
1.少量資料存盤,高速讀寫訪問。此類產品通過資料全部in-momery 的方式來保證高速訪問,同時提供資料落地的功能,實際這正是Redis最主要的適用場景。
2.海量資料存盤,分布式系統支持,資料一致性保證,方便的集群節點添加/洗掉。
3.這方面最具代表性的是dynamo和bigtable 2篇論文所闡述的思路。前者是一個完全無中心的設計,節點之間通過gossip方式傳遞集群資訊,資料保證最終一致性,后者是一個中心化的方案設計,通過類似一個分布式鎖服務來保證強一致性,資料寫入先寫記憶體和redo log,然后定期compat歸并到磁盤上,將隨機寫優化為順序寫,提高寫入性能。
4.Schema free,auto-sharding等。比如目前常見的一些檔案資料庫都是支持schema-free的,直接存盤json格式資料,并且支持auto-sharding等功能,比如mongodb。
面對這些不同型別的NoSQL產品,我們需要根據我們的業務場景選擇最合適的產品。
Redis最適合所有資料in-momory的場景,雖然Redis也提供持久化功能,但實際更多的是一個disk-backed的功能,跟傳統意義上的持久化有比較大的差別,那么可能大家就會有疑問,似乎Redis更像一個加強版的Memcached,那么何時使用Memcached,何時使用 Redis呢?
如果簡單地比較Redis與Memcached的區別,大多數都會得到以下觀點:
1 、Redis不僅僅支持簡單的k/v型別的資料,同時還提供list,set,zset,hash等資料結構的存盤。
2 、Redis支持資料的備份,即master-slave模式的資料備份。
3 、Redis支持資料的持久化,可以將記憶體中的資料保持在磁盤中,重啟的時候可以再次加載進行使用。
2. Redis常用資料型別
Redis最為常用的資料型別主要有以下:
String
Hash
List
Set
Sorted set
pub/sub
Transactions
在具體描述這幾種資料型別之前,我們先通過一張圖了解下Redis內部記憶體管理中是如何描述這些不同資料型別的:

首先Redis內部使用一個redisObject物件來表示所有的key和value,redisObject最主要的資訊如上圖所示:
type代表一個value物件具體是何種資料型別,
encoding是不同資料型別在redis內部的存盤方式,
比如:type=string代表value存盤的是一個普通字串,那么對應的encoding可以是raw或者是int,如果是int則代表實際 redis內部是按數值型類存盤和表示這個字串的,當然前提是這個字串本身可以用數值表示,比如:”123″ “456″這樣的字串。
這里需要特殊說明一下vm欄位,只有打開了Redis的虛擬記憶體功能,此欄位才會真正的分配記憶體,該功能默認是關閉狀態的,該功能會在后面具體描述。通過上圖我們可以發現Redis使用redisObject來表示所有的key/value資料是比較浪費記憶體的,當然這些記憶體管理成本的付出主要也是為了給 Redis不同資料型別提供一個統一的管理介面,實際作者也提供了多種方法幫助我們盡量節省記憶體使用,我們隨后會具體討論。
3. 各種資料型別應用和實作方式
下面我們先來逐一的分析下這7種資料型別的使用和內部實作方式:
String:
Strings 資料結構是簡單的key-value型別,value其實不僅是String,也可以是數字。
常用命令: set,get,decr,incr,mget 等。
應用場景:String是最常用的一種資料型別,普通的key/ value 存盤都可以歸為此類。即可以完全實作目前 Memcached 的功能,并且效率更高。還可以享受Redis的定時持久化,操作日志及 Replication等功能。除了提供與 Memcached 一樣的get、set、incr、decr 等操作外,Redis還提供了下面一些操作:
獲取字串長度
往字串append內容
設定和獲取字串的某一段內容
設定及獲取字串的某一位(bit)
批量設定一系列字串的內容
實作方式:String在redis內部存盤默認就是一個字串,被redisObject所參考,當遇到incr,decr等操作時會轉成數值型進行計算,此時redisObject的encoding欄位為int。
Hash
常用命令:hget,hset,hgetall 等。
應用場景:在Memcached中,我們經常將一些結構化的資訊打包成HashMap,在客戶端序列化后存盤為一個字串的值,比如用戶的昵稱、年齡、性別、積分等,這時候在需要修改其中某一項時,通常需要將所有值取出反序列化后,修改某一項的值,再序列化存盤回去。這樣不僅增大了開銷,也不適用于一些可能并發操作的場合(比如兩個并發的操作都需要修改積分)。而Redis的Hash結構可以使你像在資料庫中Update一個屬性一樣只修改某一項屬性值。
我們簡單舉個實體來描述下Hash的應用場景,比如我們要存盤一個用戶資訊物件資料,包含以下資訊:
用戶ID為查找的key,存盤的value用戶物件包含姓名,年齡,生日等資訊,如果用普通的key/value結構來存盤,主要有 2種存盤方式。
第一種方式將用戶ID作為查找key,把其他資訊封裝成一個物件以序列化的方式存盤,這種方式的缺點是,增加了序列化/反序列化的開銷,并且在需要修改其中一項資訊時,需要把整個物件取回,并且修改操作需要對并發進行保護,引入CAS等復雜問題。
第二種方法是這個用戶資訊物件有多少成員就存成多少個key-value對兒,用用戶ID+對應屬性的名稱作為唯一標識來取得對應屬性的值,雖然省去了序列化開銷和并發問題,但是用戶ID為重復存盤,如果存在大量這樣的資料,記憶體浪費還是非常可觀的。
那么Redis提供的Hash很好的解決了這個問題,Redis的Hash實際是內部存盤的Value為一個HashMap,并提供了直接存取這個Map成員的介面。
也就是說,Key仍然是用戶ID, value是一個Map,這個Map的key是成員的屬性名,value是屬性值,這樣對資料的修改和存取都可以直接通過其內部Map的 Key(Redis里稱內部Map的key為field), 也就是通過 key(用戶ID) + field(屬性標簽) 就可以操作對應屬性資料了,既不需要重復存盤資料,也不會帶來序列化和并發修改控制的問題。很好的解決了問題。
這里同時需要注意,Redis提供了介面(hgetall)可以直接取到全部的屬性資料,但是如果內部Map的成員很多,那么涉及到遍歷整個內部 Map的操作,由于Redis單執行緒模型的緣故,這個遍歷操作可能會比較耗時,而另其它客戶端的請求完全不回應,這點需要格外注意。
實作方式:
上面已經說到Redis Hash對應Value內部實際就是一個HashMap,實際這里會有2種不同實作,這個Hash的成員比較少時Redis為了節省記憶體會采用類似一維陣列的方式來緊湊存盤,而不會采用真正的HashMap結構,對應的value redisObject的encoding為zipmap,當成員數量增大時會自動轉成真正的HashMap,此時encoding為ht。
List
常用命令:lpush,rpush,lpop,rpop,lrange等。
應用場景:
Redis list的應用場景非常多,也是Redis最重要的資料結構之一,比如twitter的關注串列,粉絲串列等都可以用Redis的list結構來實作。
Lists 就是鏈表,相信略有資料結構知識的人都應該能理解其結構。使用Lists結構,我們可以輕松地實作最新訊息排行等功能。Lists的另一個應用就是訊息佇列,
可以利用Lists的PUSH操作,將任務存在Lists中,然后作業執行緒再用POP操作將任務取出進行執行。Redis還提供了操作Lists中某一段的api,你可以直接查詢,洗掉Lists中某一段的元素。
實作方式:
Redis list的實作為一個雙向鏈表,即可以支持反向查找和遍歷,更方便操作,不過帶來了部分額外的記憶體開銷,Redis內部的很多實作,包括發送緩沖佇列等也都是用的這個資料結構。
Set
常用命令:
sadd,spop,smembers,sunion 等。
應用場景:
Redis set對外提供的功能與list類似是一個串列的功能,特殊之處在于set是可以自動排重的,當你需要存盤一個串列資料,又不希望出現重復資料時,set 是一個很好的選擇,并且set提供了判斷某個成員是否在一個set集合內的重要介面,這個也是list所不能提供的。
Sets 集合的概念就是一堆不重復值的組合。利用Redis提供的Sets資料結構,可以存盤一些集合性的資料,比如在微博應用中,可以將一個用戶所有的關注人存在一個集合中,將其所有粉絲存在一個集合。Redis還為集合提供了求交集、并集、差集等操作,可以非常方便的實作如共同關注、共同喜好、二度好友等功能,對上面的所有集合操作,你還可以使用不同的命令選擇將結果回傳給客戶端還是存集到一個新的集合中。
實作方式:
set 的內部實作是一個 value永遠為null的HashMap,實際就是通過計算hash的方式來快速排重的,這也是set能提供判斷一個成員是否在集合內的原因。
Sorted Set
常用命令:
zadd,zrange,zrem,zcard等
使用場景:
Redis sorted set的使用場景與set類似,區別是set不是自動有序的,而sorted set可以通過用戶額外提供一個優先級(score)的引數來為成員排序,并且是插入有序的,即自動排序。當你需要一個有序的并且不重復的集合串列,那么可以選擇sorted set資料結構,比如twitter 的public timeline可以以發表時間作為score來存盤,這樣獲取時就是自動按時間排好序的。
另外還可以用Sorted Sets來做帶權重的佇列,比如普通訊息的score為1,重要訊息的score為2,然后作業執行緒可以選擇按score的倒序來獲取作業任務。讓重要的任務優先執行。
實作方式:
Redis sorted set的內部使用HashMap和跳躍表(SkipList)來保證資料的存盤和有序,HashMap里放的是成員到score的映射,而跳躍表里存放的是所有的成員,排序依據是HashMap里存的score,使用跳躍表的結構可以獲得比較高的查找效率,并且在實作上比較簡單。
Pub/Sub
Pub/Sub 從字面上理解就是發布(Publish)與訂閱(Subscribe),在Redis中,你可以設定對某一個key值進行訊息發布及訊息訂閱,當一個 key值上進行了訊息發布后,所有訂閱它的客戶端都會收到相應的訊息。這一功能最明顯的用法就是用作實時訊息系統,比如普通的即時聊天,群聊等功能。
Transactions
誰說NoSQL都不支持事務,雖然Redis的Transactions提供的并不是嚴格的ACID的事務(比如一串用EXEC提交執行的命令,在執行中服務器宕機,那么會有一部分命令執行了,剩下的沒執行),但是這個Transactions還是提供了基本的命令打包執行的功能(在服務器不出問題的情況下,可以保證一連串的命令是順序在一起執行的,中間有會有其它客戶端命令插進來執行)。Redis還提供了一個Watch功能,你可以對一個key進行 Watch,然后再執行Transactions,在這程序中,如果這個Watched的值進行了修改,那么這個Transactions會發現并拒絕執行。
4. Redis實際應用場景
Redis在很多方面與其他資料庫解決方案不同:它使用記憶體提供主存盤支持,而僅使用硬碟做持久性的存盤;它的資料模型非常獨特,用的是單執行緒。另一個大區別在于,你可以在開發環境中使用Redis的功能,但卻不需要轉到Redis。
轉向Redis當然也是可取的,許多開發者從一開始就把Redis作為首選資料庫;但設想如果你的開發環境已經搭建好,應用已經在上面運行了,那么更換資料庫框架顯然不那么容易。另外在一些需要大容量資料集的應用,Redis也并不適合,因為它的資料集不會超過系統可用的記憶體。所以如果你有大資料應用,而且主要是讀取訪問模式,那么Redis并不是正確的選擇。
然而我喜歡Redis的一點就是你可以把它融入到你的系統中來,這就能夠解決很多問題,比如那些你現有的資料庫處理起來感到緩慢的任務。這些你就可以通過 Redis來進行優化,或者為應用創建些新的功能。在本文中,我就想探討一些怎樣將Redis加入到現有的環境中,并利用它的原語命令等功能來解決 傳統環境中碰到的一些常見問題。在這些例子中,Redis都不是作為首選資料庫。
1、顯示最新的專案串列
下面這個陳述句常用來顯示最新專案,隨著資料多了,查詢毫無疑問會越來越慢。
SELECT * FROM foo WHERE … ORDER BY time DESC LIMIT 10
在Web應用中,“列出最新的回復”之類的查詢非常普遍,這通常會帶來可擴展性問題。這令人沮喪,因為專案本來就是按這個順序被創建的,但要輸出這個順序卻不得不進行排序操作。
類似的問題就可以用Redis來解決。比如說,我們的一個Web應用想要列出用戶貼出的最新20條評論。在最新的評論邊上我們有一個“顯示全部”的鏈接,點擊后就可以獲得更多的評論。
我們假設資料庫中的每條評論都有一個唯一的遞增的ID欄位。
我們可以使用分頁來制作主頁和評論頁,使用Redis的模板,每次新評論發表時,我們會將它的ID添加到一個Redis串列:
LPUSH latest.comments
我們將串列裁剪為指定長度,因此Redis只需要保存最新的5000條評論:
LTRIM latest.comments 0 5000
每次我們需要獲取最新評論的專案范圍時,我們呼叫一個函式來完成(使用偽代碼):
FUNCTION get_latest_comments(start, num_items):
id_list = redis.lrange(“latest.comments”,start,start+num_items – 1)
IF id_list.length < num_items
id_list = SQL_DB(“SELECT … ORDER BY time LIMIT …”)
END
RETURN id_list
END
這里我們做的很簡單。在Redis中我們的最新ID使用了常駐快取,這是一直更新的。但是我們做了限制不能超過5000個ID,因此我們的獲取ID函式會一直詢問Redis。只有在start/count引數超出了這個范圍的時候,才需要去訪問資料庫。
我們的系統不會像傳統方式那樣“重繪”快取,Redis實體中的資訊永遠是一致的。SQL資料庫(或是硬碟上的其他型別資料庫)只是在用戶需要獲取“很遠”的資料時才會被觸發,而主頁或第一個評論頁是不會麻煩到硬碟上的資料庫了。
2、洗掉與過濾
我們可以使用LREM來洗掉評論。如果洗掉操作非常少,另一個選擇是直接跳過評論條目的入口,報告說該評論已經不存在。
有些時候你想要給不同的串列附加上不同的過濾器。如果過濾器的數量受到限制,你可以簡單的為每個不同的過濾器使用不同的Redis串列。畢竟每個串列只有5000條專案,但Redis卻能夠使用非常少的記憶體來處理幾百萬條專案。
3、排行榜相關
另一個很普遍的需求是各種資料庫的資料并非存盤在記憶體中,因此在按得分排序以及實時更新這些幾乎每秒鐘都需要更新的功能上資料庫的性能不夠理想。
典型的比如那些在線游戲的排行榜,比如一個Facebook的游戲,根據得分你通常想要:
– 列出前100名高分選手
– 列出某用戶當前的全球排名
這些操作對于Redis來說小菜一碟,即使你有幾百萬個用戶,每分鐘都會有幾百萬個新的得分。
模式是這樣的,每次獲得新得分時,我們用這樣的代碼:
ZADD leaderboard
你可能用userID來取代username,這取決于你是怎么設計的。
得到前100名高分用戶很簡單:ZREVRANGE leaderboard 0 99。
用戶的全球排名也相似,只需要:ZRANK leaderboard 。
4、按照用戶投票和時間排序
排行榜的一種常見變體模式就像Reddit或Hacker News用的那樣,新聞按照類似下面的公式根據得分來排序:
score = points / time^alpha
因此用戶的投票會相應的把新聞挖出來,但時間會按照一定的指數將新聞埋下去。下面是我們的模式,當然演算法由你決定。
模式是這樣的,開始時先觀察那些可能是最新的專案,例如首頁上的1000條新聞都是候選者,因此我們先忽視掉其他的,這實作起來很簡單。
每次新的新聞貼上來后,我們將ID添加到串列中,使用LPUSH + LTRIM,確保只取出最新的1000條專案。
有一項后臺任務獲取這個串列,并且持續的計算這1000條新聞中每條新聞的最終得分。計算結果由ZADD命令按照新的順序填充生成串列,老新聞則被清除。這里的關鍵思路是排序作業是由后臺任務來完成的。
5、處理過期專案
另一種常用的專案排序是按照時間排序。我們使用unix時間作為得分即可。
模式如下:
– 每次有新專案添加到我們的非Redis資料庫時,我們把它加入到排序集合中。這時我們用的是時間屬性,current_time和time_to_live。
– 另一項后臺任務使用ZRANGE…SCORES查詢排序集合,取出最新的10個專案。如果發現unix時間已經過期,則在資料庫中洗掉條目。
6、計數
Redis是一個很好的計數器,這要感謝INCRBY和其他相似命令。
我相信你曾許多次想要給資料庫加上新的計數器,用來獲取統計或顯示新資訊,但是最后卻由于寫入敏感而不得不放棄它們。
好了,現在使用Redis就不需要再擔心了。有了原子遞增(atomic increment),你可以放心的加上各種計數,用GETSET重置,或者是讓它們過期。
例如這樣操作:
INCR user: EXPIRE
user: 60
你可以計算出最近用戶在頁面間停頓不超過60秒的頁面瀏覽量,當計數達到比如20時,就可以顯示出某些條幅提示,或是其它你想顯示的東西。
7、特定時間內的特定專案
另一項對于其他資料庫很難,但Redis做起來卻輕而易舉的事就是統計在某段特點時間里有多少特定用戶訪問了某個特定資源。比如我想要知道某些特定的注冊用戶或IP地址,他們到底有多少訪問了某篇文章。
每次我獲得一次新的頁面瀏覽時我只需要這樣做:
SADD page:day1:
當然你可能想用unix時間替換day1,比如time()-(time()%3600*24)等等。
想知道特定用戶的數量嗎?只需要使用SCARD page:day1: 。
需要測驗某個特定用戶是否訪問了這個頁面?SISMEMBER page:day1: 。
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/231648.html
標籤:其他
上一篇:mapreduce為什么報錯后還會運行成功,防火墻也關了,代碼也沒問題,求大神解決!!!
下一篇:中科院微電子所歷年考博真題
