點擊:轉載原文地址 redis快取
1、為什么使用redis
2、使用redis有什么缺點
3、單執行緒的redis為什么這么快
4、redis的資料型別,以及每種資料型別的使用場景
5、redis的過期策略以及記憶體淘汰機制
6、redis和資料庫雙寫一致性問題
7、如何應對快取穿透和快取雪崩問題
8、如何解決redis的并發競爭問題
正文
1、為什么使用redis
分析:博主覺得在專案中使用redis,主要是從兩個角度去考慮:性能和并發,當然,redis還具備可以做分布式鎖等其他功能,但是如果只是為了分布式鎖這些其他功能,完全還有其他中間件(如zookpeer等)代替,并不是非要使用redis,因此,這個問題主要從性能和并發兩個角度去答,
回答:如下所示,分為兩點
(一)性能
如下圖所示,我們在碰到需要執行耗時特別久,且結果不頻繁變動的SQL,就特別適合將運行結果放入快取,這樣,后面的請求就去快取中讀取,使得請求能夠迅速回應,

題外話:忽然想聊一下這個迅速回應的標準,其實根據互動效果的不同,這個回應時間沒有固定標準,不過曾經有人這么告訴我:”在理想狀態下,我們的頁面跳轉需要在瞬間解決,對于頁內操作則需要在剎那間解決,另外,超過一彈指的耗時操作要有進度提示,并且可以隨時中止或取消,這樣才能給用戶最好的體驗,”
那么瞬間、剎那、一彈指具體是多少時間呢?
根據《摩訶僧祗律》記載
一剎那者為一念,二十念為一瞬,二十瞬為一彈指,二十彈指為一羅預,二十羅預為一須臾,一日一夜有三十須臾,
那么,經過周密的計算,一瞬間為0.36 秒,一剎那有 0.018 秒.一彈指長達 7.2 秒,
(二)并發
如下圖所示,在大并發的情況下,所有的請求直接訪問資料庫,資料庫會出現連接例外,這個時候,就需要使用redis做一個緩沖操作,讓請求先訪問到redis,而不是直接訪問資料庫,

2、使用redis有什么缺點
分析:大家用redis這么久,這個問題是必須要了解的,基本上使用redis都會碰到一些問題,常見的也就幾個,
回答:主要是四個問題
(一)快取和資料庫雙寫一致性問題
(二)快取雪崩問題
(三)快取擊穿問題
(四)快取的并發競爭問題
這四個問題,我個人是覺得在專案中,比較常遇見的,具體解決方案,后文給出,
3、單執行緒的redis為什么這么快
分析:這個問題其實是對redis內部機制的一個考察,其實根據博主的面試經驗,很多人其實都不知道redis是單執行緒作業模型,所以,這個問題還是應該要復習一下的,
回答:主要是以下三點
(一)純記憶體操作
(二)單執行緒操作,避免了頻繁的背景關系切換
(三)采用了非阻塞I/O多路復用機制
題外話:我們現在要仔細的說一說I/O多路復用機制,因為這個說法實在是太通俗了,通俗到一般人都不懂是什么意思,博主打一個比方:小曲在S城開了一家快遞店,負責同城快送服務,小曲因為資金限制,雇傭了一批快遞員,然后小曲發現資金不夠了,只夠買一輛車送快遞,
經營方式一
客戶每送來一份快遞,小曲就讓一個快遞員盯著,然后快遞員開車去送快遞,慢慢的小曲就發現了這種經營方式存在下述問題
- 幾十個快遞員基本上時間都花在了搶車上了,大部分快遞員都處在閑置狀態,誰搶到了車,誰就能去送快遞
- 隨著快遞的增多,快遞員也越來越多,小曲發現快遞店里越來越擠,沒辦法雇傭新的快遞員了
- 快遞員之間的協調很花時間
綜合上述缺點,小曲痛定思痛,提出了下面的經營方式
經營方式二
小曲只雇傭一個快遞員,然后呢,客戶送來的快遞,小曲按送達地點標注好,然后依次放在一個地方,最后,那個快遞員依次的去取快遞,一次拿一個,然后開著車去送快遞,送好了就回來拿下一個快遞,
對比
上述兩種經營方式對比,是不是明顯覺得第二種,效率更高,更好呢,在上述比喻中:
- 每個快遞員——————>每個執行緒
- 每個快遞——————–>每個socket(I/O流)
- 快遞的送達地點————–>socket的不同狀態
- 客戶送快遞請求————–>來自客戶端的請求
- 小曲的經營方式————–>服務端運行的代碼
- 一輛車———————->CPU的核數
于是我們有如下結論
1、經營方式一就是傳統的并發模型,每個I/O流(快遞)都有一個新的執行緒(快遞員)管理,
2、經營方式二就是I/O多路復用,只有單個執行緒(一個快遞員),通過跟蹤每個I/O流的狀態(每個快遞的送達地點),來管理多個I/O流,
下面類比到真實的redis執行緒模型,如圖所示

參照上圖,簡單來說,就是,我們的redis-client在操作的時候,會產生具有不同事件型別的socket,在服務端,有一段I/0多路復用程式,將其置入佇列之中,然后,檔案事件分派器,依次去佇列中取,轉發到不同的事件處理器中,
需要說明的是,這個I/O多路復用機制,redis還提供了select、epoll、evport、kqueue等多路復用函式庫,大家可以自行去了解,
4、redis的資料型別,以及每種資料型別的使用場景
分析:是不是覺得這個問題很基礎,其實我也這么覺得,然而根據面試經驗發現,至少百分八十的人答不上這個問題,建議,在專案中用到后,再類比記憶,體會更深,不要硬記,基本上,一個合格的程式員,五種型別都會用到,
回答:一共五種
(一)String
這個其實沒啥好說的,最常規的set/get操作,value可以是String也可以是數字,一般做一些復雜的計數功能的快取,
(二)hash
這里value存放的是結構化的物件,比較方便的就是操作其中的某個欄位,博主在做單點登錄的時候,就是用這種資料結構存盤用戶資訊,以cookieId作為key,設定30分鐘為快取過期時間,能很好的模擬出類似session的效果,
(三)list
使用List的資料結構,可以做簡單的訊息佇列的功能,另外還有一個就是,可以利用lrange命令,做基于redis的分頁功能,性能極佳,用戶體驗好,本人還用一個場景,很合適---取行情資訊,就也是個生產者和消費者的場景,LIST可以很好的完成排隊,先進先出的原則,
(四)set
因為set堆放的是一堆不重復值的集合,所以可以做全域去重的功能,為什么不用JVM自帶的Set進行去重?因為我們的系統一般都是集群部署,使用JVM自帶的Set,比較麻煩,難道為了一個做一個全域去重,再起一個公共服務,太麻煩了,
另外,就是利用交集、并集、差集等操作,可以計算共同喜好,全部的喜好,自己獨有的喜好等功能,
(五)sorted set
sorted set多了一個權重引數score,集合中的元素能夠按score進行排列,可以做排行榜應用,取TOP N操作,
5、redis的過期策略以及記憶體淘汰機制
分析:這個問題其實相當重要,到底redis有沒用到家,這個問題就可以看出來,比如你redis只能存5G資料,可是你寫了10G,那會刪5G的資料,怎么刪的,這個問題思考過么?還有,你的資料已經設定了過期時間,但是時間到了,記憶體占用率還是比較高,有思考過原因么?
回答:
redis采用的是定期洗掉+惰性洗掉策略,
為什么不用定時洗掉策略?
定時洗掉,用一個定時器來負責監視key,過期則自動洗掉,雖然記憶體及時釋放,但是十分消耗CPU資源,在大并發請求下,CPU要將時間應用在處理請求,而不是洗掉key,因此沒有采用這一策略.
定期洗掉+惰性洗掉是如何作業的呢?
定期洗掉,redis默認每個100ms檢查,是否有過期的key,有過期key則洗掉,需要說明的是,redis不是每個100ms將所有的key檢查一次,而是隨機抽取進行檢查(如果每隔100ms,全部key進行檢查,redis豈不是卡死),因此,如果只采用定期洗掉策略,會導致很多key到時間沒有洗掉,
于是,惰性洗掉派上用場,也就是說在你獲取某個key的時候,redis會檢查一下,這個key如果設定了過期時間那么是否過期了?如果過期了此時就會洗掉,
采用定期洗掉+惰性洗掉就沒其他問題了么?
不是的,如果定期洗掉沒洗掉key,然后你也沒即時去請求key,也就是說惰性洗掉也沒生效,這樣,redis的記憶體會越來越高,那么就應該采用記憶體淘汰機制,
在redis.conf中有一行配置
# maxmemory-policy volatile-lru
該配置就是配記憶體淘汰策略的(什么,你沒配過?好好反省一下自己)
1)noeviction:當記憶體不足以容納新寫入資料時,新寫入操作會報錯,應該沒人用吧,
2)allkeys-lru:當記憶體不足以容納新寫入資料時,在鍵空間中,移除最近最少使用的key,推薦使用,目前專案在用這種,
3)allkeys-random:當記憶體不足以容納新寫入資料時,在鍵空間中,隨機移除某個key,應該也沒人用吧,你不刪最少使用Key,去隨機刪,
4)volatile-lru:當記憶體不足以容納新寫入資料時,在設定了過期時間的鍵空間中,移除最近最少使用的key,這種情況一般是把redis既當快取,又做持久化存盤的時候才用,不推薦
5)volatile-random:當記憶體不足以容納新寫入資料時,在設定了過期時間的鍵空間中,隨機移除某個key,依然不推薦
6)volatile-ttl:當記憶體不足以容納新寫入資料時,在設定了過期時間的鍵空間中,有更早過期時間的key優先移除,不推薦
ps:如果沒有設定 expire 的key, 不滿足先決條件(prerequisites); 那么 volatile-lru, volatile-random 和 volatile-ttl 策略的行為, 和 noeviction(不洗掉) 基本上一致,
6、redis和資料庫雙寫一致性問題
分析:一致性問題是分布式常見問題,還可以再分為最終一致性和強一致性,資料庫和快取雙寫,就必然會存在不一致的問題,答這個問題,先明白一個前提,就是如果對資料有強一致性要求,不能放快取,我們所做的一切,只能保證最終一致性,另外,我們所做的方案其實從根本上來說,只能說降低不一致發生的概率,無法完全避免,因此,有強一致性要求的資料,不能放快取,
首先,采取正確更新策略,先更新資料庫,再刪快取,其次,因為可能存在洗掉快取失敗的問題,提供一個補償措施即可,例如利用訊息佇列,
7、如何應對快取穿透和快取雪崩問題
分析:這兩個問題,說句實在話,一般中小型傳統軟體企業,很難碰到這個問題,如果有大并發的專案,流量有幾百萬左右,這兩個問題一定要深刻考慮,
回答:如下所示
快取穿透,即黑客故意去請求快取中不存在的資料,導致所有的請求都懟到資料庫上,從而資料庫連接例外,
解決方案:
(一)利用互斥鎖,快取失效的時候,先去獲得鎖,得到鎖了,再去請求資料庫,沒得到鎖,則休眠一段時間重試
(二)采用異步更新策略,無論key是否取到值,都直接回傳,value值中維護一個快取失效時間,快取如果過期,異步起一個執行緒去讀資料庫,更新快取,需要做快取預熱(專案啟動前,先加載快取)操作,
(三)提供一個能迅速判斷請求是否有效的攔截機制,比如,利用布隆過濾器,內部維護一系列合法有效的key,迅速判斷出,請求所攜帶的Key是否合法有效,如果不合法,則直接回傳,
快取雪崩,即快取同一時間大面積的失效,這個時候又來了一波請求,結果請求都懟到資料庫上,從而導致資料庫連接例外,
解決方案:
(一)給快取的失效時間,加上一個隨機值,避免集體失效,
(二)使用互斥鎖,但是該方案吞吐量明顯下降了,
(三)雙快取,我們有兩個快取,快取A和快取B,快取A的失效時間為20分鐘,快取B不設失效時間,自己做快取預熱操作,然后細分以下幾個小點
- I 從快取A讀資料庫,有則直接回傳
- II A沒有資料,直接從B讀資料,直接回傳,并且異步啟動一個更新執行緒,
- III 更新執行緒同時更新快取A和快取B,
8、如何解決redis的并發競爭key問題
分析:這個問題大致就是,同時有多個子系統去set一個key,這個時候要注意什么呢?大家思考過么,需要說明一下,博主提前百度了一下,發現答案基本都是推薦用redis事務機制,博主不推薦使用redis的事務機制,因為我們的生產環境,基本都是redis集群環境,做了資料分片操作,你一個事務中有涉及到多個key操作的時候,這多個key不一定都存盤在同一個redis-server上,因此,redis的事務機制,十分雞肋,
回答:如下所示
(1)如果對這個key操作,不要求順序
這種情況下,準備一個分布式鎖,大家去搶鎖,搶到鎖就做set操作即可,比較簡單,
(2)如果對這個key操作,要求順序
假設有一個key1,系統A需要將key1設定為valueA,系統B需要將key1設定為valueB,系統C需要將key1設定為valueC.
期望按照key1的value值按照 valueA–>valueB–>valueC的順序變化,這種時候我們在資料寫入資料庫的時候,需要保存一個時間戳,假設時間戳如下
系統A key 1 {valueA 3:00}
系統B key 1 {valueB 3:05}
系統C key 1 {valueC 3:10}
那么,假設這會系統B先搶到鎖,將key1設定為{valueB 3:05},接下來系統A搶到鎖,發現自己的valueA的時間戳早于快取中的時間戳,那就不做set操作了,以此類推,
其他方法,比如利用佇列,將set方法變成串行訪問也可以,總之,靈活變通,
轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/164034.html
標籤:Java
上一篇:【面經】5年Java面試親身經驗
下一篇:2020阿里最新出品的泰山版Java開發手冊,告別垃圾代碼