行程快取和快取服務，如何抉擇？-有解無憂

作者：翁智華

出處：https://www.cnblogs.com/wzh2010/

概述

我們所說的快取分為行程內部快取（系統內部快取）和快取服務（如redis/memcache），

計算機服務從原來的單體結構，到多實體，到現在流行的微服務，快取服務變得原來越流行了，

行程快取

先說說行程快取，它將資料存盤在站點、服務的行程內，在Web的發展歷史上，這樣的方式備受歡迎，比如早期常用的.Net的 System.Web.Caching.

這種實作載體很簡單，比如一個帶鎖的HasTable，或者一個List物件，使用簡單便捷，能存盤資料、html頁面片段、檔案，甚至任何物件，

在單體結構的Web模式下，行程內快取被開發到極致，大概流程如下圖：

與原先沒有快取相比，行程內快取的好處是，資料讀取不再直接訪問資料庫，先判斷快取中是否存在，如果存在，則直接讀取，不存在則再去資料庫中取，同時寫入快取，

這樣避免了每次的請求都走資料庫，減少網路開銷和資料請求次數，提高了資料獲取效率，基本等同在記憶體中執行，

快取的目的是為了冷熱資料的隔離，對于頻繁被修改的資料，快取的意義不是很大，比如微信用戶的實時步數，比較有價值的是那些不被頻繁修改且資料量較大的內容，比如系統字典、配置資料，

判斷是否需要創建快取需要一定的依據，以下是我的團隊的策略，不一定適用，可以參考：

快取的必要性：資料的變更是否過于頻繁，過于頻繁則可能導致快取不斷重建，反而降低效率，評估方式：快取的過期時間內沒被主動更新的量值應該超過60%，

假設快取時間：3600s

假設同一種型別快取資料基數：6000個

6000 * 60% = 3600 的資料在一個小時內事務未更新，這樣的快取價值更大，

行程快取的問題

在互聯網大潮下，隨著用戶量的激增，原來單體結構逐漸的向Web服務集群發展，在多實體目標下，行程快取的弊端越來越明顯，

比如快取無法統一的問題，

如果站點和服務中的多個節點訪問統一的快取服務（比如redis 或者 memerche），資料統一存盤，資料的一致性就比較容易保障，

但如果是行程快取，資料存盤在站點和服務的多個節點內，每個節點一個快取，存盤多份，一致性就比較難保障，

如上圖，但是有個問題，Cache1、Cache1、Cache3一致性難以保障，如果想保持快取的一致性時，該怎么辦呢？

一般有以下幾種方法：

1、單一服務節點通知其他服務節點，如果我們只是Web Service1 在執行業務操作的時候修改資料庫，更新快取，同時通知其他Web Service

服務，其他Web Service 接收到資訊的時候，進行快取更新，

2、啟動MQ通知其他節點：如下圖，可以通過MQ通知其他節點，寫請求發生在server1，在修改完自己快取資料與資料庫中的資料之后，給MQ生產資料變化通知，

server2和server1訂閱MQ訊息，當消費到MQ資訊的時候，也修改快取資料，

3、有一種簡單的方式，也可以解耦與Web Server的關系，就是直接放棄了“實時一致性”，啟動一個獨立的行程服務，定時從后端拉取最新的資料，更新記憶體快取，

上述的幾種方法為了保持資料的一致性，增加了一定的開銷，一方面快取資料同步程序中會有出錯的風險；

另一方面實際上違背了快取的原則：冷熱資料隔絕，有效的利用冷資料，減輕資料庫壓力，提升效率，如果快取被頻繁修改或者同步，那快取的價值就不大了，

補充：1、2 兩種方式，實體越多，快取冗余越多，各快取節點資料同步的原子性越難保證，一致性也就越難保證，

第3種方式：采用定時拉取本身已經放棄了資料的實時一致性，

所以我們在以下這幾種情況下拋棄行程快取，選用快取服務：

1、Web集群下，包含多個實體，并且不允許業務資料的不一致性（我相信大部分業務不允許）

2、行程內快取資料量較大，快取記憶體空間不足，影響Web性能，可以考慮走快取服務（快取服務如redis，一般獨立服務甚至集群配置，支持超大量級），

3、評估value大小、快取記憶體空間、峰值QPS、過期時間、快取命中率、讀寫更新策略、key值分布路由策略、過期策略以及資料一致性方案，根據實際需要判斷是否走快取服務，

快取服務

在互聯網分層架構中，最常用的kv結構的快取是redis，他有如下特點：

1、它支持復雜資料結構

value是字串、哈希，串列，集合，有序集合這類復雜的資料結構，支持各種場景，如客戶訂單資訊串列，用戶訊息，帖子評論等，

2、支持持久化

首先，redis的所有資料都是保存在記憶體中，然后不定期的通過異步方式保存到磁盤上(這稱為“半持久化模式”)；

也可以把每一次資料變化都寫入到一個append only file(aof)里面(這稱為“全持久化模式”，效率會低一點)，

但是我們盡量不要把redis當作資料庫用，如果真的需要持久化資料，建議可以走MySQL：

2.1、redis的定期快照不能保證資料不丟失

2.2、redis的AOF會降低效率，并且不能支持太大的資料量

3、具備高可用特性

redis天然支持集群功能，可以實作主動復制，讀寫分離，官方也提供了sentinel集群管理工具，能夠實作主從服務監控，故障自動轉移，

4、存盤的內容比較大

String型別：一個String型別的value最大可以存盤512M，List、Set、Hash型別：list的元素個數最多為2^32-1個，也就是4294967295個，

5、支持事務

操作都是原子性，對資料的更改要么全部執行，要么全部不執行，避免業務資料的不一致性，

快取使用注意

1、Web服務單體模式轉為多實體之后，我們將行程快取升級為快取服務（redis），清清理了所有的快取使用，都改成了對接redis，但是有一些地方漏掉，因為我們有3個實體，所以漏掉的那幾個地方，一旦修改某個資料之后，一會兒是新值，一會兒舊值，很神奇，

2、謹防快取擊穿、雪崩的產生，這個我們有慘痛的教訓，后續來一篇專門分析下，

近期熱文推薦：

1.1,000+ 道 Java面試題及答案整理(2021最新版)

2.終于靠開源專案弄到 IntelliJ IDEA 激活碼了，真香！

3.阿里 Mock 工具正式開源，干掉市面上所有 Mock 工具！

4.Spring Cloud 2020.0.0 正式發布，全新顛覆性版本！

5.《Java開發手冊（嵩山版）》最新發布，速速下載！

覺得不錯，別忘了隨手點贊+轉發哦！

轉載請註明出處，本文鏈接：https://www.uj5u.com/houduan/292290.html

標籤：Java

上一篇：??小白到精英必備的100多個Python函式匯總??寫代碼都流暢多了

下一篇：行程快取和快取服務，如何抉擇？

行程快取和快取服務，如何抉擇？

概述