主頁 > 資料庫 > 關于快取的一些重要概念(Redis 前置菜)

關于快取的一些重要概念(Redis 前置菜)

2020-11-24 23:41:33 資料庫

1. 快取的基本思想

很多朋友,只知道快取可以提高系統性能以及減少請求相應時間,但是,不太清楚快取的本質思想是什么,

快取的基本思想其實很簡單,就是我們非常熟悉的空間換時間,不要把快取想的太高大上,雖然,它的確對系統的性能提升的性價比非常高,

其實,我們在學習使用快取的時候,你會發現快取的思想實際在作業系統或者其他地方都被大量用到, 比如 CPU Cache 快取的是記憶體資料用于解決 CPU 處理速度和記憶體不匹配的問題,記憶體快取的是硬碟資料用于解決硬碟訪問速度過慢的問題, 再比如作業系統在 頁表方案 基礎之上引入了 快表 來加速虛擬地址到物理地址的轉換,我們可以把快表理解為一種特殊的高速緩沖存盤器(Cache),

回歸到業務系統來說:我們為了避免用戶在請求資料的時候獲取速度過于緩慢,所以我們在資料庫之上增加了快取這一層來彌補,

當別人再問你,快取的基本思想的時候,就把上面這段話告訴他,我覺得會讓別人對你刮目相看,

2. 使用快取為系統帶來了什么問題

軟體系統設計中沒有銀彈,往往任何技術的引入都像是把雙刃劍, 你使用的方式得當,就能為系統帶來很大的收益,否則,只是費了精力不討好,

簡單來說,為系統引入快取之后往往會帶來下面這些問題:

ps:其實我覺得引入本地快取來做一些簡單業務場景的話,實際帶來的代價幾乎可以忽略,下面主要是針對分布式快取來說的,

  1. 系統復雜性增加 :引入快取之后,你要維護快取和資料庫的資料一致性、維護熱點快取等等,
  2. 系統開發成本往往會增加 :引入快取意味著系統需要一個單獨的快取服務,這是需要花費相應的成本的,并且這個成本還是很貴的,畢竟耗費的是寶貴的記憶體,但是,如果你只是簡單的使用一下本地快取存盤一下簡單的資料,并且資料量不大的話,那么就不需要單獨去弄一個快取服務,

3. 本地快取解決方案

先來聊聊本地快取,這個實際在很多專案中用的蠻多,特別是單體架構的時候,資料量不大,并且沒有分布式要求的話,使用本地快取還是可以的,

常見的單體架構圖如下,我們使用 Nginx 來做負載均衡,部署兩個相同的服務到服務器,兩個服務使用同一個資料庫,并且使用的是本地快取,

那本地快取的方案有哪些呢?且聽 Guide 給你來說一說,

一:JDK 自帶的 HashMap 和 ConcurrentHashMap 了,

ConcurrentHashMap 可以看作是執行緒安全版本的 HashMap ,兩者都是存放 key/value 形式的鍵值對,但是,大部分場景來說不會使用這兩者當做快取,因為只提供了快取的功能,并沒有提供其他諸如過期時間之類的功能,一個稍微完善一點的快取框架至少要提供:過期時間淘汰機制命中率統計這三點,

二: Ehcache 、 Guava Cache 、 Spring Cache 這三者是使用的比較多的本地快取框架,

  • Ehcache 的話相比于其他兩者更加重量,不過,相比于 Guava Cache 、 Spring Cache 來說, Ehcache 支持可以嵌入到 hibernate 和 mybatis 作為多級快取,并且可以將快取的資料持久化到本地磁盤中、同時也提供了集群方案(比較雞肋,可忽略),
  • Guava Cache 和 Spring Cache 兩者的話比較像,Guava 相比于 Spring Cache 的話使用的更多一點,它提供了 API 非常方便我們使用,同時也提供了設定快取有效時間等功能,它的內部實作也比較干凈,很多地方都和 ConcurrentHashMap 的思想有異曲同工之妙,
  • 使用 Spring Cache 的注解實作快取的話,代碼會看著很干凈和優雅,但是很容易出現問題比如快取穿透、記憶體溢位,

三: 后起之秀 Caffeine,

相比于 Guava 來說 Caffeine 在各個方面比如性能要更加優秀,一般建議使用其來替代 Guava ,并且, Guava 和 Caffeine 的使用方式很像!

本地快取固然好,但是缺陷也很明顯,比如多個相同服務之間的本地快取的資料無法共享,

4. 為什么要有分布式快取?/為什么不直接用本地快取?

本地的快取的優勢非常明顯:低依賴輕量簡單成本低

但是,本地快取存在下面這些缺陷:

  1. 本地快取對分布式架構支持不友好,比如同一個相同的服務部署在多臺機器上的時候,各個服務之間的快取是無法共享的,因為本地快取只在當前機器上有,
  2. 本地快取容量受服務部署所在的機器限制明顯, 如果當前系統服務所耗費的記憶體多,那么本地快取可用的容量就很少,

我們可以把分布式快取(Distributed Cache) 看作是一種記憶體資料庫的服務,它的最終作用就是提供快取資料的服務,

如下圖所示,就是一個簡單的使用分布式快取的架構圖,我們使用 Nginx 來做負載均衡,部署兩個相同的服務到服務器,兩個服務使用同一個資料庫和快取,

使用分布式快取之后,快取部署在一臺單獨的服務器上,即使同一個相同的服務部署在再多機器上,也是使用的同一份快取, 并且,單獨的分布式快取服務的性能、容量和提供的功能都要更加強大,

使用分布式快取的缺點呢,也很顯而易見,那就是你需要為分布式快取引入額外的服務比如 Redis 或 Memcached,你需要單獨保證 Redis 或 Memcached 服務的高可用,

5. 快取讀寫模式/更新策略

下面介紹到的三種模式各有優劣,不存在最佳模式,根據具體的業務場景選擇適合自己的快取讀寫模式,

5.1. Cache Aside Pattern(旁路快取模式)

Cache Aside Pattern 是我們平時使用比較多的一個快取讀寫模式,比較適合讀請求比較多的場景,

Cache Aside Pattern 中服務端需要同時維系 DB 和 cache,并且是以 DB 的結果為準,

下面我們來看一下這個策略模式下的快取讀寫步驟,

 :

  • 先更新 DB
  • 然后直接洗掉 cache ,

簡單畫了一張圖幫助大家理解寫的步驟,

 :

  • 從 cache 中讀取資料,讀取到就直接回傳
  • cache中讀取不到的話,就從 DB 中讀取資料回傳
  • 再把資料放到 cache 中,

簡單畫了一張圖幫助大家理解讀的步驟,

你僅僅了解了上面這些內容的話是遠遠不夠的,我們還要搞懂其中的原理,

比如說面試官很可能會追問:“在寫資料的程序中,可以先洗掉 cache ,后更新 DB 么?

答案: 那肯定是不行的!因為這樣可能會造成資料庫(DB)和快取(Cache)資料不一致的問題,為什么呢?比如說請求1 先寫資料A,請求2隨后讀資料A的話就很有可能產生資料不一致性的問題,這個程序可以簡單描述為:

請求1先把cache中的A資料洗掉 -> 請求2從DB中讀取資料->請求1再把DB中的A資料更新,

當你這樣回答之后,面試官可能會緊接著就追問:“在寫資料的程序中,先更新DB,后洗掉cache就沒有問題了么?

答案: 理論上來說還是可能會出現資料不一致性的問題,不過概率非常小,因為快取的寫入速度是比資料庫的寫入速度快很多!

比如請求1先讀資料 A,請求2隨后寫資料A,并且資料A不在快取中的話也有可能產生資料不一致性的問題,這個程序可以簡單描述為:

請求1從DB讀資料A->請求2寫更新資料 A 到資料庫并把洗掉cache中的A資料->請求1將資料A寫入cache,

現在我們再來分析一下 Cache Aside Pattern 的缺陷

缺陷1:首次請求資料一定不在 cache 的問題

解決辦法:可以將熱點資料可以提前放入cache 中,

缺陷2:寫操作比較頻繁的話導致cache中的資料會被頻繁被洗掉,這樣會影響快取命中率 ,

解決辦法:

  • 資料庫和快取資料強一致場景 :更新DB的時候同樣更新cache,不過我們需要加一個鎖/分布式鎖來保證更新cache的時候不存在執行緒安全問題,
  • 可以短暫地允許資料庫和快取資料不一致的場景 :更新DB的時候同樣更新cache,但是給快取加一個比較短的過期時間,這樣的話就可以保證即使資料不一致的話影響也比較小,

5.2. Read/Write Through Pattern(讀寫穿透)

Read/Write Through Pattern 中服務端把 cache 視為主要資料存盤,從中讀取資料并將資料寫入其中,cache 服務負責將此資料讀取和寫入 DB,從而減輕了應用程式的職責,

這種快取讀寫策略小伙伴們應該也發現了在平時在開發程序中非常少見,拋去性能方面的影響,大概率是因為我們經常使用的分布式快取 Redis 并沒有提供 cache 將資料寫入DB的功能,

寫(Write Through):

  • 先查 cache,cache 中不存在,直接更新 DB,
  • cache 中存在,則先更新 cache,然后 cache 服務自己更新 DB(同步更新 cache 和 DB),

簡單畫了一張圖幫助大家理解寫的步驟,

讀(Read Through):

  • 從 cache 中讀取資料,讀取到就直接回傳 ,
  • 讀取不到的話,先從 DB 加載,寫入到 cache 后回傳回應,

簡單畫了一張圖幫助大家理解讀的步驟,

Read-Through Pattern 實際只是在 Cache-Aside Pattern 之上進行了封裝,在 Cache-Aside Pattern 下,發生讀請求的時候,如果 cache 中不存在對應的資料,是由客戶端自己負責把資料寫入 cache,而 Read Through Pattern 則是 cache 服務自己來寫入快取的,這對客戶端是透明的,

和 Cache Aside Pattern 一樣, Read-Through Pattern 也有首次請求資料一定不再 cache 的問題,對于熱點資料可以提前放入快取中,

5.3. Write Behind Pattern(異步快取寫入)

Write Behind Pattern 和 Read/Write Through Pattern 很相似,兩者都是由 cache 服務來負責 cache 和 DB 的讀寫,

但是,兩個又有很大的不同:Read/Write Through 是同步更新 cache 和 DB,而 Write Behind Caching 則是只更新快取,不直接更新 DB,而是改為異步批量的方式來更新 DB,

很明顯,這種方式對資料一致性帶來了更大的挑戰,比如cache資料可能還沒異步更新DB的話,cache服務可能就就掛掉了,

這種策略在我們平時開發程序中也非常非常少見,但是不代表它的應用場景少,比如訊息佇列中訊息的異步寫入磁盤、MySQL 的 InnoDB Buffer Pool 機制都用到了這種策略,

Write Behind Pattern 下 DB 的寫性能非常高,非常適合一些資料經常變化又對資料一致性要求沒那么高的場景,比如瀏覽量、點贊量,

作者:Snailclimb
鏈接:關于快取的一些重要概念(Redis 前置菜)
來源:github

轉載請註明出處,本文鏈接:https://www.uj5u.com/shujuku/227144.html

標籤:其他

上一篇:HIVE的安裝配置

下一篇:window上, 用命令列為oracle 建立db(簡版,不建立新實體)

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • GPU虛擬機創建時間深度優化

    **?桔妹導讀:**GPU虛擬機實體創建速度慢是公有云面臨的普遍問題,由于通常情況下創建虛擬機屬于低頻操作而未引起業界的重視,實際生產中還是存在對GPU實體創建時間有苛刻要求的業務場景。本文將介紹滴滴云在解決該問題時的思路、方法、并展示最終的優化成果。 從公有云服務商那里購買過虛擬主機的資深用戶,一 ......

    uj5u.com 2020-09-10 06:09:13 more
  • 可編程網卡芯片在滴滴云網路的應用實踐

    **?桔妹導讀:**隨著云規模不斷擴大以及業務層面對延遲、帶寬的要求越來越高,采用DPDK 加速網路報文處理的方式在橫向縱向擴展都出現了局限性。可編程芯片成為業界熱點。本文主要講述了可編程網卡芯片在滴滴云網路中的應用實踐,遇到的問題、帶來的收益以及開源社區貢獻。 #1. 資料中心面臨的問題 隨著滴滴 ......

    uj5u.com 2020-09-10 06:10:21 more
  • 滴滴資料通道服務演進之路

    **?桔妹導讀:**滴滴資料通道引擎承載著全公司的資料同步,為下游實時和離線場景提供了必不可少的源資料。隨著任務量的不斷增加,資料通道的整體架構也隨之發生改變。本文介紹了滴滴資料通道的發展歷程,遇到的問題以及今后的規劃。 #1. 背景 資料,對于任何一家互聯網公司來說都是非常重要的資產,公司的大資料 ......

    uj5u.com 2020-09-10 06:11:05 more
  • 滴滴AI Labs斬獲國際機器翻譯大賽中譯英方向世界第三

    **桔妹導讀:**深耕人工智能領域,致力于探索AI讓出行更美好的滴滴AI Labs再次斬獲國際大獎,這次獲獎的專案是什么呢?一起來看看詳細報道吧! 近日,由國際計算語言學協會ACL(The Association for Computational Linguistics)舉辦的世界最具影響力的機器 ......

    uj5u.com 2020-09-10 06:11:29 more
  • MPP (Massively Parallel Processing)大規模并行處理

    1、什么是mpp? MPP (Massively Parallel Processing),即大規模并行處理,在資料庫非共享集群中,每個節點都有獨立的磁盤存盤系統和記憶體系統,業務資料根據資料庫模型和應用特點劃分到各個節點上,每臺資料節點通過專用網路或者商業通用網路互相連接,彼此協同計算,作為整體提供 ......

    uj5u.com 2020-09-10 06:11:41 more
  • 滴滴資料倉庫指標體系建設實踐

    **桔妹導讀:**指標體系是什么?如何使用OSM模型和AARRR模型搭建指標體系?如何統一流程、規范化、工具化管理指標體系?本文會對建設的方法論結合滴滴資料指標體系建設實踐進行解答分析。 #1. 什么是指標體系 ##1.1 指標體系定義 指標體系是將零散單點的具有相互聯系的指標,系統化的組織起來,通 ......

    uj5u.com 2020-09-10 06:12:52 more
  • 單表千萬行資料庫 LIKE 搜索優化手記

    我們經常在資料庫中使用 LIKE 運算子來完成對資料的模糊搜索,LIKE 運算子用于在 WHERE 子句中搜索列中的指定模式。 如果需要查找客戶表中所有姓氏是“張”的資料,可以使用下面的 SQL 陳述句: SELECT * FROM Customer WHERE Name LIKE '張%' 如果需要 ......

    uj5u.com 2020-09-10 06:13:25 more
  • 滴滴Ceph分布式存盤系統優化之鎖優化

    **桔妹導讀:**Ceph是國際知名的開源分布式存盤系統,在工業界和學術界都有著重要的影響。Ceph的架構和演算法設計發表在國際系統領域頂級會議OSDI、SOSP、SC等上。Ceph社區得到Red Hat、SUSE、Intel等大公司的大力支持。Ceph是國際云計算領域應用最廣泛的開源分布式存盤系統, ......

    uj5u.com 2020-09-10 06:14:51 more
  • es~通過ElasticsearchTemplate進行聚合~嵌套聚合

    之前寫過《es~通過ElasticsearchTemplate進行聚合操作》的文章,這一次主要寫一個嵌套的聚合,例如先對sex集合,再對desc聚合,最后再對age求和,共三層嵌套。 Aggregations的部分特性類似于SQL語言中的group by,avg,sum等函式,Aggregation ......

    uj5u.com 2020-09-10 06:14:59 more
  • 爬蟲日志監控 -- Elastc Stack(ELK)部署

    傻瓜式部署,只需替換IP與用戶 導讀: 現ELK四大組件分別為:Elasticsearch(核心)、logstash(處理)、filebeat(采集)、kibana(可視化) 下載均在https://www.elastic.co/cn/downloads/下tar包,各組件版本最好一致,配合fdm會 ......

    uj5u.com 2020-09-10 06:15:05 more
最新发布
  • day02-2-商鋪查詢快取

    功能02-商鋪查詢快取 3.商鋪詳情快取查詢 3.1什么是快取? 快取就是資料交換的緩沖區(稱作Cache),是存盤資料的臨時地方,一般讀寫性能較高。 快取的作用: 降低后端負載 提高讀寫效率,降低回應時間 快取的成本: 資料一致性成本 代碼維護成本 運維成本 3.2需求說明 如下,當我們點擊商店詳 ......

    uj5u.com 2023-04-20 08:33:24 more
  • MySQL中binlog備份腳本分享

    關于MySQL的二進制日志(binlog),我們都知道二進制日志(binlog)非常重要,尤其當你需要point to point災難恢復的時侯,所以我們要對其進行備份。關于二進制日志(binlog)的備份,可以基于flush logs方式先切換binlog,然后拷貝&壓縮到到遠程服務器或本地服務器 ......

    uj5u.com 2023-04-20 08:28:06 more
  • day02-短信登錄

    功能實作02 2.功能01-短信登錄 2.1基于Session實作登錄 2.1.1思路分析 2.1.2代碼實作 2.1.2.1發送短信驗證碼 發送短信驗證碼: 發送驗證碼的介面為:http://127.0.0.1:8080/api/user/code?phone=xxxxx<手機號> 請求方式:PO ......

    uj5u.com 2023-04-20 08:27:27 more
  • 快取與資料庫雙寫一致性幾種策略分析

    本文將對幾種快取與資料庫保證資料一致性的使用方式進行分析。為保證高并發性能,以下分析場景不考慮執行的原子性及加鎖等強一致性要求的場景,僅追求最終一致性。 ......

    uj5u.com 2023-04-20 08:26:48 more
  • sql陳述句優化

    問題查找及措施 問題查找 需要找到具體的代碼,對其進行一對一優化,而非一直把關注點放在服務器和sql平臺 降低簡化每個事務中處理的問題,盡量不要讓一個事務拖太長的時間 例如檔案上傳時,應將檔案上傳這一步放在事務外面 微軟建議 4.啟動sql定時執行計劃 怎么啟動sqlserver代理服務-百度經驗 ......

    uj5u.com 2023-04-20 08:26:35 more
  • 云時代,MySQL到ClickHouse資料同步產品對比推薦

    ClickHouse 在執行分析查詢時的速度優勢很好的彌補了MySQL的不足,但是對于很多開發者和DBA來說,如何將MySQL穩定、高效、簡單的同步到 ClickHouse 卻很困難。本文對比了 NineData、MaterializeMySQL(ClickHouse自帶)、Bifrost 三款產品... ......

    uj5u.com 2023-04-20 08:26:29 more
  • sql陳述句優化

    問題查找及措施 問題查找 需要找到具體的代碼,對其進行一對一優化,而非一直把關注點放在服務器和sql平臺 降低簡化每個事務中處理的問題,盡量不要讓一個事務拖太長的時間 例如檔案上傳時,應將檔案上傳這一步放在事務外面 微軟建議 4.啟動sql定時執行計劃 怎么啟動sqlserver代理服務-百度經驗 ......

    uj5u.com 2023-04-20 08:25:13 more
  • Redis 報”OutOfDirectMemoryError“(堆外記憶體溢位)

    Redis 報錯“OutOfDirectMemoryError(堆外記憶體溢位) ”問題如下: 一、報錯資訊: 使用 Redis 的業務介面 ,產生 OutOfDirectMemoryError(堆外記憶體溢位),如圖: 格式化后的報錯資訊: { "timestamp": "2023-04-17 22: ......

    uj5u.com 2023-04-20 08:24:54 more
  • day02-2-商鋪查詢快取

    功能02-商鋪查詢快取 3.商鋪詳情快取查詢 3.1什么是快取? 快取就是資料交換的緩沖區(稱作Cache),是存盤資料的臨時地方,一般讀寫性能較高。 快取的作用: 降低后端負載 提高讀寫效率,降低回應時間 快取的成本: 資料一致性成本 代碼維護成本 運維成本 3.2需求說明 如下,當我們點擊商店詳 ......

    uj5u.com 2023-04-20 08:24:03 more
  • day02-短信登錄

    功能實作02 2.功能01-短信登錄 2.1基于Session實作登錄 2.1.1思路分析 2.1.2代碼實作 2.1.2.1發送短信驗證碼 發送短信驗證碼: 發送驗證碼的介面為:http://127.0.0.1:8080/api/user/code?phone=xxxxx<手機號> 請求方式:PO ......

    uj5u.com 2023-04-20 08:23:11 more