主頁 > 軟體設計 > 隨機高并發查詢結果一致性設計實踐

隨機高并發查詢結果一致性設計實踐

2023-02-02 08:22:59 軟體設計

作者:京東物流 趙帥 姚再毅 王旭東 孟偉杰 孔祥東

1 前言

物流合約中心是京東物流合同管理的唯一入口,為商家提供合同的創建,蓋章等能力,為不同業務條線提供合同的定制,歸檔,查詢等功能,由于各個業務條線眾多,為各個業務條線提供高可用查詢能力是物流合約中心重中之重,同時計費系統在每個物流單結算時,都需要查詢合約中心,確保商家簽署的合同內容來保證計費的準確性,

2 業務場景

1.查詢維度分析

從業務呼叫的來源來看,合同的大部分是計費系統在每個物流單計費的時候,需要呼叫合約中心來判斷,該商家是否簽署合同,

31

從業務呼叫的入參來看,絕大部分是多個條件來查詢合同,但基本都是查詢某個商家,或通過商家的某個屬性(例如業務賬號)來查詢合同,

從呼叫的結果來看,40%的查詢是沒有結果的,其中絕大部分是因為商家沒有簽署過合同,導致查詢為空,其余的查詢結果,每次回傳的數量較少,一般一個商家只有3到5個合同,

2.呼叫量分析

呼叫量
目前合同的呼叫量,大概是在每天2000W次,

一天的呼叫量統計:
32

呼叫時間
每天高峰期為上班時間,最高峰為4W/min,

一個月的呼叫量統計:

由上可以看出,合同每日的呼叫量比較平均,主要集中在9點到12點和13點到18點,也就是上班時間,整體呼叫量較高,基本不存在呼叫暴增的情況,

總體分析來看,合約中心的查詢,呼叫量較高,且較平均,基本都是隨機查詢,也并不存在熱點資料,其中無效查詢占比較多,每次查詢條件較多,回傳資料量比不大,

3 方案設計

從整體業務場景分析來看,我們決定做三層防護來保證呼叫量的支撐,同時需要對資料一致性做好處理,第一層是布隆過濾器,來攔截絕大部分無效的請求,第二層是redis快取資料,來保證各種查詢條件的查詢盡量命中redis,第三層是直接查詢資料庫的兜底方案,同時再保證資料一致性的問題,我們借助于廣播mq來實作,
35

1.第一層防護

由于近一半的查詢都是空,我們首先這是快取穿透的現象,

快取穿透問題

快取穿透(cache penetration)是用戶訪問的資料既不在快取當中,也不在資料庫中,出于容錯的考慮,如果從底層資料庫查詢不到資料,則不寫入快取,這就導致每次請求都會到底層資料庫進行查詢,快取也失去了意義,當高并發或有人利用不存在的Key頻繁攻擊時,資料庫的壓力驟增,甚至崩潰,這就是快取穿透問題,

常規解決方案

快取特定值

一般對于快取穿透我們比較常規的做法就是,將不存在的key 設定一個固定值,比如說NULL,&&等等,在查詢回傳這個值的時候,我們應用就可以認為這是一個不存在的key,那我們應用就可以決定是否繼續等待,還是繼續訪問,還是直接放棄,如果繼續等待訪問的話,設定一個輪詢時間,再次請求,如果取到的值不再是我們預設的,那就代表已經有值了,從而避免了透傳到資料庫,從而把大量的類似請求擋在了快取之中,

快取特定值并同步更新

特定值做了快取,那就意味著需要更多的記憶體存盤空間,當存盤層資料變化了,快取層與存盤層的資料會不一致,有人會說,這個問題,給key 加上一個過期時間不就可以了,確實,這樣是最簡單的,也能在一定程度上解決這兩個問題,但是當并發比較高的時候(快取并發),其實我是不建議使用快取過期這個策略的,我更希望快取一直存在;通過后臺系統來更新快取中的資料一致性的目的,

布隆過濾器

布隆過濾器的核心思想是這樣的,它不保存實際的資料,而是在記憶體中建立一個定長的位圖用0,1來標記對應資料是否存在系統;程序是將資料經過多個哈希函式計算出不同的哈希值,然后用哈希值對位圖的長度進行取模,最后得到位圖的下標位,然后在對應的下標位上進行標記;找數的時候也是一樣,先通過多個哈希函式得到哈希值,然后哈希值與位圖的長度進行取模得到多個下標,如果多個下標都被標記成1了,那么說明資料存在于系統,不過只要有一個下標為0那么就說明該資料肯定不存在于系統中,

在這里先通過一個示例介紹一下布隆過濾器的場景:

以ID查詢文章為例,如果我們要知道資料庫是否存在對應的文章,那么最簡單的方式就是我們把所有資料庫存在的ID都保存到快取去,這個時候當請求過進入系統,先從這個快取資料里判斷系統是否存在對應的資料ID,如果不存在的話直接回傳出去,避免請求進入到資料庫層,存在的話再從獲取文章的資訊,但是這個不是最好的方式,因為當文章的數量很多很多的時候,那快取中就需要存大量的檔案id而且只能持續增長,所以我們得想一種方式來節省記憶體資源當又能是請求都能命中快取,這個就是布隆過濾器要做的,

36

我們分析布隆過濾器的優缺點

優點

1.不需要存盤資料,只用位元表示,因此在空間占用率上有巨大的優勢
2.檢索效率高,插入和查詢的時間復雜度都為 O(K)(K 表示哈希函式的個數)
3.哈希函式之間相互獨立,可以在硬體指令層次并行計算,因此效率較高,

缺點

1.存在不確定的因素,無法判斷一個元素是否一定存在,所以不適合要求 100% 準確率的場景
2.只能插入和查詢元素,不能洗掉元素,

布隆過濾器分析:面對優點,完全符合我們的訴求,針對缺點1,會有極少的資料穿透對系統來說并無壓力,針對缺點2,合同的資料,本來就是不可洗掉的,如果合同過期,我們可以查出單個商家的所有合同,從合同的結束時間來判斷合同是否有效,并不需要取洗掉布隆過濾器里的元素,

考慮到呼叫redis布隆過濾器,會走一次網路,而我們的查詢近一半都是無效查詢,我們決定使用本地布隆過濾器,這樣就可以減少一次網路請求,但是如果是本地布隆過濾器,在更新時,就需要對所有機器的本地布隆過濾器更新,我們監聽合同的狀態來更新,通過mq的廣播模式,來對布隆過濾器插入元素,這樣就做到了所有機器上的布隆過濾器統一元素插入,

2.第二層防護

面對高并發,我們首先想到的是快取,

引入快取,我們就要考慮快取穿透,快取擊穿,快取雪崩的三大問題,

其中快取穿透,我們已再第一層防護中處理,這里只解決快取擊穿,快取雪崩的問題,

快取擊穿(Cache Breakdown)快取雪崩是指只大量熱點key同時失效的情況,如果是單個熱點key,在不停的扛著大并發,在這個key失效的瞬間,持續的大并發請求就會擊破快取,直接請求到資料庫,好像蠻力擊穿一樣,這種情況就是快取擊穿,

常規解決方案

快取失效分散

這個問題其實比較好解決,就是在設定快取的時效時間的時候增加一個隨機值,例如增加一個1-3分鐘的隨機,將失效時間分散開,降低集體失效的概率;把過期時間控制在系統低流量的時間段,比如凌晨三四點,避過流量的高峰期,

加鎖

加鎖,就是在查詢請求未命中快取時,查詢資料庫操作前進行加鎖,加鎖后后面的請求就會阻塞,避免了大量的請求集中進入到資料庫查詢資料了,

永久不失效

我們可以不設定過期時間來保證快取永遠不會失效,然后通過后臺的執行緒來定時把最新的資料同步到快取里去

解決方案:使用分布式鎖,針對同一個商家,只讓一個執行緒構建快取,其他執行緒等待構建快取執行完畢,重新從快取中獲取資料,

快取雪崩(Cache Avalanche)當快取中大量熱點快取采用了相同的實效時間,就會導致快取在某一個時刻同時實效,請求全部轉發到資料庫,從而導致資料庫壓力驟增,甚至宕機,從而形成一系列的連鎖反應,造成系統崩潰等情況,這就是快取雪崩,

解決方案:快取雪崩的解決方案是將key的過期設定為固定時間范圍內的一個亂數,讓key均勻的失效即可,

我們考慮使用redis快取,因為每次查詢的條件都不一樣,回傳的結果資料又比較少,我們考慮限制查詢都必須有一個固定的查詢條件,商家編碼,如果查詢條件中沒有查商家編碼,我們可以通過商家名稱,商家業務賬號這些條件來反查查商家編碼,

這樣我們就可以快取單個商家編碼的所有合同,然后再通過代碼使用filter對其他查詢條件做支持,避免不同的查詢條件都去快取資料而引發的快取資料更新,快取資料淘汰已經快取資料一致等問題,

同時只快取單個商家編碼的所有合同,快取的資料量也是可控,每個快取的大小也可控,基本不會出現redis大key的問題,

引入快取,我們就要考慮快取資料一致性的問題,

有關快取一致性問題,可自行百度,這個就不在敘述,

如圖所示 對于商家編碼維度的快取資料,我們通過監聽合同的狀態,使用mq廣播來洗掉對應商家的快取,從而避免出現快取和資料一致性的相關問題,

38

3.第三層防護

第三層防護,自然是資料庫,如果有查詢經過了第一層和第二層,那我們需要直接查詢資料庫來回傳結果,同時,我們對直接呼叫到資料庫的執行緒進行監控,

37

為避免一些未知的查詢大量查詢涌入,導致資料庫呼叫保證的問題,尤其是大促時,我們可以提前對資料庫里的所有商家合同進行提前快取,在快取時,為避免快取雪崩問題,我們對將key的過期設定為固定時間范圍內的一個亂數,讓key均勻的失效,

同時,為避免依然存在意外的情況,有大量查詢涌入,我們通過ducc開關控制資料庫的查詢,如呼叫量太高導致無法支撐,則直接關閉資料庫的呼叫,保證資料庫不會直接宕機導致整個業務不可用,

4 總結

本文主要分析了面對高并發呼叫的呼叫場景設計及的技術方案,在引入快取的同時,也要考慮實際的呼叫入參及結果,面對增加的網路請求,是否可以進一步減少,面對redis快取,是否可以通過一些手段避免所有查詢條件都需要快取,帶來的快取爆炸,快取淘汰策略等問題,以及解決快取與資料一致等一系列問題,

本方案是根據具體的查詢業務場景設計具體的技術方案,針對不同的業務場景,對應的技術方案也是不一樣的,

轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/542810.html

標籤:架構設計

上一篇:風控核心子域——名單服務構建及挑戰

下一篇:我在京東做研發 | 揭秘支撐京東萬人規模技術人員協作的行云DevOps平臺

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 面試突擊第一季,第二季,第三季

    第一季必考 https://www.bilibili.com/video/BV1FE411y79Y?from=search&seid=15921726601957489746 第二季分布式 https://www.bilibili.com/video/BV13f4y127ee/?spm_id_fro ......

    uj5u.com 2020-09-10 05:35:24 more
  • 第三單元作業總結

    1.前言 這應該是本學期最后一次寫作業總結了吧。總體來說,對作業的節奏也差不多掌握了,作業做起來的效率也更高了。雖然和之前的作業一樣,作業中都要用到新的知識,但是相比之前,更加懂得了如何利用工具以及資料。雖然之間卡過殼,但總體而言,這幾次作業還算完成的比較好。 2.作業程序總結 相比前兩個單元,此單 ......

    uj5u.com 2020-09-10 05:35:41 more
  • 北航OO(2020)第四單元博客作業暨課程總結博客

    北航OO(2020)第四單元博客作業暨課程總結博客 本單元作業的架構設計 在本單元中,由于UML圖具有比較清晰的樹形結構,因此我對其中需要進行查詢操作的元素進行了包裝,在樹的父節點中存盤所有孩子的參考。考慮到性能問題,我采用了快取機制,一次查詢后盡可能快取已經遍歷過的資訊,以減少遍歷次數。 本單元我 ......

    uj5u.com 2020-09-10 05:35:48 more
  • BUAA_OO_第四單元

    一、UML決議器設計 ? 先看下題目:第四單元實作一個基于JDK 8帶有效性檢查的UML(Unified Modeling Language)類圖,順序圖,狀態圖分析器 MyUmlInteraction,實際上我們要建立一個有向圖模型,UML中的物件(元素)可能與同級元素連接,也可與低級元素相連形成 ......

    uj5u.com 2020-09-10 05:35:54 more
  • 6.1邏輯運算子

    邏輯運算子 1. && 短路與 運算式1 && 運算式2 01.運算式1為true并且運算式2也為true 整體回傳為true 02.運算式1為false,將不會執行運算式2 整體回傳為false 03.只要有一個運算式為false 整體回傳為false 2. || 短路或 運算式1 || 運算式2 ......

    uj5u.com 2020-09-10 05:35:56 more
  • BUAAOO 第四單元 & 課程總結

    1. 第四單元:StarUml檔案決議 本單元采用了圖模型決議UML。 UML檔案可以抽象為圖、子圖、邊的邏輯結構。 在實作中,圖的節點包括類、介面、屬性,子圖包括狀態圖、順序圖等。 采用了三次遍歷UML元素的方法建圖,第一遍遍歷建點,第二、三次遍歷設定屬性、連邊,實作圖物件的初始化。這里借鑒了一些 ......

    uj5u.com 2020-09-10 05:36:06 more
  • 談談我對C# 多型的理解

    面向物件三要素:封裝、繼承、多型。 封裝和繼承,這兩個比較好理解,但要理解多型的話,可就稍微有點難度了。今天,我們就來講講多型的理解。 我們應該經常會看到面試題目:請談談對多型的理解。 其實呢,多型非常簡單,就一句話:呼叫同一種方法產生了不同的結果。 具體實作方式有三種。 一、多載 多載很簡單。 p ......

    uj5u.com 2020-09-10 05:36:09 more
  • Python 資料驅動工具:DDT

    背景 python 的unittest 沒有自帶資料驅動功能。 所以如果使用unittest,同時又想使用資料驅動,那么就可以使用DDT來完成。 DDT是 “Data-Driven Tests”的縮寫。 資料:http://ddt.readthedocs.io/en/latest/ 使用方法 dd. ......

    uj5u.com 2020-09-10 05:36:13 more
  • Python里面的xlrd模塊詳解

    那我就一下面積個問題對xlrd模塊進行學習一下: 1.什么是xlrd模塊? 2.為什么使用xlrd模塊? 3.怎樣使用xlrd模塊? 1.什么是xlrd模塊? ?python操作excel主要用到xlrd和xlwt這兩個庫,即xlrd是讀excel,xlwt是寫excel的庫。 今天就先來說一下xl ......

    uj5u.com 2020-09-10 05:36:28 more
  • 當我們創建HashMap時,底層到底做了什么?

    jdk1.7中的底層實作程序(底層基于陣列+鏈表) 在我們new HashMap()時,底層創建了默認長度為16的一維陣列Entry[ ] table。當我們呼叫map.put(key1,value1)方法向HashMap里添加資料的時候: 首先,呼叫key1所在類的hashCode()計算key1 ......

    uj5u.com 2020-09-10 05:36:38 more
最新发布
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:20:47 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:20:25 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:20:17 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:20:10 more
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:19:44 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:19:07 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:18:57 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:18:49 more
  • 05單件模式

    #經典的單件模式 public class Singleton { private static Singleton uniqueInstance; //一個靜態變數持有Singleton類的唯一實體。 // 其他有用的實體變數寫在這里 //構造器宣告為私有,只有Singleton可以實體化這個類! ......

    uj5u.com 2023-04-19 08:42:51 more
  • 【架構與設計】常見微服務分層架構的區別和落地實踐

    軟體工程的方方面面都遵循一個最基本的道理:沒有銀彈,架構分層模型更是如此,每一種都有各自優缺點,所以請根據不同的業務場景,并遵循簡單、可演進這兩個重要的架構原則選擇合適的架構分層模型即可。 ......

    uj5u.com 2023-04-19 08:42:41 more