主頁 > 軟體設計 > 資料同步gossip協議原理與應用場景介紹

資料同步gossip協議原理與應用場景介紹

2023-02-11 08:00:15 軟體設計

作者:京東物流 馮鴻儒

1 簡介

Gossip是一種p2p的分布式協議,它的核心是在去中心化結構下,通過將資訊部分傳遞,達到全集群的狀態資訊傳播,傳播的時間收斂在O(Log(N))以內,其中N是節點的數量,基于gossip協議,可以構建出狀態一致的各種解決方案,
一些常見的分布式協議如二階段提交協議和 Raft 演算法,你發現它們都需要全部節點或者大多數節點正常運行,才能穩定運行,而Gossip即使只有一個節點可用也能提供服務,

1.1 適用場景

適用于AP 場景的資料一致性處理:分布式資料庫中節點同步資料使用(如Apache Cassandra、Redis Cluster);
其他場景如資訊擴散、集群成員身份確認、故障探測等(如Consul),

1.2 優勢

  • 學習成本:實作簡單
  • 擴展性:允許節點的任意增加和減少,新增節點的狀態 最侄訓與其他節點一致,
  • 容錯:任意節點的宕機和重啟都不會影響 Gossip 訊息的傳播,具有天然的分布式系統容錯特性,可以在一定程度上避免網路分割帶來的問題,
  • 去中心化:無需中心節點,所有節點都是對等的,任意節點無需知道整個網路狀況,只要網路連通,任意節點可把訊息散播到全網,
  • 性能:指數級一致性收斂,訊息會以“一傳十的指數級速度”在網路中傳播,因此系統狀態的不一致可以在很快的時間內收斂到一致,訊息傳播速度達到了 logN,
    Gossip協議的最大的好處是,即使集群節點的數量增加,每個節點的負載也不會增加很多,幾乎是恒定的,如Consul管理的集群規模能橫向擴展到數千個節點,

1.3 劣勢

  • 訊息延遲:節點隨機向少數幾個節點發送訊息,訊息最終是通過多個輪次的散播而到達全網;不可避免的造成訊息延遲,
  • 訊息冗余:節點定期隨機選擇周圍節點發送訊息,而收到訊息的節點也會重復該步驟;不可避免的引起同一節點訊息多次接收,增加訊息處理壓力,

2 細節介紹

2.1 傳播方式

Gossip 協議的訊息傳播方式主要有兩種:Anti-Entropy(反熵傳播)和 Rumor-Mongering(謠言傳播),

2.1.1 反熵傳播

  • 定義:反熵(指消除不同節點中資料的差異,提升節點間資料的相似度,降低熵值),反熵傳播:以固定的概率傳播所有的資料,可用來避免因為UDP資料包丟失或者新節點的加入而導致的集群元資料不一致問題,
  • 程序:集群中的節點,每隔段時間就隨機選擇某個其他節點,然后通過互相交換自己的所有資料來消除兩者之間的差異,實作資料的最終一致性,
  • 適用場景:執行反熵時,相關的節點都是已知的,而且節點數量不能太多,如果是一個動態變化或節點數比較多的分布式環境(比如在 DevOps 環境中檢測節點故障,并動態維護集群節點狀態),這時反熵就不適用了,
  • 缺點:訊息數量非常龐大,且無限制;通常只用于新加入節點的資料初始化,可以通過引入校驗和(Checksum)等機制,降低需要對比的資料量和通訊訊息等,

2.1.2 謠言傳播

  • 定義:當一個節點有了新資料后,這個節點變成活躍狀態,并周期性地聯系其他節點向其發送新資料,直到所有的節點都存盤了該新資料,
  • 程序:訊息只包含最新 update,謠言訊息在某個時間點之后會被標記為 removed,并且不再被傳播,
  • 當一個新節點A連接到Gossip集群內的某個節點B時,A節點會將自己的資訊發送給B節點,然后B節點會在集群中隨機選取幾個未被傳染的節點,向他們廣播A節點的資訊(首次傳染),集群中的其他節點收到A節點的資訊后,又會像B節點那樣廣播A節點的資訊給其他未被傳染的節點(二次傳染),直至多次傳染后,集群所有節點都收到了A節點的資訊,同步完成,
  • 適用場景:適合動態變化的分布式系統,
  • 缺點:系統有一定的概率會不一致,通常用于節點間資料增量同步,

2.2 通信方式

Gossip 協議最終目的是將資料分發到網路中的每一個節點,根據不同的具體應用場景,網路中兩個節點之間存在三種通信方式:推送模式、拉取模式、Push/Pull,

  • Push: 節點 A 將資料 (key,value,version) 及對應的版本號推送給 B 節點,B 節點更新 A 中比自己新的資料
  • Pull:A 僅將資料 key, version 推送給 B,B 將本地比 A 新的資料(Key, value, version)推送給 A,A 更新本地
  • Push/Pull:與 Pull 類似,只是多了一步,A 再將本地比 B 新的資料推送給 B,B 則更新本地

如果把兩個節點資料同步一次定義為一個周期,則在一個周期內,Push 需通信 1 次,Pull 需 2 次,Push/Pull 則需 3 次,雖然訊息數增加了,但從效果上來講,Push/Pull 最好,理論上一個周期內可以使兩個節點完全一致,直觀上,Push/Pull 的收斂速度也是最快的,

2.3 執行示例

2.3.1 狀態的傳播

以Gossip協議同步狀態的思路類似于流言的傳播,如下圖所示,

A節點率先知道了某個流言(msg),它首先將此資訊傳播到集群中的部分節點(比如相鄰的兩個節點)B和C,后者再將其傳遞到它們所選擇的“部分”節點,例如B選擇了D和E,C選擇了將流言傳播到B和F,以此類推,最終來自于A的這條流言在3輪互動后被傳播到了集群中的所有節點,
在分布式系統的實踐中,這個“流言”可能是:某個節點所感知到的關于其它節點是否宕機的認識;也可能是資料水平拆分的快取集群中,關于哪些hash桶分布在哪些節點上的資訊,每個節點起初只掌握部分狀態資訊,不斷地從其它節點收到gossip資訊,每個節點逐漸地掌握到了整個集群的狀態資訊,因此解決了狀態同步的第一個問題:全集狀態的獲取,
對于集群中出現的部分網路分割,訊息也能通過別的路徑傳播到整個集群,如下圖所示:

2.3.2 狀態的一致

狀態同步的第二個問題:對于同一條狀態資訊,不同的節點可能掌握的值不同,也能通過基于gossip通信思路構建的協議包版本得到解決,例如水平拆分的redis快取集群,初始狀態下hash桶在各個節點的分布如下圖所示:

此時各個節點預先通過某種協議(比如Gossip)得知了集群的狀態全集,此時新加入了節點D,如下圖所示:

D分擔了C的某個hash桶,此時C/D和集群中其它節點就C所擁有哪些hash這件事發生了分歧:A/B認為C目前有6/7/8個hash桶,此時通過為gossip訊息體引入版本號,使得關于C的最新狀態資訊(只有6/7兩個桶了)在全集群達到一致,例如B收到來自A和C的gossip訊息時會將版本號更新的訊息(來自C的v2)更新到自己的本地副本中,
各個節點的本地副本保存的集群全量狀態也可能用來表示各個節點的存活狀態,對于部分網路分割的情況如下圖所示:

例如A和C的網路斷開,但A和C本身都正常運行,此時A和C互相無法通信,C會將A標記為不可用狀態,對于中心化思路的協議,如果C恰好是中心節點,那么A不可用的資訊將會同步到集群的所有節點上,使得這些節點將其實可用的A也標記為宕機,而基于gossip這類去中心化的協議進行接收到訊息后的實作邏輯擴展(例如只有當接收到大多數的節點關于A已經宕機的訊息時,才更新A的狀態),最終保證A不被誤判為宕機,

3 開源軟體中的應用

3.1 Fabric

Fabric gossip使用push(從成員視圖隨機選出活躍鄰居,給他們轉發訊息),pull(定期探測,請求遺失的訊息)的方式擴散區塊,

3.2 Cassandra

Cassandra使用的是pull-push,這種方式是均等的,會有3次發送,但是發送完以后雙方都可以更新彼此的資訊,利用pull-push方式,如果A要與B節點同步,需要進行如下圖的三個通信階段,

3.3 RedisCluster

Redis Cluster 在運行時,每個實體上都會保存 Slot 和實體的對應關系(也就是 Slot 映射表),以及自身的狀態資訊,新節點加入、節點故障、Slot 變更等事件發生時,實體間也可以通過 gossip協議進行PING、PONG 訊息的傳遞,完成集群狀態在每個實體上的同步,
redisCluster默認組建集群的方式:

  • 通過cluster meet命令將一個節點跟集群中其中一個節點建立連接(此時只能被集群中這一個節點認識)
  • 通過Gossip訊息轉播給其他節點,其他節點收到訊息后,再通過類似meet的命令來跟對新節點建立集群連接(需要一定時間的擴散)

使用gossip演算法利用PFAIL和FAIL flags的轉換和傳播來判定故障

3.4 Consul

一致性協議采用 Raft 演算法,用來保證服務的高可用.
成員管理和訊息廣播 采用GOSSIP協議,支持ACL訪問控制,
consul是建立在serf之上的,它提供了一個完整的gossip協議,用在很多地方,Serf提供了成員,故障檢測和事件廣播,Gossip的節點到節點之間的通信使用了UDP協議,
Consul的每個Agent會利用Gossip協議互相檢查在線狀態,本質上是節點之間互Ping,分擔了服務器節點的心跳壓力,如果有節點掉線,不用服務器節點檢查,其他普通節點會發現,然后用Gossip廣播給整個集群,

4 總結

gossip協議是很多開源中間件和區塊鏈實作的一種底層通信機制,掌握它的原理和細節能更好的理解中間件和區塊鏈的一些行為和分布式特性,


轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/543581.html

標籤:架構設計

上一篇:如何創建干凈的C++工程

下一篇:資料同步gossip協議原理與應用場景介紹

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 面試突擊第一季,第二季,第三季

    第一季必考 https://www.bilibili.com/video/BV1FE411y79Y?from=search&seid=15921726601957489746 第二季分布式 https://www.bilibili.com/video/BV13f4y127ee/?spm_id_fro ......

    uj5u.com 2020-09-10 05:35:24 more
  • 第三單元作業總結

    1.前言 這應該是本學期最后一次寫作業總結了吧。總體來說,對作業的節奏也差不多掌握了,作業做起來的效率也更高了。雖然和之前的作業一樣,作業中都要用到新的知識,但是相比之前,更加懂得了如何利用工具以及資料。雖然之間卡過殼,但總體而言,這幾次作業還算完成的比較好。 2.作業程序總結 相比前兩個單元,此單 ......

    uj5u.com 2020-09-10 05:35:41 more
  • 北航OO(2020)第四單元博客作業暨課程總結博客

    北航OO(2020)第四單元博客作業暨課程總結博客 本單元作業的架構設計 在本單元中,由于UML圖具有比較清晰的樹形結構,因此我對其中需要進行查詢操作的元素進行了包裝,在樹的父節點中存盤所有孩子的參考。考慮到性能問題,我采用了快取機制,一次查詢后盡可能快取已經遍歷過的資訊,以減少遍歷次數。 本單元我 ......

    uj5u.com 2020-09-10 05:35:48 more
  • BUAA_OO_第四單元

    一、UML決議器設計 ? 先看下題目:第四單元實作一個基于JDK 8帶有效性檢查的UML(Unified Modeling Language)類圖,順序圖,狀態圖分析器 MyUmlInteraction,實際上我們要建立一個有向圖模型,UML中的物件(元素)可能與同級元素連接,也可與低級元素相連形成 ......

    uj5u.com 2020-09-10 05:35:54 more
  • 6.1邏輯運算子

    邏輯運算子 1. && 短路與 運算式1 && 運算式2 01.運算式1為true并且運算式2也為true 整體回傳為true 02.運算式1為false,將不會執行運算式2 整體回傳為false 03.只要有一個運算式為false 整體回傳為false 2. || 短路或 運算式1 || 運算式2 ......

    uj5u.com 2020-09-10 05:35:56 more
  • BUAAOO 第四單元 & 課程總結

    1. 第四單元:StarUml檔案決議 本單元采用了圖模型決議UML。 UML檔案可以抽象為圖、子圖、邊的邏輯結構。 在實作中,圖的節點包括類、介面、屬性,子圖包括狀態圖、順序圖等。 采用了三次遍歷UML元素的方法建圖,第一遍遍歷建點,第二、三次遍歷設定屬性、連邊,實作圖物件的初始化。這里借鑒了一些 ......

    uj5u.com 2020-09-10 05:36:06 more
  • 談談我對C# 多型的理解

    面向物件三要素:封裝、繼承、多型。 封裝和繼承,這兩個比較好理解,但要理解多型的話,可就稍微有點難度了。今天,我們就來講講多型的理解。 我們應該經常會看到面試題目:請談談對多型的理解。 其實呢,多型非常簡單,就一句話:呼叫同一種方法產生了不同的結果。 具體實作方式有三種。 一、多載 多載很簡單。 p ......

    uj5u.com 2020-09-10 05:36:09 more
  • Python 資料驅動工具:DDT

    背景 python 的unittest 沒有自帶資料驅動功能。 所以如果使用unittest,同時又想使用資料驅動,那么就可以使用DDT來完成。 DDT是 “Data-Driven Tests”的縮寫。 資料:http://ddt.readthedocs.io/en/latest/ 使用方法 dd. ......

    uj5u.com 2020-09-10 05:36:13 more
  • Python里面的xlrd模塊詳解

    那我就一下面積個問題對xlrd模塊進行學習一下: 1.什么是xlrd模塊? 2.為什么使用xlrd模塊? 3.怎樣使用xlrd模塊? 1.什么是xlrd模塊? ?python操作excel主要用到xlrd和xlwt這兩個庫,即xlrd是讀excel,xlwt是寫excel的庫。 今天就先來說一下xl ......

    uj5u.com 2020-09-10 05:36:28 more
  • 當我們創建HashMap時,底層到底做了什么?

    jdk1.7中的底層實作程序(底層基于陣列+鏈表) 在我們new HashMap()時,底層創建了默認長度為16的一維陣列Entry[ ] table。當我們呼叫map.put(key1,value1)方法向HashMap里添加資料的時候: 首先,呼叫key1所在類的hashCode()計算key1 ......

    uj5u.com 2020-09-10 05:36:38 more
最新发布
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:20:47 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:20:25 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:20:17 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:20:10 more
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:19:44 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:19:07 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:18:57 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:18:49 more
  • 05單件模式

    #經典的單件模式 public class Singleton { private static Singleton uniqueInstance; //一個靜態變數持有Singleton類的唯一實體。 // 其他有用的實體變數寫在這里 //構造器宣告為私有,只有Singleton可以實體化這個類! ......

    uj5u.com 2023-04-19 08:42:51 more
  • 【架構與設計】常見微服務分層架構的區別和落地實踐

    軟體工程的方方面面都遵循一個最基本的道理:沒有銀彈,架構分層模型更是如此,每一種都有各自優缺點,所以請根據不同的業務場景,并遵循簡單、可演進這兩個重要的架構原則選擇合適的架構分層模型即可。 ......

    uj5u.com 2023-04-19 08:42:41 more