主頁 > 後端開發 > 訊息推送平臺有沒有保證資料不丟?

訊息推送平臺有沒有保證資料不丟?

2023-05-16 10:41:05 後端開發

我們在使用mq的時候,就會很自然思考一個問題:怎么保證資料不丟失

現在austin接入層是把訊息發到mq,下發邏輯層從mq消費資料,隨后呼叫對應渠道介面來下發訊息,

訊息推送平臺??推送下發【郵件】【短信】【微信服務號】【微信小程式】【企業微信】【釘釘】等訊息型別

  • https://gitee.com/zhongfucheng/austin/
  • https://github.com/ZhongFuCheng3y/austin

訊息丟棄一般我們考慮的是消費端,于是重點看的是下發邏輯層,

(因為對于mq使用方來說:生產端只要配置mq相關的引數,在呼叫下發時有回呼重試機制,那就足夠了,生產端能做的東西確實不多)

目前為止,下發邏輯層(消費端)使用的是自動提交offset策略,只要消費端存在系統重啟或者行程被kill掉,那就會有丟訊息的情況,

spring.kafka.consumer.enable-auto-commit=true

當前下發邏輯層(消費端)有可能放大了這個丟棄訊息的問題,因為現在是消費到mq資料后,會把訊息給到執行緒池去處理,執行緒池會指定一個阻塞佇列,那佇列數量越大,可能由重啟所丟棄的訊息就越多

這里我的策略是:當應用重啟的時候,系統里的執行緒池是優雅關閉的(盡可能等待一段時間,等阻塞佇列里沒有訊息了,再關閉執行緒池),

但回到問題的本質上,只要消費端是自動提交offset策略,就一定會有丟訊息的問題,所以要做到消費端的訊息不丟,我們就要設定為手動提交offset,這個是必要條件,

有沒有必要保證不丟

在探討具體的技術實作方案之前,我們來看看在業務上有沒有必要保證訊息不丟,我剛接觸到訊息推送平臺的時候,當時那個交接的哥們告訴我和我學長:訊息少發比多發要好

1、重要的訊息用戶很可能會手動重試觸發

austin是一個發送各類渠道訊息的平臺,從我的經驗來說,這里面最重要的是短信渠道,經過austin下發很可能是登陸驗證碼,銀行卡提現驗證碼,這類訊息從全域上看是最重要的,

而其他渠道,例如push通知欄的通知訊息,微信渠道的營銷訊息,這種訊息即便用戶沒收到,也不會對用戶帶來很大的使用體驗問題,這種訊息或許對絕大數用戶都是無感知的(少發幾條,用戶可能更樂意),

我們先假設用戶的某一次銀行卡提現的驗證碼恰好因為我們重啟系統而丟棄,這時候,絕大數用戶可能懷疑自己的信號問題,會繼續操作,重新發送一次

(因為客服經常找我排查這種問題,每次都能看到有好幾條下發記錄,當然了,能到技術的,99%的問題都不是由系統重啟丟失訊息導致的,更多可能是用戶的客戶端本身確實就存在問題)

2、訊息是有時效性的,比如驗證碼這種短信一般就5min的時效性,由于系統的問題,你超過這個時間給用戶發送,對用戶的體驗是非常差的,

3、訊息推送平臺是有全鏈路追蹤的,是可以知道下發的訊息有沒有到達到用戶手上,至少都可以知道在我們的系統內部執行程序中有沒有丟,如果這條訊息真的那么重要,那可以單獨為丟棄的訊息單獨做重發處理,這些功能在訊息推送平臺都是支持的,

這個問題我以前的同事也跟我探討過,就是把上面的內容給我隔壁的老哥聽的,他說:你就盡扯淡吧,到面試的時候人家可不認你,丟了就是丟了,其他都是借口

我說:沒事,要是不認的話,就把我們處理訂單那一套給他講講嘛,反正處理的思路都是一樣的,

不過啊,廣告訂單邏輯處理又相對沒那么復雜,廣告訂單最后是以入資料庫作為標準的,又可以接受一定的延遲,只要能保證處理完就行了,

要想client端消費資料不能丟,肯定是不能使用autoCommit的,所以必須是手動提交的,

候選者:我們這邊是這樣實作的:

候選者:一、從Kafka拉取訊息(一次批量拉取500條,這里主要看配置)時

候選者:二、為每條拉取的訊息分配一個msgId(遞增)

候選者:三、將msgId存入記憶體佇列(sortSet)中

候選者:四、使用Map存盤msgId與msg(有offset相關的資訊)的映射關系,通過msgId用來獲取相關元資訊

候選者:五、當業務處理完訊息后,ack時,獲取當前處理的訊息msgId,然后從sortSet洗掉該msgId(此時代表已經處理過了)

候選者:六、接著與sortSet佇列(本地記憶體佇列)的首部第一個Id比較(其實就是最小的msgId),如果當前msgId<=sort Set第一個ID,則提交當前offset

候選者:七、系統即便掛了,在下次重啟時就會從sortSet隊首的訊息開始拉取,實作至少處理一次語意

候選者:八、會有少量的訊息重復,但只要下游做好冪等就OK了,

面試官:嗯,你也提到了冪等,你們這業務怎么實作冪等性的呢?

候選者:嗯,還是以處理訂單訊息為例好了,

候選者:冪等Key我們由訂單編號+訂單狀態所組成(一筆訂單的狀態只會處理一次)

候選者:在處理之前,我們首先會去查Redis是否存在該Key,如果存在,則說明我們已經處理過了,直接丟掉

候選者:如果Redis沒處理過,則繼續往下處理,最終的邏輯是將處理過的資料插入到業務DB上,再到最后把冪等Key插入到Redis上

候選者:顯然,單純通過Redis是無法保證冪等的(:

候選者:所以,Redis其實只是一個「前置」處理,最終的冪等性是依賴資料庫的唯一Key來保證的(唯一Key實際上也是訂單編號+狀態)

候選者:總的來說,就是通過Redis做前置處理,DB唯一索引做最終保證來實作冪等性的

保證austin資料不丟需要做什么?

保證資料不丟簡單來說,就是我們要在消費端手動ack offset,不能再用自動提交策略了,這樣當我們系統重啟時,kafka會自動從未ackoffset中拉取,

如果要實作訊息推送平臺不丟訊息的話,有幾個問題是需要考慮的:

1、訊息少發比多發要好,那么要實作訊息不丟,就必須要在系統內實作冪等,因為現在的訊息不丟,一般都是基于【至少一次]消費語意去做的,

2、那實作冪等的邏輯是在呼叫渠道下發介面前,還是渠道下發介面后?

如果做在下發介面前,那是不是會有可能第一次下發記錄寫入了,但實際呼叫下發介面卻失敗了,后面的重試都被冪等處理掉了,

如果做在下發介面后,那是不是會有可能呼叫呼叫下發介面成功了,但寫入冪等處理的訊息失敗了,后面的重試就會導致訊息多發

3、訊息是有時效性的,那如果重試的處理時間過長,那是不是要考慮把這條訊息給丟棄掉,不再重試了,

4、重試的訊息不應該影響到正常訊息的下發,他得作為一種補償的機制,而非主流程

稍微細想下技術實作,應該不太好搞,還有很多細節的地方得關注到,比如業務上的:應該是不需要所有的渠道的所有型別訊息都得實作訊息不丟吧?現在的設計是追求高性能的,能在短時間內下發批量的訊息,而如果做到所有訊息不丟,肯定會影響到下發的速率

什么時候動手?

1、對于這個功能吧,有用肯定是有用,但這功能又沒那么急

2、我估摸對現有代碼改動還是蠻大的,現在我還沒想好該怎么實作比較好,也一直沒下手,

3、最近作業的事挺多的,沒那么有空

結論:先看看想要這個功能的人多不多,不多就鴿一會,

都看到這了,如果按上面的理由,我不實作這個功能,你認不認可?

訊息推送平臺??推送下發【郵件】【短信】【微信服務號】【微信小程式】【企業微信】【釘釘】等訊息型別

  • https://gitee.com/zhongfucheng/austin/
  • https://github.com/ZhongFuCheng3y/austin
更多的文章可往:文章的目錄導航

轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/552492.html

標籤:其他

上一篇:【設計模式】使用 go 語言實作簡單工廠模式

下一篇:返回列表

標籤雲
其他(159053) Python(38137) JavaScript(25421) Java(18044) C(15226) 區塊鏈(8265) C#(7972) AI(7469) 爪哇(7425) MySQL(7186) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5871) 数组(5741) R(5409) Linux(5340) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4572) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2433) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) .NET技术(1973) 功能(1967) Web開發(1951) HtmlCss(1936) python-3.x(1918) C++(1917) 弹簧靴(1913) xml(1889) PostgreSQL(1876) .NETCore(1860) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 【C++】Microsoft C++、C 和匯編程式檔案

    ......

    uj5u.com 2020-09-10 00:57:23 more
  • 例外宣告

    相比于斷言適用于排除邏輯上不可能存在的狀態,例外通常是用于邏輯上可能發生的錯誤。 例外宣告 Item 1:當函式不可能拋出例外或不能接受拋出例外時,使用noexcept 理由 如果不打算拋出例外的話,程式就會認為無法處理這種錯誤,并且應當盡早終止,如此可以有效地阻止例外的傳播與擴散。 示例 //不可 ......

    uj5u.com 2020-09-10 00:57:27 more
  • Codeforces 1400E Clear the Multiset(貪心 + 分治)

    鏈接:https://codeforces.com/problemset/problem/1400/E 來源:Codeforces 思路:給你一個陣列,現在你可以進行兩種操作,操作1:將一段沒有 0 的區間進行減一的操作,操作2:將 i 位置上的元素歸零。最終問:將這個陣列的全部元素歸零后操作的最少 ......

    uj5u.com 2020-09-10 00:57:30 more
  • UVA11610 【Reverse Prime】

    本人看到此題沒有翻譯,就附帶了一個自己的翻譯版本 思考 這一題,它的第一個要求是找出所有 $7$ 位反向質數及其質因數的個數。 我們應該需要質數篩篩選1~$10^{7}$的所有數,這里就不慢慢介紹了。但是,重讀題,我們突然發現反向質數都是 $7$ 位,而將它反過來后的數字卻是 $6$ 位數,這就說明 ......

    uj5u.com 2020-09-10 00:57:36 more
  • 統計區間素數數量

    1 #pragma GCC optimize(2) 2 #include <bits/stdc++.h> 3 using namespace std; 4 bool isprime[1000000010]; 5 vector<int> prime; 6 inline int getlist(int ......

    uj5u.com 2020-09-10 00:57:47 more
  • C/C++編程筆記:C++中的 const 變數詳解,教你正確認識const用法

    1、C中的const 1、區域const變數存放在堆疊區中,會分配記憶體(也就是說可以通過地址間接修改變數的值)。測驗代碼如下: 運行結果: 2、全域const變數存放在只讀資料段(不能通過地址修改,會發生寫入錯誤), 默認為外部聯編,可以給其他源檔案使用(需要用extern關鍵字修飾) 運行結果: ......

    uj5u.com 2020-09-10 00:58:04 more
  • 【C++犯錯記錄】VS2019 MFC添加資源不懂如何修改資源宏ID

    1. 首先在資源視圖中,添加資源 2. 點擊新添加的資源,復制自動生成的ID 3. 在解決方案資源管理器中找到Resource.h檔案,編輯,使用整個專案搜索和替換的方式快速替換 宏宣告 4. Ctrl+Shift+F 全域搜索,點擊查找全部,然后逐個替換 5. 為什么使用搜索替換而不使用屬性視窗直 ......

    uj5u.com 2020-09-10 00:59:11 more
  • 【C++犯錯記錄】VS2019 MFC不懂的批量添加資源

    1. 打開資源頭檔案Resource.h,在其中預先定義好宏 ID(不清楚其實ID值應該設定多少,可以先新建一個相同的資源項,再在這個資源的ID值的基礎上遞增即可) 2. 在資源視圖中選中專案資源,按F7編輯資源檔案,按 ID 型別 相對路徑的形式添加 資源。(別忘了先把檔案拷貝到專案中的res檔案 ......

    uj5u.com 2020-09-10 01:00:19 more
  • C/C++編程筆記:關于C++的參考型別,專供新手入門使用

    今天要講的是C++中我最喜歡的一個用法——參考,也叫別名。 參考就是給一個變數名取一個變數名,方便我們間接地使用這個變數。我們可以給一個變數創建N個參考,這N + 1個變數共享了同一塊記憶體區域。(參考型別的變數會占用記憶體空間,占用的記憶體空間的大小和指標型別的大小是相同的。雖然參考是一個物件的別名,但 ......

    uj5u.com 2020-09-10 01:00:22 more
  • 【C/C++編程筆記】從頭開始學習C ++:初學者完整指南

    眾所周知,C ++的學習曲線陡峭,但是花時間學習這種語言將為您的職業帶來奇跡,并使您與其他開發人員區分開。您會更輕松地學習新語言,形成真正的解決問題的技能,并在編程的基礎上打下堅實的基礎。 C ++將幫助您養成良好的編程習慣(即清晰一致的編碼風格,在撰寫代碼時注釋代碼,并限制類內部的可見性),并且由 ......

    uj5u.com 2020-09-10 01:00:41 more
最新发布
  • 訊息推送平臺有沒有保證資料不丟?

    我們在使用mq的時候,就會很自然思考一個問題:怎么保證資料不丟失? 現在austin接入層是把訊息發到mq,下發邏輯層從mq消費資料,隨后呼叫對應渠道介面來下發訊息。 訊息推送平臺🔥推送下發【郵件】【短信】【微信服務號】【微信小程式】【企業微信】【釘釘】等訊息型別。 https://gitee.c ......

    uj5u.com 2023-05-16 10:41:05 more
  • 【設計模式】使用 go 語言實作簡單工廠模式

    最近在看《大話設計模式》,這本書通過對話形式講解設計模式的使用場景,有興趣的可以去看一下。 第一篇講的是簡單工廠模式,要求輸入兩個數和運算子號,得到運行結果。 這個需求不難,難就難在類要怎么設計,才能達到可復用、維護性強、可拓展和靈活性高。 運算子可能是加、減、乘、除,未了方便以后可以拓展其它運算子 ......

    uj5u.com 2023-05-16 10:40:58 more
  • SICP:元回圈求值器(Python實作)

    元語言抽象就是建立新的語言。它在工程設計的所有分支中都扮演著重要的角色,在計算機程式設計領域更是特別重要。因為這個領域中,我們不僅可以設計新的語言,還可以通過構造求值器的方式實作這些語言。對某個程式設計語言的求值器(或者解釋器)也是一個程序,在應用于這個語言的一個運算式時,它能夠執行求值這個運算式所... ......

    uj5u.com 2023-05-16 10:35:43 more
  • 【深入淺出 Yarn 架構與實作】6-4 Container 生命周期原始碼分析

    本文將深入探討 AM 向 RM 申請并獲得 Container 資源后,在 NM 節點上如何啟動和清理 Container。將詳細分析整個程序的原始碼實作。 ......

    uj5u.com 2023-05-16 10:30:12 more
  • Windows平臺下的Go版本切換工具-g

    voidint/g g 是一個 Linux、macOS、Windows 下的命令列工具,可以提供一個便捷的多版本 go 環境的管理和切換。 在這里我們介紹一下在 windows 下的使用,涉及到我們開發所需要用到的 幾個 go 專案層環境變數它們分別是 GOPATH,GOPROXY,GO111MOD ......

    uj5u.com 2023-05-16 10:30:04 more
  • Spring原始碼:Bean生命周期(四)

    在本文中,我們深入探討了 Spring 框架中 Bean 的實體化程序,關于某些細節以后我會單獨拿出一篇文章單獨講解,我們來總結下實體化都做了哪些事情:先從bean定義中加載當前類,因為最初Spring使用ASM技術決議元資料時只獲取了當前類的名稱尋找所有InstantiationAwareBean... ......

    uj5u.com 2023-05-16 10:24:51 more
  • < Python全景系列-2 > Python資料型別大盤點

    Python作為一門強大且靈活的編程語言,擁有豐富的資料型別系統。本文詳細介紹了Python中的每一種資料型別,包括數值、序列、映射、集合、布爾和None型別。每種資料型別的特性、使用方式,以及在實際問題中的應用都將被深入探討。此外,我們還將探討Python的動態型別特性,以及如何在實際編程中充分利... ......

    uj5u.com 2023-05-16 10:13:02 more
  • Pytest - 概述&入門

    Pytest - 概述&入門 簡介 Pytest是一款強大的python自動化測驗工具,可以勝任各種型別或者級別的軟體測驗作業; pytest提供了豐富的功能,包括assert重寫,第三方插件,以及其他測驗工具無法比擬的fixture模型; pytest是一個軟體測驗框架,是一款命令列工具,可以自動 ......

    uj5u.com 2023-05-16 10:12:56 more
  • 裝飾器擴展類功能

    對類中屬性訪問,并修改他的行為 可以直接使用類裝飾器 """ 類裝飾器擴展 類功能 """ def log_getattribute(cls): old_getattribute = cls.__getattribute__ def new_getattribute(self, name): pri ......

    uj5u.com 2023-05-16 10:12:51 more
  • Python工具箱系列(三十二)

    Elasticsearch是一個基于Lucene的搜索引擎。它提供了一個分布式多用戶能力的全文搜索引擎,基于RESTful 的API介面。Elasticsearch是用Java語言開發的,并作為Apache許可條款下的開放原始碼發布,是非常流行的企業級搜索引擎。 ......

    uj5u.com 2023-05-16 10:12:46 more