21 | 流量回放:保障業務技術升級的神器
什么是流量回放?
流量就是指在某個時間段內的所有請求,我們通過某種手段把發送到A應用的所有請求錄制下來,然后把這些請求統一轉發到B應用,讓B應用接收到的請求引數和A應用保持一致,從而實作A接收到的請求在B應用里面重新請求了一遍,這個程序,我們稱為“流量回放”,
當我們對應用邏輯有改動,但在做了單元測驗和回歸測驗之后,因為線上環境更加復雜,為了降低出錯的概率,可以嘗試使用流量回放,
傳統QA測驗不能滿足要求的根本原因就是在于改造后的應用在上線后出現跟應用上線前不一致的行為,我們測驗的目的就是為了保證改造后的應用跟改造前應用的行為一致,我們測驗Case也應該盡力去模擬應用在線上的行為,這時最好的方式就是用線上流量來驗證,但是又不能把新的應用直接上線,所以我們可以考慮流量回放,也就是說我們可以把線上一段時間內的請求引數和回應結果保存下來,然后把這些請求引數在新改造的應用里面重新請求一遍,對比一下改造前后的回應結果是否一致,這樣就間接達到了使用線上流量進行測驗的效果,
我們常用的流量回放方案包括TcpCopy、Nginx等,
在RPC框架中,因為所有的請求都經過RPC,我們可以在RPC中拿到這些請求引數,將這些引數旁錄下來,并將旁錄結果用異步的方式發送到一個固定的地方保存起來,這樣就完成了流量錄制功能,
在完成錄制功能后,我們需要模擬一個應用呼叫方,將錄制好的請求引數重新發送一遍到要回歸測驗的應用里面,然后對比錄制拿到的請求結果和新請求的結果,這樣就完成了請求回放的程序,
流量回放不是RPC框架的核心功能,但是有了這個功能以后,用戶可以更放心的升級自己的應用了,
使用流量回放,對請求有一些限制:
- 請求是否依賴底層資料,如果依賴,那么需要保證底層資料是一致的,
- 請求是否與當前系統狀態或者系統時間有關系,如果相關,那么相關依賴也需要保持一致,
- 請求所執行的方法是否冪等,如果不冪等,很可能會影響驗證結果,
實作流量回放的設計思路:
- 使用動態代理,切面攔截對應的方法,獲取出入參,
- 把攔截資訊異步轉存到線上驗證系統,
- 通過線上驗證系統呼叫待驗證的防范,
- 收集結果對比資訊,設定報警功能,
22 | 動態分組:超高效實作秒級擴縮容
我們之前學習過服務分組,在呼叫方復雜的情況下,如果讓所有呼叫方都呼叫同一個集群,那么很可能會因為非核心業務呼叫量的突增,造成整個集群都不可用了,為了避免這種情況,我們需要把整個打擊群根據不同的呼叫方劃分出不同的小集群,從而實作呼叫方流量隔離的效果,保證不同業務之間不會相互影響,
在給集群分組的時候,我們一般會選擇性的合并一些呼叫方到同一個分組里,至于如何合并,并沒有統一標準,一般來說,我們可以按照應用的重要級別來劃分,讓非核心業務應用和核心業務應用不要共用一個分組,并且非核心應用之間也最好別用一個分組,
那么我們如何為每個分組配置合適的機器數量呢?一般會通過壓測來評估服務提供方單臺機器所能承受的QPS,然后再計算出每個分組里面的所有呼叫方的呼叫總量,考慮到可能的不確定性因素,我們可以在現有呼叫總量的基礎上,添加一個百分比作為buffer,這個百分比一般來自經驗總結,
我們計算每個分組所需要的機器數量時,會額外增加一些機器,這樣讓每個小集群可以有一定的抗壓能力,而抗壓能力取決于預留機器的數量,這就需要在成本和可用性之間做權衡,
當某個分組的呼叫方流量突增,而分組所預留的空間不能滿足當前流量要求時,我們可以看一下其他分組的服務提供方是否有富余能力來幫忙處理請求,這也就是動態分組的含義,
因為服務提供方的分組資訊以及機器節點都保存在注冊中心里面,我們可以在注冊中心里面將部分實體的別名改成我們想要的別名,然后通過服務發現進而影響到不同呼叫方能夠呼叫的服務提供方實體集合,換句話說,我們可以通過控制注冊中心,來管理服務呼叫方可以觸達的服務提供方以及分組節點的資訊,
通過直接修改注冊中心資料,我們可以讓任何一個分組瞬間擁有不同規模的集群能力,我們不僅可以實作把某個實體的分組名改成另一個分組名,還可以讓某個實體分組名變成多個分組名,這就是我們在動態分組里面最常見的兩種動作:追加和替換,
我們還可以利用動態分組解決分組后的每個分組預留機器冗余的問題,我們沒有必要把所有冗余的機器都分配到分組里面,我們可以把這些機器做成一個共享的池子,從而減少整理預留的實體數量,
作者:李潘 出處:http://wing011203.cnblogs.com/ 本文著作權歸作者和博客園共有,歡迎轉載,但未經作者同意必須保留此段宣告,且在文章頁面明顯位置給出原文連接,否則保留追究法律責任的權利,轉載請註明出處,本文鏈接:https://www.uj5u.com/houduan/542774.html
標籤:其他
