主頁 > 軟體設計 > MeterSphere 結合混沌注入工具(ChaosBlade)的測驗實踐

MeterSphere 結合混沌注入工具(ChaosBlade)的測驗實踐

2021-08-12 08:08:11 軟體設計

公司使用 JumpServer 堡壘機作為遠程辦公的入口,并且搭建了高可用環境,不過兩個節點都是部署在國內某云的海外節點上的,上個月有一次海外光纜出了問題,直接導致使用該遠程辦公的同事全部提前下班了,基于如何避免以上未知的故障去研究了混沌工程相關內容,雖然這個已知的故障場景用一些網路命令就能復現,用混沌注入頗有點大炮打蚊子的感覺,但是混沌工程主要是用來模擬出現那些未知故障的,也算是借著這個場景了解下最近很火的混沌工程,研究的程序中發現了另一個問題,每次操作都需要手動寫命令,我自己練習完了下次沒辦法再次自動執行,正好那段時間 JumpServer 交流群里在推他們團隊的另外一款測驗平臺產品 —— MeterSphere,里邊的介面自動化能力非常強大,任務定時執行還支持 cron 運算式的圖形化方式,可以讓我這種對 cron 不是那么懂的人都能用的飛起,感覺可以通過這個平臺把混沌測驗中的故障注入和介面測驗結合起來,心動不如行動,逐開始進行操作,

混沌工程相關的概念不是本篇文章的重點,這里不再贅述,用個人理解的一句話介紹 ChaosBlade:ChaosBlade 是阿里開源的一個混沌注入的工具,所謂混沌注入可以理解為制造各種可能發生的故障(比如 CPU、存盤、網路等故障),來模擬線上環境可能會發生的一些問題,通過判斷注入后系統是否還能保持穩定來分析和測驗出系統的健壯性,從而進一步改善系統,

下面就來簡單介紹一下,通過 MeterSphere 是如何呼叫 ChaosBlade 完成一個場景自動化測驗的

一、準備作業:

1.1 準備好被測系統,這里是單節點 JumpServer一臺,這里因為只是實驗,配置不做多要求,參考 JumpServer 的推薦配置即可;

1.2 準備一臺服務器用于安裝 MeterSphere 測驗平臺,具體操作和使用可參考官網檔案,這里不做介紹;

1.3 從 ChaosBlade 的 github 地址上下載基于 Linux 環境的最新安裝包,下載完成后傳到被測服務器上并解壓即可,無需編譯,

下載地址為:https://chaosblade.oss-cn-hangzhou.aliyuncs.com/agent/github/1.2.0/chaosblade-1.2.0-linux-amd64.tar.gz

比如解壓到了服務器的 /opt 目錄下,進入解壓后的檔案夾,可以看到以下內容:

├── bin
│   ├── chaos_burncpu
│   ├── chaos_burnio
│   ├── chaos_changedns
│   ├── chaos_delaynetwork
│   ├── chaos_dropnetwork
│   ├── chaos_filldisk
│   ├── chaos_killprocess
│   ├── chaos_lossnetwork
│   ├── jvm.spec.yaml
│   └── tools.jar
├── blade
└── lib
    └── sandbox

其中 blade 是可執行檔案,即 chaosblade 工具的 cli,混沌實驗執行的工具,

在這里先簡單介紹一下如何使用這個工具:

我們拿 CPU 滿載(CPU 使用率 100%) 演練場景舉例(!!注意,在不清楚影響面的情況下,此命令切勿直接在韌性不夠的生產系統機器上執行),執行以下命令實施實驗:

./blade create cpu fullload

執行結果回傳:

{"code":200,"success":true,"result":"7c1f7afc281482c8"}

通過 top 命令查看 CPU 使用率

CPU usage: 93.79% user, 6.20% sys, 0.0% idle

此時命令已經生效,停止混沌實驗,執行:

./blade destroy 7c1f7afc281482c8

回傳以下結果,表示停止實驗成功

{"code":200,"success":true,"result":"command: cpu fullload --debug false --help false"}

再去觀察 CPU 情況,CPU 負載已回到正常狀態:

CPU usage: 6.36% user, 4.74% sys, 88.88% idle

一次 CPU 滿載演練完成,

二、配置相關:

我們知道 MeterSphere 可以做到創建場景介面自動化測驗,測驗的流程包括:

1)確定一個觀察的穩定的指標,如JumpServer的資產串列查詢;

2)在 MeterSphere 上定義一個查詢穩定指標的介面用例:呼叫JumpServer的資產串列查詢的介面;

可以看到,在沒有外界干擾的情況下,能夠正常呼叫JumpServer的介面查詢資產串列,

3)定義第二個介面用例:這個用例執行目的在于引入混沌測驗發起故障注入,(這里選擇提高服務器 CPU 負載到 100%)

4) 定義第三個介面用例:這個用例目的在于查詢上一個混沌注入測驗的注入狀態,引數 result 為上一個混沌測驗所回傳回應的 result 值,

可以通過如下命令查看 CPU 使用率:

iostat -c 1 1000

可以看到,這次請求的回應時間比較長,說明服務器 CPU 負載的提升,對系統的穩定性有一定的影響,可能會影響后續介面的正常呼叫,

5)定義第四個介面用例:這個用例目的在于驗證混沌注入后是否影響對 Jumpserver介面正常的呼叫,以及觀察與第一次呼叫介面時候的差別,

可以看到對比之前請求,回應時間延長了,原先的 56ms 變成了 192ms,但是依然還是能夠正常的請求介面獲取資料,說明 CPU 滿負載還不能破壞我們預先設定的穩定指標,(正常查詢資產串列)

6)定義第五個介面用例:這個用例目的在于銷毀此次的混沌注入測驗,把之前的 CPU 滿負載混沌注入效果銷毀,即使服務器恢復為初始狀態

7)定義第六個測驗用例:該用例與第三個用例可以復用,這個用例目的在于查詢上一個混沌注入測驗的注入狀態,引數 result 為 MS 在前面用例定義好的變數 result 的值,

可以看到,當成功銷毀混沌實驗后,服務器的 CPU 負載情況已經恢復原始狀態

8)定義第七個測驗用例:該用例也是此次介面場景自動化測驗的最后一個用例,就是再次呼叫JumpServer 的查詢資產串列,觀察回應結果,

可以看到,這一次請求查詢中間件串列的介面,回應時間 63ms,對比在混沌注入后的接近 200ms 又恢復變快了,說明服務器 CPU 的負載對于介面回應時延還是有一定影響,到此實驗結束,

三、結果展示:

上面只是列出了每個測驗用例的截圖,這里將完整的場景介面自動化做一個展示:

點擊執行,觀察結果:

結果分析:

7 個步驟均執行完成,該流程場景測驗成功,并且能看出,在混沌注入前后,對介面請求的效果是有一定的影響,明顯在注入之后的系統回應時間變長,但是也可以看出 CPU 滿負載依然不能破壞穩態,系統依然能穩定運行,訪問JumpServer也能正常訪問,

四、實驗小結&補充:

1)安裝 ChaosBlade 之后,后臺啟動 blade,會暴露出 web 服務,上層可通過 http 呼叫,請求格式是 chaosblade?cmd= 具體命令,例如執行 CPU 滿載,則請求是 chaosblade?cmd=create%20cpu%20fullload(%20 相當于 unicode 的一個空格),

命令

start       啟動 server 模式, 暴露 web 服務
stop        停止 server 模式, 關閉 web 服務

start 命令引數

-p, --port string   服務埠號,默認是 9526

案例

# 啟動 server 模式,服務埠是 8080
blade server start --port 8080
success, listening on 8080
 
# 觸發 CPU 負載 50% 場景
curl "http://xxx.xxx.xxx.xxx:8080/chaosblade?cmd=create%20cpu%20load%20--cpu-percent%2050"
 
{"code":200,"success":true,"result":"e08a64a9af02c393"}
 
# 銷毀實驗場景
curl "http://xxx.xxx.xxx.xxx:8080/chaosblade?cmd=destroy%20e08a64a9af02c393"
 
# 停止 blade server
blade server stop
 
{"code":200,"success":true,"result":"pid is 12619"}

2)相關鏈接說明:

MeterSphere github 地址:https://github.com/metersphere/metersphere

ChaosBlade 地址:https://github.com/chaosblade-io/chaosblade/wiki/%E6%96%B0%E6%89%8B%E6%8C%87%E5%8D%97

ChaosBlade web 服務 http 介面地址:https://chaosblade-io.gitbook.io/chaosblade-help-zh-cn/blade-server

3)感覺 MeterSphere 好像挺適合做這種自動監控的事情的,不知道其它使用者有用 MeterSphere 搞出來一個自動監控平臺的沒,有的話可以一并分享下,

MeterSphere的官網鏈接:https://metersphere.io/

以上就是我在用 MeterSphere 呼叫 ChaosBlade 開源混沌注入工具的簡單實踐,若有不足之處或錯誤的地方請多指出,謝謝,

轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/293222.html

標籤:其他

上一篇:??《畫解資料結構》七個影片 “畫“ 解鏈表??

下一篇:09交換排序演算法---冒泡排序和快速排序

標籤雲
其他(157675) Python(38076) JavaScript(25376) Java(17977) C(15215) 區塊鏈(8255) C#(7972) AI(7469) 爪哇(7425) MySQL(7132) html(6777) 基礎類(6313) sql(6102) 熊猫(6058) PHP(5869) 数组(5741) R(5409) Linux(5327) 反应(5209) 腳本語言(PerlPython)(5129) 非技術區(4971) Android(4554) 数据框(4311) css(4259) 节点.js(4032) C語言(3288) json(3245) 列表(3129) 扑(3119) C++語言(3117) 安卓(2998) 打字稿(2995) VBA(2789) Java相關(2746) 疑難問題(2699) 细绳(2522) 單片機工控(2479) iOS(2429) ASP.NET(2402) MongoDB(2323) 麻木的(2285) 正则表达式(2254) 字典(2211) 循环(2198) 迅速(2185) 擅长(2169) 镖(2155) 功能(1967) .NET技术(1958) Web開發(1951) python-3.x(1918) HtmlCss(1915) 弹簧靴(1913) C++(1909) xml(1889) PostgreSQL(1872) .NETCore(1853) 谷歌表格(1846) Unity3D(1843) for循环(1842)

熱門瀏覽
  • 面試突擊第一季,第二季,第三季

    第一季必考 https://www.bilibili.com/video/BV1FE411y79Y?from=search&seid=15921726601957489746 第二季分布式 https://www.bilibili.com/video/BV13f4y127ee/?spm_id_fro ......

    uj5u.com 2020-09-10 05:35:24 more
  • 第三單元作業總結

    1.前言 這應該是本學期最后一次寫作業總結了吧。總體來說,對作業的節奏也差不多掌握了,作業做起來的效率也更高了。雖然和之前的作業一樣,作業中都要用到新的知識,但是相比之前,更加懂得了如何利用工具以及資料。雖然之間卡過殼,但總體而言,這幾次作業還算完成的比較好。 2.作業程序總結 相比前兩個單元,此單 ......

    uj5u.com 2020-09-10 05:35:41 more
  • 北航OO(2020)第四單元博客作業暨課程總結博客

    北航OO(2020)第四單元博客作業暨課程總結博客 本單元作業的架構設計 在本單元中,由于UML圖具有比較清晰的樹形結構,因此我對其中需要進行查詢操作的元素進行了包裝,在樹的父節點中存盤所有孩子的參考。考慮到性能問題,我采用了快取機制,一次查詢后盡可能快取已經遍歷過的資訊,以減少遍歷次數。 本單元我 ......

    uj5u.com 2020-09-10 05:35:48 more
  • BUAA_OO_第四單元

    一、UML決議器設計 ? 先看下題目:第四單元實作一個基于JDK 8帶有效性檢查的UML(Unified Modeling Language)類圖,順序圖,狀態圖分析器 MyUmlInteraction,實際上我們要建立一個有向圖模型,UML中的物件(元素)可能與同級元素連接,也可與低級元素相連形成 ......

    uj5u.com 2020-09-10 05:35:54 more
  • 6.1邏輯運算子

    邏輯運算子 1. && 短路與 運算式1 && 運算式2 01.運算式1為true并且運算式2也為true 整體回傳為true 02.運算式1為false,將不會執行運算式2 整體回傳為false 03.只要有一個運算式為false 整體回傳為false 2. || 短路或 運算式1 || 運算式2 ......

    uj5u.com 2020-09-10 05:35:56 more
  • BUAAOO 第四單元 & 課程總結

    1. 第四單元:StarUml檔案決議 本單元采用了圖模型決議UML。 UML檔案可以抽象為圖、子圖、邊的邏輯結構。 在實作中,圖的節點包括類、介面、屬性,子圖包括狀態圖、順序圖等。 采用了三次遍歷UML元素的方法建圖,第一遍遍歷建點,第二、三次遍歷設定屬性、連邊,實作圖物件的初始化。這里借鑒了一些 ......

    uj5u.com 2020-09-10 05:36:06 more
  • 談談我對C# 多型的理解

    面向物件三要素:封裝、繼承、多型。 封裝和繼承,這兩個比較好理解,但要理解多型的話,可就稍微有點難度了。今天,我們就來講講多型的理解。 我們應該經常會看到面試題目:請談談對多型的理解。 其實呢,多型非常簡單,就一句話:呼叫同一種方法產生了不同的結果。 具體實作方式有三種。 一、多載 多載很簡單。 p ......

    uj5u.com 2020-09-10 05:36:09 more
  • Python 資料驅動工具:DDT

    背景 python 的unittest 沒有自帶資料驅動功能。 所以如果使用unittest,同時又想使用資料驅動,那么就可以使用DDT來完成。 DDT是 “Data-Driven Tests”的縮寫。 資料:http://ddt.readthedocs.io/en/latest/ 使用方法 dd. ......

    uj5u.com 2020-09-10 05:36:13 more
  • Python里面的xlrd模塊詳解

    那我就一下面積個問題對xlrd模塊進行學習一下: 1.什么是xlrd模塊? 2.為什么使用xlrd模塊? 3.怎樣使用xlrd模塊? 1.什么是xlrd模塊? ?python操作excel主要用到xlrd和xlwt這兩個庫,即xlrd是讀excel,xlwt是寫excel的庫。 今天就先來說一下xl ......

    uj5u.com 2020-09-10 05:36:28 more
  • 當我們創建HashMap時,底層到底做了什么?

    jdk1.7中的底層實作程序(底層基于陣列+鏈表) 在我們new HashMap()時,底層創建了默認長度為16的一維陣列Entry[ ] table。當我們呼叫map.put(key1,value1)方法向HashMap里添加資料的時候: 首先,呼叫key1所在類的hashCode()計算key1 ......

    uj5u.com 2020-09-10 05:36:38 more
最新发布
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:20:47 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:20:25 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:20:17 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:20:10 more
  • 【中介者設計模式詳解】C/Java/JS/Go/Python/TS不同語言實作

    * 中介者模式是一種行為型設計模式,它可以用來減少類之間的直接依賴關系,
    * 將物件之間的通信封裝到一個中介者物件中,從而使得各個物件之間的關系更加松散。
    * 在中介者模式中,物件之間不再直接相互互動,而是通過中介者來中轉訊息。 ......

    uj5u.com 2023-04-20 08:19:44 more
  • 露天煤礦現場調研和交流案例分享

    他們集團的資訊化公司及研究院在一個礦區正在做智能礦山的統一平臺的 試點,專案投資大概1億,包括了礦山的各方面的內容,顯示得我們這次交流有點多余。他們2年前開始做智能礦山的規劃,有很多煤礦行業專家的加持,他們的描述是非常完美,但是去年底應該上線的平臺,現在還沒有看到影子。他們確實有很多場景需求,但是被... ......

    uj5u.com 2023-04-20 08:19:07 more
  • 《社區人員管理》實戰案例設計&個人案例分享

    設計是一個讓人夢想成真程序,開始編碼、測驗、除錯之前進行需求分析和架構設計,才能保證關鍵方面都做正確 ......

    uj5u.com 2023-04-20 08:18:57 more
  • 軟體架構生態化-多角色交付的探索實踐

    作為一個技術架構師,不僅僅要緊跟行業技術趨勢,還要結合研發團隊現狀及痛點,探索新的交付方案。在日常中,你是否遇到如下問題 “ 業務需求排期長研發是瓶頸;非研發角色感受不到研發技改提效的變化;引入ISV 團隊又擔心質量和安全,培訓周期長“等等,基于此我們探索了一種新的技術體系及交付方案來解決如上問題。 ......

    uj5u.com 2023-04-20 08:18:49 more
  • 05單件模式

    #經典的單件模式 public class Singleton { private static Singleton uniqueInstance; //一個靜態變數持有Singleton類的唯一實體。 // 其他有用的實體變數寫在這里 //構造器宣告為私有,只有Singleton可以實體化這個類! ......

    uj5u.com 2023-04-19 08:42:51 more
  • 【架構與設計】常見微服務分層架構的區別和落地實踐

    軟體工程的方方面面都遵循一個最基本的道理:沒有銀彈,架構分層模型更是如此,每一種都有各自優缺點,所以請根據不同的業務場景,并遵循簡單、可演進這兩個重要的架構原則選擇合適的架構分層模型即可。 ......

    uj5u.com 2023-04-19 08:42:41 more