基于上一篇《微服務海量日志監控平臺》介紹的平臺架構,繼續架構的優化和能功的擴展,實作服務治理能力,
問題現狀態
日志監控平臺為我們帶來了很多排查解決線上問題的便利,但是從某種程度上講,只為我們提供了線索,最終的排查和解決還是需要人工去執行參與,所以從運維角度上說,并沒有幫助解決問題,由于采集覆寫面和分析問題,監控方面也存在很多問題,大概歸納如下:
- 監控不全面
- 鏈路不全,缺少應用拓撲
- 無服務健康檢測機制
- 缺乏深度分析能力
- 缺乏治理能力
- 人工運維
解決方案
針對現狀,我們大致采取以下解決方案:
- 監控源多樣化
業務資料、應用、中間件、網路設備、存盤設備、物理機、虛擬機、容器、資料庫、api等監控
- 豐富可視化內容
使用grafana和kibana提供分析和可視化的 Web 平臺,可查找和互動資料,并生成各種維度的分析報表,增加應用拓撲、鏈路跟蹤等可視化
- 服務健康檢測
定期呼叫應用服務的介面檢查服務的健康狀況,當發現不可用的介面時立即告警并啟用熔斷功能;當發現例外節點應啟動告警并移除該節點
- 實時分析、預測、告警
實時過濾清洗、多維分析采集資料,對當前發生例外進行分析、風險預判,并對分析結果決策告警通知并持久化
- 最終打造服務治理平臺
結合現有的技術體系,打造服務治理平臺,實作咖啡式運維
監控平臺的優化
功能架構優化

多源監控
實時分析預

告警完善

更多可視化

優化擴展監控服務

打造服務治理生態體系
由于業務需求和技術的發展,平臺使用的技術各種各樣,當前我們的服務架構除了使用Zero Ice外,有的用到了springCloud,需要把這些服務統一對接到治理平臺,達到治理能力,降低運維成本,提高版本迭代,實作故障快速定位、靈活資源調整等服務治理價值,
治理平臺功能

打造服務治理生態體系
結合服務架構情況,一切從實際出發,圍繞監控服務,打通其它管理、控制服務,如網關、配置中心等之間的通訊,形成服務治理生態圈,

【著作權宣告】
本文著作權歸作者(深圳伊人網網路有限公司)和博客園共有,歡迎轉載,但未經作者同意必須在文章頁面給出原文鏈接,否則保留追究法律責任的權利,如您有任何商業合作或者授權方面的協商,請給我留言:[email protected]
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/131674.html
標籤:其他
下一篇:react+ts準備作業—阿楠
