摘要:經過中國信通院的檢驗,華為云應用運維管理平臺滿足云上軟體系統穩定-可觀測性平臺技術要求,達到了可觀測性平臺技術檢驗的先進級水平,
本文分享自華為云社區《華為云應用運維管理平臺獲評中國信通院可觀測性評估先進級!》,作者:華為云PaaS服務小智,
近日,華為云應用運維管理平臺參與了中國資訊通信研究院(以下簡稱“中國信通院”)主辦的“穩保行動”的可觀測性平臺能力評估,經過中國信通院的檢驗,華為云應用運維管理平臺滿足云上軟體系統穩定-可觀測性平臺技術要求,達到了可觀測性平臺技術檢驗的先進級水平,
作為云計算和軟體的權威評估機構,中國信通院在可觀測性平臺和工具的評測中,以通信行業標準《可觀測性平臺技術要求》為依據,客觀真實地評估了廠商的可觀測能力水平,經中國信通院的細致評估,華為云應用運維管理平臺在資料采集、資料處理、資料應用、平臺運維這4項檢驗中,滿足了可觀測性平臺先進級能力要求,這也意味著華為云在可觀測性領域已經達到業內領先水平,
圖1 可觀測性平臺能力
華為云應用運維管理平臺是云上應用的一站式立體化運維管理平臺,實時監控應用及相關云資源,采集并關聯資源的各項指標、日志及事件等資料共同分析應用健康狀態,提供靈活的告警及豐富的資料可視化功能,幫助用戶及時發現故障,全面掌握應用、資源及業務的實時運行狀況,
圖2 華為云應用運維管理平臺
一、牢固的基石——應用資源管理和采集管理
應用資源管理
傳統資訊技識訓礎設施庫(Information Technology Infrastructure Library,簡稱ITIL)流程中面向基礎設施資源的管理方式,易造成各運維服務之間資料割裂、資訊不一致等問題,華為云應用運維管理平臺的應用資源管理(簡稱CMDB)是基于DevOps理念打造的面向應用全生命周期的資源管理平臺,是現代自動化運維的基石服務,統一集中管理資源物件與應用之間的關系,
應用資源管理CMDB以應用為中心,實作多層級應用、子應用、組件到環境的模型管理,建立應用與云資源依賴關系,通過應用資源管理,可以找到應用與下級微服務以及部署在不同環境(開發環境、測驗環境或生產環境等)下的資源實體,包括ECS、RDS、ELB、CCE等云服務實體,為應用監控、告警關聯分析以及自動化運維提供配置資料,同時也支持通過開放配置資料介面,輔助第三方系統運維場景建設,
圖3 應用資源管理能力示意
采集管理
作為資料的來源,采集插件至關重要,華為云應用運維管理平臺提供無侵入式采集插件,用戶無需修改應用代碼,只需要部署探針包,修改相應的應用啟動引數,就能對應用進行全方位的資料采集,以便全面掌握應用的運行情況,采集范圍包括但不限于:
- 基礎資源:包含云主機、容器、網路等;
- 中間件:包含資料庫、訊息佇列、應用容器、存盤、日志等;
- IOT設備:包含各種邊緣設備、采集的資料范圍包括指標等;
- 前端組件:包含H5、ios、android、小程式等;
- 后端組件:包含java、python、nodejs、c#、go等,
另外華為云應用運維管理平臺還提供插件生命周期管理能力,不同的插件分工采集不同的資料,用戶可以按需安裝、升級、卸載各類插件,
二、強大的核心——指標監控、云日志、應用性能管理
隨著云原生技術逐漸普及,傳統監控系統正朝可觀測性系統演進,業界對可觀測性的共識,是基于可觀測性的三大支柱“metrics、logging、tracing”,
華為云應用運維管理平臺將云監控服務(Cloud Eye,簡稱CES)的指標資料、云日志服務(Log Tank Service,簡稱LTS)的日志資料、應用性能管理服務(Application Performance Management,簡稱APM)的性能分析資料進行統一監控,從而提供了對云資源、應用和性能的全面監控和診斷,
指標——云監控服務CES
云監控CES是華為云上資源監控的服務,提供80多種云服務、上千類資源指標,涵蓋彈性云服務器、帶寬、資料庫等服務,滿足用戶各類云上資源監控需求,CES可提供多聚合方式、最長六個月的歷史監控圖表,方便用戶查看近半年業務監控資料,
除了云監控提供的云服務指標外,用戶還可以自定義上報業務指標,通過Open API、SDK方式上報,可更全面、深入地監控業務運行狀況,
日志——云日志服務LTS
在海量資料的時代,讓寶貴的原始日志資料躺在磁盤里日漸沉寂,無法在云時代“一展宏圖”,完全是埋沒了日志資料的價值,而使用華為云日志服務就可以從專案初始便賦予日志資料搜索、分析和探索能力,讓日志資料活起來、變有用,華為云日志服務提供日志采集、秒級搜索、海量存盤、結構化處理、轉儲和可視化圖表等各項能力,可滿足應用運維、可視化分析、等保合規等各類應用場景,
場景1日志分析、保障系統安全:實時收集系統產生的日志資料,對日志資料進行分析、歸檔,支持每天百TB級日志的接入,十億級日志秒級搜索
場景2日志審計:通過實時收集日志,避免資料被誤刪和被非法入侵者洗掉的可能性,同時將日志轉儲長期存盤,滿足合規要求
場景3 問題診斷:系統出現問題或故障時,通過日志快速查詢、精準定位問題所在
場景4 系統改進:通過阻塞記錄發現站點性能瓶頸,優化快取策略、資料傳輸策略
圖4 日志服務示意圖
性能——應用性能管理服務APM
在華為內部,有上百萬微服務使用著應用性能管理服務APM,在日常性能診斷、故障定位和排查等場景中,通過使用APM實作故障1分鐘感知、5分鐘定界、10分鐘恢復能力的構筑,APM有力地支撐了華為云、終端、車、能源等各型別產品的應用性能管理和日常運維保障,
現在,華為云將內部多年積累的應用性能管理能力沉淀到華為云應用性能管理服務APM上,向云上用戶提供端到端的全鏈路性能管理服務,包含前端監控、應用性能監控、全面擁抱開源生態,幫助用戶在復雜的業務環境下快速發現應用性能問題,降低MTTR(平均故障恢復時長),全面掌控應用的性能健康狀況,
圖5 應用性能管理拓撲示意
三、豐富的周邊能力——統一監控大盤、容器洞察、告警降噪
華為云應用運維管理平臺除了牢固的基石及強大的核心,還提供了豐富的周邊能力,
統一監控大盤
集中管理云監控、云日志、性能、Prometheus等多維度可觀測性資料源,提供統一監控與分析,用戶可以將來自不同資料源定義在一張監控大屏中顯示,統一管理告警等,
圖6 統一監控大盤示意
容器洞察
無縫對接華為云云容器引擎CCE,基于原生Kubernetes容器和集群模型,用戶可通過Cluster、Namespace、Deployment、POD和Container進行逐步運維分析,包括Prometheus監控、日志和性能管理等;支持將Promethues服務器遠程接入(Remote-Write)到華為云應用運維管理平臺,還可通過PromQL查詢原生指標并配置告警,
圖7 容器洞察示意
告警降噪
華為云應用運維管理平臺的告警降噪功能,提供分組、抑制和屏蔽告警降噪策略,大大減少了運維人員需要關注的告警量,增加了關鍵告警、高優先級問題的關注度,突出告警的重點問題,提高告警的可靠性,減少誤判和漏警的情況,節省了人力和時間成本,提高了作業效率,有效保障系統的穩定性和安全性,
圖8 告警降噪示意
如果軟體系統內部情況都不可觀測,更無從談起故障分析和系統改進等穩定性保障手段,依托牢固的基石、強大的核心及豐富的周邊能力,華為云應用運維管理平臺助力企業提高軟體系統的質量和效率,提升用戶體驗和關鍵業務的穩定性,優化業務流程和方向,提高業務決策的質量,
點擊關注,第一時間了解華為云新鮮技術~
轉載請註明出處,本文鏈接:https://www.uj5u.com/qita/553230.html
標籤:其他
上一篇:介面加密了該怎么測?介面中有資料要進行加密怎么做??
下一篇:返回列表
