目錄
1.我們可以用zabbix監控哪些
2.zabbix的主動監控與被動監控
3.Zabbix監控做過哪些
4.zabbix監控mysql的四大性能指標:
5.配置zabbix自定義監控流程
6.安全組是什么,限制了3306的入規則,客戶端還能訪問嗎
7.Nagio監控?
8.服務器一般需要監控哪些專案? 憑借這些專案如何判斷服務器的瓶頸?
9.zabbix監控mysql的io情況是否正常的流程
10.監控MySQL主從同步是否例外,如果例外,則發送短信或者郵件給管理員,
11.zabbix如何修改其中監控的一臺服務器中記憶體閾值資訊,比如正常記憶體使用到了 80%報**警,我想修改為 60%報警?
12.報警型別和故障處理:
13.告警屏蔽:
1.我們可以用zabbix監控哪些
1. 硬體監控, 通過 SNMP 來進行路由器交換機的監控2. 系統監控, 如 CPU 的負載,背景關系切換、記憶體使用率、磁盤讀寫、磁盤使用率、磁盤 inode 節點,3. 服務監控, 比如公司用 LNMP nginx 自帶 Status 模塊、 PHP 也有相關的 Status 、 MySQL 的話可以通過 percona 來進行監控, 4. 網路監控, 如果是云主機又不是跨機房,那么可以選擇不監控網路,5. 安全監控, 如果是云主機可以考慮使用自帶的安全防護,當然也可以使用 iptables , 如果是硬體,那么推薦使用硬體防火墻,6.Web 監控, web 監控的話題其實還是很多,比如可以使用自帶的 web 監控來監控頁面相關的延遲、 js 回應時間、下載時間、等等,7. 日志監控, 如果是 web 的話可以使用監控 Nginx 的 500x 日志, PHP 的 ERROR 日志,8. 流量分析, 平時我們分析日志都是拿 awk sed xxx 一堆工具來實作, 這樣對我們統計 ip 、 pv 、 uv 不是很方便,那么可以使用百度統計、 google 統計、商業,讓開發嵌入代碼即可9. 可視化, 通過 screen 以及引入一 些第三方的庫來美化界面,同時我們也需要知道、訂單量突然增加、 突然減少,或者說突然來了一大波流量,這流量從哪兒來,是不是推廣了,還是被攻擊了,可以結合監控平來來梳理各個系統之間的業務關系,10. 自動化監控, 如上我們做了那么多的作業,當然不能是一臺一臺的來加 key 實作, 可以通過Zabbix 的主動模式以及被動模式來實作,當然最好還是通過 API 來實作,
2.zabbix的主動監控與被動監控
主動監控和被動監控都是相對于被監控端主機而言的默認 zabbix 采用被動監控當監控主機達到一定量級后 ,zabbix 服務器會越來越慢 , 此時可以考慮使用主動監控 , 釋放服務器的壓力 zabbix 也支持分布式監控被動監控 :server 向 Agent 發起連接 , 發送監控 key,Agent 接受請求 , 回應監控資料主動監控 :Agent 向 server 發起連接 ,Agent 請求需要檢測監控專案串列 ,server 相應 Agent 發送一個 items 串列 ,Agent 確認收到監控串列 ,TCP 連接完成 , 會話關閉 ,Agent 開始周期性收集資料區別 :server 不用每次需要資料都連接 Agent,Agent 會自己收集資料并處理資料 ,Server 僅需要保存資料 即可
3.Zabbix監控做過哪些
zabbix監控mysql集群:1)創建并編輯監控mysql的腳本(通常有腳本模板),添加執行權限
2)修改zabbix-agent組態檔,默認有一個MySQL的子組態檔,直接編輯該檔案即可,資料庫添加授權用戶
3)重啟zabbix-agent
4)Web界面配置、點擊需要監控的主機,進去添加監控模板,自帶的Template DB MySQL
5)配置完成后等一會兒就可以查看到監控主機的MySQL監控資訊
如果發現監控沒有資料,請排查如下問題
\1. zabbix客戶端是否重啟
\2. 腳本是否有執行權限
\3. 資料庫是否有用戶授權
\4. 環境變數是否有問題
4.zabbix監控mysql的四大性能指標:
查詢吞吐量
查詢執行性能
連接情況
緩沖池使用情況
5.配置zabbix自定義監控流程
①被監控端修改 Agent 組態檔 ( 修改是否允許自定義 key, 加載組態檔目錄 )②被監控端創建存放自定義 key 檔案 ( 在 zabbix_agentd.conf 檔案中定義 ), 書寫自定義 key ③重起客戶端 agentd④測驗自定義 key 是否生效⑤在 zabbix 頁面創建監控模板 , 創建應用 , 創建監控項 , 關聯主機
6.安全組是什么,限制了3306的入規則,客戶端還能訪問嗎
因為安全組的默認規則是在出方向上的資料報文全部放行,同一個安全組內的彈性云服務器和華 為云關系型資料庫實體可互相訪問,默認情況下,一個租戶可以創建 500 條安全組規則,為一個安全組設定過多的安全組規則會增加首包延時,因此,建議一個安全組內的安全組規則不超過 50 條,當需要從安全組外訪問安全組內的華為云關系型資料庫實體時,需要為安全組添加相應的入方向 規則,限制了 3306 的入規則,客戶端就沒有辦法訪問了,就好像 ping 一樣
7.Nagio監控?
不用存盤歷史資料,注重服務或者監控項的狀態Nagios 是一款開源的免費網路監視工具,能有效監控 Windows 、 Linux 和 Unix 的主機狀態,交換機路由器等網路設定,列印機等,在系統或服務狀態例外時發出郵件或短信報警第一時間通知網 站運維人員,在狀態恢復后發出正常的郵件或短信通知,;Nagios 可以監控的功能有:監控網路服務( SMTP 、 POP3 、 HTTP 、 NNTP 、 PING 等);監控主機資源(處理器負荷、磁盤利用率等);簡單地插件設計使得用戶可以方便地擴展自己服務的檢測方法;并行服務檢查機制;具備定義網路分層結構的能力,用 "parent" 主機定義來表達網路主機間的關系,這種關系可被用來發現和明晰主機宕機或不可達狀態;當服務或主機問題產生與解決時將告警發送給聯系人(通過 EMail 、短信、用戶定義方式);可以定義一些處理程式,使之能夠在服務或者主機發生故障時起到預防作用;自動的日志滾動功能;可以支持并實作對主機的冗余監控;可選的 WEB 界面用于查看當前的網路狀態、通知和故障歷史、日志檔案等;
8.服務器一般需要監控哪些專案? 憑借這些專案如何判斷服務器的瓶頸?
1)比如網站故障監控、服務器性能監控、網站安全監控、用戶訪問速度監控等;記憶體,IO,
CPU,網路,這個四個模塊是必須的;
2)不能單一指標衡量性能瓶頸,比如說是IO出現在性能瓶頸:
第一種是調整緩沖區的大小、調整緩沖區中的資料同步的磁盤中的時間
第二種是修改磁盤調度演算法,查看的路徑cat /sys/bock/sda/queue/scheduler
9.zabbix監控mysql的io情況是否正常的流程
在 zabbix 的組態檔中開啟自定義監控撰寫監控腳本,過濾出 mysql 的 IO 執行緒是否為 yes撰寫自定義監控檔案,監控腳本測驗定義的監控命令是否成功在 zabbix 網頁中自定義監控項,添加監控檔案中的 UserParameter
10.監控MySQL主從同步是否例外,如果例外,則發送短信或者郵件給管理員,
a. 開發一個守護行程腳本每 30 秒實作檢測一次,b. 如果同步出現如下錯誤號( 1158,1159,1008,1007,1062 ),則跳過錯誤,c. 請使用陣列技術實作上述腳本(獲取主從判斷及錯誤號部分),#!/bin/bashmysqlbin=/usr/bin/mysqlmysqlhost=127.0.0.1mysqluser=rootmysqlpwd=rootskiperrors=(1158 1159 1008 1007 1062)admin=' email@qq.com 'check() {LASTNO= mysqlbin -hmysqluser -p$mysqlpwd -e "show slavestatus\G"|grep Last_Errno|awk -F: '{print $2}')}skip() {for errorno in skiperrors[@];doif[errorno == LASTNO] ;thrnnotify errornobreakfidone}notify() {text="mysql slave monitor error: I "echotext|mail -s 'mysql error'}main() {while :;docheck && skip || notify "mysql connected failed!"sleep 30done}main
11.zabbix如何修改其中監控的一臺服務器中記憶體閾值資訊,比如正常記憶體使用到了 80%報**警,我想修改為 60%報警?
正常來說 , 一般會把監控的服務器統一加入到一個模板中 , 修改模板的其是某一項的監控項引數和告警閾值后 , 加入模板中的所有主機都會同步,如果單獨想修改其中某一臺服務器內存告警閾值 , 需要進入這臺主機 , 單獨創建一個告警 Triggers, 關聯這臺主機監控記憶體的項 ,配置好告警的閾值為 60% 即可實作,
12.報警型別和故障處理:
1.E-mail 郵件 2.微信報警等
故障:如監控服務器down機不報警
解決:1.先定位問題:zabbix服務器采用輪詢的方式從監控目標機的agent獲取資料,但如果目標機down了,目標機的agent通常也無法作業,所以檢查被監控的主機服務
2.增加一個目標主機進行是否存活的檢測,
告警收斂:
1)所有產生告警均由zabbix呼叫腳本推入快取redis當中,
2)分析系統將在規定時間(1分鐘)內去redis中拉取資料,根據定義好的一系列規則進行,合并、分析或直接丟棄,并存入分析平臺資料庫,以便供歷史查詢,
3)根據預先定義好的規則將報警通過定義好的方式發送給相關人員,
13.告警屏蔽:
1、處于維護中的主機,告警資訊還是會報出來,但是不會觸發動作;
2、對于可預知的臨時維護或緊急維護,可以提前設定告警屏蔽;
3、可針對組、單臺或多臺主機,進行一次性、每日定時、每月定時、每周定時屏蔽;
4、前端可以將維護中的主機不進行顯示,Dashboard右上角有個圖示可以進行篩選是否顯示維護中的主機;
5、告警屏蔽時,可以設定采集資料或不采集資料兩種方式;
至此,zabbix的告警屏蔽介紹完成,
轉載請註明出處,本文鏈接:https://www.uj5u.com/ruanti/305632.html
標籤:其他
上一篇:【歷史上的今天】10 月 4 日:計算機先驅阿塔納索夫出生;卡巴斯基創始人誕生;谷歌推出 Google Pixel 手機
下一篇:Shell面試題
