監控zabbix面試題-有解無憂

1.我們可以用zabbix監控哪些

2.zabbix的主動監控與被動監控

3.Zabbix監控做過哪些

4.zabbix監控mysql的四大性能指標:

5.配置zabbix自定義監控流程

6.安全組是什么，限制了3306的入規則，客戶端還能訪問嗎

7.Nagio監控？

8.服務器一般需要監控哪些專案? 憑借這些專案如何判斷服務器的瓶頸?

9.zabbix監控mysql的io情況是否正常的流程

10.監控MySQL主從同步是否例外，如果例外，則發送短信或者郵件給管理員，

11.zabbix如何修改其中監控的一臺服務器中記憶體閾值資訊,比如正常記憶體使用到了 80%報**警,我想修改為 60%報警?

12.報警型別和故障處理：

13.告警屏蔽:

1.我們可以用zabbix監控哪些

1. 硬體監控，通過 SNMP 來進行路由器交換機的監控

2. 系統監控，如 CPU 的負載，背景關系切換、記憶體使用率、磁盤讀寫、磁盤使用率、磁盤 inode 節點，

3. 服務監控，比如公司用 LNMP nginx 自帶 Status 模塊、 PHP 也有相關的 Status 、 MySQL 的話可以通過 percona 來進行監控， 4. 網路監控，如果是云主機又不是跨機房，那么可以選擇不監控網路，

5. 安全監控，如果是云主機可以考慮使用自帶的安全防護，當然也可以使用 iptables ，如果是硬體，那么推薦使用硬體防火墻，

6.Web 監控， web 監控的話題其實還是很多，比如可以使用自帶的 web 監控來監控頁面相關的延遲、 js 回應時間、下載時間、等等，

7. 日志監控，如果是 web 的話可以使用監控 Nginx 的 500x 日志， PHP 的 ERROR 日志，

8. 流量分析，平時我們分析日志都是拿 awk sed xxx 一堆工具來實作，這樣對我們統計 ip 、 pv 、 uv 不是很方便，那么可以使用百度統計、 google 統計、商業，讓開發嵌入代碼即可

9. 可視化，通過 screen 以及引入一些第三方的庫來美化界面，同時我們也需要知道、訂單量突然增加、突然減少，或者說突然來了一大波流量，這流量從哪兒來，是不是推廣了，

還是被攻擊了，可以結合監控平來來梳理各個系統之間的業務關系，

10. 自動化監控，如上我們做了那么多的作業，當然不能是一臺一臺的來加 key 實作，可以通過Zabbix 的主動模式以及被動模式來實作，當然最好還是通過 API 來實作，

2.zabbix的主動監控與被動監控

主動監控和被動監控都是相對于被監控端主機而言的

默認 zabbix 采用被動監控

當監控主機達到一定量級后 ,zabbix 服務器會越來越慢 , 此時可以考慮使用主動監控 , 釋放服務器的壓力 zabbix 也支持分布式監控

被動監控 :server 向 Agent 發起連接 , 發送監控 key,Agent 接受請求 , 回應監控資料

主動監控 :Agent 向 server 發起連接 ,Agent 請求需要檢測監控專案串列 ,server 相應 Agent 發送一個 items 串列 ,Agent 確認收到監控串列 ,TCP 連接完成 , 會話關閉 ,Agent 開始周期性收集資料

區別 :

server 不用每次需要資料都連接 Agent,Agent 會自己收集資料并處理資料 ,Server 僅需要保存資料即可

3.Zabbix監控做過哪些

zabbix監控mysql集群:1）創建并編輯監控mysql的腳本(通常有腳本模板),添加執行權限

2）修改zabbix-agent組態檔，默認有一個MySQL的子組態檔，直接編輯該檔案即可,資料庫添加授權用戶

3）重啟zabbix-agent

4）Web界面配置、點擊需要監控的主機，進去添加監控模板，自帶的Template DB MySQL

5）配置完成后等一會兒就可以查看到監控主機的MySQL監控資訊

如果發現監控沒有資料，請排查如下問題

\1. zabbix客戶端是否重啟

\2. 腳本是否有執行權限

\3. 資料庫是否有用戶授權

\4. 環境變數是否有問題

4.zabbix監控mysql的四大性能指標:

查詢吞吐量

查詢執行性能

連接情況

緩沖池使用情況

5.配置zabbix自定義監控流程

①被監控端修改 Agent 組態檔 ( 修改是否允許自定義 key, 加載組態檔目錄 )

②被監控端創建存放自定義 key 檔案 ( 在 zabbix_agentd.conf 檔案中定義 ), 書寫自定義 key ③重起客戶端 agentd

④測驗自定義 key 是否生效

⑤在 zabbix 頁面創建監控模板 , 創建應用 , 創建監控項 , 關聯主機

6.安全組是什么，限制了3306的入規則，客戶端還能訪問嗎

因為安全組的默認規則是在出方向上的資料報文全部放行，同一個安全組內的彈性云服務器和華為云關系型資料庫實體可互相訪問，

默認情況下，一個租戶可以創建 500 條安全組規則，

為一個安全組設定過多的安全組規則會增加首包延時，因此，建議一個安全組內的安全組規則不超過 50 條，

當需要從安全組外訪問安全組內的華為云關系型資料庫實體時，需要為安全組添加相應的入方向規則，

限制了 3306 的入規則，客戶端就沒有辦法訪問了，就好像 ping 一樣

7.Nagio監控？

不用存盤歷史資料，注重服務或者監控項的狀態

Nagios 是一款開源的免費網路監視工具，能有效監控 Windows 、 Linux 和 Unix 的主機狀態，交換機路由器等網路設定，列印機等，在系統或服務狀態例外時發出郵件或短信報警第一時間通知網站運維人員，在狀態恢復后發出正常的郵件或短信通知，；

Nagios 可以監控的功能有：

監控網路服務（ SMTP 、 POP3 、 HTTP 、 NNTP 、 PING 等）；

監控主機資源（處理器負荷、磁盤利用率等）；

簡單地插件設計使得用戶可以方便地擴展自己服務的檢測方法；

并行服務檢查機制；

具備定義網路分層結構的能力，用 "parent" 主機定義來表達網路主機間的關系，這種關系可被用來發現和明晰主機宕機或不可達狀態；

當服務或主機問題產生與解決時將告警發送給聯系人（通過 EMail 、短信、用戶定義方式）；

可以定義一些處理程式，使之能夠在服務或者主機發生故障時起到預防作用；

自動的日志滾動功能；

可以支持并實作對主機的冗余監控；

可選的 WEB 界面用于查看當前的網路狀態、通知和故障歷史、日志檔案等；

8.服務器一般需要監控哪些專案? 憑借這些專案如何判斷服務器的瓶頸?

1）比如網站故障監控、服務器性能監控、網站安全監控、用戶訪問速度監控等；記憶體，IO，

CPU,網路，這個四個模塊是必須的；

2）不能單一指標衡量性能瓶頸，比如說是IO出現在性能瓶頸：

第一種是調整緩沖區的大小、調整緩沖區中的資料同步的磁盤中的時間

第二種是修改磁盤調度演算法,查看的路徑cat /sys/bock/sda/queue/scheduler

9.zabbix監控mysql的io情況是否正常的流程

在 zabbix 的組態檔中開啟自定義監控

撰寫監控腳本，過濾出 mysql 的 IO 執行緒是否為 yes

撰寫自定義監控檔案，監控腳本

測驗定義的監控命令是否成功

在 zabbix 網頁中自定義監控項，添加監控檔案中的 UserParameter

10.監控MySQL主從同步是否例外，如果例外，則發送短信或者郵件給管理員，

a. 開發一個守護行程腳本每 30 秒實作檢測一次，

b. 如果同步出現如下錯誤號（ 1158,1159,1008,1007,1062 ），則跳過錯誤，

c. 請使用陣列技術實作上述腳本（獲取主從判斷及錯誤號部分），

#!/bin/bash

mysqlbin=/usr/bin/mysql

mysqlhost=127.0.0.1

mysqluser=root

mysqlpwd=root

skiperrors=(1158 1159 1008 1007 1062)

admin=' email@qq.com '

check() {

LASTNO= mysqlbin -h

mysqluser -p$mysqlpwd -e "show slave

status\G"|grep Last_Errno|awk -F: '{print $2}')

}

skip() {

for errorno in skiperrors[@];doif[errorno == LASTNO] ;thrnnotify errorno

break

fi

done

}

notify() {

text="mysql slave monitor error: I "echotext|mail -s 'mysql error'

}

main() {

while :;do

check && skip || notify "mysql connected failed!"

sleep 30

done

}

main

11.zabbix如何修改其中監控的一臺服務器中記憶體閾值資訊,比如正常記憶體使用到了 80%報警,我想修改為 60%**報警?

正常來說 , 一般會把監控的服務器統一加入到一個模板中 , 修改模板的其是某一項的監控項

引數和告警閾值后 , 加入模板中的所有主機都會同步，如果單獨想修改其中某一臺服務器內

存告警閾值 , 需要進入這臺主機 , 單獨創建一個告警 Triggers, 關聯這臺主機監控記憶體的項 ,

配置好告警的閾值為 60% 即可實作，

12.報警型別和故障處理：

1.E-mail 郵件 2.微信報警等

故障：如監控服務器down機不報警

解決：1.先定位問題：zabbix服務器采用輪詢的方式從監控目標機的agent獲取資料，但如果目標機down了，目標機的agent通常也無法作業，所以檢查被監控的主機服務

2.增加一個目標主機進行是否存活的檢測，

告警收斂:

1)所有產生告警均由zabbix呼叫腳本推入快取redis當中，

2)分析系統將在規定時間（1分鐘）內去redis中拉取資料，根據定義好的一系列規則進行，合并、分析或直接丟棄，并存入分析平臺資料庫，以便供歷史查詢，

3)根據預先定義好的規則將報警通過定義好的方式發送給相關人員，

13.告警屏蔽:

1、處于維護中的主機，告警資訊還是會報出來，但是不會觸發動作；

2、對于可預知的臨時維護或緊急維護，可以提前設定告警屏蔽；

3、可針對組、單臺或多臺主機，進行一次性、每日定時、每月定時、每周定時屏蔽；

4、前端可以將維護中的主機不進行顯示，Dashboard右上角有個圖示可以進行篩選是否顯示維護中的主機；

5、告警屏蔽時，可以設定采集資料或不采集資料兩種方式；

至此，zabbix的告警屏蔽介紹完成，

轉載請註明出處，本文鏈接：https://www.uj5u.com/ruanti/305632.html

標籤：其他

上一篇：【歷史上的今天】10 月 4 日：計算機先驅阿塔納索夫出生；卡巴斯基創始人誕生；谷歌推出 Google Pixel 手機

下一篇：Shell面試題