Zabbix5.0の障害の確認、クローズについて

投稿者: | 2020-11-01

前回はZabbixのテンプレートについて解説しました。今回は、Zabbixで障害を検知した際の内容の確認、障害のクローズの方法について解説します。

障害検知・対応について

Zabbixではテンプレートのトリガーで設定した条件式に一致すると、障害としてダッシュボードへの表示やWebインターフェースのアラート通知、ユーザー設定のメディアに通知します。

Zabbixで障害の表示、通知を確認したら、監視対象のホストに何かしらの問題が発生しているため、該当のホストの状態を確認し状況に応じた対応を行ってください。

障害対応のフローに関しては、現場によって変わりますが一般的なフローとしては、以下のような流れになります。

  1. 監視ツール、メール等の通知にて障害を検知
  2. 現状把握、影響範囲を確認
  3. 関連部署・担当者へ連絡
  4. 復旧作業
  5. 復旧後、障害報告書の作成、再発防止策の実施

障害対応は素早さと正確さ、状況に応じて柔軟さが求められるため、数をこなして実際に障害が起きた際に対応できるようにしておきましょう。

障害内容の確認

Zabbixで障害内容を確認するには、Zabbixのダッシュボードの「監視データ > 障害」から、確認する障害の時間をクリックします。

イベント詳細画面ではトリガーの詳細やイベントの詳細、アクション結果を確認することができます。

Zabbixでは障害内容を確認したかどうかのステータスがあります。確認済のステータスを変更するには、該当の障害にチェックを入れ「一括更新」をクリックします。

「障害確認」にチェックを入れ「更新」をクリックします。

障害の確認済ステータスが「はい」に変更されたことを確認します。

障害のクローズについて

Zabbixの障害のクローズは、自動でクローズを行う場合と手動でクローズする場合があります。

自動でクローズを行う場合は、復旧作業後にZabbixのチェックが正常であれば障害は自動でクローズします。手動でクローズを行う場合は、Zabbixのダッシュボードから該当の障害を選択し手動でクローズします。

多くの場合、自動でクローズさせるケースがほとんどですが、正常の確認を行う間隔が長い場合、すぐに改善できない障害等、正常性の確認を行いにくい場合には手動でクローズを行うこともあります。

手動でクローズをする場合

Zabbixで障害を手動でクローズするには、Zabbixのダッシュボードの「監視データ > 障害」からクローズする障害にチェックを入れ「一括更新」をクリックします。

「障害のクローズ」にチェックを入れ「更新」をクリックします。

障害がクローズされたことを確認します。少し時間が経つと、Zabbixのダッシュボードから障害が消えます。

※参考
Zabbixの障害を手動でクローズするには、テンプレートのトリガー設定時に「手動クローズを許可」の項目を有効にする必要があります。「手動クローズを許可」が無効の場合、障害を手動でクローズすることはできません。