モニタリングのアラーム設定方法¶
モニタリングにおけるアラームの設定方法について説明いたします。
モニタリングのアラームを新規設定するには、モニタリングコントロールパネル上で「アラーム一覧」を選択し、アラーム一覧画面から「作成」または「一括作成」をクリックします。
モニタリングのアラームの新規設定においては、下記の4つの項目を設定します。
基本情報設定 | お客様でアラームを管理するためのアラーム名やその説明を記載 |
アラームの条件 | 各リソースおよびメーターに対する閾値を設定 |
アラーム発生時のアクション | アクションを発動する条件(閾値を超過または下回った場合)および
アクション種別(メール通知またはAPIのPOST)、
アクション内容(通知先アドレスまたはAPIリクエスト文)を設定
|
高度な設定 | アラームに関する統計方法の設定
高度な設定では、次の5項目を設定することができます。
* 生成範囲・・・統計情報を生成する範囲を秒単位で指定します。
* 統計方法・・・統計方法の種別を選択します。(count/sum/avg/min/max)
* 評価回数・・・取得した統計情報に対して評価を行う回数を指定します。
* 評価タイプ・・・アクションの実行条件を指定します。(行った全ての評価で条件に当てはまった場合に実行するときは "and" を、1 回でも条件に当てはまった場合に実行するときは "or" を選択します。)
* 繰り返し通知・・・アラームの繰り返し通知の有無を選択します。(繰り返し通知有に設定すると、ALARM状態継続中は5分毎にアラームアクションが実行されます。)
1回でも閾値を上回った/下回った場合にすぐアラームアクションを実行したい場合は、高度な設定は不要です。
|
注釈
死活監視のメーターは、正常(active)=0、故障(down)=1を示します。
注釈
アラーム発生時のアクション数の上限は1アラームあたり5つまでです。
注釈
アラーム通知先のアドレスで利用可能な記号は「.」「_」「-」のみとなります。
注釈
アラーム通知先のPOSTリクエストで指定可能なアドレスの条件は下記となります。
- インターネットから通信可能
- 255文字以下
- URI形式
- プロトコルが以下のいずれか
http
https
ここでは、先ほど作成したサーバーインスタンス(CentOS_Tutorial)のCPU高負荷時のアラームと、インスタンス停止時のアラームの2つを設定します。
CPU高負荷時のアラーム設定例¶
ここでは、「CPU使用率が80%を超過した場合にメール通知」のアラーム設定例についてご説明します。
「CPU使用率が80%を超過した場合にALARM状態と判定」を条件として設定し、「ALARM状態に遷移した場合にメールで通知する」を条件に合致した際のアクションとして設定します。
注釈
上記例において、ALARM状態からOK状態に遷移した場合(CPU使用率が80%を下回った場合)にもメール通知を実施したい場合は、「③アクションを設定」においてOK状態におけるアクションを追加する必要があります。
注釈
「③アクションを設定」は、入力後に必ず「+追加」ボタンをクリックし、「追加済みアラームアクション一覧」に追加してください。
さらに、高度な設定による「5分毎のCPU使用率が、2回連続で80%を超過した場合にメール通知」のアラーム設定例についてご説明します。
「過去450秒間のCPU使用率の最小値(min)が閾値の80%を超えた場合にALARM状態と判定」と設定します。
注釈
この設定例では、現在時刻と300秒前の2つのサンプル値をアラームの判定対象とします。
CPU利用率のメーターは300秒間隔で監視していますが、モニタリングの監視間隔には数秒の誤差があるため、
300秒前のサンプル値をアラーム判定対象に含むには生成範囲を300+150(監視間隔の1/2)=450秒に設定します。
また、CPU利用率が80%を超過してからアラームがALARM状態に遷移するまでに少なくとも10分かかります。
インスタンス停止時のアラーム設定例¶
ここでは、「対象のサーバーインスタンスが停止状態になった場合にメール通知」のアラーム設定例についてご説明します。
「サーバーインスタンス死活監視のメーターが1(停止状態)の場合にALARM状態と判定」を条件として設定し、「ALARM状態に遷移した場合にメールで通知する」を条件に合致した際のアクションとして設定します。
注釈
サーバーインスタンス死活監視(VirtualMachineStatus)のメーターにおいて、インスタンス停止状態を示す値は1です。
注釈
上記設定例において、ALARM状態からOK状態に遷移した場合(インスタンスが起動状態に戻った場合)にもメール通知を実施したい場合は、「③アクションを設定」においてOK状態におけるアクションを追加する必要があります。
注釈
「③アクションを設定」は、入力後に必ず「+追加」ボタンをクリックし、「追加済みアラームアクション一覧」に追加してください。
さらに、高度な設定による「1分毎に収集しているサーバーインスタンスのステータスが、3回連続で停止状態になった場合にメール通知」のアラーム設定例についてご説明します。
「過去150秒間のサーバーインスタンス死活監視のメーターの最小値(min)が1(停止状態)の場合にALARM状態と判定」を設定します。
注釈
この設定例では、現在時刻、60秒前、120秒前の3つのサンプル値をアラームの判定対象とします。
サーバーインスタンス死活監視のメーターは60秒間隔で監視しておりますが、
モニタリングの監視間隔には数秒の誤差があるため、120秒前のサンプル値をアラーム判定対象に含むには生成範囲を120+30(監視間隔の1/2)=150秒に設定します。
また、サーバーインスタンスが停止してからアラームがALARM状態に遷移するまでに少なくとも3分かかります。
複数リソースへのCPU高負荷時とインスタンス停止時のアラーム一括設定例¶
アラーム一括設定機能では、単一リソースへの複数アラームの一括設定や、複数リソースへの同一アラームの一括設定ができます。
ここでは、複数のサーバーインスタンス(Ubuntu_Tutorial、RHEL_Tutorial)への「CPU使用率が80%を超過した場合にメール通知」、「対象のサーバーインスタンスが停止状態になった場合にメール通知」のアラームを一括で設定します。