モニタリングのアラーム設定方法

モニタリングにおけるアラームの設定方法について説明いたします。
モニタリングのアラームを新規設定するには、モニタリングコントロールパネル上で「アラーム一覧」を選択し、アラーム一覧画面から「作成」または「一括作成」をクリックします。
アラーム設定方法

モニタリングのアラームの新規設定においては、下記の4つの項目を設定します。

基本情報設定 お客様でアラームを管理するためのアラーム名やその説明を記載
アラームの条件 各リソースおよびメーターに対する閾値を設定
アラーム発生時のアクション
アクションを発動する条件(閾値を超過または下回った場合)および
アクション種別(メール通知またはAPIのPOST)、
アクション内容(通知先アドレスまたはAPIリクエスト文)を設定
高度な設定
アラームに関する統計方法の設定
高度な設定では、次の5項目を設定することができます。
* 生成範囲・・・統計情報を生成する範囲を秒単位で指定します。
* 統計方法・・・統計方法の種別を選択します。(count/sum/avg/min/max)
* 評価回数・・・取得した統計情報に対して評価を行う回数を指定します。
* 評価タイプ・・・アクションの実行条件を指定します。(行った全ての評価で条件に当てはまった場合に実行するときは "and" を、1 回でも条件に当てはまった場合に実行するときは "or" を選択します。)
* 繰り返し通知・・・アラームの繰り返し通知の有無を選択します。(繰り返し通知有に設定すると、ALARM状態継続中は5分毎にアラームアクションが実行されます。)
1回でも閾値を上回った/下回った場合にすぐアラームアクションを実行したい場合は、高度な設定は不要です。

注釈

死活監視のメーターは、正常(active)=0、故障(down)=1を示します。

注釈

アラーム発生時のアクション数の上限は1アラームあたり5つまでです。

注釈

アラーム通知先のアドレスで利用可能な記号は「.」「_」「-」のみとなります。

注釈

アラーム通知先のPOSTリクエストで指定可能なアドレスの条件は下記となります。
- インターネットから通信可能
- 255文字以下
- URI形式
- プロトコルが以下のいずれか
http
https

ここでは、先ほど作成したサーバーインスタンス(CentOS_Tutorial)のCPU高負荷時のアラームと、インスタンス停止時のアラームの2つを設定します。

CPU高負荷時のアラーム設定例

ここでは、「CPU使用率が80%を超過した場合にメール通知」のアラーム設定例についてご説明します。
「CPU使用率が80%を超過した場合にALARM状態と判定」を条件として設定し、「ALARM状態に遷移した場合にメールで通知する」を条件に合致した際のアクションとして設定します。
CPU Utilizationの設定例

注釈

上記例において、ALARM状態からOK状態に遷移した場合(CPU使用率が80%を下回った場合)にもメール通知を実施したい場合は、「③アクションを設定」においてOK状態におけるアクションを追加する必要があります。

注釈

「③アクションを設定」は、入力後に必ず「+追加」ボタンをクリックし、「追加済みアラームアクション一覧」に追加してください。

さらに、高度な設定による「5分毎のCPU使用率が、2回連続で80%を超過した場合にメール通知」のアラーム設定例についてご説明します。
「過去450秒間のCPU使用率の最小値(min)が閾値の80%を超えた場合にALARM状態と判定」と設定します。
高度な設定の例

注釈

この設定例では、現在時刻と300秒前の2つのサンプル値をアラームの判定対象とします。 CPU利用率のメーターは300秒間隔で監視していますが、モニタリングの監視間隔には数秒の誤差があるため、 300秒前のサンプル値をアラーム判定対象に含むには生成範囲を300+150(監視間隔の1/2)=450秒に設定します。
また、CPU利用率が80%を超過してからアラームがALARM状態に遷移するまでに少なくとも10分かかります。

インスタンス停止時のアラーム設定例

ここでは、「対象のサーバーインスタンスが停止状態になった場合にメール通知」のアラーム設定例についてご説明します。
「サーバーインスタンス死活監視のメーターが1(停止状態)の場合にALARM状態と判定」を条件として設定し、「ALARM状態に遷移した場合にメールで通知する」を条件に合致した際のアクションとして設定します。

注釈

サーバーインスタンス死活監視(VirtualMachineStatus)のメーターにおいて、インスタンス停止状態を示す値は1です。

VirtualMachine Instanceの設定例

注釈

上記設定例において、ALARM状態からOK状態に遷移した場合(インスタンスが起動状態に戻った場合)にもメール通知を実施したい場合は、「③アクションを設定」においてOK状態におけるアクションを追加する必要があります。

注釈

「③アクションを設定」は、入力後に必ず「+追加」ボタンをクリックし、「追加済みアラームアクション一覧」に追加してください。

さらに、高度な設定による「1分毎に収集しているサーバーインスタンスのステータスが、3回連続で停止状態になった場合にメール通知」のアラーム設定例についてご説明します。
「過去150秒間のサーバーインスタンス死活監視のメーターの最小値(min)が1(停止状態)の場合にALARM状態と判定」を設定します。
高度な設定の例

注釈

この設定例では、現在時刻、60秒前、120秒前の3つのサンプル値をアラームの判定対象とします。 サーバーインスタンス死活監視のメーターは60秒間隔で監視しておりますが、 モニタリングの監視間隔には数秒の誤差があるため、120秒前のサンプル値をアラーム判定対象に含むには生成範囲を120+30(監視間隔の1/2)=150秒に設定します。
また、サーバーインスタンスが停止してからアラームがALARM状態に遷移するまでに少なくとも3分かかります。

複数リソースへのCPU高負荷時とインスタンス停止時のアラーム一括設定例

アラーム一括設定機能では、単一リソースへの複数アラームの一括設定や、複数リソースへの同一アラームの一括設定ができます。
ここでは、複数のサーバーインスタンス(Ubuntu_Tutorial、RHEL_Tutorial)への「CPU使用率が80%を超過した場合にメール通知」、「対象のサーバーインスタンスが停止状態になった場合にメール通知」のアラームを一括で設定します。
アラーム一括設定の例