ESXi6.5u3/6.7u3でHWアラームが大量に誤発生する

vSphere

2023年3月16日 (2023年3月17日:更新)

事象概要

ESXi 6.7 Update 3 において、ESXi ホストで Sensor -1 タイプのハードウェア健全性アラームの誤発生が確認されております。
(VMware社の情報ではESXi6.5 Update 3でも同様の事象が発生する可能性があるということです。)

これにより、vCenter Server システムでハードウェア センサーの状態アラームのメール通知を設定している場合に、メール アラートが過剰に送信される場合があります。

この影響として、これらのメールによって、統計情報、イベント、アラーム、およびタスク (SEAT) ディレクトリが 95% のしきい値を超えた場合に、vCenter Server データベースでストレージの問題が発生し、vCenterサービスにアクセスできなくなる等の問題が発生する可能性があります。
 

対処方法

問題を回避するためには、以下のリリース以上にアップデートしてください。(ESXiホストの再起動が必要となります)

該当のパッチがダウンロードできない場合は、チケットにてお問合せください。

・ESXi 6.5 P07 (ビルド番号:18678235/2021年10月リリース) 
(関連情報)VMware ESXi 6.5、パッチ リリース ESXi650-202110001

・ESXi 6.7 EP 13 (ビルド番号:15018017/2019年11月リリース)
(関連情報)VMware ESXi 6.7、パッチ リリース ESXi670-201911001

暫定対処方法(ESXiホストにパッチを適用しない方法)

以下の1) または2) を実行することで問題を回避できます。

1)WBEMサービスの無効化

WBEMサービスを無効化することで、問題を回避できます。
※WBEMサービスを無効化すると、ハードウェア健全性のステータスを確認できなくなります。

ESXiホストにSSH接続して以下のコマンドを実行します。
esxcli system wbem set --enable false
ESXi ホストが再起動され、サードパーティ プロバイダーが存在する場合、WBEM サービスは再起動後に自動的に有効化されます。再度無効化するには再起動の後に上記を再実行してください。

なお、再起動のたびにWBEMサービスが有効化されるのを回避するには、以下を実行します。
chkconfig sfcbd-watchdog off

2)アラートメール送信の制限

WBEMサービスの無効化をしないで、大量のアラートメールが送信されるのを回避するには、以下の設定を実行して、アラートメールの送信を制限します。

    1. vSphere Clientを用いてvCenter Serverにログインします。
    2. vCenter Serverを選択して、構成をクリックします。
    3. アラーム定義をクリックします。
    4. 「ホストハードウェアセンサー状態」のアラーム名を選択します。
    5. 「編集」>「次へ」をクリックします。
    6. アラームルール選択で「引数の追加」をクリックします。
    7. 引数でセンサー番号を選択し、オペレーターで「開始しない」を選択し、アラートのトリガーとなるセンサー番号を「-1」と指定します。
    8. 「次へ」をクリックし、「保存」をクリックします。

(参考)VMware社 KB
Excessive Hardware health alarms being triggered for “Sensor -1 type” on ESXi hosts running vSphere 6.7/6.5 (74607) (vmware.com)

 

更新履歴

更新日 更新内容
2023年3月16日 初版