このエピソードの続き。
ESXiをUSBメモリからブート
ESXi監視で大ハマリ (1) - RAIDを構築
ESXi監視で大ハマリ (2) - 警告ランプで監視
ESXi監視で大ハマリ (3) - コマンドで監視(A)
ESXi監視で大ハマリ (4) - コマンドで監視(B)
DELLから提供されている、OpenManage Server Administrator および OpenManage Essentials を使用して、ESXi のアラート監視をトライしてみる事にする。
まず、ESXiには、OpenManage Server Administrator 用のVIBをインストールする。
インストールの前に、ESXi をメンテナンス・モードに切り替える必要があり、インストール後は ESXi の再起動が必要になる。
~ # esxcli software vib install -d /(path)/OM-SrvAdmin-Dell-Web-7.4.0-876.VIB-ESX55i_A00.zip
続いて、ESXi 上に Windows Server 2008 R2 をインストールし、これを監視サーバとする。
DELLのサイトから、OpenManage Server Administrator を含むISOイメージをダウンロードし、監視サーバにインストール。
問題なくインストール完了。
物理ドライブの状態、シリアルナンバーなども表示された。
OpenManage Server Administrator は、サーバの状態を表示する事はできるが、エラーを検出したらメールを発信するなどの監視機能は無い。
そこで、監視機能を持つ OpenManage Essentials をインストールする。
DELLのサイトから OpenManage Essentials をダウンロードし、監視サーバにインストール。
チュートリアルに従ってSNMPなどを初期設定。
サーバの検出を実行してみる。
が…「VMWare ESX Servers」として認識はされたものの、「?」が付いている。
ハードウェアの情報も、ほとんど取得できていない。
これでエラーを検出できる状態なのか?
OpenManage Essentials で、「管理」→「アラート」で、アラート監視を追加、電子メールを送信するように設定する。
ESXi 上から、SNMPにテスト送信を実行してみる。
~ # esxcli system snmp test
OpenManage Essentials は、まったく反応しない。
もちろん、メールも飛んでこない。
OpenManage Server Administrator で、「温度」の警告のしきい値を変更し、強制的に警告が出る状態にしてみる。
設定を変更した OpenManage Server Administrator だけでなく、vSphere Client でもエラーが検出された。
OpenManage Essentials でも検出するはずだ。
しかし、OpenManage Essentials は、まったく反応しない。
サーバの筐体の蓋を開けてみる。
OpenManage Server Administrator、vSphere Client では、サーバの筐体の蓋が開いたことが検出された。
しかし、OpenManage Essentials は、まったく反応しない。
監視サーバに、SNMPマネージャーをインストールして、SNMPの受信状態を確認してみると、アクションを起こしたタイミングで、何かを受信しているのを確認できる。
(A)は、esxcliコマンドでのテスト送信したタイミング。
(B)は、温度のしきい値を変更して、エラー状態にしたタイミング。
(C)は、温度のしきい値を元に戻し、通常の状態に回復したタイミング。
(D)は、筐体の蓋を開けたタイミング。
(E)は、筐体の蓋を閉じたタイミング。
SMNPは間違いなく何かを受信しているが、OpenManage Essentials は、まったく動作しない。
何だこれ?
一連記事: