Reading Time: 1 minutes
サーバやネットワークの管理者は、パフォーマンスの問題発生時にアラート通知を受け取りますが、時に、そのアラートが結局間違いであったとわかることがあります。一定期間にわたり間違ったアラート通知を繰り返し受け取ると、管理者は苛立ち、そのうちにアラート通知を無視したいと考えざるを得なくなります。しかしながら、アラート通知が正しい可能性もあり、ただ単に全てのアラート通知を無視することは得策とはいえません。
もし、監視ツール自身で間違ったアラートを差し止めて、正しいアラートのみを表示することができれば、素晴らしいと思いませんか?
実は、統合アプリケーション監視ツール「ManageEngine Applications Manager」では、そのような設定が可能です。設定方法に関して、いくつかの例でご紹介します。
例 1:
外部 URL を5分おきに監視しており、その応答時間は3000 msとしてレポートされました。一方で、URLの平均応答時間は250msです。管理者は、応答時間に対してしきい値を設定し、応答時間がそのしきい値より大きい場合にアラームを生成し、メールやSMSの送信によってアラーム通知を受け取ることができます。
しかしながら、過度な帯域利用が原因で、URL 応答時間が 3000 ms に達するのは、一日に一度か二度です。管理者は、ピーク時間帯のトラフィックはURL応答時間の増大が原因だと考えられることを把握しており、応答時間のしきい値超えによるアラート通知を電子メールによって受け取ります。
このような既知のアラート通知を差し止めるために、管理者は「トライポール(Polls to try)」オプションを設定することができます。このオプションは、全ての監視に対して一括設定するか、または、各監視に対して個別に設定することができます。
以下に、いくつかのスクリーンショットを紹介します。URL監視における、可用性と応答時間を表示しています。:
アラームの設定(Configure Alarms) -> アドバンストオプションの表示(Show Advanced Options) をクリックし、監視のダウンをレポートするまでの連続ポール回数を設定します。これが、可用性の「トライポール(Polls to try)」設定です。
このオプションを、全ての監視に対して一括設定するには、管理(Admin) -> アクション/アラート設定(Action/Alarm Settings)から設定します。
次のスクリーンショット(英語)では、応答時間の7日間レポートを表示しています。ご覧の通り、一定期間ごとに一時的な数値の上昇が確認できます。このレポートをドリルダウンして、数値の上昇が記録された時間を調べることが可能です。
次のスクリーンショットでは、応答時間のしきい値に対して、「トライポール(Polls to try)」を一括設定する方法を紹介します。
「トライポール(Polls to try)」設定を属性レベルで行った場合、全ての監視に対する一括設定は無効になります。
HTTP(s) URL シーケンス監視 と リアルブラウザ監視 に対して、同様の設定が可能です。
例 2:
サーバのメモリ使用量では、様々な原因により、一時的な数値上昇をレポートする可能性があります。しきい値超えによって生成されたアラームは、「トライポール(Polls to try)」設定によって、アラーム生成を抑制することができます。
上図の「応答時間のしきい値」に関するスクリーンショットに表示されているように、「トライポール(Polls to try)」オプションを設定することができます。
今回ご紹介した方法以外に、Applications Managerにおけるアラーム管理の改善方法を思いついた方は、是非教えてください!お気軽にコメント欄にご投稿ください。
■統合アプリケーション監視ツール 「Applications Manager」:
http://www.manageengine.jp/products/Applications_Manager/
>> 試用版をダウンロードできます!(30日間無料、技術サポート提供可)
=> http://www.manageengine.jp/products/Applications_Manager/download.html
なお、このブログは、米国本社(ZOHO Corporation)のManageEngine Blogsを翻訳・加筆したものです。
フィードバックフォーム
当サイトで検証してほしいこと、記事にしてほしい題材などありましたら、以下のフィードバックフォームよりお気軽にお知らせください。