Reading Time: 1 minutes

「アプリケーション監視ツールは高価である」という時代はもうすぐ終わるかもしれない。低価格な製品が登場している。とは言え、安かろう悪かろうではユーザーを不幸にするだけだ。要件を満たせた上で、かつ低価格でなくては価値はない。一方、クラウド化が進む今、その要件は多様化するばかりである。今回話を伺った日揮株式会社(以下、日揮)も例外ではなかった。Webシステムが「何か遅い」。その原因を特定するための調査を迅速化した秘訣を紐解く。

日揮株式会社

[業種]プラント・エンジニアリング
[所在地]〒220-6001 横浜市西区みなとみらい2-3-1
[設立]1928年(昭和3年)10月
[URL]www.jgc.com/jp/

世界80カ国以上2万件のプロジェクトを展開

日揮は、80年以上にわたりプラント・エンジニアリング業界を牽引してきたリーディングカンパニーである。その範囲は、日本、アジア、中近東、アフリカ、北米、南米、欧州など世界80カ国以上、件数にして2万件にも及ぶプロジェクトを成功に導いてきた。

「オイルやガスなどのエネルギー分野の印象が強いかもしれませんが、電力、水、医療等のインフラ分野にも進出し、実績を残しています」と、日揮 経営統括本部 コーポレートIT室 PMSチーム 喜多陵氏は説明する。

お写真
[写真]日揮 経営統括本部 コーポレートIT室 PMSチーム 喜多 陵 氏

その日揮のシステム開発と運用を担っているのが富士通エンジニアリングテクノロジーズ株式会社(以下、FETEC)である。FETECは1983年に日揮の情報システム部門として独立し、2016年3月に富士通グループに仲間入りして日揮情報システムという名称から改称した。「富士通の先進的な技術力と日揮のプロジェクトマネジメントや設計の方法論を融合し、さらにお客様に貢献していくためです」と、FETEC J-SYS事業本部 ビジネスサービスマネジメント部 第2チーム 遠藤圭子氏は富士通グループ参加の目的を語る。

監視ツールの乗り換えに至った背景

日揮がリソースやパフォーマンスの統計、アプリケーション動作監視のためのツールを導入したのは2007年にさかのぼる。ほとんどの業務が電子化され、基幹システムの複雑化・巨大化が進み、運用の効率化と安定稼働のため、監視業務の集約化が求められた。

監視対象となるシステムは大きく分けて2つ、同社の基幹業務であるPMS(プロジェクト管理システム)と全社システムだ。特にPMSは、プロジェクトの設計(Engineering)、調達(Procurement)、建設(Construction)の各業務を支えるシステムであり、これらの遅延や障害の発生は、お客様はもちろん、パートナー各社などへの影響が大きく、決して許されない。

当時、システムの監視は先進的な技術で、必要とする企業も一部の大企業に限られていた。このためツールの数は少なく、高価なものしかなかった。

しかし、監視ツールの需要の増加にともない、多くのベンダーから製品が提供されるとともに、低価格化が顕著となった。「この流れにともない、当社内でもそれまで運用していた製品の費用対効果が指摘されるようになりました」と喜多氏は振り返る。

ツールの見直しが本格化したのは2016年からだ。この頃、同社ではデータセンターのサーバー利用と平行してクラウドインフラの利用が活発化していた。

ツール選定の要件を喜多氏は次のように語る。「まずランニングコストを落とせること。次に既存ツールの機能を継承していること。具体的にはサーバーのパフォーマンス監視とリソース監視。それから、数が増えたことで一部しか監視できていないJavaアプリケーションとOracle DBのパフォーマンスを監視できること。さらに、現在開発中のシステムなど今後クラウド上に増えていくシステムを、既存のデータセンターにあるシステムと合わせて同じ場所から見られることでした」。

候補製品30点から1点に絞り込むまで

製品選定チームがまずはインターネット上の情報から候補となる製品を抽出。それは30製品にも及んだ。それらの機能を十分に調べた後に10製品以下に絞り込み、5~6社になってからはより詳細に必要な機能を洗い出し、一覧表にして各製品ベンダーの担当者にヒヤリングを開始した。

「この中にはゾーホージャパンの提供するManageEngine OpManager APMプラグイン(単体製品名:ManageEngine Applications Manager。以下、APM)の他、数製品が含まれていました」と、遠藤氏は語る。このヒヤリングで候補をさらに絞り込み、2017年に入ってからAPMの評価版をダウンロード、本格的に検証を開始した。

FETECの遠藤氏はAPMを推した理由について、「投資対効果の要件はお客様である日揮の判断によるところが大きいのですが、開発側としてはエージェントレスなど導入構築時に工数削減できる点を特に魅力に感じていました。必要な機能が揃っているのですぐに監視を開始できるという印象で、とにかくとっつきやすかったです。また、評価版の稼働を開始してからも管理画面の操作性がなじみやすく、これならお客様に受け入れられると感じました」と語る。

2017年3月にAPMと合わせて「Java Webトランザクション解析オプション」を購入。同年7月には、クラウド上に開発している新システムの本番稼働前の負荷テストや動作検証にも活用することを目的に「.Net Webトランザクション解析オプション」も購入している。

購入後すぐに構築を進め、同年8月には最優先して進めてきたデータセンターにあるPMSと全社システムの監視、本番運用を開始している。「構築はこれまで大きな問題もなくスケジュール通りに進みました」と喜多氏は語る。

監視規模とサーバースペック

監視している内容についても詳しく聞いた。「インフラ層はサーバーが物理、仮想合わせて70台くらい。アプリケーション層は、Javaアプリケーションが70本にOracle DBが10台です。近日、.Netアプリケーション1本とMS SQLサーバー1台を追加する予定です。サーバーは今後の監視対象の拡大も考慮し、仮想マシン上でCPUを4vCPU、メモリを8GB、ディスクを200GB程度割り当てています。」とFETECの遠藤氏は説明する。

構成図イメージ
[図1]日揮の監視構成図 ※製品画面はイメージです。

調査を迅速化できた秘訣 その1

次に構築時に工夫した点について聞いた。「初期に監視対象となったシステムを担当する日揮の管理者数は、PMSと全社システム合わせて最大10名程度です」(喜多氏)。「2つのシステムには大小さまざまなアプリケーションが存在します。また、インフラ管理者とアプリケーション管理者が異なるため、FETECの管理者の数は最大50名ほどになります」(遠藤氏)。合わせて60名いるその全員がAPMの管理画面を見る機会がある。役割や担当するシステムはさまざまだ。管理者を大きくタイプに分けると次の5つになる。

  1. 日揮のPMS管理者
  2. 日揮の全社システム管理者
  3. FETECのインフラ管理者
  4. FETECのPMSアプリケーション管理者
  5. FETECの全社システムアプリケーション管理者

当然それぞれ見たい情報が異なる。そこで、APMで権限の異なるアカウントをタイプ毎に作成し、起動後に表示される管理画面、いわゆるダッシュボードに表示される情報をカスタマイズした。こうすることで、各管理者が自分に割り当てられたアカウントでAPMにログインすると自分の担当しているシステムの状態を素早く把握できるようになった。次のアクションを決めるために必要な判断を迅速化できるわけだ(図1参照)。

「システム遅延など問題が発生していることを検知したら、まず日揮の管理者が自分のダッシュボードで状況を把握し調査します。その範囲で解決できない場合はFETECにエスカレーションします。FETECの管理者には自身のダッシュボードから原因の特定と解決に向けて動いていただくという体制をとっています」(喜多氏)。

調査を迅速化できた秘訣 その2

次に気になるのは調査時にどのような情報をどのような順番で見ているかだ。アプリケーションにボトルネックがあった場合を例に遠藤氏は次のように説明する。「ダッシュボードに設定して頻繁に見るものとしては、各システムのリソースの状況とスクリプト監視機能で取得した値をグラフ化したアクセス数などです」。日揮の管理者はそれを見てもアプリケーションの問題までは特定できない。報告を受けてFETECのアプリケーション管理者は「まずOracle DBのメモリの使用率やセッション数などの変化を示すグラフや表領域の状態などデータベースの監視項目を確認します」。情報が一か所にまとまっているためこれに要する時間は10分もかからない。そこにも異常が見られなかった場合はアプリケーションそのものに問題があると判断する。「APMのWebトランザクション解析オプション機能(図2参照)で、アプリケーションのどの処理に時間がかかっているか、また、アプリケーションのDBへのどのSQLが遅いのかをドリルダウンしながら確認することでボトルネックを特定します」。

インフラ層からアプリケーション層まで、この幅広い監視ポイントと日揮(エンドユーザー)とFETEC(SIer)の連携、そして何よりFETECの技術力の高さと調査ノウハウこそが素早いシステム遅延のボトルネック特定を実現する秘訣と言えそうだ。
「APMの良いところは、データベースの様々な項目を監視できるようプリセットされているだけでなく、アプリケーションからデータベースまで縦串で一貫した監視を、多くのカスタマイズを要することなく実現できる点だと思います」と遠藤氏は付け加える。(図2、図3参照)

[図2]Webトランザクション解析画面
[図2]Webトランザクション解析画面 ※製品画面はイメージです。

[図3]Webトランザクション解析 詳細トレース画面
[図3]Webトランザクション解析 詳細トレース画面 ※製品画面はイメージです。

システム保守費80%を削減

ここまでの話で、APMに移行してから以前と比べてかなり多くのアプリケーションやデータベースをよりきめ細かく監視できるようになったことがわかる。普通に考えたらコストは上がりそうだが、どれほど削減できたのだろうか。「年間のシステム保守費は80%削減できました。これは社内で高く評価されています」。話を聞いていた一同は驚きを隠せなかった。喜多氏はそれを見て笑顔を見せる。

ゾーホージャパンの技術サポートに対する評価はどうだろうか。「採用前はもちろん、構築段階のころから度々質問を投げかけています。その都度、わかりやすい説明がタイムリーに返ってくるので助けられています」と遠藤氏は答える。

また今後の展開については、「社内での横展開を進めます。例えば設計システムやCAD、プロジェクトごとのサーバーなど、監視システムの対象を増やしていく予定です」と喜多氏は語る。

最後にAPMの導入を検討している方々へのアドバイスをお伺いした。「ちょうど当社はオンプレミスからクラウドへとシステムの軸足を移行する時期に重なっていました。同様のフェーズを迎えている企業は多いと思います。クラウド時代に移行する過渡期の今、広範なシステムの監視にAPMは大変価値のある選択だと思います。すでにAPMなしにはプロジェクトの遂行は不可能になっています。そのプロジェクトを円滑に安定して進めるための最適なソリューションと言えます。自信を持っておすすめします」と喜多氏は訴えた。(終)

※この記事は、2017年11月06日に「TechTarget ジャパン」に掲載されたものです

 

アプリケーションパフォーマンス監視ソフトウェア「Applications Manager」の概要を見る

 

本記事のリーフレット版(PDF)をダウンロードする

 


フィードバックフォーム

当サイトで検証してほしいこと、記事にしてほしい題材などありましたら、以下のフィードバックフォームよりお気軽にお知らせください。