マルチクラウド・ハイブリッドクラウド時代に求められる基幹システムの監視運用

マルチクラウド・ハイブリッドクラウド時代に求められる基幹システムの監視運用

 基幹システムにおいて切っても切れないのが 「監視運用」の課題だ。

 DX時代においても、その重要性は変わらない。しかしながら、変わらないのは「重要性だけ」であることに注意したい。

 時代の変化に伴い、監視運用の考え方についても刷新する必要があり、本記事では、その点について解説していく。

▼ 目次
なぜ監視が必要なのか
従来型の監視とDX時代の監視
DX時代の監視を支える統合監視ツール

1. なぜ監視が必要なのか

 監視の目的は主に2つあるが、今回ここで取り上げる監視とは、RASISで言うところの可用性を指す。

 さて、エンドユーザがシステムを使用する上で一番ストレスを感じるのはどんな時だろうか?

 答えは、システムを使用したい時に使用することができない、期待できる性能を満たしていない時である。

 これを回避するために監視が必要となる。


 次に、どのような監視が必要になるだろうか?

 以下の監視が必要となる。

  • リソースに対する監視
    • システムの死活監視はもちろん、CPU使用率、メモリ、ディスク、ネットワーク等に対して閾値を設け、インフラストラクチャーの観点からシステムが健全に使用できるかを監視する
  • アプリケーションの処理に対する監視
    • アプリケーションの処理が正常終了しているか、想定された時間で処理が終了しているか、を指す

2.従来型の監視とDX時代の監視

 DX時代の監視は何が違うのか。DX時代の監視を話す前に、まずは従来型の監視についておさらいしておきたい。

 従来型の監視を一言で言うと、完全掌握型である。まず監視を実行するシステム自体がオンプレミスであり、監視対象もまたオンプレミスである。対象となる全システムの管理者権限を持っているため、監視対象であるシステムにエージェントをインストールし、監視システムに情報を集約する、というスタイルとなる。

 では、DX時代の監視はどうだろう?


 まず押さえておきたいのは、システムの利用形態が多様化しているということである。

 従来のようにオンプレミスの環境だけ監視すれば良い、という話ではなくなっているというのがポイントである。

 ここでポイントとなるのは下記である。

2-1.IaaS

 以前より仮想マシンの技術は存在していたが、Amazon Web Servicesを始めとするクラウドサービスプラットフォームの台頭により、欲しいときに欲しい分だけリソースを調達することが可能となった。

 ハードウェアのリソースの増強や縮小も思いのまま、作業のリードタイムが限りなく0に近くなり、システムのダウンタイムなしで対応できることも増えている。これはオンプレミスのシステムと比べると画期的なことである。

 IaaSの登場により、システムの構築=自前でハードウェアを購入する、という従来の概念が覆された。

 IaaSでは、OSより上の部分については管理者権限を持ち合わせており、自前で用意したエージェントをインストールし、オンプレミス環境と同等の情報を監視システムに連動が可能である。



2-2.SaaS

 システムのサービス部分のみを利用するという形態であり、OSレベルでの管理者権限は付与されない。

 それどころか、OS部分のレイヤーに関する情報は参照すらできないことも多い。

 インフラ部分の管理をサービス提供事業者にお任せできる、というメリットは大きいが、反面、サービス提供時間に融通が利かないというデメリットも存在する。

 OSレベルの管理者権限がないということは、当然のことながら自前でエージェントを用意してインストールするということはできない。



2-3.PaaS

 アプリケーションが動作するための環境・基盤を提供するサービスのこと。

 SaaSとは異なり、基盤上に自由にアプリケーションを配置することが可能である。環境が保証されているので開発者は動作環境を意識しなくて良いというメリットがある。

 Cloud Foundry等が有名であるが、OS部分のレイヤーについての管理者権限は持ち合わせていない。



表 1. 各サービスでの管理者権限の有無

マルチクラウド・ハイブリッドクラウド時代に求められる基幹システムの監視運用
○. 管理者権限を有するレイヤー。エージェントをインストールする為にはOSレイヤーの管理者権限が必要
(敢えて細かい表現は避けています)




 DX時代の監視における一番の課題は「監視の統合と集約化」である。

 DX時代の監視は、従来型の監視に加えてインターネット上に分散しているシステムを監視する必要がある。

 システム毎に監視を行うのは大変煩雑であり、運用コストも嵩んでしまう。

 また、サービスを横断して監視ができることも重要となる。

 従来型の監視は、DX時代の監視においてはあくまで一要素に過ぎないことを認識する必要がある。

 ここで登場するのが統合監視システムである。

マルチクラウド・ハイブリッドクラウド時代に求められる基幹システムの監視運用
図 1. 従来型の監視
マルチクラウド・ハイブリッドクラウド時代に求められる基幹システムの監視運用
図 2. DX時代の監視

3. DX時代の監視を支える統合監視ツール

 統合監視ツールとは何か?

 統合監視ツールとは、一言でいうと、DX時代に対応した次世代型の監視ツールのことである。

 従来型の「オンプレミスシステムの監視」に加え、IaaS・SaaS・PaaSに対応し、システム間を横断して監視データを参照できるという特徴を持つツールである。製品によって様々な機能があるが、主な機能は、以下4つとなっている。

3-1. インフラストラクチャーの監視

  • オンプレミス、及び、IaaSシステムにおける、エージェントベースの監視
  • 主に従来型の監視ツールで参照できる、CPU使用率やメモリ使用率、ディスク使用量などのデータが参照可能

3-2. 外形監視(Synthetics)

  • 特定のスクリプトを実行し、アプリケーションやAPIなどの応答時間をチェックする機能
  • エージェントがインストールできないSaaSやPaaSの環境に対して、一定間隔でアクセスを試み、システムがダウンしていないかをチェックすることも可能

3-3. ダッシュボード

  • 参照したい情報を纏め、「1画面」で参照できる機能
  • 複数のシステムを横断し、かつ欲しい情報を欲しい切り口で参照することが可能
  • 例えば、システム管理者、運用メンバー、監視担当者で欲しい情報は異なるが、利用者の属性に合わせた画面を作成し、利用することができる
マルチクラウド・ハイブリッドクラウド時代に求められる基幹システムの監視運用
図 3. ユーザの属性ごとに求められる画面

3-4. APM アプリケーションモニタリング

  • 個別にアプリケーションの挙動詳細を見ることができる機能
  • 挙動を丸裸にすることができ、どの部分の処理がボトルネックになっているかを容易に特定可能
  • また、異常終了した際に、一連の処理の中のどこで問題が発生したかをビジュアル的に特定することができたりもする
  • 基幹システムからAPIでデータ抽出し、データ加工して印刷用のSaaSサービスに送る処理で、印刷用のSaaSサービスへのデータ送信が失敗した時などが例として挙げられる



表 2. APMが利用可能な環境

マルチクラウド・ハイブリッドクラウド時代に求められる基幹システムの監視運用
※アプリケーションのデプロイ時にAPMのエージェントを含められることが必要

最後に

 監視運用に求められている要求が日々高度化していく中で、統合監視ツール自体も日々進化を遂げ、機能拡張され続けている。まだまだ発展途上のジャンルではあるが、既に十分実用に耐えうる性能に達しており、DX時代の監視運用に切っても切れない要素となることは間違いないだろう。今後のアップデートについて注目していきたい。

 次回連載では、SAP を中心とした UI/UX の課題と技術について焦点を合わせ解説していく。

関連記事を読む
お問合せ