技術・機能解説、ノウハウ|オンプレxクラウド運用管理
AIOpsとは|AI活用によるITシステム運用の負荷軽減
企業システムの運用はかつてない程に複雑化しており、情報システム部門の運用負荷は飛躍的に高まっています。
こうした中、IT運用のためのAI活用「AIOps」が注目を集めています。
そこで、システム運用の負荷を軽減する次の一手「AIOps」について解説します。
▼ 目次
・AIOpsとは
・AIOpsへの期待が高まっている理由
・AIOpsプラットフォームを構成する3つの領域
・急拡大しつつあるAIOps市場
1. AIOpsとは
AIOpsとは「AI for Operations」の略であり、直訳すれば「IT運用のためのAI活用」ということになります。
この言葉を使い始めたのは、数多くIT用語とコンセプトを提唱してきたガートナー社であり、同社はその定義を次のように述べています。
- AIOpsとは、ビッグデータと機械学習を組み合わせ、イベントの相関関係や異常の検知、因果関係の判定といったIT運用プロセスを自動化するものである
- 原文
- AIOps combines big data and machine learning to automate IT operations processes, including event correlation, anomaly detection and causality determination.
AIOps が登場したのは6年前の2016年頃です。ガートナーが2021年11月に発表した「日本におけるITオペレーションとDevOpsのハイプ・サイクル:2021年」では「黎明期」の終盤、「過度な期待のピーク期」の直前に位置づけられています。
図 1. ハイプサイクル概要図
- 補足 : ハイプ・サイクルとは
- ハイプサイクルとは、横軸を「時間の経過」、縦軸を「市場からの期待度」とし、市場からの期待度が時間とともにどのように変化するのかを示した曲線を指す
- 曲線は低いところから大きく上昇し(黎明期)、その頂点に達し(過度な期待のピーク期)、その後一気に下降して期待度がいったん底をつく(幻滅期)、再び緩やかに上昇(啓発期)、安定した状態に至る(生産性の安定期)という線を描く
先程の位置づけは1年前のものなので、現在のAIOpsは「過度な期待のピーク期」に入りつつあると推測されます。
いわばいま最も「旬な」コンセプトの1つなのです。
2. AIOpsへの期待が高まっている理由
なぜAIOpsへの期待が高まっているのでしょうか。
それは冒頭でも述べたように、企業ITがマルチクラウドへのシフトで複雑化し、人による運用では追いつかなくなっているからです。
一般的に、オンプレミスのシステムはハードウェアとアプリケーションの関係が固定的であり、システム構成はハードウェア更改時か、大規模なアプリケーション展開の時にしか変化しないものでした。
このようなシステムの運用は比較的単純であり、何が起こるのかもある程度までは予測できます。
監視を行う場合でも、これまでの経験にもとづいて必要なデータを各種ログなどから収集し、事前に設定したしきい値によって異常を検出する、といった方法で対応できます。
しかしマルチクラウド化したシステムにおいては、この方法では不十分です。
主な理由は次の通りです。
- DX推進に伴ってシステムを構成する要素が短時間で増える傾向があり、運用対象はどんどん変化し続けているため
- 特にコンテナ化されたクラウドネイティブ型のシステムでは、どこでどのコンテナが動いているのかも、刻々と変化する可能性がある
このように「変化し続けるシステム」を人手で運用し続けるには、膨大な人的リソースが必要になってしまうのです。
そこで登場したのが「システム運用にAIを活用しよう(AIOps)」という発想です。
AIが常に運用対象のシステムの状況を学習し、その学習結果に基づいて適切な閾値を設定できるようになれば、変化し続けるシステムにも追随しやすくなります。
またシステムで発生したインシデントの分析や、問題原因の究明、対処の自動化まで実現できれば、自律的なシステム運用が可能になり、運用担当者の負荷を大幅に軽減できるようになります。
3. AIOpsプラットフォームを構成する3つの領域
AIOpsを実現するための基盤を「AIOpsプラットフォーム」と呼びます。
このプラットフォームは、大きく3つの領域(ドメイン)で構成されています。
3-1. 観測、監視
AIであろうと人間であろうと、システムを運用するには下記が不可欠です。
- 「システムで何が起きているのか」を観測
- 「システムで問題が発生していないかどうか」を監視
その中には、各コンポーネントの動きを記録するログや、パフォーマンスの計測、イベント間の関連性、トレース情報、異常検知などが含まれます。
人間が観測・監視する場合には、適切な運用に必要な最小限の情報を、正確かつピンポイントで収集することが重要になります。
必要以上のアラートの存在は、情報システム担当者の負荷を増大させる上、重要なアラートを見えにくくし、結果的に対処が遅くなるという弊害をもたらすからです。
これに対してAIの場合には、その心配はありません。
より多くのデータを収集することで、それらを学習のための教師データとして活用することも可能になります。
3-2. ITサービスマネジメント
ITサービスマネジメントとは、観測・監視によって得られた情報からインシデントの分析を行い、問題原因を特定することです。
複数のインシデントが発生している場合には、どのインシデントへの対処を優先するか、といった優先順位付けも必要になります。
3-3. オートメーション
オートメーションはインシデントに対する対処を、AIによって自動化することです。オートメーションには、大きく2つのレベルが考えられます。
- ITサービスマネジメントの段階でインシデントへの対処方法と優先度をAIが示し、それに対して人間が承認を行う
- ビジネスへの影響度合いや影響範囲が広く、リアルタイムでの対処が求められない場合には、このレベルのオートメーションが適している
- AIが即座に対処を行う
- 例えばマルウェアに感染したコンポーネントが発生した場合には、このレベルで迅速に感染コンポーネントを切断する
4. 急拡大しつつあるAIOps市場
AIOpsを導入することで、システム運用の負荷軽減が期待できます。
理由は、システムで発生している各種インシデントをAIで分析し、その結果がインシデントへの対処方法としてレコメンドされるようになれば、膨大なアラートをチェックし続ける必要がなくなり、対処方法の検討も不要になるからです。
これによってインシデントへの対応は、かつてなかったほどに迅速化されるでしょう。
またAIが適切な学習を行っていればレコメンドされる対処内容も適切なものになり、人間が判断することで発生するヒューマンエラーも排除できます。
このようなメリットは、多くのIT部門にとって歓迎すべきものだと言えます。
AIOpsの市場規模も急速に拡大していくと予測されています。
- 株式会社アイ・ティ・アール(ITR)の予測
- 2020年度に44億円だったAIOpsの市場規模は、2022年度に59億円、2026年度には111億円になる(https://www.itr.co.jp/company/press/220609pr.html)
- 株式会社グローバルインフォメーションの予測
- AIOpsの世界的な市場規模は年率21%で成長し、2027年には195億ドルになる(https://www.gii.co.jp/report/kbv1037543-global-artificial-intelligence-it-operations.html)
両社の予測値にはかなりの乖離がありますが、ITRの予測は「運用自動化」という、AIOpsの一部を扱っているからだと考えられます。
いずれにしてもAIOpsは今後急速に成長を遂げることになるでしょう。
AIOpsまでは必要ないと考えているIT担当者も、近い将来を見据えるのであれば、いまからしっかり理解しておくべきだといえます。
まとめ
本記事のポイントをまとめると以下のようになります。
- 「AIOps」というコンセプトは2016年頃に登場しており、2021年の段階で「過度な期待のピーク期」の直前にあり、いま最も旬なコンセプトの1つになっている
- AIOpsへの期待が高まっている背景としては、マルチクラウドへのシフトによって、システムの複雑性が増していることが挙げられる
- クラウドネイティブなシステムではシステム構成が動的に変化する可能性があるため、従来の定型的な監視・運用では対応できず、人手での運用にも限界がある
- AIOpsプラットフォームは大きく3つの領域(ドメイン)で構成されている
- 観測・監視
- ITサービスマネジメント
- オートメーション
- AIOpsの導入で運用の負荷が軽減し、対処の迅速化やヒューマンエラーの排除も期待できる。そのため市場規模も急拡大しつつある