多くのITプロフェッショナルは、人工知能(AI)と機械学習をビジネス課題に応用するという任務を背負っている。これは、製品やサービスを改善できるのではないかという期待があるからだ。一方、新しいアプローチである「AIOps」は、厄介なIT運用の問題に機械のインテリジェンスを適用するものだ。
提供:Joe McKendrick
Constellation Researchが最近発表したレポートでは、AIOpsはIT運用の現状を改善し、長年に渡って積み重なってきたアーキテクチャーのスパゲッティを解きほぐすのに有効だと主張している。このレポートの著者であるAndy Thurai氏は、「ITリーダーは、効率化という大きな課題に直面している。これは、彼らがあまりにも多くのツールを抱え、サイロ化されてしまっているからだ」と述べている。「データが断片化しているのに加えて、多くのツールが同じイベントに対して複数のアラートを発生させているため、『アラート疲れ』が起きている」
Thurai氏は、「AIOpsは、AIを使ってIT運用を強化するものだ」と説明している。「一部の誤解とは異なり、AIOpsはIT運用によってAIを改善するものではなく、むしろその逆だ」
同氏は、AIOpsはITチームの生産性を改善する可能性を持ったツールであると述べ、IT運用の複雑性を管理するために、AIOpsの採用を検討すべき理由を7つ挙げている。
- IT運用のノイズ、アラート疲れの軽減。「今日のITチームは、間違ったアラームによって発生するノイズの量や、1つのインシデントにあまりにも多くのアラートが出ることによって疲弊してしまっている」とThurai氏は述べ、「ノイズの量が多すぎると、アラート疲れが起きてしまう場合がある」と指摘する。同氏によれば、AIOpsは、このノイズを80~90%減らすことに寄与できると推定されるという。
- 根本原因分析のスピードアップ。Thurai氏は、今日のマルチクラウド環境やハイブリッド環境では、「インシデントを引き起こす原因となったイベントを特定することは極めて難しい」と述べ、「根本原因分析の最も大きな問題は、スタック全体にわたって同時に発生しているログや、指標や、トレースをつなぎ合わせることだ」と説明している。AIOpsは、異常の原因を浮き彫りにするのに役立つ。また、AIOpsのソリューションは、「インシデント時のタイムラインを、発生時から順番に示すことができる」という。