企業のシステムの管理において、インシデント管理を適切に進めることは非常に重要です。一方でインシデント管理は、問題管理と混同されることが多々あります。システム運用においてこの2つには明確な違いがあり、これを理解することでより迅速なインシデント管理や適切な問題管理ができるでしょう。
本記事では、システム運用におけるインシデント管理と問題管理の違いについて紹介します。インシデント管理や問題管理について理解を深めたい方、悩みを抱えている方は、ぜひ参考にしてください。
インシデント管理と問題管理の主な違いは目的
インシデント管理と問題管理の主な違いは、その目的です。
インシデント管理の目的は、応急処置として迅速にシステムを復旧し、事業への影響を抑えることです。一時的な回避策を打ち、スピーディーにシステムの復旧をしますが根本的に不具合が解消されたわけではありません。
対して問題管理の目的は、インシデントの根本原因を特定し解決策を見出すことです。問題管理を適切に行い恒久対策に取り組むことで、未知のインシデント発生や一度起きたインシデントの再発防止を期待できます。
システム運用におけるインシデント管理とは
まずはインシデント管理について紹介します。
そもそもインシデントとは、システムの稼働において発生する問題のことを指します。そして、そのインシデントを正しく管理することをインシデント管理というのです。
インシデント管理では何らかの原因によりインシデントが発生した場合、企業運営に与える影響を最小限にするために迅速なシステムの復旧対応を行います。インシデントの根本的な原因を調査するよりも、一時的な回避策を活用したスピーディーな応急処置が求められているのです。
インシデント管理の業務工程は、主に以下の4つです。
- インシデントの受付、発生の検出
システムのアラートによりインシデントの発生を検出。復旧に向けて対応を開始します。 - インシデントの分類、優先度付け
過去の事例を参考にインシデントを分類し、緊急度や重要度から判断し優先度を付けます。 - インシデントの調査、解決
インシデントサポート担当者を割り当てたらインシデントの調査と診断をします。解決策を特定後に、システムを復旧。基本的には担当者が対応しますが、難しい場合はエスカレーションを行い責任者が対応するケースもあります。 - インシデントのクローズ
インシデントが解決できていることを確認できたら関係者へ報告し、インシデントをクローズします。
インシデント管理の課題
企業の正常な運営に関わるインシデント管理は、情シス担当者にとって非常に重要な業務です。しかし、様々な課題に頭を悩ませている現場も多いようです。ここでは、インシデント管理においてよくある課題を紹介します。
同じインシデントが何度も発生してしまう
インシデント管理においてよくある課題が、同じインシデントの再発です。インシデントが再発した場合は、過去に起きた原因や解決策など蓄積された情報を活用して素早いインシデントへの対応、そしてその情報から同じインシデントが起きないよう対応することが必要とされています。しかし、過去のインシデントに関する情報の共有や蓄積ができていないと、同じインシデントを繰り返す原因となるため業務担当者を決める、ワークフローを定めておくことが重要なのです。
属人化、知識不足などにより社内体制が不安定
インシデントの対応には専門的な知識や高度なスキルが必要です。しかし、多くの企業ではそうした専門知識を持つ人材が不足しているといわれています。そのため十分な対応ができない、少数の担当者で対応するため知見や技術が共有されず属人化してしまうといった課題を抱えているのです。こうした状況では、適切なインシデント管理は困難でしょう。
専門知識や高度なスキルをすぐに身に着けることはなかなかできないため、ノウハウや情報の共有を円滑に行える社内体制を整えておくことが大切です。
インシデント管理と問題管理の違いを理解していない
インシデント管理と問題管理の違いを理解していないことには、適切なインシデント管理の対応は難しいでしょう。インシデント管理の目的は応急処置、問題管理の目的は恒久対策ということからわかるように、それぞれの対応は異なります。応急処置を行う必要があるインシデント管理では対応までのスピード感が重視されるため、原因の解決に時間をかけてしまうと迅速な対応ができなくなってしまいます。このように、目的の違いを理解していないと適切な対応が難しいため注意が必要です。
問題管理とは
問題管理とは、インシデントを起こした原因の根本的な原因を調査し、恒久対策をすることです。インシデントを解消して終了ではなく、再び同じインシデントが発生しないように対処します。問題管理では、システムのさらなる安定利用を目指し、時間をかけてでも根本原因を究明することが求められているのです。
問題管理の業務工程は、主に以下の4つです。
- 問題の識別、記録
まずは問題を洗い出し、記録する業務です。インシデントの再発を防ぐため、解決すべき問題を記録します。 - 問題の分類、優先度付け
洗い出した課題すべてを一度に対応することは難しいため、記録した問題を分類して業務に与える影響や、緊急度から問題に優先度をつけます。 - 問題の調査、解決
優先度の高い問題を調査し原因を特定し、問題解決の対処をします。 - 既知のエラーに関する記録の作成
すでに解決した問題の根本原因と、回避策、解決策を既知のエラーとして記録します。記録しておくことで、将来的に問題が再発しインシデントが起きた際に、対応する時間の大幅な削減が見込めるのです。
問題管理が重要なタイミング
インシデントは発生しないことが一番望ましいですが、絶対に発生しない環境にするのは難しいといえます。しかし、再発の可能性を下げる対応は可能です。インシデントの再発を防ぐために、問題管理が重要となる場面を紹介します。
過去に一度も起きたことがないインシデントが発生した時
過去に一度も起きたことがないインシデントは、問題管理の対象です。
前項で紹介したとおり、問題とは不都合を引き起こす可能性のある未知の根本原因のため初めて起きた未知のインシデントは、問題管理が必要になります。同じようなインシデントの発生を防ぐために、問題の原因を根本から解決することが重要です。
すでに解決済みのインシデントが発生した時
解決済みのインシデントの発生も問題管理が重要な場面といえます。
過去に一度対応し有効だった対策でも、時間が経過し使用や設定の変更、技術などの変更・更新により対策が不十分になっている可能性があります。過去のインシデントと同じでも、現状に合わせた対応をする必要があるのです。
一方で、過去の問題管理が不十分だったケースもあります。この場合は、過去と同じ対策をしても意味がないため問題管理のプロセスを見直した方がよいでしょう。
インシデント管理の課題の改善策
頭を悩ませる課題が多いインシデント管理ですが、フローをしっかり構築することで解決する可能性が高まります。質の高いインシデント管理ができるように、情シスの体制を整えることが重要です。
他にも、システム管理をまるごとアウトソーシングするという解決策があります。情シス担当者の負担を軽減するだけでなく、専門知識のあるプロが運用設計や監視・障害対応などを代行するため、より高度な管理が可能になるのです。
さらに、テクバンの運用保守・監視・障害支援に関するアウトソーシングサービス Techvan Remote Center の参考資料をご用意しております。ぜひご参考ください。
【事例】柔軟なメニューで実現できた。24時間365日、有人リモート監視で 情シスの負担軽減
もうアウトソースで悩まない。インフラ運用保守を上手に委託する方法
違いを理解して適切な対応を目指す
インシデント管理と問題管理の違いや、担当者が抱える課題について紹介しました。
2つの違いをしっかり理解することで、応急処置なのか、再発防止の対応なのかといった何を目的に対応すればよいのかが明確になります。インシデント管理によってインシデント対応のノウハウや情報を蓄積・共有し、根本的な原因を調査、そして最終的に問題解決につなげましょう。
担当者が抱える課題の解決策として紹介したように、アウトソーシングすることで問題解決へ近づく場合もあります。興味のある方は、ぜひご検討ください。