情シス運用サポートBlog

2023.09.27

企業の事業継続性、信頼性にもつながる「DR対策」をあらためて解説

関連サービス
ITインフラ構築

目次

業務の大部分がITシステムに依存しているケースも多い現代のビジネスにおいて、企業が安定して事業を継続していくためには、BCPの一環としてDR対策も重要です。緊急時の対応を事前に講じておくことで、システム障害による影響や損失を最小限に抑えられます。

この記事では、DR対策の基本知識と考え方、具体的な対策などを解説。BCPとの違いや、ITシステム復旧の3つの指標であるRTO・RPO・RLOについても詳しくお伝えします。

トラブルは最小限に! サーバー、ネットワーク 管理を最適化するポイント

システム運用時の重要課題である「DR対策」とは

DR対策の「DR」は、Disaster Recovery(ディザスタリカバリ)の略で、日本語に訳すと「災害復旧」という意味になります。DR対策とは、災害復旧対策のことを指し、災害が発生した場合に備えて、迅速にシステムを復旧させるための手段や体制を整えておくことを意味するのです。

ここでいう災害には、地震や台風、雷などの自然災害だけでなく、大規模停電やテロ、サイバー攻撃なども含まれます。このような災害でシステムが停止すると事業継続できず、大きな損害が発生する可能性も。具体的には、「顧客にサービスの提供ができない」「オンラインシステムやECサイトが利用不可となる」「工場の生産がストップする」など、様々な影響が懸念されます。
ビジネスにおけるITシステムの利用が一般化した現代では、DR対策は欠かせないものとなっているのです。

DR対策と「BCP対策」の違い

よく混同されがちなBCPとDR対策、この2つの用語の違いを知っておくことは重要です。どちらも災害からの復旧を目指すという目的は同じですが、対象の範囲に違いがあります

それでは、それぞれの違いを詳しく解説します。

  • BCP
    BCPは、Business Continuity Planning(ビジネスコンティニュイティプランニング)の略で、日本語では「事業継続計画」と訳されます。BCPとは、災害発生時の総合的な復旧対策であり、緊急時に企業が事業を継続するための方針、手段、体制などを取りまとめた計画です。事前に、優先すべき重要業務の洗い出しやリスク分析、具体的な復旧対応の検討、指示系統の明確化などを行うことで、災害による影響の最小化が狙いとされています。
  • DR対策
    一方、DR対策は、前述したように災害発生時のシステム復旧を目的とします。BCPもDR対策も災害時の対応を策定したものですが、BCPが事業継続を目的とした総合的な復旧計画であるのに対し、DR対策はシステムの復旧・修復に重点を置いています。

システム復旧計画はBCPにも含まれるため、BCPの中にDR対策が存在していると理解しておくとよいでしょう。

DR対策で大切となる考え方

そもそもDR対策は、なぜ必要とされているのでしょうか。ここでは、DR対策が重要視される理由や、対策を講じる上で必要となる指標について解説します。

DR対策状況は企業の信頼性に直結する

自然災害やサイバー攻撃によってシステム障害が発生すると、その影響は顧客や取引先にも及びます。システム復旧に時間がかかれば、利益損失につながるだけでなく、企業の信頼性を損ねてしまう可能性があるのです。

例えば、システム停止によって製品の出荷ができない状態が長引くと、取引先にも大きな損害が発生します。今後の契約に影響が出たり、場合によっては何らかの賠償を求められるリスクも想定できるでしょう。また、企業が運営するサイトやシステムが度々ダウンすれば、顧客は不信感を抱き、別のサービスに乗り換えるなどの顧客離れにつながるおそれがあります。

災害が発生した非常事態においても、事業継続や早期復旧ができる企業は、顧客や取引先から高く評価されます。DR対策を万全にすることは、企業の信頼性向上にも貢献するのです。

RPOとRTO、RLO

DR対策を講じる上で重要な指標が、「RPO」「RTO」「RLO」です。
これらは「3つのR」と呼ばれ、システム復旧における目標値となります。災害発生に備えて、3つの指標を設定しておく必要があります。

  • RPO:Recovery Point Objective/目標復旧時点
    「過去のどの時点までデータを復旧させるか」の目標値
  • RTO:Recovery Time Objective/目標復旧時間
    「どのくらいの時間でシステムを復旧させるか」の目標値
  • RLO:Recovery Level Objective/目標復旧レベル
    「どのレベルでシステムを復旧させるか」の目標値

RPO

RPO(Recovery Point Objective)は、日本語で「目標復旧時点」を意味します。災害発生でシステムが停止した場合に、過去のどの時点までデータを復旧させるかの指標になります。言い換えると、いつの時点のバックアップファイルを復元するかということです。

RPOの設定値は、業種や業務内容によって様々です。例えば、証券取引や金融機関などリアルタイムでの情報更新が求められるシステムでは、RPOを0秒に設定しなければなりません。0秒とは、災害でシステムが停止する直前の時点を指します。
一方、更新頻度の低いシステムやデータに完全性を求めない場合では、RPOを24時間や数日などに設定するケースもあります。

RTO

RTO(Recovery Time Objective)は、日本語で「目標復旧時間」を意味します。災害発生から、どのくらいの時間でシステムを復旧させるかの指標です。例えば、RTOを24時間に設定した場合、24時間以内のシステム復旧を目指すことになります。

RTOの設定値は、事業内容やシステムの規模によって異なります。ライフラインに関わるものなど、人々の生活に大きな影響を与えるシステムであれば、可能な限り短時間での復旧が求められるでしょう。
システム停止の状態が長期化すれば、企業だけでなく取引先や顧客への影響が拡大し、機会損失や信頼失墜などのダメージが大きくなります。そのため、RTOの設定値は短い方が理想です。
とはいえ、RTOを短縮するとその分コストが増大します。社会的な影響や予算を考慮した上で、現実的な復旧時間を設定しましょう。

RLO

RLO(Recovery Level Objective)は、日本語で「目標復旧レベル」を意味します。どのレベルでシステムを復旧させ、運用を再開するかの指標です。
災害発生時には、すべてのシステムを早期に完全復旧させることは困難です。そのため、復旧するシステムに優先順位を付け、重要なシステムがある程度復旧した段階で、暫定的に運用を再開していく手法がとられます。

例えば、A、B、Cの3つのシステムがあり、復旧レベルを0%(システム停止)~100%(通常稼働)で考える場合、RLOは以下のように設定します。

  • Aシステム:優先度高、RLO50%、RTO24時間で暫定運用を開始
  • Bシステム:優先度中、RLO50%、RTO48時間で暫定運用を開始
  • Cシステム:優先度低、A、Bシステムが暫定運用後に本格復旧したら、復旧作業を開始

通常、RLOはRTOとセットで考えます。まず、RLOで「どのレベルで復旧させるのか」、RTOで「どれくらいの時間内に復旧させるのか」を策定します。上の例でいうと、Aシステムは、24時間以内にシステムの処理能力を50%のレベルまで復旧させて暫定運用を開始する、という意味合いになります。

具体的なDR対策手順

ここからは、DR対策の具体的な方法とポイントを紹介します。

まずはBCPを策定する

まずやるべきことは、BCP(事業継続計画)の策定です。災害によって起こり得るリスクや復旧の手順を事前に把握しておけば、緊急時でも迅速かつ適切に対応できます。

BCP策定の手順は以下の通りです。

  1. BCM(事業継続マネジメント)の基本方針を策定する
  2. BIA(ビジネスインパクト分析)を実施して、災害による事業への影響度を評価する
  3. リスクの洗い出しと分析を行い、具体的な復旧対策を検討する
  4. 決定事項を整理し、事業継続計画書を作成する

事業継続計画書には、BCMの基本方針や被害想定から、災害時の対応フロー、業務復旧の優先順位、システム復旧の指標(RTO・RPO・RLO)、緊急時の体制、さらには事前対策や教育・訓練の実施計画まで含まれます。

IT人材を確保する

DR対策を推進するためには、ITに関する知識とスキルが豊富な人材を確保する必要があります。BCP策定の場面においてもIT人材は欠かせません。
社内にIT部門を持たない企業など、IT人材が不足する場合はアウトソースやソリューションサービスの活用を検討するのもよいでしょう。

緊急時の社内体制・連絡手段を整える

災害でシステム障害が発生した場合に、各自がどのような対応を行うのか、事前に取り決めておくことが大切です。緊急時の社内体制や連絡体制を整備し、マニュアル化しておきましょう。「誰に報告するか」「どこへ連絡するか」など、連絡先や対応手順がすぐに把握できれば初動から迅速に対応できます。緊急時の対応について、社員に周知することも必要です。

大規模な災害が起きると、電話やインターネットなどの連絡手段が使えない可能性があります。そのような事態を想定した対応フローも準備しておくと、有事の際にも混乱を防げるでしょう。

RLO(目標復旧レベル)をどの程度にするのか検討する

災害でシステム障害が起きたときを想定して、RLOを事前に検討しておきましょう。システムをどの程度まで復旧させるのか、どの段階で運用再開とするのかを決めておきます。災害時に、すべてのシステムを早期復旧させるのは困難なため、事業への影響度が高いシステムから優先的に復旧させていきます。

前章でも紹介しましたが、災害時のシステム復旧には、3つの指標「RTO」「RPO」「RLO」が用いられます。例えば、「RTO=24時間、RPO=0秒、RLO=50%」というような形で目標を設定します。このケースでは、災害発生から24時間以内に(RTO)、システム停止直前のデータで(RPO)、通常の50%の処理に対応できる状態に(RLO)復旧させる、という意味になります。

クラウドサービス・データセンターなどバックアップの仕組みを導入しておく

クラウドサービスやデータセンターに重要なデータのバックアップをしておけば、災害時におけるデータ破損・紛失のリスクを抑えられます。サーバー自体を移すことも有効な対策のひとつです。万が一、災害によって自社で運用するシステムやデータが損失してしまった場合でも、外部にバックアップがあれば復旧が可能です。

クラウドサービスやデータセンターを選ぶ際は、セキュリティの堅牢性や耐災害性に注目するとよいでしょう。

BCPとすり合わせながら最終検討する

災害による影響を最小化し、早期復旧を実現するためには、事業全体の復旧を見据えたBCPと、システム復旧に特化したDR対策の両方が重要となります。災害を想定してシミュレーションを行い、必要な情報が網羅されているか、内容に不備がないかといった最終チェックを行いましょう。

基本的にBCPやDR対策は、災害時における社内の運用体制を整備するために作成するものですが、顧客や投資家など外部に公開することもあります。専門知識を有する社外のコンサルタントにBCP策定の依頼をしたり、DR対策についてのアドバイスを求めたりするのもよい方法です。

DR対策におけるよくある課題

DR対策にはいくつかの課題やデメリットがあります。代表的なものを見ていきましょう。

対策の種類によっては導入・運用にコストがかかる

DR対策の導入と運用にはコストがかかります。復旧の質を上げるためには、新しいシステムの構築や大掛かりなシステム改修が必要になることもあるでしょう。また、データセンターを利用してサーバーの二重化を行えば、運用に継続的なコストが発生します。DR対策が重要であるとわかっていても、コスト増大や予算の都合で導入に踏み切れない企業も多いようです。

コストを抑えながらDR対策を行う方法として、クラウドサービスを活用する方法があります。比較的低コストで導入・運用が可能なため、まずはクラウドサービス主体の対策を検討してみるのもおすすめです。

社内のデジタル化が進められていない場合は時間と人材が必要になる

社内のデジタル化が進んでいない企業では、時間と人材の確保が大きな課題となります。
DR対策の導入には、社内のデジタル化が欠かせません。書類や資料を紙ベースで管理しているといったアナログな方法で業務を行っている企業では、まずデータのデジタル化やITツールの導入などからスタートするため、DR対策の実施までに長い時間を要することになります。

また、DR対策を進めるにあたって、IT分野に精通した人材の確保が必要です。優良な人材の獲得からIT部門の新設まで、やるべきことは多岐にわたります。

クラウドファイルサーバーをはじめ、DR対策はテクバンにお任せください

テクバンでは、ITの課題を解決に導く様々なソリューションを提供しています。「災害に備えてシステム体制を強化したい」「自社に適したクラウドサービスを導入したい」といったDR対策に関するご相談から、サーバーやネットワークの運用監視、即戦力となるITエンジニアの派遣、IT環境整備のためのマネジメントまで幅広く対応しています。
どのようなご相談でも、まずはお気軽にお問い合わせください。

なお、テクバンでは、Microsoft Azure導入支援サービスOracle Cloud Infrastructure(OCI)導入支援サービスAmazon Web Services(AWS)導入支援サービスなど各種クラウドサービスの導入・運用支援サービスも提供しています。
詳細は、以下の資料をご参照ください。
ITインフラの課題解決に役立つ資料のダウンロードはこちらから

不測の事態に備え、万全なDR対策を

この記事では、DR対策の基本知識と考え方、具体的な対策について解説しました。自然災害やサイバー攻撃によるシステム障害は、いつ発生するかわかりません。損失を最小限に抑え、早期復旧を果たすには、DR対策を万全にしておくことが肝心です。

大規模災害などの非常時において、事業継続やシステムの早期復旧を実現すれば、顧客や取引先の信用維持が可能です。社会的信頼の獲得や企業価値の向上も期待できるでしょう。

お気軽に
ご相談ください