Disaster Recovery -- warum Notfallwiederherstellung für Unternehmen überlebenswichtig ist
Disaster Recovery beschreibt die Maßnahmen, die eine schnelle Wiederherstellung nach einem Datenverlust in einem Unternehmensnetzwerk ermöglichen. In die deutsche Sprache übersetzt, bedeutet Disaster Recovery soviel wie Notfallwiederherstellung. Im Kern handelt es sich bei Disaster Recovery um eine Kombination aus einer Strategie und konkreten Aktionen, die zusammen eine geplante sowie zügige Wiederinbetriebnahme der Infrastruktur nach einem Systemausfall ermöglichen. Die Bedeutung von Disaster Recovery hat in den letzten Jahren dramatisch zugenommen. Organisationen sind heute mehr denn je auf funktionsfähige IT-Systeme angewiesen, und bereits kurze Störungen können zu erheblichen finanziellen Verlusten führen. Ein durchdachter Notfallwiederherstellungsplan ist daher für Unternehmen aller Größen unverzichtbar geworden.
1 Welche Szenarien führen zu einer Situation, die ein Disaster Recovery erfordern?
Als Desaster werden eine Reihe von Ereignissen definiert. Gemeinsam haben diese, dass sie zu einem Systemausfall oder einem Verlust führen und Schritte notwendig sind, um eine Recovery der Infrastruktur durchzuführen. Es werden technische, natürliche und menschliche Katastrophen unterschieden.
Technische Störungen und Hardware-Ausfälle
Als technische Störungen werden Ausfälle und Defekte in der Hardware oder Infrastruktur bezeichnet. Dazu gehören Stromausfälle, die den gesamten Betrieb lahmlegen können, oder Hardware-Defekte, die geschäftskritische Systeme betreffen.
Menschliche Bedrohungen und Cyberangriffen
Die Liste der menschlichen Bedrohungen reicht von Bedienungsfehlern der Mitarbeiter bis zu gezielten Angriffen von Cyberkriminellen. Diese sorgen vor allem dafür, dass Daten verloren gehen, wobei Teile oder die gesamte IT betroffen sein können. Besonders Cyberangriffen und Ransomware-Angriffe haben in den vergangenen Jahren massiv zugenommen. Ransomware verschlüsselt gezielt geschäftskritische Daten und kann ganze Organisationen für Wochen lahmlegen.
Naturkatastrophen und physische Bedrohungen
Zu den natürlichen Katastrophen zählen beispielsweise Überschwemmungen, Feuer und ähnliche Naturkatastrophen. Diese können im schlimmsten Fall dafür sorgen, dass die gesamte IT eines Standorts zerstört wird.
2 Wie sieht ein Plan für das Disaster Recovery aus?
Sowohl die Auslöser als auch die Konsequenzen einer Katastrophe sind sehr unterschiedlich. Dementsprechend vielseitig müssen auch die Maßnahmen für die Wiederherstellung aussehen. Alle diese Punkte müssen im DRP, dem Disaster Recovery Plan, berücksichtigt werden. Dieser legt Strategien, Methoden und Regeln fest, die im Notfall aktiviert werden.
Business Impact Analyse als Grundlage
Disaster Recovery basiert zu einem Teil auf Prävention. Der andere Part des Disaster Recovery sind die Reaktionen auf einen Ernstfall. Beide Punkte sind im DRP festgehalten. Aus diesem Grund ist der Notfallplan immer individuell für jedes Unternehmen ausgelegt. Den Anfang macht eine Business Impact Analyse. Diese listet alle Geschäftsprozesse und Funktionen in einem Unternehmen auf. Anschließend erfolgt eine Bewertung, wie wichtig einzelne Anwendungen, Systeme oder Prozesse für den Geschäftsbetrieb sind und welche Wechselwirkungen mit anderen Abläufen bestehen. Somit lassen sich die Kritikalität und Priorität für jeden Prozess sowie jedes System bestimmen.
Recovery Point Objective (RPO) und Recovery Time Objective (RTO)
Der DRP besteht aus zwei wesentlichen Kennwerten. Bei diesen handelt es sich um das Recovery Point Objective (RPO) sowie das Recovery Time Objective (RTO). Im RTO wird analysiert und festgelegt, welche Ausfallzeiten für einen Prozess akzeptabel sind. Die Ausfallzeit kann in einer Zeitspanne von Minuten bis Tagen festgelegt werden. Geschäftskritische Systeme, bei denen kein Ausfall akzeptabel ist, werden mit einer RTO von 0 definiert. Ein Beispiel hierfür wären Beatmungssysteme in einem Krankenhaus. Die RPO definiert die Menge an Daten, die im Falle einer Katastrophe maximal verloren gehen dürfen. Auch hier wird für jeden Prozess, jede Anwendung und jedes System eine eigene Bewertung vorgenommen. Dabei gilt, dass ein RPO von 0 möglich ist, wenn absolut keine Daten verloren gehen dürfen.
Geschäftskontinuität und Organisationsstrukturen
Die hier festgelegten Ziele legen dann die Rahmenbedingungen für die konkreten Maßnahmen im eigentlichen Disaster Recovery fest. Der DRP ist Teil der Business Continuity, wobei Letztere noch deutlich weiter in der Planung geht. In der Geschäftskontinuität geht es darum, den kontinuierlichen Betrieb unter allen Umständen zu gewährleisten beziehungsweise die kritischen Systeme zu identifizieren, die auf jeden Fall für die Aufrechterhaltung benötigt werden. Der zweite Teil des DRP bestimmt die Verhaltensweisen im Falle eines Vorfalls. Hier legt der Disaster Recovery Plan die verschiedenen Eskalationsstufen fest und bestimmt die Verantwortlichen sowie Meldeketten. Das entsprechende Team muss genau definiert sein, und die Mitarbeiter müssen wissen, wer im Notfall welche Aufgaben übernimmt. Auf diese Weise ist sichergestellt, dass die Entscheidungsträger, beispielsweise der Leiter der IT, sofort informiert werden, auch wenn diese nicht vor Ort sind. Auf diese Weise sollen die Auswirkungen einer Unterbrechung minimiert und eine schnelle Reaktion ermöglicht werden.
3 Welche Methoden kommen beim Disaster Recovery zum Einsatz?
Basierend auf dem Disaster Recovery Plan erfolgt die Auswahl und Implementierung von Gegenmaßnahmen. Hier wird einerseits vom Worst Case ausgegangen. Andererseits geht es darum, alle potenziellen Risiken zu identifizieren und zu berücksichtigen.
Backup-Strategien als Grundpfeiler
Am Beispiel eines Backups zeigen sich die Überlegungen, die in die Prävention fließen. Die Datensicherung ist eine wichtige Maßnahme im Disaster Recovery. Über eine Sicherheitskopie ist es möglich, ausgefallene Systeme oder verloren gegangene Daten in kurzer Zeit wiederherzustellen. In bestimmten Szenarien sind aber lokale Sicherheitskopien ebenfalls vom Verlust betroffen. Dies wäre beispielsweise bei einem Feuer im Gebäude der Fall. Solche Überlegungen fließen in den Disaster Recovery Plan mit ein und bestimmen die Auswahl der Lösungen.
Cloud-basierte Wiederherstellungsstrategien
Aus diesem Grund definiert das Disaster Recovery für den Kontinuitätsplan, dass mehrere Sicherheitskopien vorhanden sein müssen. Somit ist das Ergebnis eines Disaster Recovery Plans häufig, dass eine Sicherung in der Cloud notwendig ist. Mit einer Sicherung in der Cloud ist einerseits ein zusätzlicher Datensatz vorhanden, der im Falle eines Datenverlusts für die Wiederherstellung dient. Andererseits sind die Daten so auch räumlich getrennt vom Unternehmensstandort, was einen zusätzlichen Punkt der Anforderungen erfüllt.
DRaaS -- Disaster Recovery as a Service
Eine erweiterte Form des Cloud-Backups ist DRaaS. Die Abkürzung DRaaS steht für Disaster Recovery as a Service und beschreibt eine Dienstleistung, bei der die gesamte IT-Infrastruktur inklusive Daten auf einem Speicher in der Cloud gesichert werden. Mit diesen Eigenschaften erlaubt DRaaS eine schnelle und vollständige Wiederherstellung der eigenen Infrastruktur nach einem Katastrophenfall. Damit geht DRaaS über ein reines Daten-Backup hinaus, denn bei einer solchen Sicherung sind nur die reinen Daten gespeichert. DRaaS nutzt fortschrittliche Replikation, um eine kontinuierliche Kopie der gesamten IT-Umgebung zu erstellen. Dieser Ansatz ermöglicht es Unternehmen, ihre geschäftskritischen Ressourcen innerhalb kürzester Wiederherstellungszeit an einem alternativen Standort wiederherzustellen. Die Wiederaufnahme des Betriebs kann so in Minuten statt in Jahren erfolgen. Mit den Services von TelemaxX ist die Umsetzung von DRaaS möglich. Als Server Backup sind hier flexible Datensicherung nach den eigenen Anforderungen möglich. Die Intervalle der Backups für die einzelnen Anwendungen und Daten werden auf Basis der im RPO festgelegten Ziele definiert. So ist eine Synchronisation mit der Cloud möglich, wenn das Ziel eine RPO von 0 ist.
Aus diesem Grund definiert das Disaster Recovery für den Notfallplan, dass mehrere Sicherheitskopien vorhanden sein müssen. Somit ist das Ergebnis eines Disaster Recovery Plans häufig, dass eine Sicherung in der Cloud notwendig ist. Mit einer Sicherung in der Cloud ist einerseits ein zusätzlicher Datensatz vorhanden, der im Falle eines Datenverlusts für die Recovery dient. Andererseits sind die Daten so auch räumlich getrennt vom Unternehmensstandort, was einen zusätzlichen Punkt der Anforderungen erfüllt.
Eine erweiterte Form des Cloud-Backups ist DRaaS. Die Abkürzung DRaaS steht für Disaster Recovery as a Service und beschreibt eine Dienstleistung, bei der die gesamte IT-Infrastruktur inklusive Daten auf einem Speicher in der Cloud gesichert werden. Mit diesen Eigenschaften erlaubt DRaaS eine schnelle und vollständige Wiederherstellung der eigenen Infrastruktur nach einem Katastrophenfall. Damit geht DRaaS über ein reines Daten-Backup hinaus, denn bei einer solchen Sicherung sind nur die reinen Daten gespeichert.
Mit den Services von TelemaxX ist die Umsetzung von DRaaS möglich. Als Server Backup sind hier flexible Datensicherung nach den eigenen Anforderungen möglich. Die Intervalle der Backups für die einzelnen Anwendungen und Daten werden auf Basis der im RPO festgelegten Ziele definiert. So ist eine Synchronisation mit der Cloud möglich, wenn das Ziel eine RPO von 0 ist.
Ebenfalls ist die Sicherheit bei der Lösung von TelemaxX gewährleistet. Dies ist bei DRaaS ein ebenso wichtiger Punkt. Sowohl die Sicherheit als auch die Erreichbarkeit müssen gewährleistet sein. TelemaxX betreibt eigene Rechenzentren, die über eigene Notstromversorgungen sowie redundante Datensicherungen verfügen. Die Cloud ist über mehrfache Glasfaseranbindungen erreichbar, was gleichzeitig eine hohe Datenübertragungsrate sichert.
Was ist ein Recovery Test?
Nachdem ein Plan für das Disaster Recovery erstellt und die Wiederherstellungsmechanismen eingerichtet sind, erfolgt ein Test. DR-Tests decken mögliche Schwachstellen in der Planung auf. Vor allem geht es darum, zu kontrollieren, ob ein Recovery in der angestrebten Zeit möglich ist. Ebenfalls wird kontrolliert, ob eine Notfallwiederherstellung überhaupt gelingt. Solche Tests sollten regelmäßig, etwa im Abstand von drei Monaten, durchgeführt werden. Zudem ist eine tägliche Kontrolle der Sicherheitskopien beim DRaaS-Dienstleister sinnvoll. Dienstleister stellen beispielsweise Screenshots bereit, die belegen, dass die Datensicherung durchgeführt wurde. Mit diesen Mitteln ist eine Kontrolle der DR-Maßnahmen möglich.
4 Die Wahl des richtigen Dienstleisters für DRaaS ist entscheidend
Die wichtigste Aufgabe von DR ist es, eine zuverlässige und schnelle Recovery zu ermöglichen. Da lokale Lösungen nicht ausreichend sind, um eine absolute Sicherheit in allen Szenarien zu gewährleisten, ist die Kooperation mit einem externen Dienstleister erforderlich. Über die Sicherung der IT-Infrastruktur in der Cloud ist eine Recovery aller Informationen und Anwendungen in kurzer Zeit möglich.
Professionelle Anbieter bringen mehrere Vorteile mit sich:
Expertise und bewährte Ansätze
Spezialisierte Anbieter verfügen über langjährige Erfahrung mit verschiedensten Notfall-Szenarien und können erprobte Lösungen anbieten, die in der Praxis funktionieren.
Skalierbare Ressourcen und Sicherheit
Im Notfall können zusätzliche Kapazitäten schnell bereitgestellt werden, ohne dass Organisationen permanent Überkapazitäten vorhalten müssen. Dies reduziert die Kosten erheblich. Ebenfalls ist die Sicherheit bei professionellen Lösungen gewährleistet. Dies ist bei DRaaS ein ebenso wichtiger Punkt. Sowohl die Sicherheit als auch die Erreichbarkeit müssen gewährleistet sein. TelemaxX betreibt eigene Rechenzentren, die über eigene Notstromversorgungen sowie redundante Datensicherungen verfügen. Die Cloud ist über mehrfache Glasfaseranbindungen erreichbar, was gleichzeitig eine hohe Datenübertragungsrate sichert.
5 Was ist ein Recovery Test?
Nachdem ein Plan für das Disaster Recovery erstellt und die Wiederherstellungsmechanismen eingerichtet sind, erfolgt ein Test. DR-Tests decken mögliche Schwachstellen in der Planung auf. Vor allem geht es darum, zu kontrollieren, ob eine Wiederherstellung in der angestrebten Zeit möglich ist. Ebenfalls wird kontrolliert, ob eine Notfallwiederherstellung überhaupt gelingt.
Solche Tests sollten regelmäßig, etwa im Abstand von drei Monaten, durchgeführt werden. Zudem ist eine tägliche Kontrolle der Sicherheitskopien beim DRaaS-Dienstleister sinnvoll. Anbieter stellen beispielsweise Screenshots bereit, die belegen, dass die Datensicherung durchgeführt wurde. Mit diesen Mitteln ist eine Kontrolle der DR-Maßnahmen möglich.
6 Weiterentwicklung Disaster Recovery
Die Anforderungen an Disaster Recovery entwickeln sich kontinuierlich weiter. In den kommenden Jahren werden neue Herausforderungen entstehen, die Unternehmen bei der Planung berücksichtigen müssen:
Entwicklung neuer Bedrohungen
Zunehmende Bedrohungen durch Cyberangriffen: Ransomware und andere Angriffe werden immer raffinierter und zielen gezielt auf Backup-Systeme ab. Moderne Disaster Recovery-Strategien müssen diese Bedrohungen berücksichtigen.
Wandel der Arbeitsmodelle
Hybride Arbeitsmodelle: Die Verbreitung von Homeoffice erfordert neue Ansätze für die Geschäftskontinuität. Mitarbeiter müssen auch im Notfall von verschiedenen Standorten aus arbeiten können.