Categories
Analysen

Ausfallprävention: Diese Fragen sollte man seinem Cloud Computing Anbieter stellen

Ausfälle, wie der kürzlich bei den Amazon Web Services, in der Cloud, sind für alle Beteiligten sehr ärgerlich. Der Kunde verliert im schlimmsten Fall seine Daten und Kunden, hat aber in der Regel mit der Nichtverfügbarkeit seiner Systeme zu kämpfen. Der Anbieter, auf der anderen Seite, muss sich erklären und erleidet einen Imageverlust.

Vor Ausfällen ist niemand geschützt

Seit 2007 haben 568 Stunden Ausfallzeit von 13 namhaften Cloud Services mehr als 71.700,000 US-Dollar an Kosten verursacht, das zeigt eine Studie der International Working Group on Cloud Computing Resiliency (IWGCR). Dabei liegt die durchschnittliche Nichtverfügbarkeit von Cloud Services bei 7,5 Stunden pro Jahr. Das entspricht einer garantierten Verfügbarkeit von 99,9 Prozent, die weit weg von dem liegt, was von geschäftskritischen Systemen (99,999 Prozent) erwartet wird. Im Vergleich dazu beträgt die durchschnittliche Nichtverfügbarkeit von Strom in einer modernen Großstadt weniger als 15 Minuten pro Jahr.

Zwar vergüten die Cloud Anbieter die Ausfallzeiten, indem für den Zeitraum des Ausfalls keine Gebühren berechnet oder Rabatte erstattet werden, allerdings bezieht sich das lediglich auf die genutzte Infrastruktur. Die weiteren Kosten, die dem Kunden durch den Ausfall entstanden sind – Ersatzansprüche seiner Kunden, Datenverluste, usw. – erstattet der Cloud Anbieter nicht.

Fragen an den Cloud Computing Anbieter

Der Kunde wird also nicht geschützt und sollte sich vorab selbst darum kümmern den Anbieter auf Herz und Nieren zu prüfen.

Entspricht das SLA den eigenen Ansprüchen?

Cloud Anbieter werben in der Regel mit einer Verfügbarkeit von 99,9%. Wen das die eigenen Ansprüche nicht befriedigt oder das Unternehmen eine deutlich höhere Verfügbarkeit benötigt, der muss nachverhandeln. Zudem sollte man darauf achten, dass im Vertrag für jeden Service gut definierte Wiederherstellungspunkte beschrieben sind und welche Objekte das betrifft. Erwartet man eine Verfügbarkeit von 99,999% ist allerdings davon auszugehen, dass man hier monatlich deutlich draufzahlen muss.

Wie wird Verfügbarkeit und Ausfallzeit bestimmt?

Was genau bezeichnet der Anbieter selbst als Ausfall? Ist es die nicht Verfügbarkeit der gesamten Infrastruktur oder wenn 10%, 20% oder 60% der Nutzer von dem Problem betroffen sind? Wie sieht es aus, wenn das System zwar technisch einwandfrei funktioniert, aber sehr langsam arbeitet? Die meisten Anbieter schließen eine Reihe von Themen in ihren AGBs aus, die nicht als Ausfall bezeichnet werden, darunter Notsituationen oder Ausfälle von 15 Minuten oder weniger.

Wie schaut es mit höherer Gewalt aus?

Die meisten Cloud Anbieter schließen Ereignisse durch höhere Gewalt aus. Dazu gehören Naturkatastrophen, Kriege und Streiks. Hier muss man allerdings genauer hinschauen. Wenn bspw. die Notstromaggregate auf Grund eines Defektes an der eigenen Infrastruktur ausfallen, ist es wiederum keine höhere Gewalt, selbst dann wenn der Stromausfall z.B. durch ein Unwetter ausgelöst wurde. (eigene Meinung)

Wie robust ist die Cloud Umgebung?

Hier sollte man genau hinschauen. Befindet sich das Rechenzentrum z.B. in einem Erdbeben gefährdeten Gebiet, ist das ein enormes Risiko. Man sollte die Cloud Umgebung daher immer einer genauen technischen Prüfung unterziehen, wenn man die Cloud Services ernsthaft nutzen will.

Wie sehen die Notfallpläne aus?

Hier sollte man besonders drauf achten, das haben die letzten Ausfälle gezeigt! Es gilt daher, sich einen Blick auf die Notfallpläne zu verschaffen und ggf. einen Besuch vor Ort vorzunehmen und einen Audit durchzuführen. Das gilt für den gesamten Prozess inkl. der eigenen Anwendung, die auf der Cloud Infrastruktur betrieben wird, falls es zu einem Ausfall kommt.

Wie oft werden die Notfallpläne gestestet?

Nur weil der Anbieter über einen Notfallplan verfügt, bedeutet das nicht, dass dieser auch funktioniert. Fakten sind hier gefragt. Hier ist es angebracht sich die Ergebnisse der letzten Tests zu zeigen und dieses ebenfalls vertraglich festzuhalten.

Wie nutze ich die Infrastruktur am besten?

Beim letzten Ausfall der Amazon Web Services waren viele Services nicht verfügbar, da sich diese nur auf eine AWS Region konzentriert haben. Andere hingegen waren dennoch erreichbar, da sie ihre Systeme intelligent über die Amazon Cloud verteilt haben. 1. Ermöglicht ein Anbieter diese Vorgehensweise? 2. Wie nutze ich diese (gibt es eine Dokumentation dafür)?

Kann ich bevorzugt behandelt werden?

Sollte es zu einem Ausfall kommen, sind in der Regel mehrere Kunden davon betroffen. Der Anbieter wird also dafür sorgen müssen tausende von Kunden wieder online zu bringen. Hier kann es sich lohnen, für eine bevorzugte Behandlung zu zahlen, wenn die eigene Anwendung geschäftskritisch ist.

Due Diligence?

Neben den technischen Prüfungen ist es ebenfalls interessant zu wissen, wie der Anbieter z.B. auf der finanziellen Seite aufgestellt ist, um seine eigenen Rechnungen zu bezahlen. Was nützt also eine sehr robuste Infrastruktur, wenn der Anbieter auf Grund einer Insolvenz plötzlich nicht mehr erreichbar ist.


Bildquelle: http://www.mobileappz.tv, http://blog.cloudbees.com

By Rene Buest

Rene Buest is Gartner Analyst covering Infrastructure Services & Digital Operations. Prior to that he was Director of Technology Research at Arago, Senior Analyst and Cloud Practice Lead at Crisp Research, Principal Analyst at New Age Disruption and member of the worldwide Gigaom Research Analyst Network. Rene is considered as top cloud computing analyst in Germany and one of the worldwide top analysts in this area. In addition, he is one of the world’s top cloud computing influencers and belongs to the top 100 cloud computing experts on Twitter and Google+. Since the mid-90s he is focused on the strategic use of information technology in businesses and the IT impact on our society as well as disruptive technologies.

Rene Buest is the author of numerous professional technology articles. He regularly writes for well-known IT publications like Computerwoche, CIO Magazin, LANline as well as Silicon.de and is cited in German and international media – including New York Times, Forbes Magazin, Handelsblatt, Frankfurter Allgemeine Zeitung, Wirtschaftswoche, Computerwoche, CIO, Manager Magazin and Harvard Business Manager. Furthermore Rene Buest is speaker and participant of experts rounds. He is founder of CloudUser.de and writes about cloud computing, IT infrastructure, technologies, management and strategies. He holds a diploma in computer engineering from the Hochschule Bremen (Dipl.-Informatiker (FH)) as well as a M.Sc. in IT-Management and Information Systems from the FHDW Paderborn.

6 replies on “Ausfallprävention: Diese Fragen sollte man seinem Cloud Computing Anbieter stellen”

Leave a Reply