Cloud Intelligence™Cloud Intelligence™

Cloud Intelligence™

Cloud-Kosten clever optimieren und Ausgaben im Griff behalten

By Craig LowellSep 20, 20227 min read

Diese Seite ist auch in English, Español, Français, Italiano, 日本語 und Português verfügbar.

Wenn Optimierung mehr Aufwand als Nutzen bringt, führt der einfache Weg zu echten Cloud-Einsparungen.

Wenn Strategien zur Cloud-Kostenoptimierung mehr Aufwand als Nutzen bringen: der einfache Weg zu echten Cloud-Einsparungen

Bei aller Skalierbarkeit, Zuverlässigkeit und Flexibilität, die die Public Cloud bietet – geschenkt gibt es auch hier nichts. Bei Cloud-Anbietern wie Amazon Web Services und Google Cloud nutzen und bezahlen Sie Rechenleistung und Services genau dann, wenn Sie sie brauchen. Wer das jedoch ausschließlich on-demand tut, zahlt schnell drauf. Irgendwann wird die rein bedarfsgesteuerte Nutzung der Public Cloud schlicht zu teuer.

Es gibt verschiedene Wege, Ihre Cloud-Ausgaben besser in den Griff zu bekommen – etwa indem Sie sich frühzeitig auf Nutzungs- oder Ausgabenvolumen festlegen oder Spot Instances zu stark vergünstigten Konditionen einsetzen. Beide Strategien zur Kostenoptimierung erfordern jedoch Zeit und Ressourcen, um sauber umgesetzt zu werden. Die entscheidende Frage lautet daher nicht "Wie viel Geld lässt sich sparen?", sondern "Steht das Ergebnis im Verhältnis zum Aufwand?".

Werfen wir einen genaueren Blick auf beide Strategien – was sie konkret bedeuten und wie sie sich so optimieren lassen, dass sich der Aufwand für Ihr Unternehmen wirklich lohnt.

Compute Commitments / Reservierungen

Da Compute in der Regel mehr als die Hälfte Ihrer gesamten Cloud-Rechnung ausmacht, hat die Optimierung dieser Kostenposition den größten Hebel auf Ihre Gesamtausgaben. Genau deshalb gewähren Public-Cloud-Anbieter wie AWS deutliche Rabatte, wenn Sie Ihre Nutzung im Voraus reservieren oder verbindlich zusagen. Diese Commitment-Programme – bei AWS bekannt als Reserved Instances oder Savings Plans – haben Laufzeiten von einem oder drei Jahren, wobei dreijährige Commitments naturgemäß die größten Rabatte bringen.

Um diese Sparpotenziale zu heben, brauchen Sie allerdings sehr präzise Prognosen Ihrer Nutzung über die gesamte Laufzeit des Commitments. Wer überprovisioniert und mehr Compute reserviert als nötig, verbrennt Geld für ungenutzte Workloads (was an die alten Zeiten klassischer Rechenzentren und CapEx-Modelle erinnert). Umgekehrt gilt: Wer unterprovisioniert und später zusätzliche Instances braucht, muss entweder erneut prognostizieren und ein neues Commitment aufsetzen oder deutlich höhere On-Demand-Preise zahlen.

Erschwerend kommen zahlreiche Variablen hinzu, die sich nur schwer in die Konditionen eines Commitments einrechnen lassen, zum Beispiel:

  • Code-Änderungen, die den Compute-Bedarf einer Anwendung erhöhen oder senken
  • das Erfolgs- oder Viralitätspotenzial neuer Produkte und Services
  • makroökonomische Einflüsse wie Inflation oder Lieferkettendynamiken, die sich nicht steuern lassen, Ihre Cloud-Nutzung aber dennoch beeinflussen

In der Praxis reservieren Unternehmen meist so viel wie möglich über dreijährige Commitments, um eine Mindestbasis abzudecken, und legen darauf einjährige Reservierungen für die VM-Typen, Größen und Regionen, die ihre Anwendungen konkret benötigen.

Das Ergebnis ist meist ein ständig wechselnder Rabattkalender, dessen Workload-Ziele, Spezifikationen und Ablaufdaten das ganze Jahr über nachgehalten und gesteuert werden müssen – mindestens von einer dedizierten Person, wenn nicht von einem ganzen Team. Diese Kolleginnen und Kollegen brauchen Cloud-Expertise und müssen die Nutzung mit übergeordneten Geschäftszielen verknüpfen können. Und natürlich frisst der Aufwand für Recruiting, Schulung und Bindung eines so spezialisierten Teams die Einsparungen schnell wieder auf.

Wenig überraschend ist das für viele Unternehmen eine erhebliche Hürde – besonders für jüngere Firmen mit begrenzten Ressourcen und klarem Wachstumsfokus. Die meisten Start-ups können es sich nicht leisten, Zeit und Aufmerksamkeit ihrer ohnehin knappen DevOps-Ressourcen ins Commitment-Management zu stecken, und konzentrieren sich lieber auf Produktentwicklung und Wachstum statt auf Kosten- und Nutzungsmanagement.

Aber auch größere, besser ausgestattete und digital reifere Unternehmen tun sich schwer, ihr Commitment-Portfolio im Griff zu behalten. Je komplexer die Cloud-Umgebung, desto anspruchsvoller wird das Management: Compute-Bedarf und Verbrauchsraten unterscheiden sich zwischen einzelnen Teams, Verantwortlichkeiten für Provisionierung und Nutzungs-Tracking verschieben sich, und die Umgebungen der Teams entwickeln sich auseinander.

Je komplexer die Cloud-Umgebung, desto anspruchsvoller wird das Management.

Spot Instances

Eine der wirksamsten Stellschrauben, um Ihre AWS-Cloud-Ausgaben zu senken, ist der Einsatz von Spot Instances, wo immer es geht. Mit Einsparungen von bis zu 90 % gegenüber dem On-Demand-Preis bieten sie sogar größere Rabatte als dreijährige Commitments – allerdings mit einem deutlichen Haken: Spot Instances werden als Last-Minute-Angebote auf nicht genutzte On-Demand-Kapazitäten verkauft (vergleichbar mit einer Bäckerei, die ihre Auslage am Abend abverkauft) – können aber vom Cloud-Anbieter mit nur zwei Minuten Vorlauf zurückgefordert werden. Dieser Vorbehalt schreckt viele ab: Im Trade-off zwischen Verfügbarkeit der Anwendungen und Einsparungen entscheidet man sich im Zweifel für die Verfügbarkeit.

Spot Instances lassen sich auf AWS über Auto Scaling Groups (ASGs) verwalten. Ihr Einsatz erfordert jedoch eine gewisse Flexibilität bei den angefragten Instance-Typen und Availability Zones, denn es kann jederzeit passieren, dass keine Kapazität in Ihren Zielspezifikationen verfügbar ist. ASGs müssen außerdem manuell konfiguriert und regelmäßig nachjustiert werden, damit Ihr Compute-Bedarf weiterhin ohne nennenswerte Unterbrechungen gedeckt ist. Auch das ist ein manueller, mühsamer Prozess – und bei einer falschen Konfiguration funktioniert es im Zweifel gar nicht.

Trotz der klaren Grenzen von Spot Instances gibt es Strategien, deren Einsatz zu optimieren. Eine davon ist Capacity Rebalancing, das die Verfügbarkeit absichert (basierend auf den Instance Rebalance Recommendations von AWS). Dabei wird ein präventives Signal gesendet, sobald eine Spot Instance voraussichtlich abgeschaltet wird – eine deutliche Verbesserung gegenüber der standardmäßigen Zwei-Minuten-Warnung von AWS, vorausgesetzt, jemand ist verfügbar, um die Umstellung zu steuern.

Lohnt sich der Aufwand?

Die unangenehme Wahrheit ist: Es gibt keine Zauberformel dafür, wie viel das Management all dieser Kostenoptimierungsstrategien Sie kosten wird. Das hängt stark von Größe und Komplexität Ihrer Cloud-Umgebung, Ihren aktuellen und zukünftigen Geschäftszielen sowie der verfügbaren Expertise im Unternehmen ab. Ist es zum Beispiel günstiger, in einem gewissen Rahmen zu einem niedrigeren Preis zu viel zu committen, als zu wenig zuzusagen und den Rest zu On-Demand-Konditionen zu beziehen? Und wenn Sie sich für Letzteres entscheiden: Wie viel ist Ihnen die gewonnene Flexibilität wert – verglichen mit dem zusätzlichen Sparpotenzial eines größeren Commitments?

Eine Ebene tiefer: Kann Ihr Team diese Programme planen und steuern, oder müssen Sie zusätzliches Personal mit den nötigen Skills und der nötigen Erfahrung einstellen? Und falls ja: Ist das wirklich der beste Einsatz Ihres operativen Budgets, oder wäre dieses Geld in Produktentwicklung oder Go-to-Market-Strategien besser aufgehoben?

Viele Unternehmen kommen zu dem Schluss, dass all diese Fragen – und die Zeit, sie zu beantworten – mehr Aufwand als Nutzen bringen. Schwer zu widersprechen, gerade weil längerfristige Commitments oft zulasten der Engineering-Flexibilität gehen: Neue Projekte oder Features, die in der ursprünglichen Prognose nicht berücksichtigt waren, müssen unter Umständen warten, bis neue Ressourcen bereitgestellt werden können. Möchten Sie wirklich, dass Ihre Produkt-Roadmap durch Budgetentscheidungen ausgebremst wird, die vor über einem Jahr getroffen wurden?

Es gibt jedoch alternative Ansätze – Lösungen, die dringend benötigte Einsparungen ermöglichen, ohne so viel Zeit und Energie Ihres Infrastruktur-Teams zu binden.

Möchten Sie wirklich, dass Ihre Produkt-Roadmap durch Budgetentscheidungen ausgebremst wird, die vor über einem Jahr getroffen wurden?

DoiT Flexsave löst die Herausforderung des Commitment-Managements durch die automatisierte Steuerung von Compute-Rabatten. Die Lösung überwacht Ihre Cloud-Nutzung kontinuierlich mit Machine Learning und erkennt Compute-Instances, die nicht durch bestehende Commitments abgedeckt sind. Anschließend werden auf passende Workloads die Rabattsätze einjähriger Commitments angewendet, um diese Lücke zu schließen. So erhalten Sie die Flexibilität von On-Demand-Nutzung, ohne explodierende Infrastrukturkosten fürchten zu müssen. Sie können sogar so viele dreijährige Commitments einkaufen, wie Sie möchten, um Ihre Einsparungen zu maximieren – Flexsave deckt den Rest ab.

DoiT Spot Scaling wiederum sorgt dafür, dass Sie Ihre Workloads zuverlässig auf AWS Spot Instances betreiben, ohne sich um Unterbrechungen sorgen zu müssen. Spot Scaling überwacht Ihre ASGs autonom, empfiehlt Best-Practice-Konfigurationen und ersetzt On-Demand-Instances – wo möglich – durch die stark vergünstigten Spot Instances. Ist im Markt keinerlei Spot-Kapazität verfügbar, wird automatisch auf On-Demand zurückgegriffen. Spot Scaling ist zudem die einzige Lösung am Markt, bei der alle Einsparungen bei Ihnen bleiben – ganz ohne Provisionsabzug.

cloud cost optimization

Mehr über die von DoiT empfohlenen Strategien zur Kostenoptimierung erfahren Sie im Gespräch mit unseren Experten oder in unserem aktuellen E-Book The Cost Conscious Cloud.