Cloud Intelligence™Cloud Intelligence™

Cloud Intelligence™

Punktgenau: DoiT Anomaly Detection – präziser und persönlicher

By Matan BordoNov 29, 20237 min read

Diese Seite ist auch in English, Español, Français, Italiano, 日本語 und Português verfügbar.

Mit Anomalieerkennung auf SKU-Ebene und gezielten Anomalie-Alerts etablieren Sie eine Kultur bewusster Cloud-Ausgaben und verkürzen zugleich die Zeit, bis Kostenspitzen behoben sind.

Immer mehr Unternehmen wollen ihre Cloud-Ausgaben in den Griff bekommen und nehmen Engineering- und Produktteams stärker in die Pflicht, was deren Anteil an den Cloud-Kosten betrifft – aus gutem Grund.

Wenn Engineers und Product Owner wissen, was ihre Arbeit kostet, beziehen sie diesen Faktor eher in die Feature-Entwicklung und das Monitoring nach dem Launch ein. Das schlägt sich direkt im Ergebnis nieder.

Echtzeit-Reporting ist zwar nach wie vor eine der wirksamsten Maßnahmen, um Stakeholder für das Thema zu sensibilisieren – nur reagieren Teams damit nicht automatisch schnell auf auffälliges Verhalten oder Kostenspitzen. Dafür braucht es zusätzlich Echtzeit-Alerting.

Bislang lieferten Out-of-the-box-Systeme zur Anomalieerkennung in der Regel Einblicke in die Cloud-Nutzung Ihrer gesamten Organisation – mit Alerts auf Service-Ebene. Dieser breite Ansatz hat aber zwei Schwächen:

  1. Sie müssen die SKUs und Ressourcen, die hinter einer Kostenanomalie eines Services stecken, manuell ausfindig machen.
  2. Teams werden über Kostenanomalien benachrichtigt, die für ihren Bereich gar nicht relevant sind.

Deshalb freuen wir uns, SKU-spezifisches Alerting für DoiT Anomaly Detection vorzustellen – inklusive der Möglichkeit, Anomalie-Alerts gezielt für die Infrastrukturbereiche zu abonnieren, für die Sie verantwortlich sind.

Werfen wir einen Blick auf die Vorteile beider Funktionen und darauf, wie Sie eigene Anomalie-Alerts in DoiT Cloud Intelligence™ einrichten.

Jeder trägt Verantwortung für seine Cloud-Kosten

Ein zentrales FinOps-Prinzip lautet: "Everyone owns their costs."

Wer eine Kultur der Kostenoptimierung etablieren will, muss präzise und personalisierte Daten zu den richtigen Personen bringen.

Wie Reports und Dashboards stoßen auch personalisierte und präzise Anomalie-Alerts interne Diskussionen an, die letztlich zu einem besseren Verständnis der Kosten und der dahinterliegenden Infrastrukturentscheidungen führen – und zu mehr Verantwortungsbewusstsein.

"Warum sind unsere Kosten in die Höhe geschnellt? War das so zu erwarten? Was machen wir beim nächsten Mal besser?"

So funktioniert die Anomalieerkennung auf SKU-Ebene

Da viele Unternehmen ihr Anomalie-Alerting nach wie vor automatisieren möchten, ist DoiT Anomaly Detection sofort einsatzbereit: Es überwacht Kostenspitzen autonom und meldet auffällige Ausgaben, damit Sie schnell gegensteuern und die Auswirkungen auf Ihre Rechnung gering halten können. Ihre Engineers müssen also kein eigenes Tool zur Anomalieüberwachung bauen und pflegen.

Bisher beobachtete das System, wie Ihre Organisation Cloud-Ressourcen nutzt, und definierte ein "normales Verhalten" für jeden Service über alle Projekte und Accounts hinweg.

Doch jede Minute, in der eine Kostenspitze unentdeckt bleibt, ist wie ein offener Wasserhahn auf Ihrem Bankkonto. Je länger sie unbemerkt bleibt, desto größer der finanzielle Schaden. Und je mehr Handarbeit nötig ist, um die Ursache zu finden, desto stärker fällt der Effekt auf Ihre Rechnung aus.

Mit unserem aktuellen Update prüft DoiT Anomaly Detection nun jede SKU einzeln auf Auffälligkeiten. Sobald abnormales Verhalten erkannt wird, erhalten Sie eine E-Mail (und – falls eingerichtet – eine Slack-Nachricht), die die betroffene SKU hervorhebt.

Anomaly alert sent via email

Anomalie-Alert per E-Mail

Wenn Sie in DoiT Cloud Intelligence tiefer einsteigen, sehen Sie zusätzlich die Ressourcen, die zur Kostenspitze beitragen. So lässt sich auf granularster Ebene genau bestimmen, was die Spitze ausgelöst hat – und die Zeit bis zur Behebung sinkt deutlich.

Im folgenden Beispiel erkennt DoiT Cloud Intelligence eine Anomalie für S3 – konkret für die SKU "DataTransfer-Out-Bytes". Im unteren Bereich werden im Wesentlichen drei S3-Buckets als Verursacher sichtbar, mit "bucket-1" als Hauptauslöser.

Anomaly detected for an AWS S3 SKU

Beispiel für eine erkannte Kostenspitze auf SKU-Ebene in AWS S3

Zusätzlich erhalten Sie eine Erläuterung zur Anomalie und zur SKU – die Bezeichnungen sind schließlich nicht immer selbsterklärend (z. B. "EUN1-LCUUsage") – samt passender Optimierungstipps.

Anomaly explanation for an anomaly detected in an AWS S3 SKU

Detaillierte Erklärung einer erkannten Anomalie bei S3-Datentransferkosten samt Optimierungsempfehlungen

Warum Sie Anomalie-Alerts auf Ihre Infrastrukturbereiche zuschneiden sollten

Gezieltes Anomalie-Alerting geht über die Erkennung auf SKU-Ebene hinaus: Ihre Teams können die Alerts feinjustieren und sich auf genau die Cloud-Kosten konzentrieren, für die sie verantwortlich sind.

Manchmal wollen Sie Abweichungen in einem klar abgegrenzten Kontext verstehen. So können beispielsweise saisonale Geschäftseffekte Kostenspitzen in F&E-Projekten überdecken.

Darum ist das so wichtig:

  1. Relevanz und Fokus: Wenn Sie Anomalie-Alerts an einzelne Teams anpassen, werden Ihre Stakeholder nur über Anomalien informiert, die ihren Bereich direkt betreffen. Das beugt Alert-Müdigkeit vor und hilft den Teams, sich auf Maßnahmen in ihrem Verantwortungsbereich zu konzentrieren.
  2. Schnellere Reaktion: Erhält Ihr Team Alerts zu seinen eigenen Cloud-Kosten, kann es die Ursache zügig untersuchen und Auffälligkeiten beheben. Dieser gezielte Ansatz verkürzt die Reaktionszeit und hält die Auswirkungen einer Kostenspitze auf Ihre Monatsrechnung gering.
  3. Präzise Optimierung: Anomalieerkennung zeigt, wo Kostenoptimierung nötig ist. Werden Teams auf Kostenspitzen in ihrem eigenen Bereich aufmerksam gemacht, sind sie motivierter, die Ressourcennutzung zu optimieren und Best Practices umzusetzen – mit insgesamt niedrigeren Kosten und gesunden Finanzgewohnheiten als Ergebnis.
  4. Verantwortung stärken: Gezielte Anomalieerkennung stärkt das Gefühl von Eigenverantwortung. Teams werden direkt für ihre Cloud-Ausgaben zuständig – das fördert eine Kultur des finanziellen Bewusstseins und der Umsicht.

Personalisiertes Anomalie-Alerting mit DoiT einrichten

Zuerst müssen Sie festlegen, für welche Kosten welches Team oder welche Person zuständig ist. In DoiT Cloud Intelligence übernehmen das die Attributions.

Was sind Attributions?

Eine "Attribution" ist eine logische Gruppierung von Cloud-Ressourcen, die eine für Ihr Unternehmen individuelle Kostenkategorie definiert.

Mit Attributions ordnen Sie Ihre Cloud-Ausgaben Teams, Anwendungen, Umgebungen oder jeder anderen für Ihr Geschäft relevanten Kategorie zu.

Nehmen wir an, Ihr Unternehmen hat drei verschiedene Produkte, deren Kosten Sie nachverfolgen möchten. Die Ressourcen jedes Produkts verteilen sich dabei auf mehrere AWS-Accounts.

Mit Attributions lassen sich diese AWS-Accounts gruppieren und nach der jeweiligen Anwendung benennen. Unten sehen Sie, wie "Application A" auf diese Weise definiert wird.

Example Attribution for a hypothetical application

Beispiel-Attribution für eine fiktive Anwendung

Nehmen wir weiter an, die Engineers und Produktverantwortlichen rund um Application A sollen nur dann benachrichtigt werden, wenn eine Anomalie in dieser Anwendung auftritt.

Sobald die Attribution erstellt ist, müssen Sie nur noch die Anomalieerkennung dafür aktivieren.

Toggling on Anomaly Detection for an Attribution

Anomalieerkennung für eine Attribution aktivieren

Anschließend können Sie in den Benachrichtigungseinstellungen die für Application A zuständigen Personen für Alerts zu dieser Attribution anmelden – oder sie tun es selbst.

Subscribing to anomaly alerts for a specific Attribution

Anomalie-Alerts für eine bestimmte Attribution abonnieren

Diese Alerts lassen sich zudem in einen Team-Slack-Channel ausspielen, falls vorhanden.

Subscribing to Slack alerts for detected anomalies on an AttributionAnomalie-Alerts für eine Attribution in einen gemeinsamen Slack-Channel senden

Geht ein Anomalie-Alert in Slack ein, können Sie ihn entweder bewerten, um unseren Algorithmus weiter zu schärfen, oder ihn direkt in DoiT Cloud Intelligence genauer untersuchen.

anomaly alert sent to a slack channel

Anomalie-Alert in einem gemeinsamen Slack-Channel

Wird eine Anomalie für eine Attribution erkannt, erscheint deren Name auf der Anomalie-Seite.

Beim Cloud-Kostenmanagement sind präzise und personalisierte Echtzeit-Alerts entscheidend, um Kostenverantwortung im Team zu verankern.

SKU-Level-Alerting in DoiT Anomaly Detection ist ein großer Schritt, um die Zeit bis zur Behebung von Kostenspitzen spürbar zu verkürzen.

In Kombination mit präziserem, gezieltem Anomalie-Alerting hilft das Ihrem Unternehmen, eine Kultur bewusster Cloud-Ausgaben zu fördern. Teams treffen eigenständig fundierte Entscheidungen, reagieren schnell auf Auffälligkeiten und tragen proaktiv zum Erfolg Ihrer Cloud-Initiativen bei.

Wenn Ihr Unternehmen FinOps-Praktiken etabliert, wird diese Funktion zu einem unverzichtbaren Werkzeug, um Kostentransparenz zu erhöhen, Ressourcen optimal zuzuteilen und letztlich finanzielle Exzellenz in der Cloud zu erreichen.

Sie sind bereits DoiT-Kunde? Dann melden Sie sich und Ihre Stakeholder ab sofort in DoiT Cloud Intelligence für Anomalie-Alerts zu den jeweils verantworteten Infrastrukturbereichen an. Noch kein DoiT-Kunde, aber daran interessiert, diese Funktion gemeinsam mit dem umfassenden Produkt-Portfolio von DoiT zu nutzen? Dann nehmen Sie hier Kontakt mit uns auf.