Foto von Karen Roach auf Shutterstock
In der dynamischen Welt des Cloud Computings ist es entscheidend, Servicestörungen einen Schritt voraus zu sein, um den Geschäftsbetrieb aufrechtzuerhalten und eine optimale Performance sicherzustellen.
Personalized Service Health (PSH) von Google Cloud ist ein praktischer Service, mit dem Sie Störungen von Google-Cloud-Diensten erkennen, die für Ihre Projekte relevant sind, und effizient darauf reagieren können. Mit PSH identifizieren und beheben Sie potenzielle Probleme proaktiv, bevor sie spürbar auf Ihren Betrieb durchschlagen.
Personalized Service Health
Personalized Service Health ist eine Funktion von Google Cloud, die relevante Störungsereignisse anhand der Abhängigkeiten und Nutzungsmuster Ihres Projekts filtert. So erhalten Sie nur die Informationen, die für Ihre Umgebung tatsächlich wichtig sind, und können sich auf die entscheidenden Ereignisse konzentrieren.
Die wichtigsten Vorteile von Personalized Service Health
- Proaktive Transparenz: Erhalten Sie zeitnah Einblick in Störungen, bevor diese Ihren Betrieb beeinträchtigen.
- Geringere Auswirkungen: Minimieren Sie Ausfallzeiten und potenzielle Geschäftsunterbrechungen durch proaktives Handeln.
- Bessere Kommunikation: Halten Sie Ihr Team über Servicestörungen und mögliche Folgen auf dem Laufenden.
- Höhere Resilienz: Stärken Sie die Widerstandsfähigkeit Ihrer Organisation gegenüber Servicestörungen.
Das folgende Diagramm zeigt, wie Personalized Service Health den Zugriff auf Service-Health-Ereignisse bereitstellt. Die Daten stammen aus Google Cloud Service Health (CSH), und Personalized Service Health bewertet die Auswirkungen aller Vorfälle auf Ihr Projekt. Liegt eine mögliche oder bestätigte Auswirkung auf Ihr Projekt vor, erscheint der Vorfall in Personalized Service Health.

Service-Health-Ereignisse anzeigen
Aktivieren Sie zunächst die Service Health API, um Ereignisse zu empfangen. Damit Nutzer die Ereignisse einsehen können, weisen Sie ihren Konten die Rolle roles/servicehealth.viewer zu.
Auf Service-Health-Ereignisse können Sie über folgende Wege zugreifen:
- Service Health Dashboard: Verfolgen Sie aufkommende und aktive Google-Cloud-Vorfälle, die für Ihre Projekte relevant sind, in der Google Cloud Console.
- Service Health API: Rufen Sie Informationen zu Service-Health-Ereignissen pro Projekt oder Organisation ab.
- Alerts: Lassen Sie sich über Ereignisse benachrichtigen, die für Ihre Projekte relevant sind. Alerts basieren auf Logs in Cloud Logging.
- Logs: Exportieren Sie Logs zu Google-Cloud-Ereignissen.
Aktuell unterstützt die Console nur projektbezogene Ereignisse. Für umfassende Sichtbarkeit und Kontrolle über Ereignisse, die Ihre Organisation betreffen, nutzen Sie die Service Health API.
Die folgenden Screenshots zeigen Beispielereignisse für ein konkretes GCP-Projekt.

Service Health Dashboard
Relevance beschreibt, wie ein Vorfall Ihr Projekt betrifft. Die Relevance kann sich im Verlauf des Vorfalls ändern und folgende Werte annehmen:
- Impacted: Es ist bestätigt, dass der Vorfall Ihr Projekt betrifft. Nur für bestimmte Google-Cloud-Produkte verfügbar.
- Related: Der Vorfall steht in direktem Zusammenhang mit Ihrem Projekt und betrifft ein Google-Cloud-Produkt an einem Standort, den Ihr Projekt nutzt.
- Partially Related: Der Vorfall steht im Zusammenhang mit einem von Ihrem Projekt genutzten Google-Cloud-Produkt, betrifft Ihr Projekt jedoch möglicherweise nicht. Beispielsweise kann der Vorfall ein Produkt an einem Standort betreffen, an dem Ihr Projekt nicht aktiv ist.
- Not Impacted: Der Vorfall betrifft Ihr Projekt nicht.
- Unknown: Die Auswirkungen auf Ihr Projekt sind aktuell nicht bekannt.
Klicken Sie auf den Titel, um weitere Details zum Ereignis zu sehen.

Beispielhafte Details eines Health-Ereignisses
Alerts einrichten
Personalized Service Health lässt sich mit Cloud Monitoring Log Alerts integrieren. So konfigurieren Sie Benachrichtigungen für verschiedene kritische Bedingungen, darunter:
- Neue Vorfallsmeldungen.
- Aktualisierungen bestehender Vorfälle, etwa Nachrichten des Google Cloud Supports.
- Erstellung oder Aktualisierung von Vorfällen, die bestimmten Google-Cloud-Produkten oder Standorten (z. B. Regionen) zugeordnet sind.
- Änderungen an einzelnen Details bestehender Vorfälle, etwa Statuswechsel oder Änderungen der Relevance.
Wechseln Sie zum Service Health Dashboard und wählen Sie "Create Alert Policy".

Wählen Sie die gewünschte Policy-Vorlage und den Benachrichtigungskanal für den Alert aus.

Alert-Setup testen
Um den Alert zu testen, senden Sie über Cloud Logging in der Google Cloud Console ein Beispiel-Log, das die zuvor konfigurierte Alert-Logik auslöst.
- Öffnen Sie die Referenzseite zur Methode entries:write, mit der Sie Log-Einträge in Cloud Logging schreiben können. Ersetzen Sie im Request Body
[PROJECT_NUMBER]durch Ihr Projekt. - Passen Sie beliebige
jsonPayload-Felder im Request Body an die zu testende Alert-Bedingung an und klicken Sie auf Execute.

Beispiel für eine Log-Injection-Anfrage
- Warten Sie einige Minuten und prüfen Sie anschließend, ob der Alert ausgelöst wurde.
Navigieren Sie in der Google Cloud Console zu Cloud Monitoring > Incidents und prüfen Sie, ob über den in der Alert Policy hinterlegten Benachrichtigungskanal ein Alert eingegangen ist.

Beispiel-Incident

Beispielhafte Logs in Cloud Logging

Beispielhafte E-Mail-Benachrichtigung
Fazit: Personalized Service Health von Google Cloud ist ein zentrales Frühwarnsystem für Störungen. Unternehmen können damit Risiken proaktiv minimieren, den Betrieb am Laufen halten und ihre Resilienz gegenüber Serviceunterbrechungen in der dynamischen Welt des Cloud Computings stärken.
Als DoiT-Kunde nutzen Sie die sofort einsatzbereite Funktion cloud incidents, um Verfügbarkeit und Uptime Ihrer Infrastruktur in Google Cloud und Amazon Web Services zu überwachen.