Cloud Intelligence™Cloud Intelligence™

Cloud Intelligence™

Personalized Service Health: il sistema di allerta precoce per gli eventi critici che impattano il suo Google Cloud…

By Chimbu ChinnaduraiDec 21, 20234 min read

Questa pagina è disponibile anche in English, Deutsch, Español, Français, 日本語 e Português.

Foto di Karen Roach da Shutterstock

Nel mondo in continua evoluzione del cloud computing, anticipare le interruzioni di servizio è essenziale per garantire la continuità operativa e prestazioni sempre ottimali.

Personalized Service Health (PSH) di Google Cloud è un servizio prezioso che le permette di individuare le interruzioni dei servizi Google Cloud rilevanti per i suoi progetti, così da gestirle e affrontarle in modo efficiente. Con PSH può intercettare e risolvere in modo proattivo i potenziali problemi prima che abbiano un impatto significativo sull'operatività.

Personalized Service Health

Personalized Service Health è una funzionalità di Google Cloud che filtra gli eventi critici rilevanti in base alle dipendenze e ai pattern di utilizzo del suo progetto. Questo approccio su misura le garantisce di ricevere solo le informazioni davvero pertinenti al suo ambiente, permettendole di concentrarsi sugli eventi che contano di più.

I principali vantaggi di Personalized Service Health

  • Consapevolezza proattiva: insight tempestivi sugli eventi critici prima che impattino l'operatività.
  • Impatto ridotto: meno downtime e meno interruzioni del business grazie a misure proattive.
  • Comunicazione più efficace: mantenga il team aggiornato su interruzioni di servizio e impatti potenziali.
  • Resilienza rafforzata: aumenti la capacità della sua organizzazione di reggere alle interruzioni di servizio.

Il diagramma seguente illustra come Personalized Service Health consente di accedere agli eventi di service health. I dati provengono da Google Cloud Service Health (CSH) e Personalized Service Health ne valuta l'impatto su ciascun progetto. Se l'impatto di un incidente sul suo progetto è possibile o confermato, l'incidente verrà reso disponibile in Personalized Service Health.

https://cloud.google.com/service-health/docs/overview

Visualizzare gli eventi di Service Health

Per ricevere gli eventi, abiliti la Service Health API. Per visualizzarli, assegni il ruolo roles/servicehealth.viewer agli account utente.

Può accedere agli eventi di service health tramite:

  • Service Health dashboard: tenga traccia degli incidenti Google Cloud emergenti e attivi rilevanti per i suoi progetti dalla Google Cloud Console.
  • Service Health API: recuperi le informazioni sugli eventi di service health per progetto o per organizzazione.
  • Alerts: riceva notifiche sugli eventi rilevanti per i suoi progetti. Gli alert si basano sui log di Cloud Logging.
  • Logs: esporti i log relativi agli eventi Google Cloud.

Al momento la console gestisce soltanto gli eventi specifici di un progetto. Per una visibilità e un controllo completi sugli eventi che impattano la sua organizzazione, utilizzi la Service Health API.

Gli screenshot seguenti mostrano alcuni eventi di esempio relativi a un progetto GCP.

Service Health Dashboard

Il campo Relevance dell'evento descrive in che modo un incidente impatta il suo progetto. La rilevanza può cambiare con l'evolversi dell'incidente e assumere i seguenti valori:

  • Impacted: è confermato che l'incidente sta impattando il suo progetto. Disponibile solo per alcuni prodotti Google Cloud.
  • Related: l'incidente ha un legame diretto con il suo progetto e impatta un prodotto Google Cloud in una località utilizzata dal progetto.
  • Partially Related: l'incidente è associato a un prodotto Google Cloud utilizzato dal suo progetto, ma potrebbe non avere alcun impatto su di esso. Ad esempio, può riguardare un prodotto Google Cloud usato dal progetto in una località in cui però il progetto non opera.
  • Not Impacted: l'incidente non impatta il suo progetto.
  • Unknown: l'impatto sul suo progetto non è ancora noto.

Clicchi sul titolo per maggiori dettagli sull'evento.

Esempio di dettagli di un evento Health

Configurare gli alert

Personalized Service Health si integra con i log alert di Cloud Monitoring, consentendole di configurare notifiche per diverse condizioni critiche, tra cui:

  • nuove segnalazioni di incidenti;
  • aggiornamenti su incidenti già aperti, come i messaggi inviati dal supporto Google Cloud;
  • creazione o aggiornamento di incidenti associati a specifici prodotti o località Google Cloud, come le regioni;
  • modifiche a dettagli specifici di incidenti esistenti, come variazioni di stato e rilevanza.

Apra la Service Health dashboard e selezioni Create Alert Policy.

Scelga il template di policy e il canale di notifica desiderati per l'alert.

Testare la configurazione dell'alert

Per verificare il funzionamento dell'alert può inviare un log di prova tramite Cloud Logging dalla Google Cloud console: in questo modo si attiverà la logica di alert configurata in precedenza.

  • Apra la pagina di riferimento del metodo entries:write, che le permette di scrivere voci di log in Cloud Logging. Nel corpo della richiesta, sostituisca [PROJECT_NUMBER] con il proprio progetto.
  • Modifichi i campi jsonPayload nel corpo della richiesta in base alla condizione di alert che vuole testare e clicchi su Execute.

Esempio di richiesta di inserimento del log

  • Attenda qualche minuto, quindi verifichi che l'alert sia stato attivato.

Nella Google Cloud console, vada su Cloud Monitoring > Incidents e controlli di aver ricevuto un alert sul canale di notifica usato dalla policy di alerting.

Esempio di incidente

Esempio di log in Cloud Logging

Esempio di notifica via email

In sintesi, Personalized Service Health di Google Cloud è un sistema di allerta precoce fondamentale di fronte agli eventi critici: permette alle aziende di mitigare i rischi in modo proattivo, mantenere la continuità operativa e rafforzare la propria resilienza alle interruzioni di servizio nel panorama in continua evoluzione del cloud computing.

Se è cliente DoiT, può utilizzare la funzionalità out-of-the-box cloud incidents per monitorare disponibilità e uptime della sua infrastruttura su Google Cloud e Amazon Web Services.