Cloud Intelligence™Cloud Intelligence™

Cloud Intelligence™

Personalized Service Health: alerta temprana ante eventos que afectan a tu Google Cloud…

By Chimbu ChinnaduraiDec 21, 20234 min read

Esta página también está disponible en English, Deutsch, Français, Italiano, 日本語 y Português.

Foto de Karen Roach en Shutterstock

En un cloud computing en constante evolución, anticiparse a las interrupciones de servicio resulta clave para sostener la continuidad del negocio y garantizar el mejor rendimiento.

Personalized Service Health (PSH) de Google Cloud es un servicio que te permite identificar las interrupciones de Google Cloud que son relevantes para tus proyectos, de modo que puedas gestionarlas y responder con eficiencia. Con PSH detectas y resuelves de forma proactiva los problemas potenciales antes de que tengan un impacto importante en tus operaciones.

Personalized Service Health

Personalized Service Health es una funcionalidad de Google Cloud que filtra los eventos disruptivos relevantes según las dependencias y los patrones de uso de tu proyecto. Este enfoque a medida garantiza que recibas únicamente la información más pertinente para tu entorno, para que te concentres en los eventos que de verdad importan.

Principales beneficios de Personalized Service Health

  • Visibilidad proactiva: obtén información oportuna sobre eventos disruptivos antes de que afecten tus operaciones.
  • Menor impacto: reduce el tiempo de inactividad y las posibles interrupciones del negocio actuando de forma proactiva.
  • Mejor comunicación: mantén a tu equipo al tanto de las interrupciones de servicio y su posible impacto.
  • Mayor resiliencia: fortalece la capacidad de tu organización para hacer frente a interrupciones de servicio.

El siguiente diagrama muestra cómo Personalized Service Health da acceso a los eventos de service health. Los datos provienen de Google Cloud Service Health (CSH), y Personalized Service Health evalúa el impacto de cada incidente sobre tu proyecto. Si el impacto es posible o se confirma, el incidente queda disponible en Personalized Service Health.

https://cloud.google.com/service-health/docs/overview

Visualizar los eventos de Service Health

Para recibir eventos, habilita la Service Health API. Para visualizarlos, asigna el rol roles/servicehealth.viewer a las cuentas de usuario.

Puedes acceder a los eventos de service health a través de:

  • Service Health dashboard: monitorea los incidentes emergentes y activos de Google Cloud relevantes para tus proyectos en la Google Cloud Console.
  • Service Health API: extrae información de eventos de service health por proyecto u organización.
  • Alertas: recibe notificaciones de los eventos relevantes para tus proyectos. Las alertas se basan en logs de Cloud Logging.
  • Logs: exporta los logs relacionados con los eventos de Google Cloud.

Por ahora, la consola solo admite eventos específicos de un proyecto. Usa la Service Health API para obtener visibilidad y control completos sobre los eventos que afectan a tu organización.

Las siguientes capturas muestran eventos de ejemplo específicos de un proyecto de GCP.

Service Health Dashboard

El campo Relevance del evento describe cómo un incidente impacta tu proyecto. La relevancia puede cambiar a medida que avanza el incidente y admite los siguientes valores:

  • Impacted: se confirmó que el incidente está impactando tu proyecto. Disponible solo para algunos productos de Google Cloud.
  • Related: el incidente tiene una conexión directa con tu proyecto e impacta a un producto de Google Cloud en una ubicación que tu proyecto utiliza.
  • Partially Related: el incidente está asociado a un producto de Google Cloud que utiliza tu proyecto, pero podría no estar impactándolo. Por ejemplo, puede afectar a un producto de Google Cloud que tu proyecto usa, pero en una ubicación donde tu proyecto no opera.
  • Not Impacted: el incidente no está impactando tu proyecto.
  • Unknown: por ahora se desconoce el impacto sobre tu proyecto.

Haz clic en el título para ver más detalles sobre el evento.

Detalle de un evento de Health de ejemplo

Configurar alertas

Personalized Service Health se integra con las alertas basadas en logs de Cloud Monitoring, lo que te permite configurar notificaciones para distintas condiciones críticas, entre ellas:

  • Nuevos reportes de incidentes.
  • Actualizaciones de incidentes existentes, como los mensajes enviados por Google Cloud Support.
  • Creación o actualización de incidentes asociados a productos o ubicaciones específicas de Google Cloud, como regiones.
  • Cambios en detalles puntuales de incidentes existentes, como el estado y la relevancia.

Ve al Service Health dashboard y selecciona Create Alert Policy.

Elige la plantilla de política y el canal de notificación que necesites para la alerta.

Probar la configuración de la alerta

Para probar la alerta, puedes enviar un log de prueba desde Cloud Logging en la Google Cloud Console, lo que ejecuta la lógica de alerta previamente configurada.

  • Ve a la página de referencia del método entries:write, que te permite escribir entradas de log en Cloud Logging. En el cuerpo de la solicitud, reemplaza [PROJECT_NUMBER] por tu proyecto.
  • Modifica los campos jsonPayload del cuerpo de la solicitud según la condición de alerta que estés probando y haz clic en Execute.

Solicitud de inyección de log de ejemplo

  • Espera unos minutos y verifica que la alerta se haya disparado.

En la Google Cloud Console, ve a Cloud Monitoring > Incidents y comprueba si recibiste una alerta en el canal de notificación que utiliza la política de alertas.

Incidente de ejemplo

Logs de ejemplo en Cloud Logging

Notificación por email de ejemplo

En definitiva, Personalized Service Health de Google Cloud se consolida como un sistema de alerta temprana clave frente a eventos disruptivos: permite a las empresas mitigar riesgos de forma proactiva, sostener la continuidad operativa y reforzar su resiliencia ante interrupciones de servicio en un panorama de cloud computing en constante evolución.

Si eres cliente de DoiT, puedes aprovechar la funcionalidad lista para usar de cloud incidents para monitorear la disponibilidad y el uptime de tu infraestructura en Google Cloud y Amazon Web Services.