Cloud Intelligence™Cloud Intelligence™

Cloud Intelligence™

Detección de anomalías en tiempo real: la clave para evitar sobrecostos en la nube

By Craig LowellMay 1, 20255 min read

Esta página también está disponible en English, Deutsch, Français, Italiano, 日本語 y Português.

En las empresas modernas, el ritmo de la innovación suele superar la capacidad de supervisión. A medida que las organizaciones adoptan entornos multicloud e híbridos cada vez más complejos, gestionar los costos de la nube en tiempo real se volvió un imperativo estratégico. El escalamiento dinámico, los workloads efímeros y la responsabilidad descentralizada entre los equipos de Engineering complican mantener visibilidad sobre el origen del gasto y por qué se produce.

Las anomalías de costos en la nube —esos picos repentinos e inesperados de uso o de gasto— se encuentran entre los retos más disruptivos para los equipos de FinOps. Si no se controlan a tiempo, pueden escalar rápidamente y convertirse en grandes desviaciones presupuestarias. Estas anomalías suelen originarse por causas comunes: infraestructura mal configurada, eventos de autoescalamiento no planificados, entornos de desarrollo que quedan activos demasiado tiempo o, como verás más adelante, brechas de seguridad que derivan en uso no autorizado. Sin una detección temprana, estos problemas pasan inadvertidos hasta que aparecen en la factura mensual, mucho después de que ya no hay margen para mitigarlos.

Los métodos tradicionales de monitoreo de costos, como las revisiones manuales y los reportes diferidos, son demasiado lentos para el ritmo en tiempo real de las operaciones en la nube. Cuando se detectan las anomalías, ya se pueden haber perdido decenas de miles de dólares. Por eso, la detección de anomalías de costos en tiempo real se está volviendo una capacidad crítica para los profesionales de FinOps; identificar y responder a patrones anómalos a medida que aparecen no es un extra deseable, sino una pieza fundamental de la gobernanza del costo en la nube.

El riesgo de los retrasos en tu solución de detección de anomalías

En su rol como proveedor gestionado de FinOps, los expertos en la nube de DoiT acompañan habitualmente a los clientes en la detección y mitigación del impacto de las anomalías de costos en la nube y, cuando corresponde, gestionan reembolsos en su nombre con hyperscalers como AWS, Google Cloud y Microsoft Azure.

Sin embargo, cuando el tamaño y alcance de una anomalía es excesivamente grande, la detección tradicional —basada únicamente en datos de facturación de la nube— puede llegar demasiado tarde para evitar un impacto serio en la factura mensual. Esto ocurre porque los proveedores de nube normalmente actualizan sus datos de reportes de costos solo una vez al día, lo que puede generar un retraso de 24 a 48 horas hasta que la anomalía se hace visible. En ese tiempo, como verás en los casos de abajo, los costos pueden dispararse muy por encima de lo que una empresa suele gastar en total al mes en la nube.

Anomalías de costos derivadas de brechas de seguridad

Durante un fin de semana de marzo de 2025, los equipos de cuenta de DoiT detectaron un fuerte pico de costos en varias cuentas de nuestros clientes:

El origen de estos picos fue un actor malicioso que había accedido a los entornos de los clientes a través de un plugin de Jenkins mal configurado y había levantado varias instancias EC2 metal nuevas para minar criptomonedas. Al detectarlo, el equipo alertó rápidamente a los clientes y los ayudó a contener la brecha de seguridad y a apagar los workloads de EC2 no autorizados para frenar la acumulación de costos exorbitantes.

Pero como el origen del pico de costos fue el AWS Cost and Usage Report (CUR) actualizado, las instancias estuvieron operando más de 24 horas antes de que alguien lo notara y acumularon más de 90.000 USD en costos pirateados de AWS en las facturas de los clientes, un incremento del 26,7 % sobre su gasto mensual promedio, una tasa que podría ser catastrófica para empresas con recursos limitados y presupuestos operativos ajustados.

Gasto mensual promedio en AWS

Costo de la anomalía

Costo como porcentaje del gasto mensual en la nube

Empresa 1

€62.798

€25.532

40,6 %

Empresa 2

$274.148

$48.971

17,9 %

Empresa 3

$8.856

$17.773

200,7 %

Beneficios de la detección de anomalías en tiempo real de DoiT

Si esos clientes hubieran activado la detección de anomalías en tiempo real dentro de DoiT Cloud Intelligence,™ sus datos de AWS CloudTrail habrían disparado una alerta sobre estas anomalías en menos de 30 minutos desde que los costos superaron el rango de gasto habitual (determinado por los modelos avanzados de ML de DoiT). Dado el ritmo al que el actor malicioso acumulaba costos, esto habría supuesto un promedio de 29.220 USD en costos evitados frente a la incursión real que se detectó con los datos del CUR.

Costo de la anomalía de EC2

Ahorro potencial con detección de anomalías en tiempo real

Empresa 1

€25.532

€24.255

Empresa 2

$48.971

$46.522

Empresa 3

$17.773

$16.884

Esta funcionalidad está disponible para los clientes elegibles de DoiT Cloud Intelligence y se activa otorgando permisos adicionales para que DoiT lea los datos de CloudTrail en tiempo real. Esto se hace desde la pantalla "Link AWS" en DoiT Cloud Intelligence (ubicada en la pestaña Integrate del menú desplegable superior), copiando y pegando el comando de CloudShell en tu consola de AWS. En pocos minutos, DoiT empezará a monitorear los datos y a enviar alertas en tiempo real, que pueden llegar tanto al correo del cliente como a canales de Slack o MS Teams.

Cómo mitigar el daño de las anomalías de costos

Si bien la detección es una parte vital del proceso para lidiar con las anomalías de costos en la nube, el seguimiento posterior es igual de importante para asegurar que el origen del pico quede bajo control y que se prevengan nuevos episodios. A partir de ahí, también puedes coordinar con el proveedor de nube para ver si alguno de los costos incurridos califica para un reembolso.

En situaciones como las descritas arriba, en su calidad de reseller autorizado de la nube del cliente, DoiT puede gestionar con AWS en su nombre el reembolso de al menos parte de los costos generados por la brecha de seguridad. Los expertos en la nube de DoiT también trabajan con los equipos internos de operaciones en la nube de los clientes para asegurar que se corrijan vulnerabilidades de seguridad como las encontradas en los plugins de Jenkins y, así, evitar nuevas brechas de acceso.

Para conocer más sobre la detección de anomalías en tiempo real de DoiT, contáctanos para hablar con un experto certificado en la nube, o ponte en contacto con tu account manager de DoiT.