En las empresas modernas de hoy en día, el ritmo de la innovación a menudo supera la velocidad de supervisión. A medida que las organizaciones adoptan entornos multicloud e híbridos cada vez más complejos, el reto de gestionar los costes de la nube en tiempo real se ha convertido en un imperativo estratégico. El escalado dinámico, las cargas de trabajo efímeras y la propiedad descentralizada en los equipos de ingeniería dificultan mantener la visibilidad de dónde procede el gasto y por qué se produce.
Las anomalías en los costes de la nube -esos picos repentinos e inesperados en el uso o el gasto- son uno de los retos más perturbadores a los que se enfrentan los equipos de FinOps. Si no se controlan, pueden convertirse rápidamente en importantes excesos presupuestarios. Estas anomalías pueden surgir por causas comunes, como una infraestructura mal configurada, eventos de autoescalado no planificados, entornos de desarrollo prolongados o, como verás a continuación, brechas de seguridad que conducen a un uso no autorizado. Sin una detección temprana, estos problemas suelen pasar desapercibidos hasta que aparecen en una factura mensual, mucho después de que haya pasado la oportunidad de mitigarlos.
Los métodos tradicionales de control de costes, como las revisiones manuales y los informes retrasados, son demasiado lentos para seguir el ritmo de la naturaleza en tiempo real de las operaciones en la nube. Para cuando se descubren las anomalías, ya se pueden haber perdido decenas de miles de dólares. Por eso la detección de anomalías en los costes en tiempo real se está convirtiendo en una capacidad crítica para los profesionales de FinOps; la capacidad de identificar y responder a patrones anormales a medida que surgen no es sólo un "nice-to-have", es una parte fundamental de la gobernanza de los costes de la nube.
El riesgo de retrasos en tu solución de detección de anomalías
En el papel de DoiT como proveedor gestionado de FinOps, nuestros expertos en la nube tienen a menudo la tarea de ayudar a los clientes a detectar y mitigar los efectos de las anomalías en los costes de la nube y, cuando procede, trabajar con hiperescaladores como AWS, Google Cloud y Microsoft Azure para conseguir reembolsos en su nombre.
Sin embargo, cuando el tamaño y el alcance de una anomalía son excesivamente grandes, la detección tradicional de anomalías basada únicamente en los datos de facturación de la nube puede retrasarse demasiado para evitar un impacto grave en la factura mensual de la nube. Esto se debe a que los proveedores de la nube normalmente sólo actualizan sus datos de informes de costes una vez al día, lo que puede provocar un retraso de 24-48 horas hasta que aparece la anomalía. En ese tiempo, como verás en los casos siguientes, los costes pueden dispararse mucho más allá de lo que una empresa suele gastar en costes mensuales totales en la nube.
Anomalías en los costes derivadas de fallos de seguridad
Durante un fin de semana de marzo de 2025, los equipos de cuentas de DoiT se percataron de un importante aumento de los costes en las cuentas de varios de nuestros clientes:
La causa de estos picos era un actor malicioso que había accedido a los entornos de los clientes a través de un plugin Jenkins mal configurado y había puesto en marcha varias instancias nuevas de EC2 metal con el fin de minar criptomonedas. Tras detectarlo, el equipo alertó rápidamente a los clientes de la situación y les ayudó a apuntalar la brecha de seguridad y a desactivar las cargas de trabajo EC2 no autorizadas para detener la acumulación de costes desorbitados.
Pero como la fuente del pico de costes era el Informe de Costes y Uso de AWS (CUR) actualizado, las instancias llevaban funcionando más de 24 horas antes de que nadie se diera cuenta, y acumularon más de 90.000 $ en costes pirateados de AWS en las facturas en la nube de los clientes, un aumento del 26,7% sobre su gasto medio mensual, una tasa que podría ser catastrófica para las empresas con recursos limitados y presupuestos operativos ajustados.
Gasto medio mensual en AWS | Coste de la anomalía | Coste como porcentaje del gasto mensual en la nube | |
Empresa 1 | €62,798 | €25,532 | 40.6% |
Empresa 2 | $274,148 | $48,971 | 17.9% |
Empresa 3 | $8,856 | $17,773 | 200.7% |
Ventajas de la detección de anomalías en tiempo real de DoiT
Si esos clientes hubieran activado la detección de anomalías en tiempo real en DoiT Cloud Intelligence,™ sus datos de AWS CloudTrail habrían activado una alerta por estas anomalías en menos de 30 minutos desde que los costes superaron el rango normal de gasto de los clientes (según determinaron los modelos ML avanzados de DoiT). Dado el ritmo al que el actor malicioso acumulaba costes, esto habría supuesto una media de 29.220 $ en costes evitados en comparación con la incursión real que se detectó a partir de los datos CUR.
Coste de la anomalía EC2 | Ahorro potencial de la detección de anomalías en tiempo real | |
Empresa 1 | €25,532 | €24,255 |
Empresa 2 | $48,971 | $46,522 |
Empresa 3 | $17,773 | $16,884 |
Esta capacidad, que está disponible para cualquier cliente con una suscripción suscripción Enhanced o Enterprise a DoiT Cloud Navigator, puede activarse mediante concediendo permisos adicionales para que DoiT lea los datos de CloudTrail en tiempo real. Esto se puede hacer desde la pantalla "Enlazar AWS" de la consola DoiT (situada en la sección Integra en el menú desplegable de la parte superior de la pantalla), y copiando y pegando el comando CloudShell en tu consola de AWS. En unos minutos, DoiT empezará a monitorizar los datos y a activar alertas en tiempo real que pueden enviarse tanto al correo electrónico del cliente como a los canales de Slack o MS Teams.
Mitigar los daños de las anomalías en los costes
Aunque la detección es una parte vital del proceso de hacer frente a las anomalías en los costes de la nube, el proceso de seguimiento es igualmente importante para garantizar que se controla el origen del pico y que se evitan nuevos picos. A partir de ahí, también puedes trabajar con el proveedor de la nube para ver si alguno de los costes incurridos puede ser reembolsado.
En situaciones como las descritas anteriormente, como distribuidor autorizado de la nube de un cliente, DoiT puede trabajar con AWS en su nombre para reembolsar al menos parte de los costes derivados de la brecha de seguridad. Los expertos en la nube de DoiT también trabajan con los equipos internos de operaciones en la nube de los clientes para garantizar que se rectifiquen las vulnerabilidades de seguridad como las encontradas en los plugins de Jenkins, evitando así nuevas violaciones de acceso.
Para saber más sobre la detección de anomalías en tiempo real de DoiT, ponte en contacto con nosotros para hablar con un experto certificado en la nube, o ponte en contacto con tu gestor de cuentas de DoiT.