Cloud Intelligence™Cloud Intelligence™

Cloud Intelligence™

Detecção de anomalias em tempo real: a chave para evitar estouros no orçamento de cloud

By Craig LowellMay 1, 20255 min read

Esta página também está disponível em English, Deutsch, Español, Français, Italiano e 日本語.

Nas empresas modernas, a inovação costuma andar mais rápido que a supervisão. Conforme as organizações adotam ambientes multicloud e híbridos cada vez mais complexos, gerenciar custos de cloud em tempo real virou um imperativo estratégico. Escalonamento dinâmico, workloads efêmeros e a responsabilidade descentralizada entre os times de engenharia dificultam enxergar de onde vem o gasto e por que ele está acontecendo.

As anomalias de custo na cloud — aqueles picos repentinos e inesperados de uso ou gasto — estão entre os desafios mais disruptivos para os times de FinOps. Sem controle, viram rapidamente grandes estouros de orçamento. Essas anomalias podem ter causas comuns, como infraestrutura mal configurada, eventos de autoscaling não planejados, ambientes de desenvolvimento mantidos por tempo demais ou, como você verá a seguir, brechas de segurança que abrem espaço para uso não autorizado. Sem detecção precoce, esses problemas costumam passar despercebidos até aparecerem na fatura mensal — quando já é tarde demais para reagir.

Métodos tradicionais de monitoramento de custos, como revisões manuais e relatórios atrasados, são lentos demais para acompanhar o ritmo em tempo real das operações de cloud. Quando as anomalias são descobertas, dezenas de milhares de dólares já podem ter ido pelo ralo. Por isso, a detecção de anomalias de custo em tempo real está se tornando uma capacidade crítica para profissionais de FinOps; identificar e responder a padrões anormais assim que eles surgem deixou de ser um diferencial — é parte fundamental da governança de custos de cloud.

O risco do atraso na sua solução de detecção de anomalias

Como provedora de FinOps gerenciado, a DoiT coloca seus especialistas em cloud para ajudar os clientes a detectar e mitigar os efeitos de anomalias de custo na cloud e, quando aplicável, atuar junto a hyperscalers como AWS, Google Cloud e Microsoft Azure para garantir reembolsos em nome deles.

No entanto, quando o tamanho e o escopo da anomalia são muito grandes, a detecção tradicional, baseada apenas em dados de billing da cloud, pode chegar tarde demais para evitar um impacto sério na fatura mensal. Isso acontece porque os provedores de cloud normalmente atualizam os dados dos relatórios de custo só uma vez por dia, o que pode gerar um atraso de 24 a 48 horas até a anomalia aparecer. Nesse intervalo, como você verá nos casos a seguir, os custos podem disparar muito além do que a empresa costuma gastar no total mensal de cloud.

Anomalias de custo causadas por brechas de segurança

Em um fim de semana de março de 2025, os times de conta da DoiT identificaram um grande pico de custos em várias contas de clientes:

Os picos foram causados por um agente malicioso que conseguiu acesso aos ambientes dos clientes por meio de um plugin do Jenkins mal configurado e subiu várias novas instâncias EC2 metal para minerar criptomoedas. Ao identificar o problema, a equipe alertou os clientes rapidamente, ajudou a fechar a brecha de segurança e desligou os workloads EC2 não autorizados, interrompendo o acúmulo de custos exorbitantes.

Mas, como a fonte do pico foi o AWS Cost and Usage Report (CUR) atualizado, as instâncias ficaram rodando por mais de 24 horas antes que alguém percebesse, acumulando mais de US$ 90.000 em custos pirateados nas faturas dos clientes — um aumento de 26,7% em relação ao gasto médio mensal, taxa que pode ser catastrófica para empresas com recursos limitados e orçamentos operacionais apertados.

Gasto médio mensal em AWS

Custo da anomalia

Custo como porcentagem do gasto mensal de cloud

Empresa 1

€ 62.798

€ 25.532

40,6%

Empresa 2

US$ 274.148

US$ 48.971

17,9%

Empresa 3

US$ 8.856

US$ 17.773

200,7%

Os benefícios da detecção de anomalias em tempo real da DoiT

Se esses clientes tivessem habilitado a detecção de anomalias em tempo real no DoiT Cloud Intelligence,™ os dados do AWS CloudTrail teriam disparado um alerta em menos de 30 minutos após os custos ultrapassarem a faixa normal de gasto (definida pelos modelos avançados de ML da DoiT). Considerando a velocidade com que o agente malicioso acumulou custos, isso teria evitado uma média de US$ 29.220 em gastos, em comparação ao impacto real detectado pelos dados do CUR.

Custo da anomalia em EC2

Economia potencial com detecção de anomalias em tempo real

Empresa 1

€ 25.532

€ 24.255

Empresa 2

US$ 48.971

US$ 46.522

Empresa 3

US$ 17.773

US$ 16.884

Esse recurso está disponível para clientes elegíveis do DoiT Cloud Intelligence e pode ser ativado concedendo permissões adicionais para que a DoiT leia os dados do CloudTrail em tempo real. Basta acessar a tela ‘Link AWS’ no DoiT Cloud Intelligence (na aba Integrate do menu suspenso no topo da tela) e copiar e colar o comando do CloudShell no seu console AWS. Em poucos minutos, a DoiT já começa a monitorar os dados e a disparar alertas em tempo real, que podem ser enviados para o e-mail do cliente e também para canais do Slack ou do MS Teams.

Como reduzir os danos das anomalias de custo

A detecção é uma etapa essencial para lidar com anomalias de custo na cloud, mas o follow-up é igualmente importante para garantir que a origem do pico seja controlada e que novos picos não voltem a acontecer. A partir daí, você também pode acionar o provedor de cloud para verificar se algum dos custos incorridos é elegível a reembolso.

Em situações como as descritas acima, como revendedora autorizada de cloud do cliente, a DoiT pode atuar junto à AWS em nome dele para reembolsar pelo menos parte dos custos decorrentes da brecha de segurança. Os especialistas em cloud da DoiT também trabalham com os times internos de operações de cloud dos clientes para garantir que vulnerabilidades de segurança como as encontradas nos plugins do Jenkins sejam corrigidas, evitando novas brechas de acesso.

Para saber mais sobre a detecção de anomalias em tempo real da DoiT, fale com a gente e converse com um especialista em cloud certificado, ou entre em contato com seu account manager da DoiT.