Cloud Intelligence™

Pare de caçar servidores ociosos: FinOps com foco em intenção para o mundo real

By Vadim SoloveyJul 23, 20254 min read

Esta página também está disponível em English, Deutsch, Español, Français, Italiano e 日本語.

A maioria das histórias de FinOps começa com um heat-map de instâncias subutilizadas e termina com um triunfante "economizamos 20%". Que ótimo.

Mas o que acontece no mês seguinte, quando uma "vitória rápida" derruba seu SLA, ou quando o time de ops percebe que cada core em produção está no limite… executando trabalho inútil?

Bem-vindo a três pontos cegos comuns na gestão moderna de custos em nuvem:

O Machado Cego — cortar tudo que parece caro sem perguntar por que foi construído daquela forma.
A Ilusão da Eficiência — achar que um workload está saudável porque a utilização está alta, mesmo que a maior parte dessa utilização não gere valor para o cliente.
A Ilusão dos Ótimos Locais — supor que melhorar um componente isolado automaticamente melhora o sistema como um todo. Em sistemas complexos, a melhor escolha local pode ser uma perda no agregado. História real: uma vez gastamos uma sprint inteira para economizar US$ 2 mil/mês em um cluster usado só para desenvolvimento. As mesmas horas de engenharia teriam entregue uma feature com projeção de adicionar US$ 50 mil/mês em novo MRR. A otimização "se pagou" — só que com um custo de oportunidade 25 vezes maior.

DoiT Cloud Intelligence™ para FinOps com foco em intenção

O FinOps com foco em intenção resolve os dois.

FinOps com foco em intenção em uma frase

Nunca mexa em uma fatura de nuvem antes de saber qual promessa arquitetural cada dólar defende.

Metas de latência, objetivos de recuperação, regras de compliance e time-to-market — tudo isso conta como promessa. Se uma otimização ameaça qualquer uma delas, ou tira o foco de um trabalho com ROI maior, não é uma vitória.

A Ilusão da Eficiência: estar ocupado não significa gerar valor

Alta utilização parece ótima no dashboard, mas pode esconder um desperdício colossal. Veja três casos reais que encontramos, e como corrigir o workload superou qualquer ajuste de instância:

Job do Spark travado em 70% de CPU por quatro horas todas as noites

O que parecia eficiente: o cluster mantinha seus nodes ocupados.

Realidade: 80% dos dados estavam concentrados em uma chave enviesada, deixando tarefas atrasadas (stragglers) rodando indefinidamente.

Corrija o workload: reparticione e aplique salting nessa chave. O job passou a terminar em 45 minutos em um cluster com um terço do tamanho.

Banco de dados batendo 85% de IOPS

O que parecia eficiente: a instância RDS estava "totalmente utilizada".

Realidade: toda consulta fazia full-table scan porque faltavam dois índices críticos.

Corrija o workload: adicione os índices. A latência caiu dez vezes, e o banco pôde reduzir dois tamanhos.

Frota de GPUs para inferência rodando a 60% de utilização

O que parecia eficiente: as caras A100 estavam sempre ocupadas.

Realidade: o modelo era pequeno e as requisições eram processadas uma de cada vez, deixando a GPU ociosa entre as chamadas.

Corrija o workload: agrupe 32 requisições em batch (ou migre para Inferentia, baseada em CPU). O custo por previsão despencou.

Em todos os casos, só o rightsizing teria reduzido um pouco a fatura, mas corrigir o workload primeiro trouxe economias maiores e melhor desempenho.

Os quatro pilares do FinOps com foco em intenção

Capture o contexto

Vincule cada linha de custo a um workload, a um responsável e a um KPI de negócio (receita por requisição, minutos de build economizados, requisito de compliance atendido). Os números só importam quando contam uma história relevante.

Investigue a intenção

Para cada recurso, pergunte: qual promessa ele cumpre? Réplicas multi-AZ protegem a receita durante uma indisponibilidade. Logs com fidelidade total garantem MTTR de cinco minutos. Se ninguém lembra qual era a promessa, talvez o recurso seja mesmo dispensável — mas nunca presuma.

Corrija o workload e só depois faça rightsizing

Cace o desperdício de design — loops de polling, índices ausentes, logs de debug verbosos demais. Elimine esse desperdício e, em geral, o desempenho melhora enquanto os custos caem. Só aí você redimensiona, agenda ou desativa.

Ferramentas como o PerfectScale.io ajudam a automatizar esse processo, analisando workloads continuamente para revelar tanto ineficiências de design quanto oportunidades seguras de right-sizing, sem comprometer desempenho ou SLAs.

Otimize com segurança e documente

Automatize mudanças com guardrails (SLA, nível de segurança, exigência de compliance) e registre a nova intenção. A revisão de FinOps do próximo trimestre não precisa começar do zero.

Um playbook prático

Crie um baseline com KPIs de negócio — acompanhe o custo e as métricas voltadas ao cliente. Se a latência do checkout se mantém estável enquanto o custo por transação cai, você está no caminho certo.
Instrumente tudo — traces de APM, planos de query, métricas no nível de tarefa. Só olhar para utilização não revela falhas de design.
Faça revisões de workload — junte engenheiros e profissionais de FinOps. Pergunte: o que aconteceria se este job rodasse com metade da frequência? Por que este serviço precisa de GPUs?
Automatize mudanças reversíveis — use ferramentas (sim, incluindo o DoiT Cloud Intelligence™) para agendar, marcar com tags e aplicar políticas com rollback em um clique.
Documente — uma breve nota de "intenção" em um repositório ou Wiki vale mais que conhecimento tribal. As próximas revisões de custo vão precisar desse contexto.

Como o DoiT Cloud Intelligence™ apoia o FinOps com foco em intenção?

Nossa plataforma correlaciona sinais de gasto, desempenho e confiabilidade, e combina tudo isso com especialistas que fazem as perguntas de "por quê". Juntos, nós:

Expomos a "Ilusão da Eficiência" ao conectar custos a resultados, e não a gráficos de utilização.
Sinalizamos a "Ilusão dos Ótimos Locais" mostrando os trade-offs em relação à velocidade do roadmap.
Automatizamos correções apenas quando elas protegem ou reforçam as promessas que mais importam.

Conclusão

Uma fatura baixa não vale nada se os clientes cancelam ou se a entrega de features estagna. O FinOps com foco em intenção muda o objetivo de "gastar menos" para "gastar só no que mantém — ou amplia — nossas promessas". Às vezes isso significa refatorar um workload barulhento antes de fazer o rightsizing.

Às vezes significa não fazer nada e entregar a feature que vai conquistar o próximo cliente. A parte difícil não é escolher uma alavanca; é escolher a alavanca que serve ao sistema como um todo.