Como a Raptive previne proativamente os custos de suporte estendido do AWS RDS
- 37 databases
- cobertos automaticamente em todas as regiões da AWS, e contando
- ~$10k/year
- em custos anuais de suporte estendido evitados
Os clusters do Amazon Aurora estavam no centro da camada de dados da plataforma, mas rodavam em configurações de Standard Storage que não refletiam os padrões reais de I/O. As instâncias RDS eram provisionadas para o pico de carga, em vez de ajustadas ao uso do dia a dia. A diferença entre o que estava provisionado e o que era de fato necessário virava gasto desnecessário, mês após mês.
Sem uma abordagem estruturada para analisar padrões de uso, esse gasto era praticamente invisível. O time sabia que existia ineficiência em algum ponto do ambiente. Identificá-la com precisão, e saber o que fazer a respeito, exigia uma expertise que eles não tinham internamente.
Acompanhar o que rodava em cada uma das 25 contas AWS era um processo manual e sujeito a erros. Em contas em processo de descontinuação, novos recursos podiam surgir sem que ninguém percebesse. Para um time responsável pelo controle de custos em um ambiente complexo, esse ponto cego trazia um risco real: recursos não rastreados significavam gastos não rastreados e possível exposição em compliance.
Cada desafio, isoladamente, era gerenciável. Juntos, apontavam para um time que precisava tanto de uma plataforma mais inteligente quanto de um parceiro técnico estendido, com profundidade especializada para complementar o que uma equipe interna desse porte e ritmo consegue sustentar sozinha.
A DoiT passou a atuar com o time de plataforma da Luxury Escapes por meio da sua plataforma Cloud Intelligence, unindo ferramentas inteligentes a uma expertise de engenharia hands-on. Para o time da Chiamaka, a diferença não estava só no que a DoiT conseguia enxergar. Estava no que a DoiT fazia com o que enxergava.
Os Forward Deployed Engineers e o Customer Success Manager da DoiT analisaram os padrões diários de uso e as métricas de performance do RDS em todo o ambiente da Luxury Escapes, montando uma visão de como os workloads de fato se comportavam, e não de como se imaginava que se comportariam. Essa análise revelou oportunidades claras de right-sizing das instâncias e de migração para um modelo de Reserved Instances calibrado pela demanda real.
O resultado foi uma estratégia sob medida que hoje cobre de 70% a 80% do workload Aurora RDS da Luxury Escapes, gerando aproximadamente US$ 7.000 a US$ 8.000 de economia direta. Os engenheiros da DoiT foram além: revisaram as configurações de storage dos clusters Aurora e identificaram workloads específicos em que a migração para I/O Optimized storage fazia sentido tanto em performance quanto em custo. Um detalhe de configuração que a maioria dos times deixaria passar virou um ganho de eficiência que se acumula.
Com a estratégia de Reserved Instances já em prática, Satyam Gupta apresentou o CloudFlow para dar ao time as ferramentas certas para monitorar e proteger esse investimento. Com os relatórios automatizados no CloudFlow, o time da Chiamaka passou a ter visibilidade das datas de expiração das Reserved Instances e das taxas de utilização em todo o ambiente, conseguindo agir antes do vencimento dos commitments, em vez de descobri-los só depois do fato consumado.
O CloudFlow também resolveu um desafio mais amplo de governança. Para um time que antes precisava trocar de contexto entre 25 contas AWS separadas, ele entregou uma visão única e unificada do que estava rodando em todo o ambiente. O alerta automatizado fez com que novos recursos criados em uma conta descontinuada disparassem uma notificação imediata, transformando um processo que dependia de checagens manuais em um fluxo controlado e auditável.
Satyam falava com o time da Chiamaka várias vezes por sprint, trazendo novos recursos da plataforma e oferecendo suporte ativo durante a migração do App Mesh e nos trabalhos em andamento com os clusters Aurora. Quando o time esbarrava em problemas que exigiam conhecimento especializado, Satyam fazia rapidamente a ponte com os engenheiros certos da DoiT. A atribuição de custos foi configurada por times e serviços, para que as anomalias pudessem ser rastreadas até a causa raiz sem demora.
O que eu realmente gosto na abordagem da DoiT é que vocês são muito hands-on e proativos. O Satyam me chamava algumas vezes por sprint, me atualizando sobre os recursos mais recentes e perguntando como estavam as coisas. Quando estamos em um período de pico, essa proatividade faz uma diferença real. O Satyam sempre aparece quando precisamos de suporte e nos ajuda a acionar os especialistas certos para chegar onde precisamos.
Chiamaka Ibeme, Engineering Manager, Platform
A Luxury Escapes não está desacelerando, e as ambições do time de plataforma para o ambiente AWS refletem isso. Nos próximos 12 meses, o foco deixa de ser estruturar a prática de FinOps e passa a ser aprofundá-la. Os recursos de visualização e governança do CloudFlow ainda têm muito a oferecer, e o time da Chiamaka pretende ampliar o uso à medida que ganha familiaridade com a plataforma.
A migração do AWS App Mesh segue em curso, com suporte ativo dos engenheiros da DoiT. Novos trabalhos de otimização de storage no Aurora estão no pipeline. E, à medida que a plataforma agrega contas, serviços e gastos, o modelo de parceria que viabilizou a primeira onda de resultados escala junto.
Para a Chiamaka, essa continuidade pesa tanto quanto qualquer resultado isolado. Um parceiro que aparece em cada sprint, conhece o ambiente e traz a expertise certa no momento certo não é um fornecedor. É infraestrutura para o próprio time.
A Luxury Escapes oferece a viajantes acesso a férias premium curadas na região Ásia-Pacífico e além. Quando um cliente reserva pela plataforma, ele confia que ela vai cuidar de tudo: encontrar a experiência certa, processar o pagamento e personalizar o que vem depois. Essa confiança depende inteiramente de uma plataforma de tecnologia que funcione de forma confiável em escala.
Chiamaka Ibeme, Engineering Manager for Platform na Luxury Escapes, carrega boa parte da responsabilidade por essa confiabilidade. O time dela é dono da infraestrutura, da developer experience, do DevOps, dos pipelines de CI e da segurança que sustentam toda a jornada do cliente. Conforme o negócio cresceu, cresceu também a complexidade do ambiente AWS sob sua gestão, com 25 contas e um conjunto diversificado de serviços, incluindo Amazon Aurora, Amazon ElastiCache, Amazon OpenSearch Service e AWS App Mesh.
Chiamaka sabia que o ambiente precisava de mais rigor. O gasto com nuvem havia chegado a cerca de 500.000 dólares australianos por mês, e as ferramentas e processos em que o time se apoiava não foram pensados para um ambiente dessa escala. Sem mais visibilidade e uma governança mais rígida, os custos podiam disparar silenciosamente enquanto a atenção da engenharia continuava voltada à entrega.
"O objetivo", ela conta, "era manter os custos de nuvem sob controle e evitar que saíssem da proporção."
Descubra como o DoiT Cloud Intelligence e o CloudFlow ajudam os times a melhorar visibilidade, governança e unit economics em ambientes de nuvem.
Cloudflow's new RDS End of Life alerts have allowed us to be more proactive on keeping our database instances up-to-date. The new solution gives us internal visibility ahead of time so that we can prepare for upgrades, instead of having to upgrade under pressure while incurring extended support costs.
Jon Fairbanks, Site Reliability Engineering Manager
PerfectScale cut 40% off our total EKS spend, and the automations handle what used to take our team 20 hours a month. Now we spend that time on reliability and performance instead of chasing cost metrics.
Caio Cristo, Director of Infrastructure/SRE
What I really like about DoiT's approach is that you're very hands-on and proactive. Satyam would ping me a few times a sprint, letting me know about the most current features, checking in on how things are going. When we are going through a peak time, that proactiveness makes a real difference. Satyam always comes through whenever we need support and helps us leverage the right experts to get us where we need to be.
Chiamaka Ibeme, Engineering Manager, Platform
SELECT has made important cost data readily accessible. I will often pull it up during engineering design reviews so we can quickly evaluate cost impact and projections and factor that into our design decisions.
Douglas Zickuhr, Senior Data Platform Engineer at Personio
I love clicking through SELECT to understand how our environment and workloads are evolving. I probably check it every day. It's coffee and SELECT for me every morning.
Ian Fahey, Senior Analytics Engineer at Loop
You guys have the best UI experience that I've had of any software. It's like you just read my mind where, like, oh, I wish I could click there. Oh, I can
Diana Koshy, Sr. Director of Data Engineering at Kargo
SELECT feels like exactly what Paul and I would have built if we had locked ourselves in a room for 18 months to create our ideal monitoring solution.
Devin McGee, Data Engineering Lead at Home Chef
SELECT dramatically lowers the cognitive load to understanding Snowflake costs. I'm able to sit there and easily understand what's driving the cost. Not to blow smoke up your ass, but it's just so easy to do in your platform
Blake Baggett, Head of Data Operations at Entain
One of the most helpful cost rituals we've setup from SELECT is the weekly spend digest sent to Slack. I can start high level and ensure things are in check. If not, I can very quickly drill down into specific workloads which may have driven the cost spike and remediate them before they become a bigger issue.
Michael Revelo, Manager of data and analytics engineering at ClickUp
Through SELECT's automated savings feature and deep cost visibility, we were able to instantly lower our Snowflake spend by over 40% and achieve a 20X ROI on our SELECT investment.
Skyler Chi, SVP, GTM Productivity & Excellence at Exiger
Our costs had jumped up 3X as we scaled, so we're talking about 60% savings in Snowflake spend after adopting SELECT.
Edward Mancey, GTM Lead at Synthesia
DoiT was a true partner, not a vendor. They helped us understand the problem, refine the vision, and build something production-ready far faster than we could have on our own. Their expertise, responsiveness, and commitment made all the difference.
Dr. Anish Kapur, Founder & CEO, Promptly
DoiT's Customer Success and Forward Deployed Engineering teams work very closely with us. The regular sessions with our CSM keep us focused on the right priorities, and the FDEs provide the deep technical guidance we need to validate decisions and optimize our environment. That combination has been genuinely valuable for us.
Alexander Lundberg Santos, Platform Engineer at Extenda Retail
Let us show you what ships this week.