Cómo Trax redujo un 75% el gasto en Kubernetes con PerfectScale de DoiT

Conoce a Trax
La misión de Traxes permitir que las marcas y los minoristas aprovechen el poder de las tecnologías digitales para producir las mejores experiencias de compra para los clientes. Sus innovaciones líderes en el sector y su excelencia en el desarrollo de tecnologías avanzadas y métodos autónomos de recogida de datos están impulsando experiencias de compra positivas y desbloqueando oportunidades de ingresos en todos los puntos de venta.
La cartera de soluciones de Trax proporciona métricas, análisis y servicios de misión crítica que ayudan a los clientes a ahorrar tiempo y dinero mejorando su experiencia de compra. Kubernetes es un componente clave de su infraestructura, que permite a Trax innovar continuamente su solución al tiempo que proporciona la escalabilidad necesaria para satisfacer constantemente la demanda. Trax ha crecido hasta convertirse en un entorno multicloud y multicluster a gran escala que da soporte a clientes de más de 90 países, incluidas algunas de las mayores empresas del mundo.
El desafío
A principios de año, el Director Financiero (CFO) estableció fuertes objetivos de ahorro de costes en toda la organización. Para Mark Serdze, Director de Infraestructura en la Nube, y su equipo, esto significaba tomar medidas rápidamente para optimizar sus costes en la nube.
Trax consiguió resultados rápidos al reducir costes fuera de Kubernetes, pero empezó a toparse con obstáculos cuando se trataba de optimizar todo dentro de sus clústeres.
“Empezamos a optimizar manualmente con las métricas disponibles, utilizando Vertical Pod Autoscaler (VPA), los registros del clúster y nuestras soluciones de monitorización”, explicó Serdze. “Este enfoque no nos proporcionaba la claridad adecuada y era difícil de escalar eficientemente sin grandes necesidades de desarrollo. Esto nos dejaba tomando acciones ad hoc y reactivas que tenían un impacto mínimo en nuestros objetivos.”
Las herramientas existentes en Trax también introdujeron fricciones en el proceso de optimización. Incluso cuando los miembros del equipo identificaban posibles oportunidades de ahorro, el proceso de aprobación para validar el mejor curso de acción se basaba más en el instinto que en los datos. Debido a la falta de visibilidad, algunos pasos en falso provocaron un aumento de la carga de trabajo, crearon tensiones internas e introdujeron riesgos que podían comprometer la resistencia del servicio.
Rápidamente se hizo evidente para Serdze y su equipo que su conjunto de herramientas carecía de la inteligencia y la claridad necesarias para optimizar sus entornos Kubernetes con eficacia.
La solución
Poco después de implantar PerfectScale de DoiT, Serdze y el equipo obtuvieron la visibilidad de costes que les faltaba. En el vasto entorno de más de 200 microservicios de Trax, tenían una visibilidad clara de los recursos que necesitaba cada servicio, y pudieron identificar las oportunidades más significativas para eliminar el despilfarro.
La inteligencia guiada por IA de la plataforma permitió al equipo tomar medidas para empezar a reducir costes rápidamente. Al comparar el ahorro de costes con la capacidad de recuperación general, pudieron ajustar los recursos de forma segura y eficaz, sin comprometer el rendimiento.
“Las recomendaciones de optimización de costes fueron clave para nosotros, ya que nos indicaron qué medidas tomar con una comprensión clara del impacto que tendría cada cambio”, explicó Serdze. “En uno de nuestros clusters, pudimos reducir los costes un 75%, ahorrándonos más de cien mil dólares en gastos anuales”.
Además, Trax quedó impresionada por la exhaustividad de los datos y la inteligencia que proporcionaba la solución en todo su entorno. Esta implantación le permitió actualizar su conjunto de herramientas de visibilidad de costes sin afectar a su presupuesto.
“Pudimos sustituir una herramienta de FinOps que utilizábamos y que no proporcionaba detalles granulares de los costes ni ofrecía orientación sobre cómo optimizar nuestro entorno”, explicó Serdze. “PerfectScale es una herramienta creada para los equipos de ingeniería, no sólo para finanzas, lo que nos facilitó conseguir los impactos en los costes que queríamos”.
Optimización de Kubernetes para mejorar las métricas empresariales
Tras eliminar los recursos desperdiciados, Trax se centró en identificar oportunidades adicionales de optimización de costes. El equipo profundizó en los datos de PerfectScale, buscando formas de influir significativamente en sus métricas empresariales centradas en los costes.
“Una métrica clave para nosotros es el ‘coste por procesamiento’, que se ve muy afectado por nuestra eficiencia de Kubernetes”, dijo Serdze. “Si supera una determinada cantidad, nos vemos sometidos a mucha presión para averiguar por qué y tomar medidas para reducirlo”.
PerfectScale tiene una función única que consolida todas las réplicas de un servicio en una única vista para ofrecer una imagen clara de las tendencias de utilización en todas las réplicas, lo que resulta especialmente útil para cargas de trabajo efímeras como los trabajos de Spark o Flink. Trax aprovechó esta capacidad para comprender mejor la utilización heterogénea en las réplicas de varios de sus servicios más utilizados. Este nivel de visibilidad le ayudó a rediseñar algunos de estos servicios para ahorrar costes adicionales sin afectar a su resistencia o disponibilidad.
“Pudimos crear varias versiones del servicio con distintos niveles de recursos y dirigir las solicitudes entrantes al servicio adecuado en función del tamaño de los datos”, explicó Serdze. “Esto tuvo un gran impacto en nuestra métrica de ‘coste por procesamiento’. PerfectScale hizo aflorar estos datos al instante, y sin ellos habríamos pasado incontables horas evaluando cientos de réplicas para generar los mismos resultados.”
Resultados
Al adoptar PerfectScale de DoiT, Trax consiguió resultados rápidos y cuantificables que se ajustaban a sus objetivos técnicos y financieros:
- Reducción del 75% de los costes de Kubernetes en un clúster, lo que equivale a más de seis cifras de ahorro anual
- Sustituyó una herramienta de FinOps de bajo rendimiento por una solución diseñada específicamente para ingenieros, sin aumentar su presupuesto.
- Mejora del “coste por procesamiento” mediante la reestructuración de los servicios basada en información en tiempo real y a nivel de réplica.
- Toma de decisiones acelerada con recomendaciones basadas en IA, eliminando las conjeturas y reduciendo el riesgo de interrupción del servicio.
Más allá de los números, Trax ganó claridad estratégica. Lo que antes requería horas de análisis manual y arriesgadas pruebas de ensayo y error, ahora es automatizado, guiado y preciso. Con PerfectScale de DoiT, Trax no sólo alcanzó importantes objetivos de costes, sino que también sentó las bases de la eficiencia de Kubernetes a escala a largo plazo.
“El apoyo durante la prueba de concepto (POC) tuvo un gran impacto a la hora de ayudarnos a obtener resultados rápidos”, dijo Serdze. “El equipo de PerfectScale se sentó con nosotros, nos ayudó a optimizar y garantizó nuestro éxito en el uso de la plataforma. No he visto este nivel de compromiso por parte de otros proveedores, y me alegro de haber encontrado un socio en el que podemos confiar para que nos ayude a mantener bajo control nuestro coste de Kubernetes a medida que seguimos escalando.”