proteanTecs reduce los costes de Kubernetes con recomendaciones basadas en IA
Conoce proteanTecs
proteanTecs tiene la misión de facilitar la escalabilidad de la industria electrónica. Su plataforma basada en la nube combina datos de telemetría profunda con aprendizaje automático para controlar la salud y el rendimiento de los chips avanzados, transformando la fiabilidad de la electrónica.
Las soluciones proteanTecs son componentes críticos utilizados por clientes clave de diversos sectores, como semiconductores, centros de datos y automoción. Esto requiere disponer de una infraestructura de aplicaciones que sea estable, escalable y altamente disponible. Para garantizar que su aplicación satisface las demandas de los clientes, proteanTecs utiliza Kubernetes para ejecutar toda su plataforma, utilizando más de 30 clústeres en los servicios en la nube de AWS, Azure y Google.
El desafío
La plataforma proteanTecs ha experimentado un crecimiento sustancial, tanto funcionalmente como desde el punto de vista del usuario final. En las primeras etapas de la historia de la empresa, la estabilidad y disponibilidad de la aplicación eran los factores más críticos, pero a medida que su solución escalaba, empezó a notar que los recursos suboptimizados afectaban a su presupuesto.
“Nuestro equipo de desarrollo construye sus microservicios y elige su propia solicitud y límites de recursos”, explicó Amit Daniel, Director de DevOps en proteanTecs. “Sin embargo, los desarrolladores tendían a asignar recursos poco arriesgados para asegurarse de que sus servicios funcionaban como se esperaba. Este enfoque mantenía nuestros sistemas disponibles y estables, pero era ineficaz desde el punto de vista de los costes.”
El equipo de DevOps se centró en optimizar su entorno Kubernetes para eliminar recursos innecesarios y reducir los costes de la nube. Sin embargo, su conjunto de herramientas tenía varias lagunas en ese momento, lo que convertía la optimización en una tarea compleja y lenta.
“Con herramientas como Datadog, podemos ver lo que queramos: peticiones, límites, etc., pero sólo nos dan visibilidad. Necesitábamos conocer mejor qué recursos necesitan nuestros microservicios para funcionar correctamente”, afirma Daniel. “PerfectScale de DoiT nos proporciona la visibilidad y los conocimientos exactos que necesitamos para optimizar nuestros costes de Kubernetes. Compara los recursos que hemos asignado a cada servicio frente a la utilización real para identificar el sobreaprovisionamiento, y luego nos dice qué medidas debemos tomar para reducir costes de forma segura.”
La solución
proteanTecs empezó probando PerfectScale de DoiT en uno de sus entornos de desarrollo para disponer de los conocimientos y la automatización necesarios para optimizar los costes de Kubernetes. Rápidamente descubrió claras oportunidades para reducir costes sin comprometer el rendimiento.
“Nuestro entorno de desarrollo costaba unos 10.000 dólares al mes”, dijo Daniel. “Aplicando las recomendaciones de PerfectScale, pudimos reducir el coste a 5.000 $ sin comprometer la estabilidad del entorno”.
A medida que preoteanTec trasladaba la solución a entornos de producción, quería asegurarse de que los esfuerzos de optimización de costes no afectaran al rendimiento del sistema. Para garantizar que los servicios se mantuvieran estables, el equipo aprovechó la capacidad de PrefectScale de proporcionar servicios de margen adicionales ajustando el “nivel de resiliencia”.
El equipo también utilizó PerfectScale para identificar los servicios que carecían de los recursos necesarios para funcionar correctamente.
“Encontramos estrangulamientos, OOM y reinicios de contenedores que no sabíamos que estaban ocurriendo. Muchos problemas no activaban alertas en nuestro sistema de supervisión. Además, si no capturábamos las métricas correctas, determinar la causa raíz de algo como una fuga de memoria resultaba complicado y requería mucho tiempo.” explicó Daniel. “PerfectScale identifica al instante los problemas y nos muestra cómo resolverlos rápidamente. Como resultado, vemos que nuestra plataforma funciona mejor, lo que nos ayuda a ofrecer a nuestros clientes una experiencia mejor.”
Resultados
Aunque el equipo de DevOps sigue liderando la optimización, la visión a largo plazo es clara: ampliar el impacto a toda la organización de ingeniería.
El objetivo es integrar la conciencia de costes en el ciclo de vida del desarrollo. Después de cada lanzamiento, se espera que los desarrolladores evalúen la rentabilidad de sus servicios y apliquen proactivamente los conocimientos de PerfectScale para mantener el entorno Kubernetes ágil, eficiente y de alto rendimiento.
Este cambio es posible gracias al éxito mensurable que ya se ha logrado:
- Reducción del 50% de los costes del entorno de desarrollo
- Mejor visibilidad de la utilización de los recursos en tiempo real
- Resolución más rápida de problemas como la ralentización y las fugas de memoria
- Mayor estabilidad y rendimiento de la plataforma
¿Y ahora qué?
“A medida que continuamos desplegando innovaciones en nuestra aplicación, y a medida que crece la base de clientes, y queremos asegurarnos de que nuestro entorno crece de la forma más eficiente posible”, dijo Daniel. “PerfectScale será una solución esencial para ayudarnos a mantener nuestro entorno rentable y estable”.