Cómo PerfectScale ayuda a un equipo DevOps de una persona a escalar en Riftweaver
Conoce a Riftweaver
Riftweaver es un innovador estudio de juegos que lleva los juegos de rol de mesa (RPG) a los usuarios de dispositivos móviles, y recientemente ha dado grandes pasos. Desde el lanzamiento de su juego estrella hasta la introducción del juego en plataformas como Steam e iPads, el juego de Riftweaver tiene más de 80.000 descargas. Con un pequeño equipo de sólo 15 empleados, la infraestructura backend de Riftweaver está gestionada por un único ingeniero DevOps, Rumby Osei, que garantiza el rendimiento, la eficacia y la escalabilidad de la infraestructura del juego, al tiempo que ofrece una experiencia sin fisuras a su creciente base de jugadores.
El desafío
“Cuando me uní a Riftweaver, el juego no estaba escalando ni manejaba una carga lista para la producción. Mi función era llevarnos hasta allí”. Éste era el cometido inicial de la función DevOps en Riftweaver, y Osei estaba ansioso por abordarlo.
Cuando el estudio de juegos Riftweaver se preparaba para pasar de la beta cerrada al acceso anticipado y al lanzamiento público, Osei sabía que una carga de jugadores impredecible ejercería una presión inmediata sobre el producto en términos de escalabilidad y rendimiento.
Este proveedor de juegos de aplicaciones modernas nativas en la nube se ejecuta. Con un clúster de producción y varios entornos de no producción ejecutándose en AWS EKS, Osei confiaba en Cluster AutoScaler (CAS) para el escalado de nodos y en Horizontal Pod Autoscaler (HPA) para el escalado de pods. Sin embargo, cuando algunos de sus servicios empezaron a tener problemas de estrangulamiento, buscó ayuda en Kubernetes Vertical Pod Autoscaler (VPA), pero rápidamente se topó con varios obstáculos.
“VPA no proporcionaba datos históricos ni me permitía generar resultados coherentes. No podía volver atrás y ver qué había cambiado con el tiempo. Incluso tuve que escribir un script para extraer todos los VPA de cada implantación sólo para comparar los datos”.
Esto creó varios retos clave para Riftweaver, entre ellos:
- Estrangulamiento de la CPU
Estrangulamiento frecuente durante las pruebas de carga y el juego en directo, lo que provoca retrasos en el juego y malas experiencias de usuario. - Solución de problemas lenta
El análisis del rendimiento requería un alto grado de esfuerzo manual , a menudo con métricas contradictorias. - Optimización limitada
Las herramientas existentes, como el VPA, carecen de información histórica y recomendaciones procesables, lo que hace que la optimización sea engorrosa.
La solución
Rumby Osei empezó a buscar una solución que pudiera ayudarla a tomar decisiones de dimensionamiento más basadas en datos, reducir los cuellos de botella en el rendimiento y proporcionar información procesable sobre el uso de los recursos. Tras una conversación con el equipo de PerfectScale, Rumby vio su potencial para salvar la distancia entre las predicciones de las pruebas de carga y el comportamiento real de los usuarios para mejorar la resistencia de sus cargas de trabajo.
La interfaz intuitiva de PerfectScale, sus sólidos análisis y sus recomendaciones prácticas la convirtieron en una herramienta atractiva para el pequeño pero dinámico equipo de Riftweaver. Funciones como el seguimiento del impacto medioambiental y la visibilidad de la HPA también se alinearon con el enfoque progresista del estudio respecto a la gestión de infraestructuras.
Con PerfectScale, Riftweaver puede ahora satisfacer sus necesidades de rendimiento, eficacia y escalabilidad de varias formas clave:
- Reducir el estrangulamiento de la CPU PerfectScale identificó las cargas de trabajo de alto riesgo y proporcionó recomendaciones a medida para los ajustes de la CPU.
- Simplificar la asignación de recursos El conocimiento de los nodos y cargas de trabajo infrautilizados permitió a Osei optimizar tanto la colocación de los pods como la selección de nodos, reduciendo el despilfarro y mejorando la eficacia.
- Mejorar la resistencia Al priorizar los cambios en función de los perfiles de riesgo de PerfectScale, Riftweaver minimiza problemas como las llamadas a la API caídas o duplicadas, que antes frustraban a los usuarios.
Estos resultados convierten a PerfectScale en parte integrante de la estrategia de infraestructuras de Osei. “La interfaz de usuario y los perfiles de riesgo de PerfectScale me dieron confianza en las recomendaciones. También introdujo funciones que no había visto antes, como la supervisión del impacto medioambiental con el seguimiento del CO2.”
Resultados
Mejoras como éstas son fundamentales para ayudar a Riftweaver a escalar con eficacia a medida que satisface la creciente demanda.
Los resultados clave incluyen
- Reducción del 59% en el estrangulamiento de la CPU
Seis API críticas mostraron mejoras significativas, garantizando un juego más fluido para los usuarios. - Experiencia de usuario mejorada
Los jugadores experimentaron menos interrupciones, incluso durante los picos de uso, lo que refuerza el compromiso de Riftweaver con la calidad. - Operaciones agilizadas para un equipo DevOps de una sola persona
Osei adquirió la capacidad de gestionar proactivamente el escalado y la resistencia con un esfuerzo manual mínimo. - Escalado rentable
Como parte del Paquete Comunitario de PerfectScale, Riftweaver accedió a estas capacidades de forma gratuita, garantizando que el equipo pudiera optimizar su infraestructura sin tensiones financieras adicionales.
“PerfectScale ha cambiado las reglas del juego. Los conocimientos no sólo han resuelto problemas inmediatos, sino que también nos han preparado para el crecimiento futuro a medida que nos expandimos a más plataformas y usuarios.”
Al aprovechar PerfectScale, Riftweaver ha optimizado su entorno Kubernetes, garantizando escalabilidad, fiabilidad y una experiencia superior para el jugador. A medida que el estudio sigue creciendo, PerfectScale sigue siendo un socio importante en su viaje para ofrecer un juego emocionante y sin retrasos a los jugadores de todo el mundo.