Cloud Intelligence™Cloud Intelligence™
Integrations

Toma el control del costo de cada cluster de Ray

Visibilidad en vivo del consumo de Anyscale, el uso de los clusters de Ray y las oportunidades de right-sizing en cada workspace y nube.

Mockup del dashboard de gasto por job en Anyscale

La eligen los equipos que escalan IA y workloads de Ray en producción

Square
FanDuel
PlanetScale
CircleCI
Canva
Rippling
HelloFresh
Starburst

Conéctalo en minutos

Un solo API token. Visibilidad total de tus clusters de Ray.

Conecta tu organización de Anyscale con un API token de solo lectura. DoiT recopila automáticamente las métricas de consumo, el uso de cada cluster y el gasto subyacente en AWS o GCP, sin agentes y sin tocar el código de tus jobs de Ray. En pocas horas ya tienes los reportes unificados disponibles.

Ilustración de la integración con Anyscale

Lo que obtienes

Pensado para la realidad de correr Ray sobre Anyscale

Lo que los líderes de FinOps y de plataformas de ML realmente nos piden cuando conectan su organización de Anyscale.

Reportes de consumo unificados

Reportes de consumo unificados

Segmenta el gasto de Anyscale por workspace, proyecto, cluster o equipo, junto con los costos de la nube subyacente.

Anomalías en tiempo real

Anomalías en tiempo real

Recibe alertas en minutos sobre jobs de Ray descontrolados y picos de gasto en GPU.

Right-sizing de clusters

Right-sizing de clusters

Detecta head nodes y worker nodes sobredimensionados con recomendaciones concretas de CPU, GPU y memoria.

Detección de clusters inactivos

Detección de clusters inactivos

Identifica clusters de Ray que quedaron corriendo después de terminar un job y recupera ese gasto.

Visibilidad de GPU y aceleradores

Visibilidad de GPU y aceleradores

Separa el uso de GPU, CPU y xPU entre los workloads de entrenamiento, tuning y serving que se esconden dentro de las facturas agregadas.

Gobierno y presupuestos

Gobierno y presupuestos

Define presupuestos por equipo de ML o por proyecto y detecta los excesos antes del próximo entrenamiento.

El dashboard de uso de Anyscale te muestra lo que consumiste. Cloud Intelligence™ te ayuda a hacer algo al respecto.

Mucho más que el dashboard de uso de Anyscale

  • Consolidación multi-nube

    Vistas consolidadas del gasto de Anyscale corriendo sobre AWS, GCP o Kubernetes, con drill-down a cualquier cluster.

  • Alertas de anomalías en tiempo real

    Detección con machine learning a nivel de workspace, cluster y job, con notificaciones en Slack o por correo.

  • Planificación de commitments de GPU

    Modela Savings Plans, CUDs y reservas frente al uso real de Ray antes de comprometer un solo dólar.

  • Higiene de proyectos y asignación

    Encuentra workloads de Ray sin etiquetar, aplica reglas de asignación y reparte los costos compartidos tal como finanzas lo necesita.

  • Asignación de costos en Kubernetes

    Desglosa el gasto de Anyscale sobre Kubernetes por namespace, workload y label sin necesidad de exporters adicionales.

  • Forward Deployed Engineers

    Arquitectos cloud de primer nivel que trabajan como una extensión de tu equipo para implementar las optimizaciones.


Las empresas de mayor crecimiento se apoyan en DoiT Cloud Intelligence™

21%

Ahorro promedio en los primeros 90 días

28 días

Tiempo promedio de implementación

Oren Ashkenazy

El foco de DoiT en la confiabilidad, sumado a la flexibilidad del sistema, nos permite optimizar nuestros workloads de Amazon EKS de forma segura y sin que nuestros engineers tengan que intervenir.

Oren Ashkenazy

Director of DevOps and Cloud en Fiverr

¿Todo listo para conectar tu organización de Anyscale?

Pon bajo la lupa el gasto de tus clusters de Ray.

Frequently asked
questions

¿Cómo gano más visibilidad de los costos de Anyscale entre workspaces y proyectos?

Conecta tu organización de Anyscale una sola vez. Cloud Intelligence™ recopila los datos de consumo de cada workspace y proyecto, para que puedas segmentar los costos por cluster, job, equipo o nube subyacente desde una sola vista, sin consolidaciones manuales.

¿Cuál es la mejor forma de integrar los datos de uso de Anyscale con Cloud Intelligence™?

Usa un API token de solo lectura de tu organización de Anyscale junto con tu conexión de facturación de AWS o GCP. DoiT se encarga de la ingesta, la normalización y los reportes con granularidad horaria. La mayoría de los equipos quedan operativos en un día.

¿Cómo veo qué clusters o jobs de Ray concentran la mayor parte del gasto?

Los reportes de Cost & Usage te permiten ir desde el gasto total de Anyscale hasta un cluster, job o tipo de nodo específico. Filtra por workspace, proyecto, región o familia de instancia sin escribir una línea de SQL.

¿Cómo monitoreo las anomalías de costo de Anyscale en tiempo real?

La detección de anomalías corre de forma continua a nivel de workspaces, clusters y jobs. Cuando algo se sale de lo normal (por ejemplo, un entrenamiento quemando horas de GPU durante toda la noche), recibes una alerta en Slack o por correo con la causa probable.

¿Cómo reduzco la pérdida de clusters de Ray inactivos o sobredimensionados?

Cloud Intelligence™ identifica clusters que corren por debajo de los objetivos de utilización, head nodes sobredimensionados para su workload y clusters que quedaron inactivos después de terminar un job. Cada recomendación muestra el ahorro estimado.

¿Cómo asigno el gasto de Anyscale a los equipos de ML y a los modelos?

Mapea los workspaces, proyectos y etiquetas de Anyscale a tus centros de costo internos. Los pools compartidos de GPU se pueden dividir con reglas de asignación, para que finanzas vea el costo por equipo y por modelo sin armar planillas a mano.

¿En qué se diferencia Cloud Intelligence™ del dashboard de uso de Anyscale?

El dashboard de uso de Anyscale muestra estimaciones de consumo dentro de Anyscale. Cloud Intelligence™ conecta eso con el gasto real en la nube y suma visibilidad multi-nube, recomendaciones proactivas, detección de anomalías, gobierno y acceso a Forward Deployed Engineers.

¿Mis datos están seguros al conectar mi organización de Anyscale?

Cloud Intelligence™ usa un API token de solo lectura con permisos de mínimo privilegio. Nunca modificamos clusters ni jobs sin tu aprobación, y la plataforma cuenta con certificación SOC 2 Type II.