Cloud Intelligence™

El nuevo modelo de CUDs por gasto de Google Cloud, explicado

By Alex GkiourosJan 23, 20266 min read

Esta página también está disponible en English, Deutsch, Français, Italiano, 日本語 y Português.

Google Cloud rediseñó por completo el funcionamiento de los CUDs por gasto: pasó de un modelo basado en créditos a uno con precios con descuento aplicado directamente, y además amplió la cobertura para incluir VMs optimizadas para memoria, HPC y Cloud Run. Desde ayer, todos los clientes ya están migrados al nuevo sistema. Acá te contamos qué significa para tus costos en la nube y tus dashboards de FinOps.

El viejo rompecabezas de la facturación

¿Alguna vez te encontraste calculando los ahorros de CUD haciendo malabares entre costos on-demand, cuotas de commitment y compensaciones de créditos? Así funcionaba el sistema legado de CUDs por gasto de Google. Te comprometías, por ejemplo, a $100/hora de gasto on-demand, pagabas una cuota de commitment de $54/hora (con un 46% de descuento) y recibías un crédito de -$100 que compensaba tus cargos por uso. Las cuentas cerraban, pero explicárselo a un cliente o al equipo de finanzas era una pesadilla.

El nuevo modelo multiprice elimina toda esa complejidad. En lugar de créditos, Google ahora aplica el descuento directamente sobre los precios de los SKUs a través de lo que llama "consumption models". Te comprometes a tu gasto real con descuento ($54/hora), pagas ese monto y tu uso aparece ya con la tarifa rebajada. Sin créditos aparte ni gimnasia mental.

El cambio también modifica de raíz cómo se ven los datos de CUD en los exports de BigQuery, lo que obliga a actualizar cualquier dashboard de FinOps casero o sistema de asignación de costos que hayas construido. En DoiT pasamos por lo mismo.

El detalle técnico

La migración trae tres cambios importantes que conviene entender:

Primero, el cálculo del commitment se invierte. Antes te comprometías en función del gasto equivalente on-demand. Ahora te comprometes a tu costo real por hora con descuento. Un commitment que cubría $185 de uso on-demand con un 46% de descuento se describía como un "commitment de $185/hora". Bajo el nuevo modelo, ese mismo commitment se describe como un "commitment de $100/hora", que es lo que efectivamente pagas. La herramienta CUD Recommendations también se actualizó en consecuencia. Si tienes scripts de automatización que calculan montos de commitment, vas a tener que revisarlos.

Segundo, el esquema de BigQuery suma campos nuevos. La incorporación más relevante es el struct consumption_model, que contiene los campos id y description. Cuando el uso queda cubierto por un Compute Flexible CUD a 3 años, la descripción dice "Compute Flexible CUDs 3 Year" en lugar de aparecer como una línea de crédito separada. Google también agregó los campos price.list_price, price.effective_price_default y cost_at_list_consumption_model para ayudarte a diferenciar entre precios on-demand y con descuento en tus consultas.

Tercero, los SKUs de cuotas se reestructuran. Los nuevos SKUs de cuota de CUD tienen un precio de $1/hora con un tipo de crédito compensatorio llamado FEE_UTILIZATION_OFFSET. Cuando tu CUD se utiliza por completo, la cuota y la compensación se cancelan a cero. Cuando hay subutilización, vas a ver la porción no usada como un cargo. Esto genera dos filas por CUD en tus datos de facturación: una para el uso cubierto a precio con descuento, y otra para cualquier excedente a precio on-demand.

FEE_UTILIZATION_OFFSET

La cobertura ampliada abre oportunidades reales de ahorro

Los Compute Flexible CUDs ahora cubren workloads que antes requerían tipos de commitment separados o que directamente no tenían vía de descuento.

Las VMs optimizadas para memoria por fin tienen cobertura de Flex CUD. Las familias de máquinas M1, M2, M3 y M4 ahora pueden cubrirse con Compute Flexible CUDs, pero solo en plazos de 3 años con un descuento del 63%. Acá hay un detalle importante: los commitments a 1 año ofrecen cero descuento para VMs optimizadas para memoria. Tu gasto va a consumir el commitment sin generar ningún ahorro. Si corres workloads intensivos en memoria como SAP HANA o bases de datos in-memory grandes, los commitments a 3 años se vuelven mucho más atractivos.

Las familias de HPC se suman a la fiesta. Las familias optimizadas para cómputo H3 y la nueva H4D ahora son elegibles para Flex CUD, con un 17% a 1 año y 38% a 3 años. La H4D, actualmente en preview, viene con procesadores AMD EPYC Turin de 5ta generación con 192 núcleos, hasta 1.488 GB de memoria y networking RDMA habilitado de 200 Gbps. Hierro de verdad para workloads de cómputo serios.

Cloud Run obtiene cobertura completa. La facturación basada en requests para los servicios de Cloud Run (incluidas las Cloud Run functions, antes conocidas como Cloud Functions) ahora califica para Compute Flexible CUDs con un 17% tanto a 1 como a 3 años. La facturación basada en instancias, los jobs y los worker pools siguen recibiendo descuentos del 28%/46%. Si corres workloads serverless a escala, esto puede impactar de forma significativa en tu economía unitaria.

La siguiente tabla resume la nueva estructura de descuentos por gasto:

Tus ahorros se ven distintos

Después de la migración, la columna de "Savings" en tu dashboard de FinOps va a mostrar números mucho más bajos. Si antes mostraba -$10.00, ahora puede mostrar -$4.50. Esto enciende todas las alarmas hasta que entiendes qué está pasando.

El modelo viejo mostraba un crédito bruto que compensaba todo tu costo on-demand. El nuevo modelo muestra tu ahorro neto real: la diferencia entre lo que habrías pagado a precio on-demand y lo que efectivamente pagaste con el descuento. El monto final de tu factura y el ahorro real son idénticos en ambos casos. Solo cambió la forma de presentarlo.

Ninguno de estos cambios afecta tus tasas de descuento reales. Un Compute Flexible CUD a 3 años te sigue ahorrando un 46% en cómputo general. Uno a 1 año te sigue ahorrando un 28%. Los dólares que salen de tu bolsillo son exactamente los mismos antes y después de la migración. Google cambió cómo se muestran los ahorros, no cómo se calculan. Que quede claro.

También vas a tener que comunicarlo a CFOs y stakeholders que se acostumbraron a ver números grandes de créditos. Cuando pregunten por qué los créditos de CUD cayeron un 55%, vas a tener que explicarles que ahora están viendo el ahorro real en lugar de compensaciones contables.

Las preguntas que más me hacen

¿Va a aumentar mi monto de commitment si no opto por la migración?

No. Cuando Google te migra automáticamente, convierte tus commitments existentes a valores equivalentes bajo el nuevo modelo. Si tenías un commitment de $185/hora (expresado como equivalente on-demand), pasa a ser un commitment de $100/hora (tu gasto real con descuento). Misma cobertura, mismo costo, otra etiqueta. Tu bolsillo queda exactamente igual; lo que cambia es el reporte.

¿Mis CUDs existentes van a cubrir menos después de la migración?

No, de hecho es al revés. Todos los CUDs existentes van a cubrir al menos lo que cubrían antes, y muchos van a cubrir más SKUs gracias a la elegibilidad ampliada. Si hoy tienes Compute Flexible CUDs, automáticamente van a empezar a cubrir workloads recién elegibles como la facturación basada en requests de Cloud Run, las instancias H3/H4D y las VMs optimizadas para memoria. Esto se traduce en un mejor aprovechamiento de los commitments que ya compraste, sin que tengas que mover un dedo.

Entonces, ¿qué cambia realmente?

La presentación y la estructura de datos. Tus porcentajes de descuento siguen iguales. El costo de tus commitments sigue igual. Tu cobertura se mantiene o mejora. Los cambios son:

Cómo se expresan los montos de commitment
Cómo aparecen los ahorros en los exports de facturación
Qué SKUs son elegibles para cobertura.

Eso es todo.

Los CUDs basados en recursos no cambian

Vale la pena recalcar lo que esta migración no afecta. Los committed use discounts basados en recursos —donde te comprometes a cantidades específicas de vCPU, memoria, GPU o Local SSD en una región y un proyecto en particular— siguen funcionando exactamente igual que antes. Siguen siendo la opción ideal para workloads predecibles y de estado estable, con requisitos de recursos consistentes.

Las diferencias clave se mantienen:

Los CUDs basados en recursos son específicos de proyecto y región (aunque puedes habilitar el sharing en toda una cuenta de facturación).
Los Flex CUDs por gasto se aplican automáticamente a todo el uso elegible dentro de una cuenta de facturación.

Los commitments basados en recursos ofrecen tasas de descuento un poco más altas para cómputo general (hasta 55% a 3 años, frente al 46% de los Flex), pero exigen una planificación de capacidad más precisa.

Lo que siempre recomiendo a la mayoría de las organizaciones es combinar ambos: CUDs basados en recursos para los workloads de baseline y predecibles, y Flex CUDs para el uso variable o distribuido, más difícil de anclar a una región y un tipo de máquina.

El nuevo modelo de CUDs multiprice es el cambio de facturación más grande de Google Cloud en años. La cobertura ampliada y un modelo de datos más limpio son grandes mejoras. Ahora, tu tarea es asegurarte de que tus sistemas internos estén listos para aprovecharlas. Si quieres que en DoiT te demos una mano, conversemos.