3 consigli per ottimizzare i costi AWS

Nel 2023 la spesa globale per il cloud è destinata ad avvicinarsi alla soglia dei 600 miliardi di dollari, con una crescita del 21% rispetto all'anno precedente: un dato che dimostra quanto il cloud sia ormai parte integrante dell'economia mondiale. Sempre più aziende nascono direttamente nel cloud (i cosiddetti digital native) e si affiancano a quelle che hanno già completato un percorso di migrazione, riconoscendo nel public cloud la scelta più conveniente e la migliore opportunità per far crescere il proprio business.

Con la crescita delle aziende, di qualunque dimensione, si amplia inevitabilmente anche la portata degli ambienti cloud e la spesa che ne deriva: man mano che le operations scalano, è naturale che salgano anche i costi infrastrutturali. La chiave del successo, e uno dei tratti distintivi di un'organizzazione matura nelle pratiche FinOps, sta nel far crescere e scalare la propria presenza nel cloud in misura strettamente coerente con le esigenze di business. Una parte rilevante di questo lavoro consiste nell'ottimizzare la spesa ovunque sia possibile, cogliendo le opportunità di risparmio e tenendo a freno i costi superflui.

Più facile a dirsi che a farsi: la natura dinamica e la complessità degli ambienti cloud richiedono competenza e attenzione costante per mantenere la spesa sotto controllo. Detto questo, ecco tre ambiti su cui può iniziare a lavorare o affinare ciò che già sta facendo per ottimizzare i costi su AWS:

Aumenti la copertura degli sconti tramite commitment

Dato che EC2 e gli altri servizi di compute pesano in genere per il 50-70% della bolletta cloud complessiva, ridurne i costi è la leva con il maggiore potenziale di risparmio. AWS offre sconti sui commitment di risorse sotto forma di Savings Plans e Reserved Instances, entrambi acquistabili con durata di 1 o 3 anni e con alcune differenze rilevanti in termini di buyback e flessibilità:

Può approfondire qui le differenze tra queste tipologie di commitment, ma il punto è che gestire i commitment e massimizzare i risparmi disponibili è un lavoro a tempo pieno. Per stimare l'utilizzo di compute occorre considerare numerosi fattori — tipologie di macchine, regioni, servizi cloud e così via — e poi monitorare consumi e date di scadenza per centrare i traguardi giusti.

Il modo migliore per massimizzare la copertura è impegnare il maggior volume possibile di workloads con RI o Savings Plans triennali, che offrono sconti del 60-70% contro il 25-35% dei piani annuali. Tenga però presente che i commitment a 3 anni sono per loro natura più rischiosi di quelli a 1 anno, semplicemente perché è molto più difficile prevedere i workloads su un orizzonte così lungo. Le aziende con la maturità e la stabilità necessarie possono coprire all'incirca metà dei workloads stimati con commitment triennali, integrando poi con quelli annuali per completare la copertura.

Il bello di una soluzione come DoiT Flexsave™ è che automatizza la gestione dei commitment annuali per massimizzare i risparmi su qualsiasi workload di compute on-demand (EC2, Fargate e Lambda compresi) non già scontato. Questo non solo alleggerisce il carico di gestione FinOps, ma elimina anche il rischio di impegnarsi in eccesso su risorse che poi non verranno utilizzate.

Flexsave funge inoltre da hub FinOps per la sua strategia di commitment AWS: offre una panoramica dei Savings Plans attivi e analisi sulla copertura degli sconti direttamente nel dashboard. Il grafico mostra di default la copertura dei dieci SKU più rilevanti; se desidera visualizzarne altri o suddividere il dato per regione, può aprire un report Cloud Analytics direttamente dal dashboard. Da lì potrà capire meglio quali servizi non sono idonei agli sconti e valutare se sia possibile ri-architettare quei workloads per aumentare i risparmi.

Clicchi sull'immagine qui sotto per scoprire come usare il dashboard di Flexsave:

Sfrutti le Spot Instances

Come Savings Plans e RI, le Spot Instances permettono di ottenere sconti consistenti sui workloads di compute on-demand, ma con una controindicazione importante: i workloads Spot possono essere revocati da AWS con un preavviso di appena 2 minuti. Pertanto, sebbene con le Spot Instances si possano ottenere risparmi ancora maggiori, fino al 90%, il rischio è decisamente più elevato e il loro uso andrebbe riservato a operazioni fault tolerant come workloads containerizzati, web server stateless, ambienti di test o applicazioni big data.

Su AWS le Spot Instances si gestiscono con gli Auto Scaling group (ASG), ma il loro utilizzo richiede una certa flessibilità sui tipi di istanza e sulle Availability Zone richieste. Perché? Perché potrebbero non essere disponibili nelle specifiche desiderate. Gli ASG, inoltre, vanno configurati manualmente e ottimizzati con regolarità per garantire che le esigenze di compute siano soddisfatte in modo costante, senza interruzioni significative. A parte la natura manuale e laboriosa del processo, una configurazione errata può semplicemente non funzionare.

Visti i rischi e l'impegno richiesto, molti professionisti rinunciano del tutto alle Spot Instances. DoiT Spot Scaling, però, automatizza il processo per eliminare il rischio di interruzioni e far girare in modo affidabile i suoi workloads sulle Spot Instances. Lo strumento analizza automaticamente gli ASG, suggerisce configurazioni best practice e, quando possibile, sostituisce le istanze on-demand con le Spot Instances, fortemente scontate. Per azzerare il rischio, Spot Scaling prevede inoltre un fallback alle istanze on-demand nei momenti in cui sul mercato non c'è capacità Spot disponibile.

Per vedere Spot Scaling all'opera, clicchi sull'immagine qui sotto:

Verifichi lo storage per individuare opportunità di ottimizzazione

Pur non pesando quanto il compute sulla bolletta cloud mensile, i costi di storage possono crescere rapidamente con la scala: è quindi un'area da rivedere periodicamente per tenerli al minimo. AWS offre diverse classi di storage con prezzi differenziati in base alla frequenza di accesso ai dati. Significa che oggetti la cui frequenza di accesso è cambiata possono restare archiviati in S3 Standard pur potendo essere spostati in Infrequent Access o addirittura in Glacier.

Per ottenere il massimo dell'efficienza dalle classi di storage, può sfruttare le lifecycle policy per spostare automaticamente i dati tra le varie classi in base ai pattern di accesso. Tenga conto anche del numero e della dimensione degli oggetti, dato che i prezzi di retrieval e trasferimento sono calcolati al GB. Inoltre, con Amazon S3 Select può recuperare dati specifici dagli oggetti S3, riducendo potenzialmente la mole di dati trasferiti.

Un altro aspetto da non sottovalutare: tanti oggetti di piccole dimensioni possono diventare costosi molto in fretta. Se ha molti file di dimensioni ridotte, può avere senso archiviarli su un servizio di database come DynamoDB o MySQL anziché su S3. Se non è praticabile, valuti la possibilità di accorparli in batch e salvarli come un unico file.

DoiT Cloud Analytics abilita questo tipo di analisi grazie ai raggruppamenti di cost allocation: le permette di ottenere rapidamente insight sui driver di costo suddividendoli per servizio, SKU, availability zone e così via.

Per capire meglio come funzionano queste funzionalità di Cloud Analytics all'interno di DoiT Cloud Navigator, clicchi sull'immagine qui sotto e faccia un tour interattivo: