Cloud Intelligence™Cloud Intelligence™

Cloud Intelligence™

AWS Partner Black Belt in Machine Learning

By Joshua FoxApr 29, 20216 min read

Questa pagina è disponibile anche in English, Deutsch, Español, Français, 日本語 e Português.

Di recente, noi tre abbiamo preso parte all'edizione pilot del programma AWS Partner Black Belt in Machine Learning e Intelligenza Artificiale, conseguendo la relativa certificazione. In questo articolo Le racconteremo com'è strutturato il programma, dalle sessioni formative al progetto finale.

aws partner blackbelt

1 grijjhqnffsesnnqi1lhea

Ovvero, com'è andata la nostra partecipazione al pilot di questo programma di certificazione avanzato

Articolo scritto insieme ai miei colleghi di DoiT International, Gad Benram e Darren Brien

Introduzione

Di recente, noi tre abbiamo preso parte all'edizione pilot del programma AWS Partner Black Belt in Machine Learning e Intelligenza Artificiale, conseguendo la relativa certificazione. In questo articolo Le racconteremo com'è strutturato il programma, dalle sessioni formative al progetto finale.

In passato avevamo già ottenuto certificazioni di vari cloud provider, tra cui l'AWS Certified Machine Learning Specialty. La Black Belt è un livello di certificazione superiore: attesta un'esperienza concreta e approfondita, non nozioni studiate all'ultimo momento. Al posto di un esame a risposta multipla, la valutazione passa attraverso un capstone project finale, paragonabile per difficoltà a un progetto universitario di fine corso.

I partecipanti erano professionisti del Machine Learning attivi sul cloud AWS. Docenti e valutatori erano architect e product manager AWS specializzati nel settore.

In DoiT International le nostre specializzazioni spaziano dall'infrastruttura cloud al ML e i nostri ruoli vanno dalla consulenza ai clienti allo sviluppo di sistemi ML. Eppure, il programma si è rivelato adatto a ciascuno di noi — e con ogni probabilità lo sarà anche per Lei.

Lezioni e laboratori

Qui di seguito ripercorreremo alcuni degli elementi essenziali di AWS ML che abbiamo trattato. Se Le sono già tutti familiari, ottimo: superare l'esame sarà una passeggiata. Più realisticamente, però, anche con anni di esperienza alle spalle è difficile aver lavorato con l'intera gamma di servizi AWS lungo tutto il workflow ML — e questa è l'occasione giusta per colmare le lacune.

Il programma parte con sessioni formative online, circa 10 ore alla settimana per quattro settimane, tra lezioni, walkthrough strutturati delle tecnologie e laboratori live. La seconda metà è dedicata al capstone project, con un impegno di tempo analogo.

Dove sono i dati?

Il primo passo di un progetto ML è chiedersi: "Dove sono i tuoi dati?"

AWS mette a disposizione diverse soluzioni per acquisire, scoprire e trasformare i dati, rendendoli subito disponibili e utilizzabili nei progetti ML.

Le suite di servizi Kinesis e Glue formano una combinazione potente per ingestion e trasformazione serverless dei dati che arrivano in tempo reale. Un'altra opzione di trasformazione è EMR, un ecosistema Hadoop gestito. In genere tutti questi servizi scrivono il proprio output su S3, lo storage di riferimento per il Machine Learning.

Lo step successivo nella gestione dei dati è costruire una raccolta massiva analizzabile per ricavare insight di business e pattern utili al training ML. Glue Data Catalog registra posizione e schema dei dati, mentre Lake Formation definisce i percorsi di accesso con set di permessi granulari.

A questo punto si possono interrogare i dati in SQL grazie ai potenti motori di Athena sopra S3 . In alternativa , invece di un lake di dati non strutturati su S3, è possibile utilizzare Redshift come data warehouse strutturato.

Lasci pilotare Autopilot

Sagemaker Autopilot Le permette di saltare qualche passaggio. Lo strumento individua un algoritmo che ha buone probabilità di funzionare e lo testa con molti valori di parametri diversi. È utile per un primo run rapido, ma otterrà risultati più accurati e meno costosi se prima esplora e prepara i dati, mettendoli in una forma con cui l'algoritmo possa davvero lavorare.

Prima esplori

Bisogna capire cosa si vuole fare prima di farlo, e questo passaggio si chiama Exploratory Data Analysis.

La visualizzazione di dataset completi si può realizzare con lo strumento di business intelligence QuickSight, ma la maggior parte dell'EDA si svolge in Sagemaker Notebook, un ambiente di sviluppo interattivo per Python pensato per il ML. Qui può fare preprocessing, analisi ed esplorazione dei dati, e perfino eseguire modellazione e valutazione con iterazioni rapide, prima di passare ai servizi distribuiti e scalabili di AWS.

Possiamo finalmente fare un po' di ML, per favore?

Finalmente è arrivato il momento di scegliere ed eseguire un algoritmo di machine learning. Amazon Sagemaker mette a disposizione una serie di algoritmi pronti all'uso: DeepAR, XGBoost, e una decina di altri, ciascuno con i propri casi d'uso. Per un tuning più mirato, Sagemaker hyperparameter optimization consente di sperimentare automaticamente valori su più dimensioni. Se ha sviluppato algoritmi proprietari, può impacchettarli in un ML container e integrarli sfruttando appieno la potenza di Sagemaker.

Machine Learning Ops su AWS

L'ultima parte del programma Black Belt si è concentrata sulla messa in produzione dei modelli: ML Ops. L'approccio di Amazon a quest'area in rapida evoluzione è una declinazione in chiave ML dei cinque pilastri dell'AWS Well-Architected Framework, basata su pratiche ormai standard nell'ingegneria del software.

Il modello evolve nel tempo

Quando arrivano nuovi dati, anche le inferenze devono rifletterne i cambiamenti. Sagemaker Pipelines automatizza il processo di training e deployment, gestendo il versioning di API e modelli. Le versioni possono girare in parallelo per A/B testing end-to-end. Il Model performance monitoring consente di capire se l'accuratezza è calata al punto da richiedere un retraining.

La sicurezza viene prima di tutto

Per controllare l'accesso a livello di rete, Sagemaker Notebooks, training job ed endpoint di inferenza possono essere distribuiti all'interno della propria VPC. A livello utente, invece, gli accessi si gestiscono con IAM.

Mantenere tutto in funzione

Gli inferencing endpoint di Sagemaker sono disponibili in modalità on-demand o batch. Sagemaker ne garantisce l'alta disponibilità con autoscaling e failover automatico all'occorrenza.

Il capstone project

Implementare una soluzione è il modo migliore per consolidare ciò che si è imparato; ed è anche il modo migliore per mettere in mostra le proprie competenze. Abbiamo scoperto con piacere che il programma Black Belt non si limitava ai laboratori live, ma includeva anche un capstone project di quattro settimane. Ogni partecipante ha scelto un progetto ML in aree come anomaly detection o manutenzione predittiva. Il team AWS ci ha accompagnato con una guida puntuale lungo tutto il percorso, rendendosi disponibile su Slack ben oltre le aspettative.

I nostri progetti sono stati valutati con una rubric completa, una griglia di valutazione che elencava tecnologie e soluzioni da impiegare in ogni fase di consegna di un sistema ML: dall'ingestion alla trasformazione, fino a training, valutazione e ML Ops.

Conclusioni

Vogliamo ringraziare il team AWS per il supporto e la guida ricevuti: progettare il programma, erogare la formazione e valutare i capstone project non è stato un lavoro da poco.

L'AWS AI/ML Black Belt è al tempo stesso una certificazione esclusiva e un modo diverso di apprendere. La consigliamo a chiunque voglia fare un salto di qualità nel ML e dimostrarlo al mondo.


Grazie per averci letto! Per restare in contatto, ci segua sul DoiT Engineering Blog , sul canale LinkedIn di DoiT e sul canale Twitter di DoiT . Per scoprire le opportunità di carriera, visiti https://careers.doit.com .