AWS Partner Black Belt in Machine Learning

Wir drei haben kürzlich an der Pilotrunde des AWS Partner Black Belt-Programms für Machine Learning und Künstliche Intelligenz teilgenommen und unsere Zertifizierungen erworben. In diesem Beitrag stellen wir das Programm vor – inklusive der Lerneinheiten und des Abschlussprojekts.

aws partner blackbelt

1 grijjhqnffsesnnqi1lhea

Oder: Unsere Erfahrungen aus der Pilotrunde dieses Advanced-Zertifizierungsprogramms

Verfasst gemeinsam mit meinen Kollegen bei DoiT International, Gad Benram und Darren Brien

Einleitung

Wir haben in der Vergangenheit bereits mehrere Zertifizierungen von Cloud-Anbietern erworben, darunter die AWS Certified Machine Learning Specialty. Der Black Belt steht für eine höhere Zertifizierungsstufe, die fundierte praktische Erfahrung statt potenziell auswendig gelerntem Wissen voraussetzt. Statt einer Multiple-Choice-Prüfung erfolgt die Bewertung über ein abschließendes Capstone-Projekt, dessen Schwierigkeitsgrad in etwa einer universitären Semesterarbeit entspricht.

Die Teilnehmenden waren ML-Praktiker, die in der AWS-Cloud arbeiten. Trainer und Prüfer waren AWS-Architekten und Product Manager mit Spezialisierung in diesem Bereich.

Unsere Schwerpunkte bei DoiT International reichen von Cloud-Infrastruktur bis zu ML, und unsere Aufgaben spannen sich von der Kundenberatung bis zur Entwicklung von ML-Systemen. Trotzdem war das Programm für jeden von uns das Richtige – und vielleicht auch für Sie.

Vorlesungen und Labs

Im Folgenden beschreiben wir einige der wesentlichen Bestandteile von AWS ML, die wir behandelt haben. Wenn Ihnen das alles bereits vertraut ist – umso besser, dann bestehen Sie problemlos! Wahrscheinlicher ist jedoch, dass Sie selbst mit langjähriger Erfahrung noch nicht mit dem gesamten Spektrum der AWS-Angebote entlang des ML-Workflows gearbeitet haben – und genau das ist Ihre Chance, dazuzulernen.

Das Programm beginnt mit Online-Lerneinheiten von rund 10 Stunden pro Woche über vier Wochen. Dazu gehören Vorlesungen, strukturierte Walkthroughs durch Technologien sowie Live-Labs. Die zweite Hälfte des Programms besteht aus dem Capstone-Projekt mit etwa demselben Zeitaufwand.

Her mit den Daten

Der erste Schritt jedes ML-Projekts lautet: "Wo sind Ihre Daten?"

AWS bietet mehrere Lösungen für das Ingestieren, Auffinden und Transformieren von Daten, damit diese für ML-Projekte unmittelbar verfügbar und nutzbar sind.

Die Service-Suiten Kinesis und Glue bilden eine starke Kombination für serverlose Ingestion und Transformation, sobald Daten in Echtzeit eintreffen. Eine weitere Lösung für Transformationen ist EMR, ein verwaltetes Hadoop-Ökosystem. All diese Dienste schreiben ihre Ergebnisse in der Regel nach S3 – die erste Wahl für die Datenspeicherung im Machine Learning.

Im nächsten Schritt geht es darum, einen umfangreichen Datenbestand aufzubauen, der sich nach Geschäftserkenntnissen und für das ML-Training nützlichen Mustern auswerten lässt. Der Glue Data Catalog erfasst Speicherort und Schema Ihrer Daten, während Lake Formation Pfade für Ihre Daten samt fein granularer Berechtigungen einrichtet.

Anschließend können Sie die Daten per SQL analysieren – mit den leistungsstarken Engines von Athena direkt auf S3 . Alternativ können Sie , statt eines Lakes mit unstrukturierten Daten in S3, auch Redshift als strukturiertes Data Warehouse nutzen.

Lassen Sie Autopilot für Sie fliegen

Mit Sagemaker Autopilot lassen sich womöglich einige Schritte überspringen. Das Tool wählt einen Algorithmus aus, der voraussichtlich passt, und probiert ihn mit zahlreichen Parameterwerten durch. Für einen schnellen ersten Durchlauf ist das hilfreich – genauere und kostengünstigere Ergebnisse erzielen Sie jedoch, wenn Sie die Daten zuvor untersuchen und so aufbereiten, dass Ihr Algorithmus damit wirklich etwas anfangen kann.

Erst erkunden

Bevor man etwas tut, sollte man verstehen, was man tut – dieser Schritt heißt Exploratory Data Analysis (EDA).

Vollständige Datasets lassen sich im Business-Intelligence-Tool QuickSight visualisieren, der Großteil der EDA findet jedoch im Sagemaker Notebook statt – einer interaktiven, auf ML ausgerichteten Entwicklungsumgebung für Python. Dort können Sie Daten vorverarbeiten, analysieren und erkunden und sogar Modellierung und Evaluation in schnellen Iterationen durchführen, um den Einsatz der skalierbaren, verteilten AWS-Dienste vorzubereiten.

Können wir bitte endlich etwas ML machen?

Endlich ist es so weit: einen Machine-Learning-Algorithmus auswählen und ausführen. Amazon Sagemaker bringt von Haus aus eine ganze Reihe Algorithmen mit: DeepAR, XGBoost und rund ein Dutzend weitere, jeweils mit eigenen Anwendungsfällen. Für ein besseres Tuning können Sie mit der Sagemaker Hyperparameter Optimization automatisch Werte über mehrere Dimensionen hinweg ausprobieren. Eigene Algorithmen lassen sich in einem ML-Container bündeln und vollständig in das Sagemaker-System integrieren.

Machine Learning Ops auf AWS

Der letzte Teil des Black Belt-Programms drehte sich darum, Modelle in die Produktion zu bringen: ML Ops. Amazons Ansatz für dieses sich rasant entwickelnde Feld ist eine ML-zentrierte Variante der AWS Well-Architected Five Pillars, basierend auf Praktiken, die im Software Engineering inzwischen Standard sind.

Das Modell ist im Wandel

Wenn neue Daten eintreffen, sollten sich die Veränderungen auch in den Inferenzen widerspiegeln. Sagemaker Pipelines automatisiert diesen Prozess aus Training und Deployment und sorgt für Versionierung von APIs und Modellen. Die Versionen lassen sich parallel betreiben – etwa für End-to-End-A/B-Tests. Model Performance Monitoring zeigt Ihnen, ob die Genauigkeit so weit nachgelassen hat, dass ein Retraining nötig ist.

Sicherheit hat oberste Priorität

Um den Zugriff auf Netzwerkebene zu steuern, lassen sich Sagemaker Notebooks, Training Jobs und Inference Endpoints jeweils in Ihrer VPC bereitstellen. Den Zugriff auf User-Ebene steuern Sie zusätzlich über IAM.

Im Dauerbetrieb

Sagemaker Inferencing Endpoints stehen On-Demand oder im Batch-Betrieb zur Verfügung. Sagemaker hält sie mit Autoscaling und automatischem Failover nach Bedarf hochverfügbar.

Capstone-Projekt

Eine Lösung selbst umzusetzen ist der beste Weg, das Gelernte zu festigen – und zugleich die beste Gelegenheit, das eigene Können zu zeigen. Wir haben uns sehr gefreut, dass das Black Belt-Programm nicht nur Live-Labs, sondern auch ein vierwöchiges Capstone-Projekt umfasst. Jeder Teilnehmende wählte eines der ML-Projekte aus Bereichen wie Anomalieerkennung oder vorausschauender Wartung. Das AWS-Team begleitete uns mit fundierter Anleitung und stand uns auch auf Slack jederzeit zur Verfügung.

Unsere Projekte wurden anhand eines umfassenden Bewertungsrasters benotet – einer Richtlinie, die Technologien und Lösungen für alle Aspekte der Bereitstellung eines ML-Systems auflistete: von Ingestion über Transformation, Training und Evaluation bis hin zu ML Ops.

Fazit

Wir danken dem AWS-Team für die Unterstützung und Begleitung: Das Programm zu konzipieren, das Training durchzuführen und die Capstone-Projekte zu bewerten war alles andere als ein kleines Unterfangen.

Der AWS AI/ML Black Belt ist sowohl eine exklusive Zertifizierung als auch eine ganz andere Art zu lernen. Wir empfehlen ihn allen, die sich im ML-Bereich weiterentwickeln und das auch nach außen sichtbar machen wollen.

Danke fürs Lesen! Bleiben Sie mit uns in Kontakt – auf dem DoiT Engineering Blog , dem DoiT LinkedIn-Kanal und dem DoiT Twitter-Kanal . Karrieremöglichkeiten finden Sie unter https://careers.doit.com .