Amazon Rekognition: KI-gestützte Bild- und Videoanalyse

Wer Multimedia-Analysen in seine Anwendungen integrieren möchte, findet in Amazon Rekognition die ideale Lösung. Der Service für Bild- und Videoanalyse setzt auf Deep Learning und erkennt, analysiert und vergleicht Gesichter präzise, identifiziert Objekte, liest gedruckten Text und vieles mehr. Rekognition läuft auf AWS, ist hochgradig skalierbar und verarbeitet Millionen Bilder oder Videos in Echtzeit.

Wie funktioniert Amazon Rekognition?

Amazon Rekognition analysiert Bilder und Videos mithilfe von Deep-Learning-Technologie und nutzt dabei Convolutional Neural Networks (CNNs), die Merkmale in den visuellen Daten erkennen. Sie können den Service auf folgenden Wegen nutzen:

Zu den wichtigsten Funktionen von Rekognition zählen:

Objekt- und Szenenerkennung: Rekognition erkennt Tausende verschiedener Objekte und Szenen – von Alltagsgegenständen wie Auto, Hund oder Baum bis hin zu übergeordneten Szenenkategorien wie Strand, Stadtlandschaft oder Wald.
Gesichtsanalyse: Erkennen, analysieren und vergleichen Sie Gesichter und ermitteln Sie Merkmale wie Altersgruppe, Geschlecht und Emotionen.
Gesichtsabgleich: Suchen und vergleichen Sie Gesichter in einer Sammlung, finden Sie mögliche Treffer oder verifizieren Sie die Identität eines Nutzers.
Pathing: Verfolgen Sie die Bewegungen von Personen in Videos, um Sicherheitsrisiken zu erkennen oder das Kundenverhalten zu analysieren.
Label-Erkennung: Mit dieser Funktion analysieren Sie Bilder und identifizieren automatisch Objekte, Szenen und Konzepte. Ein Foto von Menschen an einem tropischen Strand kann beispielsweise Labels wie Palme (Objekt), Strand (Szene), Laufen (Aktion) und Outdoor (Konzept) enthalten.
Bildeigenschaften: Erkennt dominante Farben und misst Helligkeit, Schärfe und Kontrast eines Bildes.
Videosegmentierung: Rekognition analysiert Videodateien und unterteilt sie in aussagekräftige Szenen oder Einstellungen. Das ist besonders hilfreich für Videoindexierung, Content-Management und gezielte Werbung, weil Anwender ihre Videoinhalte so besser verstehen und organisieren.
Texterkennung: Rekognition erkennt und extrahiert Text aus Bildern und Videos. So lassen sich schriftliche Informationen in visuellen Inhalten identifizieren – nützlich etwa für Dokumentenanalyse, Kennzeichenerkennung und Augmented-Reality-Anwendungen.
Emotionserkennung: Die Plattform erkennt und analysiert Emotionen, die Menschen in Bildern und Videos zeigen, etwa Freude, Trauer, Wut oder Überraschung. Das ist wertvoll für den Kundenservice, die Werbung und die Unterhaltungsbranche, weil sich Reaktionen des Publikums messen oder Inhalte gezielt auf bestimmte emotionale Reaktionen ausrichten lassen.
Content-Moderation: Rekognition hilft dabei, potenziell unsichere oder unangemessene visuelle Inhalte zu erkennen und herauszufiltern, indem explizites oder anstößiges Material automatisch identifiziert wird. Das ist hilfreich für Unternehmen und Organisationen, die ein sicheres Umfeld für ihre Nutzer gewährleisten möchten – etwa Social-Media-Plattformen, E-Commerce-Websites oder Bildungseinrichtungen.
Promi-Erkennung: Rekognition erkennt Tausende prominenter Persönlichkeiten aus Bereichen wie Unterhaltung, Sport und Politik. Das ist nützlich für Anwendungen wie Medienanalyse, Content-Empfehlungen und Werbung.

Beispiel einer Gesichtsanalyse aus dem Amazon Rekognition Dashboard in der AWS Console

Erste Schritte mit Amazon Rekognition – ein Tutorial

Dieses Tutorial führt Sie in die Label-Erkennung von Amazon Rekognition ein und zeigt die Nutzung über die AWS Management Console und das AWS SDK für Python (Boto3).

AWS-CLI-Umgebung konfigurieren

Melden Sie sich in Ihrer AWS-Konto-Console an, falls noch nicht geschehen: https://console.aws.amazon.com
Installieren Sie das AWS Command Line Interface (CLI) gemäß dieser Anleitung: https://docs.aws.amazon.com/cli/latest/userguide/getting-started-install.html
Konfigurieren Sie die AWS CLI mit Ihrem Access Key, Secret Access Key, der Standardregion und dem Ausgabeformat:

$ aws configure
AWS Access Key ID [****]:
AWS Secret Access Key [****]:
Default region name [us-east-1]:
Default output format [json]:

Amazon-S3-Bucket für Ihr Bild anlegen

Melden Sie sich in der AWS Management Console an und öffnen Sie die Amazon-S3-Konsole: https://s3.console.aws.amazon.com/s3/
Klicken Sie auf "Create bucket" und folgen Sie den Anweisungen, um einen neuen Bucket für Ihr Bild zu erstellen.
Laden Sie ein Bild in den neu erstellten S3-Bucket hoch.

Berechtigungen einrichten

Legen Sie eine IAM-Rolle mit den erforderlichen Berechtigungen für den Zugriff auf den S3-Bucket und die Nutzung von Amazon Rekognition an. Dafür benötigen Sie ein JSON-Policy-Dokument für die IAM-Rolle. Hier ein Beispiel für eine Policy mit den nötigen Berechtigungen:

{
    "Version": "2012-10-17",
    "Statement": [\
        {\
            "Effect": "Allow",\
            "Action": [\
                "rekognition:DetectLabels"\
            ],\
            "Resource": "*"\
        },\
        {\
            "Effect": "Allow",\
            "Action": [\
                "s3:GetObject",\
                "s3:ListBucket"\
            ],\
            "Resource": [\
                "arn:aws:s3:::your-bucket-name",\
                "arn:aws:s3:::your-bucket-name/*"\
            ]\
        },\
        {\
            "Effect": "Allow",\
            "Action": [\
                "logs:CreateLogGroup",\
                "logs:CreateLogStream",\
                "logs:PutLogEvents"\
            ],\
            "Resource": "arn:aws:logs:*:*:*"\
        }\
    ]
}

Hinweis: Ersetzen Sie "your-bucket-name" durch den tatsächlichen Namen Ihres S3-Buckets.

Mit der obigen Policy darf die IAM-Rolle:

die Operation DetectLabels in Amazon Rekognition ausführen,
Inhalte des angegebenen S3-Buckets auflisten und Objekte daraus lesen,
CloudWatch Logs anlegen und beschreiben – nützlich für Logging und Monitoring.

Eine Anleitung zum Anlegen der IAM-Policy mit dem JSON-Editor in der AWS Console finden Sie hier.

Amazon Rekognition in Python mit Boto3 verwenden

Installieren Sie die boto3-Bibliothek:

$ pip install boto3

2. Legen Sie eine neue Python-Datei an und importieren Sie die nötigen Bibliotheken:

import boto3

rekognition_client = boto3.client('rekognition')

3. Schreiben Sie eine Funktion, um Objekte und Szenen in einem Bild zu erkennen:

def detect_objects_and_scenes(bucket, key):
    response = rekognition_client.detect_labels(
        Image={
            'S3Object': {
                'Bucket': bucket,
                'Name': key
            }
        },
        MaxLabels=10,
        MinConfidence=80
    )

    for label in response['Labels']:
        print(f"Label: {label['Name']}, Confidence: {label['Confidence']}")

detect_objects_and_scenes('your-bucket-name', 'your-image-key')

4. Führen Sie Ihr Python-Skript aus.

Die Ausgabe zeigt die erkannten Objekte und Szenen samt Konfidenzwerten. Ein Konfidenzwert ist eine Zahl zwischen 0 und 100, die angibt, wie wahrscheinlich eine Vorhersage zutrifft. Liefert eine Bildanalyse beispielsweise einen Wert von 95 für das Label "Smiling" und 20 für "Wearing Glasses", lächelt die Person auf dem Foto sehr wahrscheinlich, trägt aber keine Brille. Bei fehlersensiblen Anwendungen empfiehlt es sich, eine höhere Mindestkonfidenz als den Standardwert zu wählen, um falsch-positive Ergebnisse auszuschließen und das Nutzererlebnis zu optimieren.

Das ist nur ein erster Eindruck dessen, was Amazon Rekognition leistet – mit weiteren Funktionen wie Gesichtsabgleich, Texterkennung, Moderation unsicherer Inhalte und vielem mehr. Mehr Details liefert die offizielle Dokumentation Erste Schritte mit Amazon Rekognition.

Praxisbeispiele für Amazon Rekognition

Marketing und Werbung: Unternehmen können mit Rekognition Kundenpräferenzen analysieren und Werbung gezielt ausspielen. Rekognition identifiziert beliebte Objekte, Aktivitäten und Szenen in Bildern und Videos aus sozialen Medien und hilft Marketern so, die Interessen und Vorlieben der Verbraucher besser zu verstehen. Diese Erkenntnisse fließen anschließend in personalisierte Marketingkampagnen ein, die Kunden wirklich ansprechen.

Social-Media-Management: Für Social-Media-Manager ist Rekognition ein wertvolles Werkzeug, um nutzergenerierte Inhalte gemäß Community-Richtlinien und Markenstandards zu moderieren. Die Content-Moderationsfunktion erkennt explizites oder anstößiges Material automatisch und verhindert dessen Veröffentlichung. Darüber hinaus liefert die Analyse von Mimik in Reaktion auf Inhalte Erkenntnisse darüber, wie das Publikum die Marke wahrnimmt.

Finanz- und Bankwesen: Finanzinstitute können mit Rekognition das Kundenerlebnis verbessern und Betrug vorbeugen. Durch die Integration von Gesichtserkennung in Mobile-Banking-Apps verifizieren Banken Nutzer, ohne dass diese Passwörter oder Sicherheitsfragen beantworten müssen. Außerdem lassen sich mit der Texterkennung wichtige Informationen aus Dokumenten wie Kreditanträgen und Ausweisen extrahieren – das beschleunigt die Datenerfassung und reduziert menschliche Fehler.

Einzelhandel und E-Commerce: Händler können Rekognition nutzen, um das Verhalten ihrer Kunden zu analysieren und Filialen optimal zu gestalten. Indem die Bewegungen der Kunden im Geschäft erfasst werden, identifiziert Rekognition beliebte Bereiche und Produkte und liefert wertvolle Erkenntnisse für fundierte Entscheidungen zu Produktplatzierung und Filialdesign. Auch E-Commerce-Plattformen profitieren von der Objekt- und Szenenerkennung: Produktbilder lassen sich automatisch kategorisieren und mit Tags versehen, was die Produktsuche für Kunden erheblich vereinfacht.

Sicherheit und Überwachung: Rekognition erweitert Sicherheitssysteme, indem Gesichter in Echtzeit erkannt und analysiert werden. Die Gesichtserkennung kann gesuchte Personen identifizieren, die Identität von Mitarbeitenden an Zugangspunkten verifizieren oder Menschenmengen auf auffälliges Verhalten überwachen. Die Pathing-Funktion verfolgt zudem die Bewegungen von Personen in Videos, sodass Sicherheitspersonal potenzielle Bedrohungen frühzeitig erkennen und reagieren kann. Ein Beispiel: Der Terroranschlag beim Boston-Marathon 2013 löste eine der größten und intensivsten Fahndungen in der Geschichte der USA aus. Die Strafverfolgungsbehörden brauchten drei Tage, um die Täter zu identifizieren – Zeit, die diese unmittelbar nach dem Anschlag zur Flucht nutzen konnten. Wäre Amazon Rekognition damals verfügbar gewesen, hätte die Technologie die enormen Mengen an Überwachungsmaterial aus verschiedenen Quellen während des Marathons in kürzester Zeit verarbeiten und auswerten können. Durch Erkennung, Identifikation und Echtzeitverfolgung der Täter hätte Rekognition den Identifizierungsprozess beschleunigt und es den Behörden ermöglicht, die Verdächtigen wesentlich schneller festzunehmen.

Vorteile und ethische Bedenken bei Amazon Rekognition

Vorteile

Benutzerfreundlichkeit: Rekognition ist so konzipiert, dass Engineers Bild- und Videoanalyse mühelos in ihre Anwendungen integrieren können.
Skalierbarkeit: Auf AWS aufgebaut, bewältigt der Service auch groß angelegte Projekte und verarbeitet Millionen von Bildern oder Videos in Echtzeit.
Genauigkeit: Dank fortschrittlicher Deep-Learning-Algorithmen liefert Rekognition präzise und verlässliche Ergebnisse.
Echtzeitanalyse: Bilder und Videos werden in Echtzeit verarbeitet, sodass Unternehmen umgehend auf Ereignisse reagieren oder Erkenntnisse aus Daten gewinnen, sobald diese entstehen.
Anpassbarkeit: Nutzer können eigene Modelle trainieren, sodass der Service spezifische Objekte, Szenen oder Aktivitäten erkennt, die für eine bestimmte Branche oder einen Anwendungsfall relevant sind.
Automatische Funktionsupdates: AWS entwickelt Rekognition kontinuierlich weiter; neue Funktionen und Verbesserungen stehen Nutzern automatisch zur Verfügung – ohne zusätzlichen Aufwand erhalten sie stets die neuesten Möglichkeiten.
Umfassende Dokumentation und Support: AWS bietet ausführliche Dokumentation, Beispielcode und Tutorials für Rekognition, sodass Engineers den Service schnell erlernen und einsetzen können. Außerdem stehen verschiedene Support-Optionen wie Foren, Webinare und technischer Support zur Verfügung, um Nutzer bei Herausforderungen zu unterstützen.

Ethische Bedenken

Datenschutz: Der Einsatz von Gesichtserkennungstechnologie wirft Datenschutzfragen auf, da unbefugte Überwachung oder Verfolgung von Personen ohne deren Einwilligung möglich ist. Unternehmen und Organisationen, die Rekognition einsetzen, sollten sicherstellen, dass sie geltende Datenschutzvorschriften und -richtlinien einhalten.
Bias: KI-Algorithmen – auch die von Rekognition – können je nach Trainingsdaten Verzerrungen in ihren Vorhersagen aufweisen. Das kann zur unfairen Behandlung bestimmter demografischer Gruppen oder Einzelpersonen führen. Engineers und Organisationen sollten sich möglicher Verzerrungen in den Trainingsdaten bewusst sein und die Vorhersagen des Services kontinuierlich überwachen, um Probleme zu minimieren.
Transparenz: Transparenz beim Einsatz von KI-Technologien wie Rekognition ist entscheidend. Organisationen sollten offen über ihre Nutzung des Services kommunizieren und nachvollziehbar machen, warum sie Entscheidungen auf Basis der Plattformanalysen treffen. Diese Transparenz schafft Vertrauen bei allen Beteiligten – Kunden, Mitarbeitenden und Aufsichtsbehörden.

Preise von Amazon Rekognition

Rekognition setzt auf ein nutzungsbasiertes Preismodell mit getrennten Kosten für Bild- und Videoanalyse. Eine kostenlose Stufe mit einer begrenzten Anzahl monatlicher Bilder und Minuten Videoanalyse erlaubt es Nutzern, den Service unverbindlich auszuprobieren. Darüber hinaus richten sich die Gebühren nach der Anzahl der analysierten Bilder oder Videominuten, der Anzahl der in einer Sammlung gespeicherten Gesichter und der Anzahl der durchgeführten Texterkennungen.

Eine detaillierte Aufschlüsselung der Preise finden Sie auf der Seite Amazon Rekognition Pricing sowie im AWS Pricing Calculator, einem webbasierten Planungstool für Kostenschätzungen.

Fazit

Amazon Rekognition gehört zur Spitze der KI-basierten Bild- und Videoanalyse und bietet AWS-Kunden zahlreiche Vorteile. Mit der Power moderner Deep-Learning-Algorithmen liefert Rekognition Funktionen, die zahlreiche Branchen und Anwendungen revolutionieren können. Vom Marketing über die Sicherheit bis weit darüber hinaus liefert der Service AWS-Kunden beispiellose Einblicke und Automatisierung, optimiert Abläufe und unterstützt fundierte Entscheidungen.

Wer die ethischen Implikationen des Einsatzes von Rekognition sorgfältig abwägt und entsprechende Richtlinien beachtet, schöpft das volle Potenzial dieser fortschrittlichen Plattform aus – und respektiert zugleich die Rechte des Einzelnen und fördert Fairness. Während sich KI-Technologie weiterentwickelt, bleibt Amazon Rekognition eine unverzichtbare Ressource für Unternehmen, die einen Schritt voraus sein und die Vorteile KI-gestützter Bild- und Videoanalyse nutzen wollen.

Mit Spezialisierung auf AWS arbeite ich überwiegend als Cloud Architect mit Fokus auf Infrastruktur-Modernisierung.

[Das Problem "Your current user or role does not have access to Kubernetes objects" auf AWS lösen…\ \

18. Juni 2023

[AWS-Architekturen mit MCP Servers und Strands Agents aufbauen\ \

22. September 2025

[JA3- und JA4-Fingerprints in AWS WAF und darüber hinaus\ \

10. April 2025

[So machen Sie aus Ihrem Startup mit AWS und DoiT eine Erfolgsgeschichte\ \

5. Mai 2023

[Stanford hat Prompt Engineering mit 8 Wörtern beerdigt (und ich kann nicht glauben, dass es funktioniert hat)\ \

19. Oktober 2025

[A clap icon25K\ \

[10 unverzichtbare Skills für Claude (und jeden Coding Agent) im Jahr 2026\ \

9. März

[A clap icon1K\ \

[Ich habe ChatGPT 30 Tage lang nicht genutzt. Was mit meinem Gehirn passiert ist, war beängstigend.\ \

28. Dezember 2025

[A clap icon12.1K\ \

[Ich bin 30 Tage lang jeden Tag um 4:30 Uhr aufgestanden – das verrät Ihnen niemand\ \

7. März

[A clap icon5K\ \

[Warum Tausende Mac Minis kaufen, um Big-Tech-KI-Abos für immer zu entkommen |…\ \

15. Februar

[A clap icon5.8K\ \

[Als Neurowissenschaftler habe ich diese 5 Morgen-Gewohnheiten aufgegeben, die Ihr Gehirn zerstören\