Cloud Intelligence™Cloud Intelligence™

Cloud Intelligence™

Amazon Rekognition: analisi di immagini e video con l'AI

By Karim AmarsiMay 19, 202311 min read

Questa pagina è disponibile anche in English, Deutsch, Español, Français, 日本語 e Português.

Se vuole integrare l'analisi multimediale nelle sue applicazioni, Amazon Rekognition è la soluzione ideale. Questo servizio di analisi di immagini e video basato sul deep learning rileva, analizza e confronta i volti con precisione, identifica oggetti, legge testo stampato e molto altro. Rekognition poggia su AWS: è quindi altamente scalabile e capace di elaborare in tempo reale milioni di immagini o video.

Come funziona Amazon Rekognition?

Grazie al deep learning, Amazon Rekognition analizza immagini e video tramite reti neurali convoluzionali (CNN), in grado di rilevare e riconoscere caratteristiche all'interno dei dati visivi. Può utilizzare il servizio attraverso:

Tra le funzionalità principali di Rekognition troviamo:

  1. Rilevamento di oggetti e scene: riconosce migliaia di oggetti e scene differenti, da elementi di uso quotidiano come un'auto, un cane o un albero, fino a categorie più ampie come spiaggia, paesaggio urbano o foresta.
  2. Analisi facciale: rileva, analizza e confronta i volti, determinando attributi come fascia d'età, genere ed emozioni.
  3. Riconoscimento facciale: cerca e confronta i volti all'interno di una raccolta, individuando potenziali corrispondenze o verificando l'identità di un utente.
  4. Pathing: traccia il movimento delle persone in un video per individuare potenziali rischi per la sicurezza o analizzare il comportamento dei clienti.
  5. Rilevamento delle etichette: una funzionalità che permette di analizzare le immagini identificandone automaticamente oggetti, scene e concetti. Ad esempio, una foto di persone su una spiaggia tropicale può contenere etichette come palma (oggetto), spiaggia (scena), corsa (azione) e all'aperto (concetto).
  6. Proprietà delle immagini: rileva i colori dominanti e misura luminosità, nitidezza e contrasto.
  7. Segmentazione video: Rekognition analizza i file video e li suddivide in scene o riprese significative. Una funzionalità particolarmente utile per l'indicizzazione video, la gestione dei contenuti e la pubblicità mirata, perché aiuta gli utenti a comprendere e organizzare meglio i propri contenuti video.
  8. Rilevamento del testo: Rekognition è in grado di individuare ed estrarre il testo da immagini e video. Una funzione che permette di identificare informazioni scritte all'interno dei contenuti visivi, utile per applicazioni come l'analisi di documenti, il riconoscimento delle targhe e le esperienze di realtà aumentata.
  9. Rilevamento delle emozioni: la piattaforma riconosce e analizza le emozioni espresse dalle persone in immagini e video, come gioia, tristezza, rabbia o sorpresa. Una funzionalità preziosa per applicazioni in ambito customer experience, pubblicità e intrattenimento, perché consente di valutare le reazioni del pubblico o di calibrare i contenuti per suscitare specifiche risposte emotive.
  10. Moderazione dei contenuti: Rekognition aiuta gli utenti a individuare e filtrare contenuti visivi potenzialmente non sicuri o inappropriati, rilevando in automatico materiale esplicito o allusivo. Una funzione utile per aziende e organizzazioni che devono garantire un ambiente sicuro ai propri utenti, come piattaforme social, siti e-commerce o istituti di formazione.
  11. Riconoscimento di celebrità: Rekognition identifica migliaia di personaggi famosi in vari ambiti, dall'intrattenimento allo sport alla politica. Una funzionalità utile per applicazioni come l'analisi dei media, la raccomandazione di contenuti e la pubblicità.

Esempio di analisi facciale tratto dalla dashboard di Amazon Rekognition nella console AWS

Tutorial: come iniziare con Amazon Rekognition

Questo tutorial illustra il concetto di rilevamento delle etichette di Amazon Rekognition e la guida nell'uso della AWS Management Console e dell'AWS SDK per Python (Boto3).

Configurare l'ambiente AWS CLI

  1. Acceda alla console del suo account AWS, se non l'ha già fatto: https://console.aws.amazon.com
  2. Installi l'AWS Command Line Interface (CLI) seguendo queste istruzioni: https://docs.aws.amazon.com/cli/latest/userguide/getting-started-install.html
  3. Configuri l'AWS CLI con la sua access key, secret access key, regione predefinita e formato di output:
$ aws configure
AWS Access Key ID [****]:
AWS Secret Access Key [****]:
Default region name [us-east-1]:
Default output format [json]:

Creare un bucket Amazon S3 per memorizzare l'immagine

  1. Acceda alla AWS Management Console e apra la console di Amazon S3: https://s3.console.aws.amazon.com/s3/
  2. Faccia clic su "Create bucket" e segua le istruzioni per creare un nuovo bucket in cui salvare l'immagine.
  3. Carichi un'immagine nel bucket S3 appena creato.

Impostare i permessi

Per creare un ruolo IAM con i permessi necessari ad accedere al bucket S3 e a usare Amazon Rekognition, dovrà preparare un documento di policy in formato JSON per il ruolo IAM. Ecco un esempio di policy che concede i permessi richiesti:

{
    "Version": "2012-10-17",
    "Statement": [\
        {\
            "Effect": "Allow",\
            "Action": [\
                "rekognition:DetectLabels"\
            ],\
            "Resource": "*"\
        },\
        {\
            "Effect": "Allow",\
            "Action": [\
                "s3:GetObject",\
                "s3:ListBucket"\
            ],\
            "Resource": [\
                "arn:aws:s3:::your-bucket-name",\
                "arn:aws:s3:::your-bucket-name/*"\
            ]\
        },\
        {\
            "Effect": "Allow",\
            "Action": [\
                "logs:CreateLogGroup",\
                "logs:CreateLogStream",\
                "logs:PutLogEvents"\
            ],\
            "Resource": "arn:aws:logs:*:*:*"\
        }\
    ]
}

Nota: sostituisca "your-bucket-name" con il nome effettivo del suo bucket S3.

La policy qui sopra consente al ruolo IAM di:

  1. Utilizzare l'operazione DetectLabels in Amazon Rekognition.
  2. Elencare i contenuti e leggere gli oggetti dal bucket S3 specificato.
  3. Creare e scrivere su CloudWatch Logs, utile per finalità di logging e monitoraggio.

I passaggi per creare la policy IAM tramite l'editor JSON nella console AWS sono illustrati in questa guida.

Usare Amazon Rekognition in Python con Boto3

  1. Installi la libreria boto3:
$ pip install boto3

2. Crei un nuovo file Python e importi le librerie necessarie:

import boto3

rekognition_client = boto3.client('rekognition')

3. Scriva una funzione per rilevare oggetti e scene in un'immagine:

def detect_objects_and_scenes(bucket, key):
    response = rekognition_client.detect_labels(
        Image={
            'S3Object': {
                'Bucket': bucket,
                'Name': key
            }
        },
        MaxLabels=10,
        MinConfidence=80
    )

    for label in response['Labels']:
        print(f"Label: {label['Name']}, Confidence: {label['Confidence']}")

detect_objects_and_scenes('your-bucket-name', 'your-image-key')

4. Esegua lo script Python.

L'output mostrerà gli oggetti e le scene rilevati nell'immagine, insieme ai relativi punteggi di confidenza. In sintesi, il punteggio di confidenza è un valore tra 0 e 100 che indica la probabilità che una determinata previsione sia corretta. Ad esempio, se l'analisi di un'immagine restituisce un punteggio di 95 per l'etichetta "Sorridente" e di 20 per "Indossa occhiali", è altamente probabile che la persona ritratta stia sorridendo ma non porti gli occhiali. Per le applicazioni che non tollerano errori, conviene impostare una soglia minima di confidenza più alta di quella predefinita, così da scartare i falsi positivi e ottimizzare l'esperienza utente.

Questo è solo l'inizio di ciò che Amazon Rekognition ha da offrire: tra le altre funzionalità ci sono il riconoscimento facciale, il rilevamento del testo, la moderazione di contenuti non sicuri e molto altro. Per approfondire, consulti la documentazione ufficiale Getting Started with Amazon Rekognition.

Casi d'uso reali di Amazon Rekognition

Marketing e pubblicità: le aziende possono usare Rekognition per analizzare le preferenze dei clienti e proporre annunci mirati. Il servizio identifica oggetti, attività e scene ricorrenti in immagini e video condivisi sui social media, aiutando i marketer a comprendere meglio gli interessi e le preferenze dei consumatori. Queste informazioni possono poi alimentare campagne di marketing personalizzate, capaci di entrare davvero in sintonia con il pubblico.

Gestione dei social media: per chi gestisce i social, Rekognition è uno strumento prezioso per moderare i contenuti generati dagli utenti, in linea con le linee guida della community e con gli standard del brand. La funzione di moderazione individua automaticamente contenuti espliciti o allusivi, impedendone la pubblicazione. Inoltre, può analizzare l'engagement rilevando le espressioni facciali in risposta ai contenuti, offrendo alle aziende una lettura più chiara di come il pubblico percepisce il brand.

Finanza e banche: gli istituti finanziari possono migliorare la customer experience e prevenire le frodi grazie a Rekognition. Integrando il riconoscimento facciale nelle app di mobile banking, le banche verificano l'identità degli utenti senza ricorrere a password o domande di sicurezza. La funzione di rilevamento del testo, inoltre, estrae informazioni utili da documenti come richieste di prestito e documenti d'identità, semplificando l'inserimento dei dati e riducendo gli errori umani.

Retail ed e-commerce: i retailer possono sfruttare Rekognition per analizzare il comportamento degli acquirenti e ottimizzare il layout dei punti vendita. Monitorando il movimento dei clienti all'interno del negozio, il servizio individua aree e prodotti più frequentati, fornendo indicazioni preziose per scegliere il posizionamento dei prodotti e progettare lo store. Anche le piattaforme di e-commerce possono trarre vantaggio dal rilevamento di oggetti e scene, che permette di categorizzare ed etichettare automaticamente le immagini di prodotto, semplificando la ricerca da parte dei clienti.

Sicurezza e sorveglianza: Rekognition rafforza i sistemi di sicurezza rilevando e analizzando i volti in tempo reale. Il riconoscimento facciale permette di individuare persone di interesse, verificare l'identità dei dipendenti ai punti di accesso o sorvegliare le folle alla ricerca di comportamenti sospetti. La funzionalità di pathing, inoltre, traccia gli spostamenti delle persone in un video, consentendo al personale di sicurezza di intercettare potenziali minacce e intervenire tempestivamente. Un esempio: l'attentato terroristico alla Maratona di Boston del 2013 diede il via a una delle cacce all'uomo più imponenti nella storia degli Stati Uniti. Le forze dell'ordine impiegarono tre giorni per identificare i responsabili, dando loro il tempo di sottrarsi all'arresto subito dopo l'attentato. Se all'epoca fosse stata disponibile una tecnologia come Amazon Rekognition, avrebbe potuto elaborare e analizzare in tempi rapidi le enormi quantità di filmati di sorveglianza raccolti da fonti diverse durante la maratona. Rilevando, riconoscendo e tracciando i colpevoli in tempo reale, avrebbe accelerato l'identificazione, permettendo alle autorità di catturare i responsabili molto più rapidamente.

Vantaggi e implicazioni etiche di Amazon Rekognition

Vantaggi

  1. Facilità d'uso: progettato per essere intuitivo, semplifica agli sviluppatori l'integrazione dell'analisi di immagini e video nelle proprie applicazioni.
  2. Scalabilità: poggiando su AWS, gestisce progetti su larga scala ed elabora in tempo reale milioni di immagini o video.
  3. Accuratezza: si basa su algoritmi avanzati di deep learning per fornire risultati precisi e affidabili.
  4. Analisi in tempo reale: elabora immagini e video in tempo reale, consentendo alle aziende di reagire prontamente agli eventi o di ricavare insight dai dati man mano che vengono generati.
  5. Personalizzazione: permette agli utenti di addestrare modelli personalizzati, in modo che il servizio riconosca oggetti, scene o attività rilevanti per uno specifico settore o caso d'uso.
  6. Aggiornamenti automatici delle funzionalità: man mano che AWS continua a sviluppare e perfezionare Rekognition, nuove funzioni e miglioramenti vengono resi automaticamente disponibili agli utenti, che possono così contare sempre sulle ultime capacità senza ulteriori interventi.
  7. Documentazione e supporto solidi: AWS offre documentazione completa, codice di esempio e tutorial dedicati a Rekognition, permettendo agli sviluppatori di apprendere e implementare rapidamente il servizio. A questo si aggiunge una gamma di opzioni di supporto, tra cui forum, webinar e supporto tecnico, per assistere gli utenti nelle eventuali difficoltà incontrate sulla piattaforma.

Implicazioni etiche

  1. Privacy: l'uso del riconoscimento facciale solleva questioni di privacy, perché può abilitare forme di sorveglianza o tracciamento di individui senza il loro consenso. Le aziende e le organizzazioni che utilizzano Rekognition devono assicurarsi di rispettare le normative e le linee guida sulla privacy applicabili.
  2. Bias: gli algoritmi di AI, compresi quelli alla base di Rekognition, possono presentare bias nelle previsioni in funzione dei dati di addestramento ricevuti. Ciò può tradursi in un trattamento iniquo di determinati gruppi demografici o individui. È fondamentale che sviluppatori e organizzazioni siano consapevoli dei potenziali bias nei dati usati per addestrare Rekognition e monitorino costantemente le previsioni del servizio per mitigare eventuali criticità.
  3. Trasparenza: garantire trasparenza nell'uso di tecnologie di AI come Rekognition è cruciale. Le organizzazioni dovrebbero dichiarare apertamente l'utilizzo del servizio e spiegare il ragionamento alla base delle decisioni prese sulla scorta delle analisi della piattaforma. Questa trasparenza aiuta a costruire fiducia e credibilità presso gli stakeholder, inclusi clienti, dipendenti e autorità di regolamentazione.

Prezzi di Amazon Rekognition

Rekognition adotta un modello di pricing pay-as-you-go, con costi distinti per l'analisi di immagini e di video. Il servizio offre un piano gratuito con un numero limitato di immagini mensili e di minuti di analisi video, così da permettere agli utenti di provarlo senza spese. Oltre il piano gratuito, le tariffe dipendono dal numero di immagini o di minuti di video analizzati, dal numero di volti memorizzati in una raccolta e dal numero di rilevamenti di testo effettuati.

Per un dettaglio completo dei prezzi può consultare la pagina Amazon Rekognition Pricing e l'AWS Pricing Calculator, uno strumento di pianificazione web utile per creare stime.

Conclusione

Amazon Rekognition si colloca all'avanguardia nell'analisi di immagini e video basata su AI, offrendo numerosi vantaggi ai clienti AWS. Sfruttando la potenza degli algoritmi di deep learning, mette a disposizione capacità all'avanguardia in grado di trasformare interi settori e applicazioni. Dal marketing alla sicurezza e oltre, il servizio promette ai clienti AWS insight e automazione senza precedenti, con operazioni più snelle e decisioni più informate.

Valutando con attenzione le implicazioni etiche dell'uso di Rekognition e seguendo le linee guida, le organizzazioni possono sfruttare appieno il potenziale di questa piattaforma avanzata, garantendo al contempo il rispetto dei diritti individuali e la promozione dell'equità. In un panorama AI in continua evoluzione, Amazon Rekognition resta una risorsa preziosa per le aziende che vogliono restare un passo avanti e cogliere i vantaggi dell'analisi di immagini e video basata sull'AI.

Specializzato in AWS, lavoro principalmente come Cloud Architect, con un focus sulla modernizzazione delle infrastrutture.

[Risolvere il problema "Your current user or role does not have access to Kubernetes objects" su AWS…\ \

18 giugno 2023

[Costruire un'architettura AWS con MCP Server e Strands Agents\ \

22 settembre 2025

[Fingerprint JA3 e JA4 in AWS WAF e oltre\ \

10 aprile 2025

[Trasformare la sua startup in una storia di successo con AWS e DoiT\ \

5 maggio 2023

[Stanford ha appena ucciso il prompt engineering con 8 parole (e non posso credere che abbia funzionato)\ \

19 ottobre 2025

[Un'icona di applauso25K\ \

[10 competenze indispensabili per Claude (e per qualsiasi coding agent) nel 2026\ \

9 marzo

[Un'icona di applauso1K\ \

[Ho smesso di usare ChatGPT per 30 giorni. Ciò che è successo al mio cervello è stato terrificante.\ \

28 dicembre 2025

[Un'icona di applauso12.1K\ \

[Mi sono svegliato alle 4:30 ogni giorno per 30 giorni: ecco cosa nessuno racconta\ \

7 marzo

[Un'icona di applauso5K\ \

[Perché in migliaia stanno comprando Mac Mini per liberarsi per sempre dai problemi degli abbonamenti AI delle Big Tech |…\ \

15 febbraio

[Un'icona di applauso5.8K\ \

[Da neuroscienziato, ho abbandonato queste 5 abitudini mattutine che distruggono il cervello\