Questo articolo è una guida passo passo per configurare dbt all'interno di Google Cloud Composer.
- Per prima cosa, creiamo un'istanza di Cloud Composer con questa configurazione dell'ambiente:

2. Installiamo due pacchetti Python in Composer:
airflow-dbt (operator e hook di dbt)
dbt (pacchetto Python di dbt)

3. A questo punto, impostiamo la variabile d'ambiente DBT_PROFILES_DIR per il file della chiave del service account su "/home/airflow/gcs/data/profiles".

4. Creiamo poi un service account "dbt-big-query-user" con il ruolo "BigQuery User".
Ipotesi di partenza: trasformazione di un dataset BigQuery in un'altra tabella BigQuery

5. Costruiamo un semplice workflow dbt (i relativi file) usando i dati pubblici di "Jaffle Shop":


6. Definiamo il workflow con l'operator dbt (dbtflow.py)

7. Carichiamo i file nel bucket di Composer rispettando questa gerarchia:

8. Avviamo il DAG "dbt" in Composer

9. Controlliamo i risultati dell'esecuzione del workflow dbt in BigQuery.

Riferimenti
Puoi scaricare i file di esempio illustrati sopra da https://bit.ly/3kJ4pWQ nell'archivio composer-dbt.zip