Introduzione alle connessioni
BigQuery ti consente di eseguire query sui dati archiviati al di fuori BigQuery nei servizi Google Cloud come Cloud Storage o Spanner, oppure in origini di terze parti come AWS o Azure. Queste connessioni esterne utilizzano l'API BigQuery Connection.
Ad esempio, supponi di archiviare i dettagli degli ordini dei clienti in Cloud SQL e i dati sulle vendite in BigQuery. Unire i due in una singola query. Puoi creare una connessione Cloud SQL un database esterno usando l'API BigQuery Connection. Con le connessioni, non avrai mai invia le credenziali del database testo in chiaro.
Una connessione è criptata e archiviata in modo sicuro in BigQuery completamente gestito di Google Cloud. Puoi concedere agli utenti l'accesso alle connessioni concedendo loro la connessione BigQuery Identity and Access Management (IAM) ruoli.
Tipi di connessione
BigQuery fornisce diversi tipi di connessione per le seguenti origini dati esterne:
- Amazon Simple Storage Service (Amazon S3)
- Apache Spark
- Archiviazione blob Azure
- Risorse di Google Cloud come modelli remoti di Vertex AI, funzioni remote e BigLake
- Spanner
- Cloud SQL
- AlloyDB per PostgreSQL (anteprima)
Connessioni Amazon S3
Per creare una connessione Amazon S3 con BigQuery Omni, consulta Connettiti ad Amazon S3.
Una volta stabilita una connessione Amazon S3, puoi procedere come segue:
- Creare tabelle esterne su Amazon S3
- Eseguire query sui dati di Amazon S3
- Esportare i risultati in Amazon S3
- Crea set di dati basati su database AWS Glue.
Connessioni Spark
Archiviate procedure per Spark esegui stored procedure scritte in Python utilizzando BigQuery. R La connessione Spark ti consente di connetterti a Dataproc Serverless ed eseguire le stored procedure per Spark.
Per creare questa connessione, vedi Creare connessioni.
Connessioni di Blob Storage
Per creare una connessione Archiviazione BLOB con BigQuery Omni, consulta Connettiti allo spazio di archiviazione BLOB.
Dopo aver creato una connessione allo spazio di archiviazione BLOB esistente, puoi:
- Crea tabelle esterne basate sull'archiviazione BLOB
- Eseguire query sui dati di Archiviazione BLOB
- Esportare i risultati in Archiviazione BLOB
Connessioni alle risorse Google Cloud
Una connessione a una risorsa Google Cloud è una connessione per autorizzare l'accesso ad altri servizi Google Cloud come modelli remoti di Vertex AI, funzioni remote GrandeLake. Per maggiori dettagli su come configurare una connessione alle risorse Google Cloud, consulta Crea e configura una connessione a una risorsa Cloud.
Quando disponi di una connessione alle risorse Google Cloud esistente, puoi creare quanto segue Oggetti BigQuery con questo codice:
- Modelli remoti. Per ulteriori informazioni, vedi L'istruzione CREATE MODEL per i modelli remoti su LLM, L'istruzione CREATE MODEL per i modelli remoti sui servizi di IA Cloud e L'istruzione CREATE MODEL per i modelli remoti su modelli ospitati da Vertex AI.
- Funzioni remote. Funzioni remote di BigQuery consentono di implementare funzioni con qualsiasi linguaggio supportato in Cloud Functions in Cloud Run. Una connessione di funzione remota ti consente di connetterti a Cloud Functions o Cloud Run ed eseguire queste funzioni. Per creare una connessione di funzione remota BigQuery, consulta Crea una connessione.
- Tabelle BigLake. Connessione di BigLake Tabelle BigLake verso origini dati esterne mantenendo il controllo dell'accesso e la sicurezza granulari di BigQuery sia per i dati strutturati che non strutturati in Cloud Storage.
- Tabelle di oggetti. Per ulteriori informazioni, consulta Introduzione alle tabelle degli oggetti.
Connessioni Spanner
Per creare una connessione Spanner, consulta Connettersi a Spanner.
Quando hai una connessione Spanner esistente, puoi creare query federate. Queste query possono stabilire connessioni a Spanner prima di inviare una query.
Connessioni Cloud SQL
Per creare una connessione Cloud SQL, consulta Connettersi a Cloud SQL.
Una volta stabilita una connessione Cloud SQL, puoi creare query federate. Queste query possono e stabilire connessioni a Cloud SQL prima di inviare una query.
Connessioni AlloyDB
Per creare una connessione AlloyDB, consulta Connettersi ad AlloyDB per PostgreSQL.
Quando hai una connessione AlloyDB esistente, puoi creare query federate. Queste query possono e stabilire connessioni ad AlloyDB prima di inviare una query.
Audit log
BigQuery registra le richieste di utilizzo e gestione relative alle connessioni. Per saperne di più, consulta Panoramica degli audit log di BigQuery.
Passaggi successivi
- Scopri come gestire le connessioni.
- Scopri come analizzare le tabelle degli oggetti utilizzando le funzioni remote.
- Scopri come eseguire query sui dati archiviati:
- Eseguire query sui dati archiviati in Amazon S3.
- Eseguire query sui dati archiviati in Archiviazione BLOB.
- Eseguire query sui dati strutturati archiviati in Cloud Storage.
- Eseguire query su dati non strutturati archiviati in Cloud Storage.
- Eseguire query sui dati archiviati in Spanner.
- Eseguire query sui dati archiviati in Cloud SQL.
- Eseguire query sui dati archiviati in AlloyDB.
- Eseguire query sui dati utilizzando funzioni remote.
- Eseguire query su dati non strutturati utilizzando funzioni remote.
- Eseguire query sui dati utilizzando stored procedure per Apache Spark.
- Scopri di più sulle tabelle esterne.