Introdução às conexões

O BigQuery permite consultar dados armazenados fora do BigQuery nos serviços do Google Cloud, como Cloud Storage ou Spanner, ou em fontes de terceiros, como AWS ou Azure. Essas conexões externas usam a API BigQuery Connection.

Por exemplo, suponha que você armazene detalhes sobre pedidos de clientes no Cloud SQL e dados sobre vendas no BigQuery e queira mesclar as duas tabelas em uma única consulta. É possível criar uma conexão do Cloud SQL com o banco de dados externo usando a API BigQuery Connection. Com as conexões, você nunca envia as credenciais do banco de dados como texto não criptografado.

Uma conexão é criptografada e armazenada com segurança no serviço de conexão do BigQuery. Para conceder aos usuários acesso às conexões, conceda a eles papéis do Identity and Access Management (IAM) de conexão do BigQuery.

Tipos de conexão

O BigQuery oferece diferentes tipos de conexão para as seguintes fontes de dados externas:

  • Amazon Simple Storage Service (Amazon S3)
  • Apache Spark
  • Armazenamento de blobs do Azure
  • Recursos do Google Cloud, como modelos remotos da Vertex AI, funções remotas e o BigLake
  • Spanner
  • Cloud SQL
  • AlloyDB para PostgreSQL (Pré-lançamento)

Conexões do Amazon S3

Para criar uma conexão do Amazon S3 com o BigQuery Omni, consulte Conectar ao Amazon S3.

Depois de ter uma conexão do Amazon S3, você pode fazer o seguinte:

Conexões Spark

Os procedimentos armazenados para o Spark permitem executar procedimentos armazenados escritos em Python usando o BigQuery. Com uma conexão Spark, você pode se conectar ao Dataproc Serverless e executar os procedimentos armazenados para o Spark.

Para criar essa conexão, consulte Criar conexões.

Conexões de armazenamento de blobs

Para criar uma conexão de armazenamento de blobs com o BigQuery Omni, consulte Conectar ao armazenamento de blobs.

Depois de ter uma conexão existente do Armazenamento de Blobs, é possível fazer o seguinte:

Conexões de recursos do Google Cloud

Uma conexão de recursos do Google Cloud é uma conexão para autorizar o acesso a outros recursos do Google Cloud, como modelos remotos da Vertex AI, funções remotas e o BigLake. Para mais detalhes sobre como configurar uma conexão de recursos do Google Cloud, consulte Criar e configurar uma conexão de recursos do Cloud.

Quando você tiver uma conexão de recursos do Google Cloud, será possível criar os seguintes objetos do BigQuery com ela:

Conexões do Spanner

Para criar uma conexão com o Spanner, consulte Conectar ao Spanner.

Depois de ter uma conexão com o Spanner, é possível criar consultas federadas. Essas consultas podem estabelecer conexões com o Spanner antes de você enviar uma consulta.

Conexões do Cloud SQL

Para criar uma conexão do Cloud SQL, consulte Conectar-se ao Cloud SQL.

Depois de estabelecer uma conexão do Cloud SQL, é possível criar consultas federadas. Essas consultas podem estabelecer conexões com o Cloud SQL antes de você enviar uma consulta.

Conexões do AlloyDB

Para criar uma conexão do AlloyDB, consulte Conectar-se ao AlloyDB para PostgreSQL.

Depois de ter uma conexão existente do AlloyDB, é possível criar consultas federadas. Essas consultas podem estabelecer conexões com o AlloyDB antes de você enviar uma consulta.

Registros de auditoria

O BigQuery registra as solicitações de uso e gerenciamento sobre conexões. Para mais informações, consulte Visão geral dos registros de auditoria do BigQuery.

A seguir