Google Cloud Managed Service per Prometheus

Google Cloud Managed Service per Prometheus è la piattaforma soluzione multiprogetto per Prometheus metrics. Consente di monitorare e creare avvisi a livello globale sui carichi di lavoro utilizzando Prometheus, senza dover gestire e utilizzare manualmente Prometheus su larga scala.

Managed Service per Prometheus raccoglie metriche dagli esportatori Prometheus e consente di eseguire query sui dati a livello globale utilizzando PromQL, il che significa che utilizzando eventuali dashboard di Grafana esistenti Avvisi e flussi di lavoro basati su PromQL. È cloud ibrido e multi-cloud compatibili, è possibile monitorare Kubernetes, VM e carichi di lavoro serverless Cloud Run conserva i dati per 24 mesi e mantiene la portabilità rimanendo compatibile con Prometheus upstream. Puoi anche integrare il tuo Prometheus il monitoraggio eseguendo query su oltre 6500 delle metriche in Cloud Monitoring, tra cui la versione gratuita di GKE metriche di sistema, usando PromQL.

Questo documento fornisce una panoramica del servizio gestito e ulteriori documenti come configurare ed eseguire il servizio. Per ricevere aggiornamenti regolari su nuovi funzioni e release, invia il campo modulo di registrazione.

Scopri come The Home Depot utilizza Managed Service per Prometheus per ottenere osservabilità unificata in 2200 datastore che eseguono cluster Kubernetes on-prem:

Panoramica del sistema

Google Cloud Managed Service per Prometheus ti offre la familiarità con Prometheus dall'infrastruttura globale, multi-cloud e tra progetti e configurazione in Cloud Monitoring.

Managed Service per Prometheus ti dà accesso alle funzionalità di Prometheus e Cloud Monitoring.

Managed Service per Prometheus si basa su Monarch, il stesso archivio dei dati scalabile a livello globale utilizzato per il monitoraggio di Google. Poiché Managed Service per Prometheus utilizza lo stesso backend e le stesse API di Cloud Monitoring, entrambe le metriche di Cloud Monitoring e le metriche importate da Managed Service per Prometheus sono interrogabili mediante PromQL in Cloud Monitoring, Grafana o qualsiasi altro strumento che possono leggere l'API Prometheus.

In un deployment Prometheus standard, la raccolta dei dati, la valutazione delle query, la regola la valutazione degli avvisi e l'archiviazione dei dati sono tutte gestite all'interno di un unico Prometheus o server web. Managed Service per Prometheus ripartisce le responsabilità per questi in più componenti:

  • La raccolta dei dati viene gestita da raccoglitori gestiti, di raccoglitori auto-distribuiti, OpenTelemetry Collector o l'Ops Agent, che esegue lo scraping dei dati degli esportatori locali e i dati raccolti a Monarch. Questi raccoglitori possono essere utilizzati Carichi di lavoro VM Kubernetes, serverless e tradizionali e può essere eseguito ovunque, inclusi altri cloud e deployment on-prem.
  • La valutazione delle query è gestita da Monarch, che esegue query e risultati di unioni su tutti i servizi Google Cloud regioni e in un massimo di 1000 progetti Google Cloud.
  • La valutazione di regole e avvisi viene gestita scrivere avvisi PromQL in Cloud Monitoring che vengono eseguite completamente nel cloud oppure mediante l'esecuzione in locale e configurati localmente che eseguono regole e automaticamente gli avvisi al datastore globale Monarch e inoltrano avvisi attivati per Prometheus AlertManager.
  • L'archiviazione dei dati viene gestita da Monarch, che archivia tutti i dati di Prometheus per 24 mesi senza costi costi aggiuntivi.

Grafana si connette al datastore globale Monarch anziché la connessione ai singoli server Prometheus. Se disponi Managed Service per i raccoglitori Prometheus configurati in tutti questa singola istanza Grafana ti offre una visualizzazione unificata le metriche in tutti i cloud.

Raccolta dei dati

Puoi utilizzare Managed Service per Prometheus in una delle quattro modalità: raccolta dei dati gestita, con dati di cui è stato eseguito il deployment autonomo , con OpenTelemetry Collector, oppure con l'Ops Agent.

Managed Service per Prometheus offre un operatore per la raccolta gestita dei dati in ambienti Kubernetes. Ti consigliamo di utilizzare la raccolta gestita; utilizzando elimina le complessità legate a deployment, scalabilità, sharding, configurazione nella manutenzione dei server Prometheus. La raccolta gestita è supportata Ambienti Kubernetes GKE e non GKE.

Con la raccolta dei dati di cui è stato eseguito il deployment autonomo, puoi gestire l'installazione di Prometheus come che hai sempre. L'unica differenza rispetto a Prometheus upstream è che eseguirai al file binario sostitutivo drop-in di Managed Service per Prometheus, anziché binario Prometheus upstream.

OpenTelemetry Collector può essere utilizzato per eseguire lo scraping dei dati degli esportatori Prometheus e inviare a Managed Service per Prometheus. OpenTelemetry supporta strategia a agente singolo per tutti gli indicatori, dove un raccoglitore può essere utilizzato metriche (incluse quelle Prometheus), log e tracce in qualsiasi ambiente.

Puoi configurare Ops Agent su qualsiasi istanza Compute Engine per eseguire lo scraping e inviare le metriche di Prometheus al datastore globale. Uso intensivo dell'agente semplifica l'individuazione delle VM ed elimina la necessità di installare, eseguire il deployment o configurare Prometheus in ambienti VM.

Se hai un servizio Cloud Run che scrive Metriche di Prometheus o metriche OTLP, puoi utilizzare un file collaterale e Managed Service per Prometheus per inviare le metriche a Cloud Monitoring.

Puoi eseguire raccoglitori gestiti, a deployment autonomo e OpenTelemetry in deployment on-prem e su qualsiasi cloud. Collettori in esecuzione al di fuori di Google Cloud e inviare dati a Monarch per l'archiviazione a lungo termine e l'esecuzione di query a livello globale.

Quando scegli tra le diverse opzioni di raccolta, considera quanto segue:

  • Raccolta gestita:

    • Approccio consigliato da Google per tutti gli ambienti Kubernetes.
    • Il deployment è stato eseguito utilizzando la UI di GKE, gcloud CLI, l'interfaccia a riga di comando kubectl o Terraform.
    • Operazione di Prometheus: generazione di configurazioni di scrape, scalabilità l'importazione, la definizione delle regole di ambito ai dati giusti e così via. gestite dall'operatore Kubernetes.
    • Lo scraping e le regole vengono configurati utilizzando risorse personalizzate leggere (RP).
    • Ideale per chi desidera un'esperienza più pratica e completamente gestita.
    • Migrazione intuitiva da prometheus-operator.
    • Supporta la maggior parte dei casi d'uso di Prometheus attuali.
    • Assistenza completa dall'assistenza tecnica di Google Cloud.
  • Raccolta di cui è stato eseguito il deployment autonomo:

    • Una sostituzione drop-in del file binario Prometheus upstream.
    • Puoi usare il meccanismo di deployment che preferisci, prometheus-operator o manuale e deployment continuo.
    • Lo scraping viene configurato utilizzando i tuoi metodi preferiti, come le annotazioni come operatore Prometheus.
    • La scalabilità e lo sharding funzionale vengono eseguiti manualmente.
    • Ideale per un'integrazione rapida in configurazioni esistenti più complesse. Puoi riutilizzare le configurazioni esistenti ed eseguire l'upstream di Prometheus Managed Service per Prometheus uno accanto all'altro.
    • Le regole e gli avvisi in genere vengono eseguiti all'interno di singoli server Prometheus, il che potrebbe essere preferibile per i deployment a livello perimetrale come valutazione delle regole locali non deve incorrere in traffico di rete.
    • Potrebbe supportare casi d'uso long-tail non ancora supportati ad esempio le aggregazioni locali per ridurre cardinalità.
    • Assistenza limitata da parte dell'assistenza tecnica di Google Cloud.
  • OpenTelemetry Collector:

    • Un unico raccoglitore in grado di raccogliere metriche (incluso Prometheus) metriche) da qualsiasi ambiente e inviarle a qualsiasi backend compatibile. Può essere utilizzato anche per raccogliere log e tracce e inviarli a qualsiasi un backend compatibile, inclusi Cloud Logging e Cloud Trace.
    • Deployment manuale o tramite deployment in qualsiasi ambiente di computing o Kubernetes utilizzando Terraform. Può essere utilizzato per inviare metriche da ambienti stateless come Cloud Run.
    • Lo scraping viene configurato utilizzando configurazioni simili a Prometheus nel Ricevitore Prometheus.
    • Supporta pattern di raccolta di metriche basate su push.
    • I metadati vengono inseriti da qualsiasi cloud utilizzando processori di rilevamento di risorse.
    • Regole e avvisi possono essere eseguiti utilizzando un avviso di Cloud Monitoring o lo strumento di valutazione delle regole autonomo.
    • Ideale supporta funzionalità e flussi di lavoro con indicatori diversi, come gli esempi.
    • Assistenza limitata da parte dell'assistenza tecnica di Google Cloud.
  • Ops Agent:

Se utilizzi il servizio gestito al di fuori di Google Kubernetes Engine o Google Cloud, potrebbe essere necessaria un'ulteriore configurazione; consulta Eseguire la raccolta gestita all'esterno di di Google Cloud, Esegui raccolta di cui è stato eseguito il deployment autonomo all'esterno Google Cloud o Aggiungi OpenTelemetry processori.

Valutazione delle query

Managed Service per Prometheus supporta qualsiasi UI di query in grado di chiamare API Prometheus Query, che include Grafana e l'interfaccia utente di Cloud Monitoring. Esistente Le dashboard di Grafana continuano a funzionare quando si passa da Prometheus locale a Managed Service per Prometheus e potrai continuare a utilizzare PromQL, disponibile in repository open source popolari e sui forum della community.

Puoi usare PromQL per eseguire query su oltre 6500 query metriche in Cloud Monitoring, anche senza inviare dati Managed Service per Prometheus. Puoi anche usare PromQL per inviare query gratuite le metriche Kubernetes, le metriche personalizzate e metriche basate su log.

Per informazioni su come configurare Grafana per eseguire query Managed Service per i dati Prometheus, vedi Eseguire query utilizzando Grafana.

Per informazioni su come eseguire query sulle metriche di Cloud Monitoring utilizzando PromQL, consulta PromQL in Cloud Monitoring.

Valutazione di regole e avvisi

Managed Service per Prometheus fornisce un sistema di avviso completamente basato su cloud pipeline e un valutatore autonomo delle regole, entrambi valuta le regole in base a tutti i dati Monarch accessibile in un ambito delle metriche. Valutare le regole a fronte di un l'ambito delle metriche multiprogetto elimina la necessità di collocare tutti i dati interesse su un singolo server Prometheus o all'interno di un singolo progetto Google Cloud, e consente di impostare autorizzazioni IAM su gruppi di progetti.

Poiché tutte le opzioni di valutazione delle regole accettano lo standard Prometheus rule_files puoi eseguire facilmente la migrazione a Managed Service per Prometheus o copia-incolla le regole che si trovano nei prodotti open source più diffusi repository. Per chi utilizza raccoglitori di cui è stato eseguito il deployment autonomo, puoi continuare valuta le regole di registrazione localmente nei raccoglitori. I risultati della registrazione e le regole di avviso sono archiviate in Monarch, proprio come raccolto i dati delle metriche. Puoi anche migrare le regole di avviso Prometheus Criteri di avviso basati su PromQL in Cloud Monitoring.

Per la valutazione degli avvisi con Cloud Monitoring, consulta Avvisi PromQL in Cloud Monitoring.

Per la valutazione delle regole con la raccolta gestita, consulta Valutazione delle regole gestite e avvisi.

Per la valutazione delle regole con una raccolta di cui è stato eseguito il deployment autonomo, OpenTelemetry Collector, e Ops Agent, consulta Valutazione delle regole con deployment autonomo e avvisi.

Per informazioni su come ridurre la cardinalità utilizzando regole di registrazione su deployment autonomo raccoglitori, consulta Controllo dei costi e attribuzione.

Archiviazione dei dati

Tutti i dati di Managed Service per Prometheus vengono archiviati 24 mesi senza costi aggiuntivi.

Managed Service per Prometheus supporta un intervallo minimo di scrape 5 secondi. I dati sono completamente memorizzati granularità per 1 settimana, poi viene ridotto a punti di 1 minuto per le 5 successive settimane, poi viene ridotto a punti di 10 minuti e archiviato per il resto il periodo di conservazione.

Managed Service per Prometheus non ha limiti al numero di istanze attive serie temporali o serie temporali totali.

Per ulteriori informazioni, consulta Quote e limiti entro il documentazione di Cloud Monitoring.

Fatturazione e quote

Managed Service per Prometheus è un prodotto Google Cloud e di fatturazione e delle quote di utilizzo.

Fatturazione

La fatturazione per il servizio si basa principalmente su il numero di campioni di metriche importati nello spazio di archiviazione. C'è anche un l'addebito nominale per le chiamate API di lettura. Managed Service per Prometheus non verranno addebitati costi per l'archiviazione o la conservazione dei dati delle metriche.

Quote

Managed Service per Prometheus condivide le quote di importazione e lettura con e configurazione in Cloud Monitoring. La quota di importazione predefinita è di 500 QPS per progetto con un massimo di 200 campioni in una singola chiamata, equivalenti a 100.000 campioni al secondo. La La quota di lettura predefinita è di 100 QPS per ambito delle metriche.

Puoi aumentare queste quote per supportare la metrica e la query come i bilanciatori del carico e i volumi di archiviazione. Per informazioni sulla gestione delle quote e sulla richiesta di aumenti delle quote, consulta Utilizzo delle quote.

Termini di servizio e conformità

Managed Service per Prometheus fa parte di Cloud Monitoring eredita determinati contratti e certificazioni da Cloud Monitoring, inclusi, a titolo esemplificativo:

Passaggi successivi