Descripción general de las alertas

En este documento, se describe cómo puedes recibir notificaciones cuando tu aplicación falla o cuando el rendimiento de una aplicación no cumple con los requisitos con tus criterios.

Cómo funcionan las alertas

El proceso de alertas de Cloud Monitoring tiene tres partes:

  • Una política de alertas, que describe las circunstancias en las que quieres y cómo quieres que te notifiquen sobre un incidente. La política de alertas puede supervisar los datos de series temporales almacenados Supervisión o registros almacenados por Cloud Logging. Cuando esos datos cumplen la condición de la política de alertas, Monitoring crea incidente y envía las notificaciones.

  • Cada incidente es un registro del tipo de datos que se supervisar y cuándo se cumplieron las condiciones. Esta información puede ayudarte a solucionar los problemas que causaron el incidente.

  • Un canal de notificaciones define cómo recibes notificaciones cuando Monitoring crea un incidente. Por ejemplo, puedes configurar una canal de notificaciones al correo electrónico my-support-team@example.com y publicar un mensaje de Slack en el canal #my-support-team. Una política de alertas puede contener uno o más canales de notificaciones.

Las políticas de alertas pueden evaluar dos tipos de datos:

  • Los datos de series temporales, también llamados datos de métricas, que almacenan Supervisión Estos tipos de políticas se denominan basadas en métricas.

    Para aprender a configurar una política de alertas basada en métricas, prueba la Guía de inicio rápido para Compute Engine.

  • Datos de registro que almacena Cloud Logging Estos tipos de políticas se denominan políticas de alertas basadas en registros. Políticas de alertas basadas en registros te notifican cuando aparece un mensaje específico en tus registros.

    Este documento se enfoca en las alertas basadas en métricas con información general sobre políticas de alertas basadas en registros cuando sea relevante. Para obtener información detallada sobre y políticas de alertas basadas en registros, consulta Supervisa tus registros.

El proceso de alerta te ayuda a responder ante problemas cuando el rendimiento cuando una aplicación no alcanza los valores aceptables. Por ejemplo, implementas una página web aplicación en una máquina virtual de Compute Engine (VM). Si bien esperas que la latencia de respuesta HTTP fluctúan, debe esperar que el equipo de asistencia responda cuando tiene una latencia alta durante un período significativo. Podrías crear un política de alertas basada en métricas que supervisa la respuesta HTTP de la aplicación métrica de latencia. Si la latencia de la respuesta es superior a dos segundos durante al menos cinco minutos, Monitoring crea un incidente y envía notificaciones por correo electrónico a tu equipo de asistencia al cliente.

Cómo crear una política de alertas

Existen varias formas de crear una política de alertas. Por ejemplo, puedes usar políticas de alertas preconfiguradas habilitando las alertas recomendadas de las integraciones o de ciertas páginas en la consola de Google Cloud. También puedes configurar una nueva política de alertas con el La consola de Google Cloud, la API de Cloud Monitoring, Google Cloud CLI y Terraform.

Usa integraciones y políticas de alertas recomendadas

La supervisión brinda paquetes previamente compilados para que puedas crear políticas de alertas para tus Integraciones de terceros y servicios de Google Cloud. Los paquetes incluyen políticas de alertas recomendadas, paneles de muestra y métricas clave para el servicio. Estos paquetes están disponibles para servicios de Google Cloud, como Google Kubernetes Engine, Compute Engine y Cloud SQL, además de integraciones comunes de terceros, como MongoDB, Kafka y Elasticsearch.

Cuando instalas un paquete, puedes habilitar las alertas recomendadas de este y políticas de seguridad. Cuando habilitas una política de alertas recomendada, configuras su el canal de notificaciones y, opcionalmente, modificar otros valores. Después de la configuración, la política de alertas de inmediato, sin necesidad de que el usuario ingrese más.

Las políticas de alertas recomendadas son útiles cuando implementas un servicio nuevo y desean generar alertas sobre métricas importantes. Por ejemplo, el El paquete de integración de Cloud SQL viene con políticas de alertas recomendadas para las instancias con errores y las transacciones lentas:

Dos de las políticas de alertas recomendadas para el paquete de integración de Cloud SQL.

Para obtener más información sobre integraciones de alertas, consulta Supervisa aplicaciones de terceros.

Use Cloud Monitoring

Si deseas crear una política de alertas y elegir su tipo de condición junto con otros componentes, como el tipo de métrica y la serie temporal, usa Supervisión En la siguiente tabla, se enumeran los diferentes tipos de que puedes usar cuando creas una política de alertas.

Tipo de condición Descripción Ejemplo
Condición de umbral de métrica

Las condiciones de umbral de métrica se cumplen cuando se cumplen los valores de una métrica superior o inferior a un umbral para un período específico de repetición de la prueba.

Para obtener más información, consulta Crea políticas de alertas sobre el umbral de métricas y Crea políticas de alertas mediante la API.

Quieres una política de alertas que envíe una notificación cuando se responda La latencia es de 500 ms o más. durante cinco verificaciones de tiempo de actividad consecutivas más de 10 minutos.
Condición de ausencia de métrica

Se cumplen las condiciones de ausencia de métricas cuando una serie temporal supervisada no tiene para un período específico de repetición de la prueba. El período máximo para repetir la prueba es 23.5 horas.

Para obtener más información, consulta Crea políticas de alertas de ausencia de métricas y Crea políticas de alertas con la API.

Quieres una política de alertas que abra un incidente con tu equipo de asistencia. cuando un recurso no responde a ninguna solicitud HTTP en el transcurso de cinco minutos.
Condición de valor de métrica prevista

Las condiciones previstas de valor de métrica se cumplen cuando la política de alertas que predice que se superará el umbral en el próximo período de previsión. El período de previsión puede variar de 1 hora a 7 días.

Para obtener más información, consulta Crea políticas de alertas de valor de métricas previstas y Crea políticas de alertas con la API.

Quieres una política de alertas que abra un incidente con tu equipo de asistencia. equipo cuando es probable que un recurso alcance el 80% de uso de espacio en el disco en las próximas 24 horas.
Condición basada en registros

Una condición en una política de alertas basada en registros se cumple cuando la alerta detecta que una métrica basada en registros coincide con la política de alertas con tus criterios. Las métricas basadas en registros derivan datos métricos del contenido del registro de entradas de registro. Por ejemplo, puedes usar una métrica basada en registros para contar el número de entradas de registro que contienen un mensaje en particular o y extraer la información de latencia registrada en entradas de registro.

Para obtener más información, consulta Configura políticas de alertas basadas en registros y Crea una política de alertas basada en registros con la API de Cloud Monitoring.

Quieres una política de alertas que abra un incidente con tu equipo de asistencia. cuando tu proyecto tiene al menos 50 entradas de registro con una message que contiene product_ids=['tier_1_support', 'tier_2_support']

Componentes de la política de alertas

Cada política de alertas tiene los siguientes componentes:

  • Una condición que describe cuándo un recurso, o un grupo de recursos, se encuentra en un estado que requiere tu respuesta. La condición incluye la fuente de datos, un umbral estático o dinámico y la agregación de datos con métodos como filtros y groupby. Tus afecciones pueden supervisar una sola métrica, varias métricas o una proporción de métricas. También puedes Usar lenguajes de consulta, como PromQL y el Lenguaje de consulta de Monitoring (MQL) para incluyen expresiones complejas, como umbrales dinámicos y lógica condicional.

    Si usas una integración para habilitar una política de alertas recomendada, Luego, se prepropaga la condición de la política de alertas.

  • Una lista de canales de notificación que describen a quién notificar cuando se lleva a cabo una acción como en los productos necesarios. Para obtener más información, consulta Crea y administra canales de notificaciones.

  • Documentación que aparece en las páginas de incidentes y notificaciones. Tú puedes configurar el asunto de una notificación y Agrega información útil al cuerpo de la notificación. Por ejemplo, puede configurar la notificación para que muestre vínculos a guías internas a páginas de Google Cloud, como paneles personalizados. Para obtener más información sobre la documentación, incluidos ejemplos, consulta Anota los incidentes con la documentación definida por el usuario.

Lenguajes de consulta

Usa lenguajes de consulta y filtros en tus políticas de alertas para un mayor control sobre la evaluación de las métricas. Supervisión admite los siguientes tipos de consultas:

  • El Prometheus Query Language (PromQL) es un lenguaje de consulta funcional que se usa para evaluar datos de series temporales en tiempo real. Puedes configurar la política de alertas condiciones para incluir una consulta de PromQL en sus condiciones. Las consultas de PromQL pueden usar cualquier una expresión válida, como combinaciones de métricas, proporciones y umbrales de escalamiento. Si configuras políticas de alertas con Condición basada en PromQL en Google Cloud, puedes reducir las dependencias infraestructura de alertas externa. Para obtener más información, consulta PromQL en Cloud Monitoring y Políticas de alertas con PromQL.

  • El lenguaje de consulta de Monitoring (MQL) es una interfaz expresiva basada en texto que te permite recuperar, filtrar y manipular datos de series temporales. Puedes crear políticas de alertas con condiciones que incluyan lo siguiente: una operación de alerta del lenguaje de consulta de Monitoring. Para obtener más información, consulta Descripción general del lenguaje de consulta de Monitoring y Políticas de alertas con MQL.

  • Los filtros de supervisión te permiten configurar políticas de alertas para usar proporciones de métricas basadas en filtros. Basada en filtros las políticas de alertas no se pueden ver ni modificar en la consola de Google Cloud. Para ver un ejemplo de una política que usa filtros de Monitoring, consulta Proporción de métrica.

Administra incidentes y políticas de alertas

Después de habilitar una política de alertas, Monitoring supervisa continuamente las condiciones de esa política. No puedes configurar política de alertas para supervisar las condiciones solo durante ciertos períodos. Si quieres para inhabilitar la política de alertas durante un período determinado y, luego, crea posponer.

Si hay un incidente abierto y Monitoring determina que el ya no se cumplen las condiciones de la política basada en métricas, Monitoring cierra automáticamente el incidente y envía notificación sobre el cierre.

Precios

En general, las métricas del sistema de Cloud Monitoring son gratuitas, y las métricas de sistemas, agentes o aplicaciones externos. Las métricas facturables son según la cantidad de bytes o de muestras transferidas.

Para obtener más información sobre los precios de Cloud Monitoring, consulta los siguientes documentos:

Obtén información para supervisar la cantidad de intervalos o registros de seguimiento que sobre los datos transferidos, o cómo recibir notificaciones cuando se incluye contenido específico en una entrada de registro, consulta los siguientes documentos:

¿Qué sigue?