Administra incidentes para políticas de alertas basadas en registros

Un incidente es un registro del momento en que la condición o se cumplen las condiciones. Por lo general, cuando se cumplen las condiciones, Cloud Monitoring abre un incidente y envía una notificación cuando se recibe un registro que coincide con la condición de tu política de alertas basada en registros. Sin embargo, no se crean incidentes en las siguientes circunstancias:

  • La política está pospuesta o inhabilitada.
  • La frecuencia máxima de notificaciones superaría el límite de 1 notificación cada 5 minutos para cada política de alertas basada en registros.
  • El total diario de notificaciones superaría el límite de 20 notificaciones al día para cada política de alertas basada en registros

Para cada incidente, Monitoring crea un Detalles del incidente que permite administrar el incidente y que informa su información que pueden ayudarte a solucionar la falla. Por ejemplo, la página Detalles del incidente muestra una lista de entradas de registro que coinciden con la consulta de la política de alertas basada en registros. También puedes encontrar vínculos a incidentes relacionados.

En este documento, se describe cómo puedes encontrar tus incidentes y cómo puedes usar la página Detalles del incidente para investigar y administrar los incidentes de las políticas de alertas basadas en registros.

Antes de comenzar

Asegúrate de tener los permisos necesarios:

Para obtener los permisos que necesitas para ver y administrar incidentes con la consola de Google Cloud, pídele a tu administrador que te otorgue los siguientes roles de IAM en tu proyecto:

Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.

Para obtener más información sobre los roles de Cloud Monitoring, consulta Controla el acceso con Identity and Access Management.

Cómo encontrar incidentes

Para ver una lista de incidentes en tu proyecto de Google Cloud, haz lo siguiente:

  1. En la consola de Google Cloud, ve a la página  Alertas.

    Ir a las Alertas

    Si usas la barra de búsqueda para encontrar esta página, selecciona el resultado cuyo subtítulo es Monitoring.

    • En el panel Resumen, se muestra la cantidad de incidentes abiertos.
    • En el panel Incidentes, se muestran los incidentes más recientes. Para enumerar los incidentes más recientes en la tabla, incluidos los que están cerrados, haz clic en Mostrar incidentes cerrados.
  2. Para ver los detalles de un incidente específico, selecciónalo en la lista.

    Se abrirá la página Detalles del incidente. Para obtener más información sobre el Detalles del incidente, consulta la Investiga un incidente de esta página.

Cómo encontrar incidentes más antiguos

En el panel Incidentes en Alertas, se muestran los incidentes abiertos más recientes. Para ubicar los incidentes más antiguos, realiza una de las siguientes acciones:

  • Para desplazarte por las entradas de la tabla Incidentes, haz clic en  Más reciente o  Más antiguo.

  • Para navegar a la página Incidentes, haz clic en Ver todos los incidentes. En la página Incidentes, puedes hacer lo siguiente:

    • Mostrar incidentes cerrados: Para enumerar todos los incidentes en la tabla, Haz clic en Mostrar incidentes cerrados.
    • Filtra incidentes: Para obtener información sobre cómo agregar filtros, consulta Filtrar incidentes.
    • Confirmar o cerrar un incidente, o posponer su política de alertas Para acceder a estas opciones, haz clic en  Más opciones en la fila del incidente. y elige una opción en el menú. Para obtener más información, consulta Administra incidentes.

Filtrar incidentes

Cuando ingresas un valor en la barra de filtros, solo los incidentes que coinciden con el filtro se enumeran en la tabla Incidentes. Si agregas varios filtros, solo se mostrará un incidente si cumple con todos los filtros.

Para agregar un filtro a la tabla de incidentes, haz lo siguiente:

  1. En la página Incidentes, haz clic en  Filtrar tabla y, luego, selecciona una propiedad de filtro. Las propiedades del filtro incluyen todas las siguientes opciones:

    • Estado del incidente
    • Nombre de la política de alertas
    • Cuando se abrió o cerró el incidente
  2. Selecciona un valor del menú secundario o ingresa un valor en la barra de filtros.

Cómo investigar un incidente

La página Detalles del incidente contiene información que puede ayudarte a identificar la causa de un incidente.

Explora las entradas de registro

Explora las entradas de registro para encontrar patrones y problemas recurrentes relacionados con tu durante tu investigación. En el panel Registros, se muestran las entradas de registro que coinciden con la consulta de tu política de alertas basada en registros.

  • Para ver las entradas de registro en el Explorador de registros, haz clic en Ver en el Explorador de registros y, luego, seleccionar un proyecto de permisos.
  • Para ver el panel de registros en el Explorador de métricas, haz clic en Explorar datos.

Ver etiquetas y documentación

Las etiquetas y la documentación proporcionan información complementaria sobre el incidente.

En la sección Etiquetas, se muestran las etiquetas y los valores del recurso supervisado incluidos en la entrada de registro que causó el incidente. Esta información puede ayudarte a identificar los componentes recurso que causó el incidente. Para obtener más información, consulta Cómo anotar incidentes con etiquetas.

En la sección Documentation, se muestra la plantilla de documentación para que proporcionaste cuando creaste la política de alertas. Esta información puede incluir una descripción supervisa políticas y, además, incluye sugerencias para la mitigación. Para obtener más información, consulta Anota las notificaciones con documentación definida por el usuario.

Si no configuraste la documentación para tu política de alertas, en el panel Documentación, se mostrará el mensaje “No se configuró ninguna documentación”.

Para ayudarte a descubrir problemas subyacentes en tu aplicación, puedes y explorar incidentes relacionados con otras condiciones de la política de alertas.

En la sección Incidentes relacionados, se muestra una lista de incidentes que coinciden con una de las siguientes opciones:

  • El incidente se creó cuando se cumplió una condición de la misma política de alertas.
  • El incidente comparte una etiqueta con el incidente que se muestra en el incidente en la página de detalles.

Administración de incidentes

Los incidentes están en uno de los siguientes estados:

  • Apertura: : Se cumplió la condición de la política de alertas basada en registros, y el incidente aún está abierto. Si se vuelve a cumplir la misma condición y ya hay un incidente abierto, no se abre un incidente nuevo.

  • Confirmado: El incidente está abierto y se marcó de forma manual como confirmado. Por lo general, este estado indica que se investiga el incidente.

  • Cerrado: Cerraste el incidente de forma manual o se cerró automáticamente después de que venciera el período de cierre automático.

Confirmar incidentes

Te recomendamos que marques un incidente como confirmado cuando comiences a investigar la causa del incidente.

Para marcar un incidente como confirmado, haz lo siguiente:

  1. En el panel Incidentes de la página Alertas, haz clic en Ver todos los incidentes.
  2. En la página Incidentes, busca el incidente que deseas confirmar y, luego, realiza una de las siguientes acciones:

    • Haz clic en  Más opciones y, luego, selecciona Confirmar.
    • Abre la página de detalles del incidente y, luego, haz clic en Confirmar incidente.

Posponer una política de alertas

Para evitar que Monitoring cree incidentes y envíe notificaciones durante un período específico, pospone la política de alertas relacionada. Cuando aplazas una política de alertas, los incidentes relacionados con ella permanecen abiertos, pero no generan más notificaciones. Los incidentes se cierran según la duración del cierre automático de la política de alertas.

Para posponer un incidente que estás viendo, haz lo siguiente:

  1. En la página Detalles del incidente, haz clic en Política de posponer.

  2. Selecciona la duración de la posposición. Después de seleccionar la duración de la función para posponer, comienza de inmediato.

También puedes posponer una política de alertas desde la página Incidentes. Para ello, busca el incidente que deseas posponer, haz clic en  Más opciones y, luego, selecciona Posponer. Puedes posponer las políticas de alertas durante las interrupciones para evitar recibir más notificaciones durante el proceso de solución de problemas.

Cerrar incidentes

Puedes permitir que Monitoring cierre un incidente por ti. puedes cerrar el incidente.

Monitoring cierra automáticamente un incidente cuando el de la política de alertas. De forma predeterminada, la duración del cierre automático es de 7 días. La duración mínima del cierre automático es de 30 minutos.

Para cerrar un incidente, haz lo siguiente:

  1. En el panel Incidentes de la página Alertas, haz clic en Ver todos los incidentes.
  2. En la página Incidentes, busca el incidente que deseas cerrar y, luego, realiza una de las siguientes acciones:

    • Haz clic en  Ver más y, luego, selecciona Cerrar incidente.
    • Abre la página Detalles del incidente de ese incidente. y, luego, en Cerrar incidente.
Si ves el mensaje Unable to close incident, vuelve a intentarlo en unos minutos. No puedes cerrar un incidente nuevo de inmediato porque el sistema de alertas aún considera activas las condiciones que lo causaron.

Límites y retención de datos

Para obtener información sobre los límites y el período de retención de los incidentes, consulta Límites de las alertas.

¿Qué sigue?