Contacta con nosotros

Temario del curso

Introducción a AIOps

  • ¿Qué es AIOps y por qué es importante?
  • Monitoreo tradicional frente a observabilidad impulsada por AIOps
  • Arquitectura de AIOps y componentes clave

Recopilación y normalización de datos operativos

  • Tipos de datos de observabilidad: métricas, registros y trazas
  • Ingestión de datos de múltiples fuentes (servidores, contenedores, nube)
  • Uso de agentes y exportadores (Prometheus, Beats, Fluentd)

Correlación de datos y detección de anomalías

  • Correlación de series temporales y métodos estadísticos
  • Uso de modelos de aprendizaje automático para la detección de anomalías
  • Detección de incidentes en sistemas distribuidos

Alertas y reducción de ruido

  • Diseño de reglas e umbrales de alerta inteligentes
  • Supresión, deduplicación y agrupación de alertas
  • Integración con Alertmanager, Slack, PagerDuty u Opsgenie

Análisis de causa raíz y visualización

  • Uso de paneles de control para visualizar métricas y detectar tendencias
  • Exploración de eventos y líneas de tiempo para el análisis de causa raíz (RCA)
  • Rastreo de problemas a través de capas con herramientas de traza distribuida

Automatización y remedición

  • Activación de scripts o flujos de trabajo automatizados a partir de incidentes
  • Integración con sistemas de Gestión de Servicios de TI (ServiceNow, Jira)
  • Casos de uso: autogestión, escalado y redireccionamiento de tráfico

Plataformas de AIOps de código abierto y comerciales

  • Descripción general de herramientas: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
  • Criterios de evaluación para seleccionar una plataforma de AIOps
  • Demostración y práctica con un conjunto de herramientas seleccionado

Resumen y próximos pasos

Requerimientos

  • Comprensión de los conceptos de operaciones de TI y monitoreo de sistemas
  • Experiencia con herramientas o paneles de control de monitoreo
  • Familiaridad con formatos básicos de registros y métricas

Público objetivo

  • Equipos de operaciones responsables de infraestructura y aplicaciones
  • Ingenieros de Confiabilidad del Sitio (SRE, por sus siglas en inglés)
  • Equipos de monitoreo y observabilidad de TI
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas