Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Introducción a AIOps
- ¿Qué es AIOps y por qué es importante?
- Monitoreo tradicional frente a observabilidad impulsada por AIOps
- Arquitectura de AIOps y componentes clave
Recopilación y normalización de datos operativos
- Tipos de datos de observabilidad: métricas, registros y trazas
- Ingestión de datos de múltiples fuentes (servidores, contenedores, nube)
- Uso de agentes y exportadores (Prometheus, Beats, Fluentd)
Correlación de datos y detección de anomalías
- Correlación de series temporales y métodos estadísticos
- Uso de modelos de aprendizaje automático para la detección de anomalías
- Detección de incidentes en sistemas distribuidos
Alertas y reducción de ruido
- Diseño de reglas e umbrales de alerta inteligentes
- Supresión, deduplicación y agrupación de alertas
- Integración con Alertmanager, Slack, PagerDuty u Opsgenie
Análisis de causa raíz y visualización
- Uso de paneles de control para visualizar métricas y detectar tendencias
- Exploración de eventos y líneas de tiempo para el análisis de causa raíz (RCA)
- Rastreo de problemas a través de capas con herramientas de traza distribuida
Automatización y remedición
- Activación de scripts o flujos de trabajo automatizados a partir de incidentes
- Integración con sistemas de Gestión de Servicios de TI (ServiceNow, Jira)
- Casos de uso: autogestión, escalado y redireccionamiento de tráfico
Plataformas de AIOps de código abierto y comerciales
- Descripción general de herramientas: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Criterios de evaluación para seleccionar una plataforma de AIOps
- Demostración y práctica con un conjunto de herramientas seleccionado
Resumen y próximos pasos
Requerimientos
- Comprensión de los conceptos de operaciones de TI y monitoreo de sistemas
- Experiencia con herramientas o paneles de control de monitoreo
- Familiaridad con formatos básicos de registros y métricas
Público objetivo
- Equipos de operaciones responsables de infraestructura y aplicaciones
- Ingenieros de Confiabilidad del Sitio (SRE, por sus siglas en inglés)
- Equipos de monitoreo y observabilidad de TI
14 Horas