Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Introducción a AIOps con herramientas de código abierto
- Descripción general de los conceptos y beneficios de AIOps
- Prometheus y Grafana en la pila de observabilidad
- El papel del aprendizaje automático en AIOps: análisis predictivo frente a reactivo
Configuración de Prometheus y Grafana
- Instalación y configuración de Prometheus para la recopilación de series temporales
- Creación de paneles en Grafana utilizando métricas en tiempo real
- Exploración de exportadores, re-etiquetado (relabeling) y descubrimiento de servicios
Preprocesamiento de datos para aprendizaje automático
- Extracción y transformación de métricas de Prometheus
- Preparación de conjuntos de datos para detección de anomalías y predicciones (forecasting)
- Uso de las transformaciones de Grafana o pipelines de Python
Aplicación del aprendizaje automático para la detección de anomalías
- Modelos básicos de ML para la detección de valores atípicos (por ejemplo, Isolation Forest, One-Class SVM)
- Entrenamiento y evaluación de modelos sobre datos de series temporales
- Visualización de anomalías en paneles de Grafana
Predicción (forecasting) de métricas con aprendizaje automático
- Construcción de modelos simples de predicción (introducción a ARIMA, Prophet y LSTM)
- Predicción de la carga del sistema o el uso de recursos
- Uso de las predicciones para alertas tempranas y decisiones de escalado
Integración de ML con alertas y automatización
- Definición de reglas de alerta basadas en la salida del modelo de ML o umbrales fijos
- Uso de Alertmanager y enrutamiento de notificaciones
- Activación de scripts o flujos de trabajo automatizados ante la detección de anomalías
Escalamiento e implementación operativa de AIOps
- Integración con herramientas externas de observabilidad (por ejemplo, ELK stack, Moogsoft, Dynatrace)
- Implementación operativa de modelos de ML en flujos de trabajo de observabilidad
- Mejores prácticas para la implementación de AIOps a gran escala
Resumen y próximos pasos
Requerimientos
- Comprensión de los conceptos de monitoreo y observabilidad de sistemas
- Experiencia usando Grafana o Prometheus
- Familiaridad con Python y principios básicos del aprendizaje automático (machine learning)
Público objetivo
- Ingenieros de observabilidad
- Equipos de infraestructura y DevOps
- Arquitectos de plataformas de monitoreo e ingenieros de confiabilidad del sitio (SRE)
14 Horas