Contacta con nosotros

Temario del curso

Introducción a AIOps con herramientas de código abierto

  • Descripción general de los conceptos y beneficios de AIOps
  • Prometheus y Grafana en la pila de observabilidad
  • El papel del aprendizaje automático en AIOps: análisis predictivo frente a reactivo

Configuración de Prometheus y Grafana

  • Instalación y configuración de Prometheus para la recopilación de series temporales
  • Creación de paneles en Grafana utilizando métricas en tiempo real
  • Exploración de exportadores, re-etiquetado (relabeling) y descubrimiento de servicios

Preprocesamiento de datos para aprendizaje automático

  • Extracción y transformación de métricas de Prometheus
  • Preparación de conjuntos de datos para detección de anomalías y predicciones (forecasting)
  • Uso de las transformaciones de Grafana o pipelines de Python

Aplicación del aprendizaje automático para la detección de anomalías

  • Modelos básicos de ML para la detección de valores atípicos (por ejemplo, Isolation Forest, One-Class SVM)
  • Entrenamiento y evaluación de modelos sobre datos de series temporales
  • Visualización de anomalías en paneles de Grafana

Predicción (forecasting) de métricas con aprendizaje automático

  • Construcción de modelos simples de predicción (introducción a ARIMA, Prophet y LSTM)
  • Predicción de la carga del sistema o el uso de recursos
  • Uso de las predicciones para alertas tempranas y decisiones de escalado

Integración de ML con alertas y automatización

  • Definición de reglas de alerta basadas en la salida del modelo de ML o umbrales fijos
  • Uso de Alertmanager y enrutamiento de notificaciones
  • Activación de scripts o flujos de trabajo automatizados ante la detección de anomalías

Escalamiento e implementación operativa de AIOps

  • Integración con herramientas externas de observabilidad (por ejemplo, ELK stack, Moogsoft, Dynatrace)
  • Implementación operativa de modelos de ML en flujos de trabajo de observabilidad
  • Mejores prácticas para la implementación de AIOps a gran escala

Resumen y próximos pasos

Requerimientos

  • Comprensión de los conceptos de monitoreo y observabilidad de sistemas
  • Experiencia usando Grafana o Prometheus
  • Familiaridad con Python y principios básicos del aprendizaje automático (machine learning)

Público objetivo

  • Ingenieros de observabilidad
  • Equipos de infraestructura y DevOps
  • Arquitectos de plataformas de monitoreo e ingenieros de confiabilidad del sitio (SRE)
 14 Horas

Número de participantes


Precio por participante

Próximos cursos

Categorías Relacionadas