Programa del Curso

Diseñando una Arquitectura Abierta AIOps

  • Visión general de los componentes clave en pipelines abiertos AIOps
  • Flujo de datos desde la ingesta hasta la alerta
  • Comparación y estrategia de integración de herramientas

Recolección y Agregación de Datos

  • Ingestando datos de series temporales con Prometheus
  • Capturando registros con Logstash y Beats
  • Normalizando los datos para correlación inter-fuente

Creando Paneles de Observabilidad

  • Visualización de métricas con Grafana
  • Construyendo paneles Kibana para el análisis de registros
  • Utilizando consultas Elasticsearch para extraer insights operacionales

Detección de Anomalías y Predicción de Incidentes

  • Exportación de datos de observabilidad a pipelines Python
  • Entrenamiento de modelos ML para la detección de outliers y pronósticos
  • Implementación de modelos para inferencia en tiempo real en el pipeline de observabilidad

Alertas y Automatización con Herramientas Abiertas

  • Creando reglas de alerta Prometheus y ruteo de Alertmanager
  • Activación de scripts o flujos de trabajo API para respuesta automática
  • Utilizando herramientas de orquestación open source (por ejemplo, Ansible, Rundeck)

Consideraciones de Integración y Escalabilidad

  • Manejo de la ingesta de alta volumetría y retención a largo plazo
  • Seguridad y control de acceso en pilas open source
  • Escalar cada capa independientemente: ingesta, procesamiento, alertas

Aplicaciones del Mundo Real y Extensiones

  • Estudios de caso: ajuste de rendimiento, prevención de tiempo muerto y optimización de costos
  • Extender pipelines con herramientas de seguimiento o gráficos de servicios
  • Mejores prácticas para ejecutar y mantener AIOps en producción

Resumen y Próximos Pasos

Requerimientos

  • Experiencia con herramientas de observabilidad como Prometheus o ELK
  • Conocimientos prácticos de Python y fundamentos de aprendizaje automático
  • Comprensión de las operaciones de TI y los flujos de trabajo de alertas

audiencia

  • Ingenieros avanzados de confiabilidad del sitio (SREs)
  • Ingenieros de datos que trabajan en operaciones
  • Líderes de plataformas DevOps y arquitectos de infraestructura
 14 Horas

Número de participantes


Precio por Participante​

Próximos cursos

Categorías Relacionadas