Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Programa del Curso
Diseñando una Arquitectura Abierta AIOps
- Visión general de los componentes clave en pipelines abiertos AIOps
- Flujo de datos desde la ingesta hasta la alerta
- Comparación y estrategia de integración de herramientas
Recolección y Agregación de Datos
- Ingestando datos de series temporales con Prometheus
- Capturando registros con Logstash y Beats
- Normalizando los datos para correlación inter-fuente
Creando Paneles de Observabilidad
- Visualización de métricas con Grafana
- Construyendo paneles Kibana para el análisis de registros
- Utilizando consultas Elasticsearch para extraer insights operacionales
Detección de Anomalías y Predicción de Incidentes
- Exportación de datos de observabilidad a pipelines Python
- Entrenamiento de modelos ML para la detección de outliers y pronósticos
- Implementación de modelos para inferencia en tiempo real en el pipeline de observabilidad
Alertas y Automatización con Herramientas Abiertas
- Creando reglas de alerta Prometheus y ruteo de Alertmanager
- Activación de scripts o flujos de trabajo API para respuesta automática
- Utilizando herramientas de orquestación open source (por ejemplo, Ansible, Rundeck)
Consideraciones de Integración y Escalabilidad
- Manejo de la ingesta de alta volumetría y retención a largo plazo
- Seguridad y control de acceso en pilas open source
- Escalar cada capa independientemente: ingesta, procesamiento, alertas
Aplicaciones del Mundo Real y Extensiones
- Estudios de caso: ajuste de rendimiento, prevención de tiempo muerto y optimización de costos
- Extender pipelines con herramientas de seguimiento o gráficos de servicios
- Mejores prácticas para ejecutar y mantener AIOps en producción
Resumen y Próximos Pasos
Requerimientos
- Experiencia con herramientas de observabilidad como Prometheus o ELK
- Conocimientos prácticos de Python y fundamentos de aprendizaje automático
- Comprensión de las operaciones de TI y los flujos de trabajo de alertas
audiencia
- Ingenieros avanzados de confiabilidad del sitio (SREs)
- Ingenieros de datos que trabajan en operaciones
- Líderes de plataformas DevOps y arquitectos de infraestructura
14 Horas