Programa del Curso
-
Introducción al aprendizaje automático
Tipos de aprendizaje automático: aprendizaje supervisado frente a aprendizaje no supervisado
Del aprendizaje estadístico al aprendizaje automático
El flujo de trabajo de minería de datos:
Comprensión del negocio
Comprensión de los datos
Preparación de los datos
Modelado
Evaluación
Despliegue
Algoritmos de aprendizaje automático
Elegir el algoritmo adecuado para el problema
Sobreajuste y equilibrio entre sesgo y varianza en ML
Bibliotecas de ML y lenguajes de programación
¿Por qué usar un lenguaje de programación?
Elegir entre R y Python
Curso intensivo de Python
Recursos de Python
Bibliotecas de Python para aprendizaje automático
Jupyter Notebooks y codificación interactiva
Prueba de algoritmos de ML
Generalización y sobreajuste
Evitar el sobreajuste
Método de exclusión
Validación cruzada
Arranque
Evaluación de predicciones numéricas
Medidas de precisión: ME, MSE, RMSE, MAPE
Estabilidad de parámetros y predicciones
Evaluación de algoritmos de clasificación
La precisión y sus problemas
La matriz de confusión
Problema de clases desequilibradas
Visualización del rendimiento del modelo
Curva de beneficios
Curva ROC
Curva de elevación
Selección de modelos
Ajuste de modelos: estrategias de búsqueda de cuadrícula
Ejemplos en Python
Preparación de los datos
Importación y almacenamiento de datos
Comprender los datos: exploraciones básicas
Manipulaciones de datos con la biblioteca pandas
Transformaciones de datos: organización de datos
Análisis exploratorio
Observaciones faltantes: detección y soluciones
Valores atípicos: detección y estrategias
Estandarización, normalización, binarización
Recodificación de datos cualitativos
Ejemplos en Python
Clasificación
Clasificación binaria frente a multiclase
Clasificación a través de funciones matemáticas
Funciones discriminantes lineales
Funciones discriminantes cuadráticas
Regresión logística y enfoque probabilístico
k-vecinos más cercanos
Bayes ingenuo
Árboles de decisión
CARRO
Embolsado
Random Forests
Impulsar
Xgboost
Soporte de máquinas vectoriales y kernels
Clasificador de margen máximo
Máquina de vectores de soporte
Aprendizaje en conjunto
Ejemplos en Python
Regresión y predicción numérica
Estimación de mínimos cuadrados
Técnicas de selección de variables
Regularización y estabilidad- L1, L2
No linealidades y mínimos cuadrados generalizados
Regresión polinómica
Splines de regresión
Árboles de regresión
Ejemplos en Python
Aprendizaje no supervisado
Agrupamiento
Agrupamiento basado en centroides: k-medias, k-medoides, PAM, CLARA
Agrupamiento jerárquico – Diana, Agnes
Clustering basado en modelos - EM
Mapas autoorganizados
Evaluación y valoración de los clústeres
Reducción de dimensionalidad
Análisis de componentes principales y análisis factorial
Descomposición de valores singulares
Escalado multidimensional
Ejemplos en Python
Minería de textos
Preprocesamiento de datos
El modelo de la bolsa de palabras
Talla y lemmización
Análisis de las frecuencias de palabras
Análisis de sentimiento
Creación de nubes de palabras
Ejemplos en Python
Motores de recomendaciones y filtrado colaborativo
Datos de recomendación
Filtrado colaborativo basado en el usuario
Filtrado colaborativo basado en elementos
Ejemplos en Python
Minería de patrones de asociación
Algoritmo de conjuntos de elementos frecuentes
Análisis de la cesta de la compra
Ejemplos en Python
Análisis de valores atípicos
Análisis de valores extremos
Detección de valores atípicos basada en la distancia
Métodos basados en la densidad
Detección de valores atípicos de alta dimensión
Ejemplos en Python
Caso práctico de aprendizaje automático
Comprensión de problemas empresariales
Preprocesamiento de datos
Selección y ajuste de algoritmos
Evaluación de los resultados
Despliegue
Requerimientos
Conocimiento y conciencia de Machine Learning fundamentos
Testimonios (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Curso - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Curso - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback