Saltar al contenido

Preparar los datos para el aprendizaje automático

Descripción

A medida que el Aprendizaje por Máquina explota en popularidad, es cada vez más importante saber con precisión cómo preparar los datos que entran en el modelo de una manera apropiada al problema que estamos tratando de resolver.

Preparar los datos para el aprendizaje automático
Preparar los datos para el aprendizaje automático

En este curso, Preparación de los datos para el aprendizaje automático*, obtendrá la capacidad de explorar, limpiar y estructurar sus datos de forma que obtenga el máximo rendimiento de su modelo de aprendizaje automático.

En primer lugar, aprenderá por qué la limpieza y la preparación de los datos son tan importantes, y cómo se pueden resolver los datos que faltan, los valores atípicos y otros problemas relacionados con los datos. A continuación, descubrirá cómo los modelos que leen demasiado en los datos sufren un problema llamado «overfitting», en el que los modelos funcionan bien en condiciones de prueba pero luchan en despliegues en vivo. También comprenderá cómo los modelos que se entrenan con datos insuficientes o no representativos sufren un conjunto diferente de problemas, y cómo estos problemas pueden ser mitigados.

Por último, completará sus conocimientos aplicando diferentes métodos para la selección de características, tratando los datos que faltan mediante imputación y construyendo sus modelos utilizando las características más relevantes.

Cuando termine este curso, tendrá las habilidades y el conocimiento para identificar los procedimientos correctos para la limpieza de datos y la preparación de datos para establecer su modelo para el éxito.