Sección Introducción Transcripciones
Resumen del curso

Hola. Me llamo Mike West, y bienvenido a mi curso «Data Wrangling with Pandas for Machine Learning Engineers». Mientras que las redes neurales artificiales están recibiendo toda la atención, uno de los aspectos más pasados por alto del aprendizaje automático son los datos. Independientemente del tipo de algoritmo, casi todos los modelos de aprendizaje automático necesitan datos bien formateados y estructurados para funcionar óptimamente. El trabajo del ingeniero de aprendizaje automático es llevar los datos a un estado modelable. La discusión de datos es una de las partes más difíciles y que más tiempo consume del aprendizaje automático. En el mundo real, los datos son sucios y los modelos de aprendizaje automático son temperamentales. Estos modelos sólo quieren datos bien estructurados y limpios. En este curso, le proporcionaremos la base que necesita para discutir esos datos rebeldes. El curso le introducirá en la aplicación de la lucha por los datos. Querrá que los desarrolladores tomen conjuntos de datos del mundo real y los relacionen con entidades numéricas altamente estructuradas que necesitan los modelos de aprendizaje de las máquinas. La biblioteca central utilizada por los ingenieros de aprendizaje de máquinas para discutir sus datos en Python se llama pandas. Aprenderás a manipular datos tabulares en una matriz. La matriz es el objeto de datos central en el aprendizaje automático. Una vez que los datos se han mezclado correctamente, construirás un modelo muy preciso que predecirá la capacidad de supervivencia de una persona si estuviera a bordo del Titanic en el momento del hundimiento. Python se ha convertido en el estándar de oro en el aprendizaje aplicado a las máquinas, y una biblioteca llamada pandas, la herramienta preferida utilizada por los desarrolladores para masajear sus datos hasta un estado bien depurado. Al final del curso, estarás familiarizado con los fundamentos de la discusión de datos y el proceso que los ingenieros de aprendizaje de máquinas utilizan para crear conjuntos de datos bien limpios y listos para el modelo. Espero que me acompañen en este viaje para aprender más sobre la discusión de datos con Python en…