Saltar al contenido

Lidiar con datos perdidos, inválidos y duplicados en R

Sección Introducción Transcripciones

Resumen del curso

Lidiar con datos perdidos, inválidos y duplicados en R
Lidiar con datos perdidos, inválidos y duplicados en R

Bienvenido a «Lidiando con datos perdidos, inválidos y duplicados» en R, y este es Martin Burger para… En este curso de nivel intermedio, estamos viendo tres partes muy importantes del pre-procesamiento de datos, la entrega de datos duplicados, la imputación de valores perdidos, así como la detección de datos atípicos e inválidos. Estos procesos son cruciales para la preparación inicial de los datos. Los valores perdidos impiden que muchas de nuestras funciones funcionen correctamente, por lo tanto usted está limitado en su conjunto de herramientas R mientras no se ocupe de todas estas N/As. Los duplicados, así como los valores atípicos y los datos inválidos introducen sesgos en su análisis. De hecho, si no eres consciente de esto, podrías llegar a conclusiones totalmente erróneas. Ahora en este curso, les mostraré múltiples métodos para identificar, eliminar y reemplazar cada una de estas tres cuestiones. Mi objetivo es darles métodos rápidos y simples, así como métodos muy avanzados para elegir. Para beneficiarse plenamente de este curso, le recomiendo que ya sepa cómo manejar los marcos de datos en R. Debería estar familiarizado con cosas como las consultas, los tipos de datos, la gestión de paquetes, la importación de datos y la interfaz de RStudio. Ahora espero realmente que utilice este curso para mejorar sus habilidades de preparación de datos. Los conceptos que se enseñan aquí son muy versátiles y pueden aplicarse a casi cualquier tipo de datos.