Sección Introducción Transcripciones
Resumen del curso
Hola, me llamo Janani Ravi, y bienvenidos a este curso sobre Características de Construcción de Datos Nominales. Un poco sobre mí, tengo un máster en ingeniería eléctrica de Stanford, y he trabajado en empresas como Microsoft, Google y Flipkart. En Google, fui uno de los primeros ingenieros que trabajó en la edición colaborativa en tiempo real en Google docs y tengo cuatro patentes de sus tecnologías subyacentes. Actualmente trabajo en mi propia empresa, Loonycorn, un estudio de contenido de video de alta calidad. La calidad del preprocesamiento al que se someten los datos numéricos es un determinante importante de los resultados de los modelos de aprendizaje automático construidos con esos datos. En este curso, obtendrá la capacidad de codificar datos categóricos de manera que aumente el poder estadístico de los modelos. En primer lugar, aprenderá los diferentes tipos de datos continuos y categóricos, y las diferencias entre los datos de escala de proporción e intervalo y entre los datos nominales y ordinales. A continuación, descubrirá cómo codificar datos categóricos utilizando la codificación de un solo disparo y de etiquetas, y cómo evitar la trampa de la variable ficticia en la regresión lineal. Finalmente, explorará cómo implementar diferentes formas de codificación de contraste, como la codificación polinómica simple, de Helmert y ortogonal. Para que los resultados de la regresión reflejen fielmente la hipótesis que queremos probar. Cuando termine este curso, tendrá las habilidades y el conocimiento de codificar datos categóricos necesarios para aumentar el poder estadístico de la regresión lineal que incluye tales datos.