SOBRE ESTE CURSO
Se trata de un curso de introducción al aprendizaje supervisado, centrado en los métodos de regresión y clasificación. El programa incluye: regresión lineal y polinómica, regresión logística y análisis discriminante lineal; validación cruzada y el bootstrap, selección de modelos y métodos de regularización (cresta y lazo); modelos no lineales, splines y modelos aditivos generalizados; métodos basados en árboles, bosques aleatorios y boosting; máquinas vectoriales de apoyo. Se examinan algunos métodos de aprendizaje no supervisados: componentes principales y agrupación (k-medios y jerárquicos).
No es una clase de matemáticas, así que intentamos describir los métodos sin depender demasiado de las fórmulas y las matemáticas complejas. Nos centramos en lo que consideramos los elementos importantes del análisis de datos moderno. La computación se hace en R. Hay conferencias dedicadas a R, dando tutoriales desde el principio, y progresando con sesiones más detalladas que implementan las técnicas en cada capítulo.
Las conferencias cubren todo el material en An Introduction to Statistical Learning, with Applications in R de James, Witten, Hastie y Tibshirani (Springer, 2013). El pdf de este libro está disponible gratuitamente en el sitio web del libro.
PREREQUISITOS
Primeros cursos de estadística, álgebra lineal y computación.
PERSONAL DE CURSO
Trevor Hastie
Trevor Hastie es el Profesor de Estadística John A Overdeck de la Universidad de Stanford. Hastie es conocido por su investigación en estadística aplicada, particularmente en los campos de la minería de datos, bioinformática y aprendizaje automático. Ha publicado cuatro libros y más de 180 artículos de investigación en estas áreas. Antes de unirse a la Universidad de Stanford en 1994, Hastie trabajó en los Laboratorios Bell de AT&T durante 9 años, donde ayudó a desarrollar el entorno de modelado estadístico popular en el sistema informático R. Recibió su licenciatura en estadística de la Universidad de Rhodes en 1976, su maestría de la Universidad de Ciudad del Cabo en 1979 y su doctorado de Stanford en 1984. El profesor Hastie es miembro electo del Instituto de Estadísticas Matemáticas, la Asociación Americana de Estadística, el Instituto Internacional de Estadística, la Asociación de Estadística de Sudáfrica y la Real Sociedad de Estadística. Ha recibido varios premios y honores, entre ellos el premio Myrto Lefkopolous de Harvard en 1994, el Premio Parzen a la Innovación en 2014 y el premio a los ex alumnos de la Universidad de Distnguished Rhodes en 2015.
Rob Tibshirani
Robert Tibshirani es profesor en los Departamentos de Investigación y Política de Salud y Estadística de la Universidad de Stanford. En su trabajo ha hecho importantes contribuciones al análisis de conjuntos de datos complejos, más recientemente en la genómica y la proteómica. Su contribución más conocida es el Lasso, que utiliza la penalización L1 en la regresión y problemas relacionados. Es coautor de más de 200 artículos y tres libros. El profesor Tibshirani fue coautor del primer estudio que vinculó el uso del teléfono móvil con los accidentes de tráfico, un artículo ampliamente citado que ha desempeñado un papel en la introducción de legislación que restringe el uso de los teléfonos mientras se conduce. Es uno de los autores más citados en todo el campo de las ciencias matemáticas. El profesor Tibshirani es miembro de la Asociación Estadística Americana, del Instituto de Estadísticas Matemáticas y de la Real Sociedad del Canadá. Ganó el prestigioso premio de los presidentes del COPSS en 1996, el premio NSERC Steacie en 1997 y fue elegido para la Academia Nacional de Ciencias en 2012.
EQUIPO DE PRODUCCIÓN DE CURSOS
Will Fithian y Sam Gross produjeron y formatearon las preguntas del concurso y las preguntas de repaso. Daniela Witten ayudó a presentar parte del material del capítulo 5. Wes Choy dirigió la producción del video. Greg Maximov filmó y editó la mayoría de los videos del curso, así como las entrevistas y grabaciones de grupo. Greg Bruhns, Monica Diaz y Marc Sanders ayudaron con Open edX.
PREGUNTAS FRECUENTES
¿Necesito comprar un libro de texto?
No, en ese sitio web se puede consultar una versión gratuita en línea de An Introduction to Statistical Learning, with Applications in R, de James, Witten, Hastie y Tibshirani (Springer, 2013). Springer ha aceptado esto, así que no hay que preocuparse por los derechos de autor. Por supuesto, no puede distribuir versiones impresas de este archivo pdf.
¿Está R y RStudio disponible de forma gratuita.
Sí. Obtienes R gratis de http://cran.us.r-project.org/. Normalmente se instala con un clic. Obtienes RStudio de http://www.rstudio.com/, también gratis, y una instalación similarmente fácil.
¿Cuántas horas de esfuerzo se esperan por semana?
Anticipamos que tomará aproximadamente de 3 a 5 horas por semana revisar los materiales y ejercicios.
¿Recibiré una declaración de cumplimiento?
Sí, si completas el curso, y obtienes una nota de aprobación del 50% en los exámenes. Si obtienes el 90% o más, tu declaración será «con distinción».
Contenidos