Saltar al contenido

Análisis de Datos de Alta Dimensión

Si te interesa el análisis y la interpretación de datos, este es el curso de ciencia de datos para ti. Empezamos aprendiendo la definición matemática de la distancia y la utilizamos para motivar el uso de la descomposición del valor singular (SVD) para la reducción de la dimensión y el escalado multidimensional y su conexión con el análisis de componentes principales. Aprenderemos sobre el efecto de lote : el problema más desafiante de análisis de datos en la genómica de hoy en día y describiremos cómo las técnicas pueden ser utilizadas para detectar y ajustar los efectos de lote. Específicamente, describiremos el análisis de componentes principales y el análisis de factores y demostraremos cómo se aplican estos conceptos a la visualización de datos y al análisis de datos experimentales de alto rendimiento.

Finalmente, damos una breve introducción al aprendizaje de la máquina y lo aplicamos a los datos de alto rendimiento. Describimos la idea general del análisis de agrupación y describimos los medios K y la agrupación jerárquica y demostramos cómo se utilizan en la genómica y describimos los algoritmos de predicción como los vecinos k-cercanos junto con los conceptos de conjuntos de entrenamiento, conjuntos de pruebas, tasas de error y validación cruzada.

Análisis de Datos de Alta DimensiónAnálisis de Datos de Alta Dimensión

Esta clase fue apoyada en parte por la subvención del NIH R25GM114818.