Saltar al contenido

Construyendo modelos de aprendizaje de máquinas en la Chispa 2

Descripción

La chispa es posiblemente el motor más popular para el procesamiento de grandes datos en estos días. En este curso, Construyendo Modelos de Aprendizaje de Máquinas en Spark 2, aprenderá a construir y entrenar modelos de Aprendizaje de Máquinas (ML) como sistemas de regresión, clasificación, agrupación y recomendación en el entorno de procesamiento distribuido de Spark 2.x.

Construyendo modelos de aprendizaje de máquinas en la Chispa 2
Construyendo modelos de aprendizaje de máquinas en la Chispa 2

Este curso comienza con una introducción a las 2 bibliotecas ML disponibles en Spark 2; la antigua biblioteca spark.mllib construida sobre RDDs y la nueva biblioteca spark.ml construida sobre dataframes. Podrás ver las dos comparadas para ayudarte a saber cuándo elegir una sobre la otra.

Podrá ver un modelo de clasificación construido utilizando los Árboles de Decisión a la antigua usanza, y ver cómo puede implementar el mismo modelo en la nueva biblioteca spark.ml.

El curso cubre muchas características del Spark 2, incluyendo el repaso de una nueva característica del Spark 2, los oleoductos ML utilizados para encadenar sus transformaciones de datos y las operaciones ML.

Al final de este curso se sentirá cómodo usando las funciones avanzadas que ofrece el Spark 2 para el aprendizaje de la máquina. Aprenderá a utilizar componentes como transformadores, estimadores y parámetros dentro de sus tuberías ML para trabajar con entrenamiento distribuido a escala.