Saltar al contenido

Análisis de los requisitos de visualización de datos en R

Encontrar relaciones entre las variables es posiblemente el requisito de visualización más popular porque es muy útil en los análisis descriptivos, diagnósticos, predictivos y prescriptivos.

Para visualizar una relación entre dos variables numéricas, se puede utilizar crear un gráfico de dispersión utilizando la función geom_point(). Por ejemplo, se podría visualizar la relación entre la edad y el nivel de inversión del solicitante. La línea de código que se muestra a continuación utiliza los mapas estéticos esenciales de los ejes x (Edad) e y (Inversión), y luego especifica la función geom_punto con los argumentos adicionales de tamaño y color.

Análisis de los requisitos de visualización de datos en R
Análisis de los requisitos de visualización de datos en R
1ggplot(dat, aes(x = Edad, y = Inversión)) + geom_point(size = 2, color="blue") + xlab("Edad en años") + ylab("Inversión en USD") + ggtitle("Edad vs. Niveles de inversión")

{r}

Salida:

El resultado anterior muestra que hay poca o ninguna relación lineal entre la edad y el nivel de inversión del solicitante. En este ejemplo se utilizan variables numéricas, pero también es posible visualizar la relación entre una variable categórica y una variable numérica. Utilice un diagrama de caja para visualizar esta relación.

Una gráfica de caja es una forma estandarizada de mostrar la distribución de los datos basada en un resumen de cinco números: mínimo, primer cuartil (Q1), mediana, tercer cuartil (Q3) y máximo. Se utiliza a menudo para identificar la distribución de los datos y detectar los valores atípicos. Por ejemplo, el código que figura a continuación traza la distribución de la variable numérica Edad frente a la variable categórica Propósito.

1ggplot(dat, aes(Propósito, Edad)) + geom_boxplot(fill = "blue") + labs(title = "Box Plot")

{r}

Salida:

De la tabla, podemos inferir que la edad media de los solicitantes de préstamos personales es más alta, mientras que es más baja para los solicitantes de préstamos para viajes. Esta es una visión interesante para entender la distribución de la edad con respecto al propósito de los préstamos.