Saltar al contenido

Prueba de hipótesis – Interpretación de datos con modelos estadísticos

La idea de una prueba t de muestra es comparar la media de un vector con una media teórica. En nuestros datos, tomaremos la variable «Ingresos» y la evaluaremos contra la media teórica.

Según las estimaciones de población anuales de mediados de año de la Oficina del Censo de los Estados Unidos, el ingreso personal medio per cápita en los Estados Unidos, en el año 2018, era de 53.820 dólares de los EE.UU. Vamos a probar una afirmación de que el ingreso medio de los solicitantes es de 53.820 dólares.

Prueba de hipótesis – Interpretación de datos con modelos estadísticos
Prueba de hipótesis – Interpretación de datos con modelos estadísticos

Una suposición importante de la prueba t de una muestra es que la distribución de la variable «Ingresos» debe ser distribuida normalmente. La línea de código de abajo crea un histograma, que parece estar aproximadamente distribuido normalmente.

12hist(df$Income, main=$0027Ingreso anual de los solicitantes de préstamos en USD$0027,xlab=$0027Ingreso(USD)$0027)

{r}

Salida:

123![nombre de la imagen](https://i.imgur.com/AEpv8FF.png)

Ya que la suposición de normalidad está satisfecha, seguiremos adelante con la prueba t. En $0027R$0027, la función t.test se utiliza para realizar esta tarea, que se realiza en la línea de código siguiente. El primer argumento es el vector de los números, $0027Ingreso$0027, mientras que el segundo argumento es la media teórica, denotada por la notación $0027mu$0027.

1t.test(df$Income, mu=53820)

{r}

Salida:

1234567891011Una muestra de datos de prueba t: df$Incomet = 11.871, df = 199, valor p < 2.2e-16 hipótesis alternativa: la media verdadera no es igual a 53820 intervalo de confianza del 95 por ciento: 61266.55, 64233.45 estimaciones de la muestra: media de x: 62750

Interpretación de la salida

La salida anterior imprime la t-estadística (t = 11.871) y los grados de libertad, que es 199 (n – 1). El valor p aquí es cercano a 0, y menor de 0,05, lo que significa que rechazaríamos la hipótesis nula de que la media de la población es igual a 53.820 dólares.

Otro punto a tener en cuenta es la línea «hipótesis alternativa: la media verdadera no es igual a 53820». Esto corresponde a una hipótesis alternativa de dos caras. Si quisiéramos que fuera una prueba t unilateral, entonces añadiremos el argumento «menos» o «más» entre comillas, y eso definirá la dirección de nuestra hipótesis alternativa.