Prueba de Chi cuadrada para independencia y bondad de ajuste| Chi square Test in R
Hola! Bienvenidos nuevamente.
En este nuevo encuentro estadístico hablaremos sobre la prueba Chi cuadrada utilizando para ello, cómo no, la distribución Chi cuadrada donde se aplicará como criterio de decisión para rechazar o no rechazar la hipótesis nula en nuestro problema establecido.Al final de cada ejemplo presentado se mostrará el código en R para ejecutarse y los resultados.
Primeramente, debemos hablar sobre la distribución Chi cuadrada y cómo varía dependiendo de los grados de libertad.
Podemos observar la variación de la curvatura al variar los grados de libertad, con ello el área balo la curva variará igualmente. Esto nos servirá para comparar nuestro χ2 calculado para la prueba con el χ2 de tabla, con grados de libertad establecidos.
Dicho esto, debemos formular la prueba estadística a utilizar en nuestra problemática:
Primero, establecemos las hipótesis nula Ho y la hipótesis alternativa Ha para bondad de ajuste y para prueba de independencia serán respectivamente:
Segundo, se deberá calcular los valores E para cada caso y seguidamente se podrá obtener χ2 de prueba o calculado, en base a los discutido anteriormente.
Tercero, se compararán los valores χ2 de prueba con el valor de χ2 de tabla junto con los grados de libertad (d.f.). La regla de decisión se basa en
Si la desigualdad anterior es cierta, se rechaza la hipótesis nula Ho.
Considere el experimento hipotético donde se miden los efectos de fumar en los divorcios para averiguar si existe una relación entre ellos.
Ho: El divorcio no está relacionado con el fumar
Ha: El divorcio está relacionado con el fumar
Los valores en la tabla anterior serán los valores observados y para cálculo de valores esperados E,
Entonces, seguidamente calculamos χ2 prueba con la fórmula establecida
χ2 = ∑ ( (O-E)^2) / E = (73 -59)^2 / 59 + (12-26)^2 / 26 + (43-57)^2 / 57 + (39 -25)^2 / 25
= 3.32 +7.54 + 3.44 + 7.84 = 22.14
donde, d.f. = ( no. de filas - 1) * (no. de columnas - 1) = (2-1)*(2-1) = 1
por tanto, el χ2 tabla con un alfa de 0.05 se obtiene en la tabla siguiente.
χ2 tabla = 3.841, por tanto se rechaza Ho al ser χ2 prueba > χ2 tabla.
Esto en palabras normales será que existe evidencia estadística para concluir que el efecto de fumar (efecto) incide en el número de divorcios (problemática).
Veamos ahora el código en R, donde además obtenemos el valor p-value mucho menor que 0.05 por lo que igualmente nos sirve para rechazar la hipótesis nula.
En este nuevo encuentro estadístico hablaremos sobre la prueba Chi cuadrada utilizando para ello, cómo no, la distribución Chi cuadrada donde se aplicará como criterio de decisión para rechazar o no rechazar la hipótesis nula en nuestro problema establecido.Al final de cada ejemplo presentado se mostrará el código en R para ejecutarse y los resultados.
Primeramente, debemos hablar sobre la distribución Chi cuadrada y cómo varía dependiendo de los grados de libertad.
Chi square distribution varying degree of freedom
Podemos observar la variación de la curvatura al variar los grados de libertad, con ello el área balo la curva variará igualmente. Esto nos servirá para comparar nuestro χ2 calculado para la prueba con el χ2 de tabla, con grados de libertad establecidos.
Dicho esto, debemos formular la prueba estadística a utilizar en nuestra problemática:
- En el caso de bondad de ajuste o goodness of fit, se deberán calcular los valores esperados (E) para cada caso según la hipótesis establecida (la distribución supuesta) y comparar con los valores observados.
- Si se desea probar la independencia de una problemática dados dos grupos entonces debemos utilizar la fórmula anterior y además
Primero, establecemos las hipótesis nula Ho y la hipótesis alternativa Ha para bondad de ajuste y para prueba de independencia serán respectivamente:
- Ho: El conjunto de datos X sigue una distribución Y
- Ho: La problemática X es independiente de los factores Y y Z
Segundo, se deberá calcular los valores E para cada caso y seguidamente se podrá obtener χ2 de prueba o calculado, en base a los discutido anteriormente.
Tercero, se compararán los valores χ2 de prueba con el valor de χ2 de tabla junto con los grados de libertad (d.f.). La regla de decisión se basa en
χ2 prueba > χ2 tabla
Si la desigualdad anterior es cierta, se rechaza la hipótesis nula Ho.
Ejemplo #1 Prueba de independencia
Ho: El divorcio no está relacionado con el fumar
Ha: El divorcio está relacionado con el fumar
Divorciados | No divorciados | Total | |
Fuma | 73 | 12 | 85 |
No - Fuma | 43 | 39 | 82 |
Total | 116 | 51 | 167 |
- Fuma - divorciados = 85 * 116 / 167 = 59
- Fuma - no divorciados = 85*51/167 = 26
- No fuma - divorciados = 82*116/167 = 57
- No fuma - no divorciados = 82*51/167 = 25
Divorciados | No divorciados | |
Fuma | 59 | 26 |
No - fuma | 57 | 25 |
Entonces, seguidamente calculamos χ2 prueba con la fórmula establecida
χ2 = ∑ ( (O-E)^2) / E = (73 -59)^2 / 59 + (12-26)^2 / 26 + (43-57)^2 / 57 + (39 -25)^2 / 25
= 3.32 +7.54 + 3.44 + 7.84 = 22.14
donde, d.f. = ( no. de filas - 1) * (no. de columnas - 1) = (2-1)*(2-1) = 1
por tanto, el χ2 tabla con un alfa de 0.05 se obtiene en la tabla siguiente.
Esto en palabras normales será que existe evidencia estadística para concluir que el efecto de fumar (efecto) incide en el número de divorcios (problemática).
Veamos ahora el código en R, donde además obtenemos el valor p-value mucho menor que 0.05 por lo que igualmente nos sirve para rechazar la hipótesis nula.
Comentarios
Publicar un comentario