Prueba de Chi cuadrada para independencia y bondad de ajuste| Chi square Test in R

Hola! Bienvenidos nuevamente.

En este nuevo encuentro estadístico hablaremos sobre la prueba Chi cuadrada utilizando para ello, cómo no, la distribución Chi cuadrada donde se aplicará como criterio de decisión para rechazar o no rechazar la hipótesis nula en nuestro problema establecido.Al final de cada ejemplo presentado se mostrará el código en R para ejecutarse y los resultados.

Primeramente, debemos hablar sobre la distribución Chi cuadrada y cómo varía dependiendo de los grados de libertad.

chisqgraph 
Chi square distribution varying degree of freedom

Podemos observar la variación de la curvatura al variar los grados de libertad, con ello el área balo la curva variará igualmente. Esto nos servirá para comparar nuestro χ2 calculado para la prueba con el χ2 de tabla, con grados de libertad establecidos.
Dicho esto, debemos formular la prueba estadística a utilizar en nuestra problemática:
  • En el caso de bondad de ajuste o goodness of fit, se deberán calcular los valores esperados (E) para cada caso según la hipótesis establecida (la distribución supuesta) y comparar con los valores observados.
          χ2 = ∑ ( (O-E)^2) / E
  • Si se desea probar la independencia de una problemática dados dos grupos entonces debemos utilizar la fórmula anterior y además
          E  = ( total fila ) x ( total columna ) /  gran total

Primero, establecemos las hipótesis nula Ho y la hipótesis alternativa Ha para bondad de ajuste y para prueba de independencia serán respectivamente:
  • Ho:  El conjunto de datos X  sigue una distribución Y
          Ha:  X no sigue una distribución Y

  • Ho:  La problemática X es independiente de los factores Y y Z
          Ha:  La problemática X es dependiente de los factores Y y Z

Segundo, se deberá calcular los valores E para cada caso y seguidamente se podrá obtener χ2 de prueba o calculado, en base a los discutido anteriormente.
Tercero, se compararán los valores χ2 de prueba con el valor de χ2 de tabla junto con los grados de libertad (d.f.). La regla de decisión se basa en

χ2 prueba  >  χ2 tabla

Si la desigualdad anterior es cierta, se rechaza la hipótesis nula Ho.


Ejemplo #1           Prueba de independencia

Considere el experimento hipotético donde se miden los efectos de fumar en los divorcios para averiguar si existe una relación entre ellos.
Ho: El divorcio no está relacionado con el fumar
Ha: El divorcio está relacionado con el fumar
DivorciadosNo divorciadosTotal
Fuma731285
No - Fuma433982
Total11651167

Los valores en la tabla anterior serán los valores observados y para cálculo de valores esperados E,
  • Fuma - divorciados = 85 * 116 / 167 = 59
  • Fuma - no divorciados = 85*51/167 = 26
  • No fuma - divorciados = 82*116/167 = 57
  • No fuma - no divorciados = 82*51/167 = 25
Por lo que nuestra nueva tabla E será

DivorciadosNo divorciados
Fuma5926
No - fuma5725

Entonces, seguidamente calculamos χ2 prueba con la fórmula establecida

χ2  =  ∑ ( (O-E)^2) / E  = (73 -59)^2 / 59 + (12-26)^2 / 26 + (43-57)^2 / 57 + (39 -25)^2 / 25

    =  3.32 +7.54 + 3.44 + 7.84 = 22.14

donde,  d.f. = ( no. de filas - 1) * (no. de columnas - 1) = (2-1)*(2-1) = 1
por tanto, el χ2 tabla con un alfa de 0.05 se obtiene en la tabla siguiente.


tblachisquare

 χ2 tabla = 3.841, por tanto se rechaza Ho al ser χ2 prueba  >  χ2 tabla.

Esto en palabras normales será que existe evidencia estadística para concluir que el efecto de fumar (efecto) incide en el número de divorcios (problemática).

Veamos ahora el código en R, donde además obtenemos el valor p-value mucho menor que 0.05 por lo que igualmente nos sirve para rechazar la hipótesis nula.




Comentarios

Entradas populares de este blog

PYTHON, SERIE ARMÓNICA Y SERIE P

Programa de numero primo en C++ con funciones