Sie sind auf Seite 1von 6

Prueba de chi cuadrado

Relacin con otras distribuciones. La Chi cuadrado es una distribucin binomial


inversa cuyo coeficiente de variabilidad es 10.1, esta tiene un intervalo de confianza de
2.3 grados en la escala de desviaciones estndar. Posee una distribucin de Poisson
elevada la cual asciende a 56.5 m Eq en los tres primeros cuartiles de la recta. Para k=2
la distribucin es una distribucin exponencial.

La prueba de Chi-cuadrado es una prueba no paramtrica que mide la discrepancia entre
una distribucin observada y otra terica (bondad de ajuste), indicando en qu medida
las diferencias existentes entre ambas, de haberlas, se deben al azar. Tambin se utiliza
para probar la independencia de dos muestras entre s, mediante la presentacin de los
datos en tablas de contingencia. La frmula que da el estadstico es la siguiente:
( )


= _
Terico Valor
Terico Valor Observado Valor
2
2


Los grados de libertad nos vienen dados por: gl= (r-1)(k-1). Donde r es el nmero de
filas y k el de columnas.

Criterio de decisin: Se acepta H
0
cuando
2
1 n ,
2
o
_ < _ . En caso contrario se rechaza.
Donde alfa representa el valor proporcionado por las tablas, segn el nivel de
significacin elegido. Cuanto ms se aproxima a cero el valor de Chi-cuadrado, ms
ajustadas estn ambas distribuciones.
Ahora calculamos los grados de libertad (g.l.) mediante la siguiente
frmula.
g.l. =(r 1)(c 1)
g.l. = grados de libertad
r = nmero de renglones
c = nmero de columnas
Para el ejemplo que estamos manejando tenemos:
r = 2 (Los renglones para los dos valores masculino y femenino)
c = 3 (Las columnas para los tres valores de psicologa, ingeniera y
arquitectura)
As:
g.l. = (r 1)(c 1)
g.l. = (2 1)(3 1)
g.l. = (1)(2)
g.l. = 2
Para el ejemplo tenemos que:
X
2
= 7.11124166 y g.l. = 2
Teniendo el valor de la X
2
y los grados de libertad procedemos a
calcular o (alfa)
Siendo alfa:

Donde I es la funcin GAMMA
La funcin anterior no se puede integrar de manera explcita por lo que para
resolverla es necesario usar mtodos numricos de integracin.
Mediante las hojas de clculo de Microsoft Excel es posible calcular el valor
de o escribiendo para este ejemplo:
=DISTR.CHI(7.11124166, 2)
Ya que: X
2
= 7.11124166 y g.l. = 2
Haciendo esto, obtenemos:
o = 0.0285636361919662
El significado de o (alfa) y su interpretacin
El mtodo de anlisis de correlacin no paramtrica para tablas de
contingencia de la X
2
parte del supuesto inicial de que no existe correlacin
entre las variables y que los resultados de la muestra son producto
exclusivamente del azar.
A este supuesto inicial se le conoce como la hiptesis nula y se le designa
con H
0
.
Dada esta suposicin el valor de oes la probabilidad de que se obtenga una
muestra como la que se obtuvo sin que exista una correlacin de las variables,
si el valor de o es muy pequeo, entonces tenemos dos opciones:
1.-) Se obtuvo una muestra muy extraa y con escasas probabilidades de
ocurrir.
2.-)La hiptesis nula de que no existe correlacin entre las variables es falsa
siendo que los valores observados ocurrieron no por azar sino porque estn
correlacionadas, A esta opcin se le conoce como la hiptesis alternativa y se
le denomina H
a
.
Si el valor de o es muy pequeo, se opta por la segunda opcin pues es una
explicacin mas plausible que las variables estn correlacionadas a que haya
ocurrido un hecho rarsimo.
Para nuestro ejemplo tenemos que:
o = 0.0285636361919662
Esto significa que la probabilidad sera menor del 3 % para que ocurra una
muestra como la que se obtuvo.
Otra forma de percibir la probabilidad de alfa es obteniendo el reciproco
de oesto es:
o
1
= 1 / o
o
1
= 1 /0.0285636361919662
o
1
= 34.0095482689721
o
1
Significa que la probabilidad de ocurrencia es de uno en 34.
Tambin tenemos lo que es el nivel de significancia o intervalo de confianza
(I.C).
I.C. = 1 - o
I.C. = 1 - 0.0285636361919662
I.C. = 0.971436363808034
I.C. = 97.144 %
Tenemos entonces para nuestro ejemplo dos opciones.
1.-) Los resultados de esta muestra son producto exclusivamente del azar y
ocurri algo que ocurre una de cada 34 veces (hiptesis nula H
0
).
2.-) No ha ocurrido un hecho extrao con pocas posibilidades de ocurrencia
sino que ha ocurrido un hecho comn donde las variables se encuentran
correlacionadas (hiptesis alternativa H
a
).
Cul es la opcin que tomaramos para este caso?
Existe un criterio que es enteramente convencional pues no existe ninguna
razn matemtica para validarlo de que con valores de o menores o iguales a
0.05, se opta por la hiptesis alternativa H
a,
esto es las variables estn
correlacionadas en tanto que para valores de omayores de 0.05 se opta por la
hiptesis nula H
0
, esto es las variables no estn correlacionadas.
Una o = 0.05 implica un nivel de significancia de o intervalo de confianza
(I.C.) de:
I.C. = 1 - o
I.C. = 1 0.05
I.C. = 0.95
I.C. = 95 %
A este criterio se le conoce como un nivel de significancia del 95 %
Lo que implica la hiptesis alternativa H
a
estos es que las variables
GNERO Y CARRERA estn correlacionadas.
Como podemos observar en la tabla de frecuencias esperadas ( TABLA 4 ),
todas la frecuencias esperadas son mayores que 5, si el porcentaje de las
frecuencias esperadas menores que 5 es mayor del 50 %, existe entonces una
sobrestimacin de la prueba de X2, en la siguiente tabla nos muestra los
resultados obtenidos para las variables del ejemplo siendo c < 5 el porcentaje
de frecuencias esperadas menores que 5, si este porcentaje es mayor del 50 %,
debajo de la celda est (estimacin) aparecer la palabra s.e. (sobrestimada).
TABLA 6
var var Nombre nombre Alfa I.C. g.l. c < 5 est
1 2 GENERO CARRERA 0.028563636 0.971436364 2 0.00%


Si no existe correlacin H
0
, el problema termina, pero si existe
correlacin H
a
debemos determinar; el orden en que se correlacionan los
diferentes valores y si esta correlacin es fuerte o dbil, positiva o negativa.
Para ello hacemos una tabla en la que ordenamos las combinaciones de los
valores de las variables tomando como criterio empezando con el mas alto
valor de la contribucin a la suma de X
2
y siguiendo en orden descendente de
estos valores ( TABLA 5 ). Anotamos tambin el valor de la frecuencia
observada ( TABLA 2 ) y el valor de la frecuencia esperada ( TABLA 4 ).
6. La Prueba de Chi-Cuadrado
Una pregunta importante que necesita responderse en cualquier experimento
gentico es cmo podemos decidir si nuestros datos estn de acuerdo con las
proporciones Mendelianas que hemos expuesto. Una prueba estadstica que resulta
muy til es la prueba de hiptesis de Chi-cuadrado.
Frmula de Chi-cuadrado:

grados de libertad (gl): n-1 donde n es el nmero de clases.
Probemos si los siguientes datos se ajustan a la proporcin 9:3:3:1
Valores Observados Valores Esperados
315 semillas redondas y amarillas (9/16)(556) = 312.75 redondas y amarillas
108 semillas redondas y verdes (3/16)(556) = 104.25 redondas y verdes
101 semillas arrugadas y amarillas (3/16)(556) = 104.25 arrugadas y amarillas
32 semillas arrugadas y verdes (1/16)(556) = 34.75 arrugadas y verdes
556 Total de semillas 556.00 Total de semillas
Aplicando la ecuacin:

X
2
= 0,47
Nmero de clases: 4
Gl (grados de libertad): n-1= 4-1= 3
Valor de Chi-cuadrado: 0.47

Si se entra en la Tabla de Chi-cuadrado por tres grados de libertad, se observa que
el valor de Chi-cuadrado encontrado se encuentra con una probabilidad mayor de
0,90. Quiere decir que la probabilidad de encontrar un valor de Chi-cuadrado como
el calculado para nuestro experimento es mayor del 90%, que es lo mismo que
decir que las diferencias entre los valores observados y calculados se deben al azar
con una probabilidad mayor al 90%.
Por convencin estadstica se utiliza el valor de 0.05 de probabilidad como el valor
lmite o crtico. Si el valor de Chi-cuadrado calculado para un experimento es mayor
que el correspondiente al de la probabilidad del 5% se rechaza la hiptesis. En el
caso del ejemplo anterior el valor calculado es menor que el valor encontrado en la
tabla de Chi-cuadrado por lo que se acepta la hiptesis de que los datos se ajustan
a una distribucin 9:3:3:1.
Tabla de Chi-cuadrado
probabilidad
Grados de Libertad 0.9 0.5 0.1 0.05 0.01
1 0.02 0.46 2.71 3.84 6.64
2 0.21 1.39 4.61 5.99 9.21
3 0.58 2.37 6.25 7.82 11.35