Sie sind auf Seite 1von 8

SEMANA 14 y 15 8. DISTRIBUCIN CHI2 CUADRADO Si (X1,X2,...

,Xn) son n variables aleatorias normales independientes de media 0 y varianza 1, la variable definida como n 2 2 Yn = X1 + L + Xn = i=1 X i2 Se dice que tiene una distribucin CHI con n grados de libertad. Su funcin de densidad es 1 f (x) = x ( n 2) / 2 e x / 2 x>0 n n 2 2 Siendo (P) = X P 1e x dx la funcin gamma de Euler, con P>0. La funcin de
0

distribucin viene dada por

F( x ) = P( X x ) = f ( x )dx
0

La media de esta distribucin es E(X)=n y su varianza V(X)=2n. Esta distribucin es bsica en un determinado nmero de pruebas no paramtricas. Si consideramos una variable aleatoria Z~N(0,1), la variable aleatoria X=Z2 se distribuye segn una ley de probabilidad distribucin CHI con un grado de libertad Si tenemos n variable aleatoria independientes Zi~N(0,1), la suma de sus cuadrados respectivos es una distribucin CHI con n grados de libertad,
Z i N(0,1) Z i2 2 n
i =1 n

La media y varianza de esta variable son respectivamente, E(X)=n y V(X)=2n EJEMPLO El espesor de un semiconductor se controla mediante la variacin estndar no mayor a =0.60 mm. Para mantener controlado el proceso se toman muestras aleatoriamente de tamao de 20 unidades, y se considera que el sistema est fuera de control cuando la probabilidad de que 2 tome valor mayor o igual al valor de la muestra observado es que es 0.01. Que se puede concluir si s=0.84mm? Solucin. Existe fuera de control si (n 1)s 2 / 2 con n=20 y =0.60, excede
2 0 .01,19 = 36.191

(n 1)s 2 19 * 0.84 2 = = 37.24 2 0.60 2 Por tanto, el sistema est fuera de control Entonces, La funcin de distribucin bucin CHI tienen importantes variaciones de acuerdo con los grados de libertad y del tamao muestral (menor tamao muestral y mayor tamao muestral respectivamente),

En consecuencia, si tenemos X1,..,Xn, variable aleatoria independientes, donde cada X i N( i , i ) , se tiene


Xi i i =1 i
n

2 n

La distribucin Chi muestra su importancia cuando queremos determinar la variabilidad (sin signo) de cantidades que se distribuyen en torno a un valor central siguiendo un mecanismo normal.

La funcin Chi-cuadrado cuadrado es igual a la funcin normal elevada al cuadrado. Esto es, el producto de dos distribuciones de Gauss es una distribucin de Chi-cuadrado. Chi cuadrado. Si de una poblacin normal, o aproximadamente normal, se extraen muestras aleatorias e independientes, dientes, y se le calcula e el estadgrafo 2 usando el valor muestral de la varianza y el poblacional con: (n 1)s 2 2 = 2
Esta funcin matemtica est caracterizada por el valor del nmero de grados de libertad =n-1 1 (donde n es el tamao muestral). Al igual que la t t-Studen Student, el valor total del rea bajo la curva es igual a la unidad, pero la diferencia principal es que esta no es simtrica respecto al origen, sino que se extiende desde 0 hasta + porque no puede ser negativa.

A medida que los grados de libertad aumentan, aumentan, la curva cambia de forma y sus valores se han tabulado en el anexo de tablas estadsticas, donde se muestran los valores del rea bajo la curva, para los principales valores de 2, a la derecha de ste. O sea, se muestra la zona de rechazo para diferentes diferentes niveles de significacin y de grados de libertad, lo cuales varan entre 1 y 100. Ms all, conviene usar directamente la funcin de Gauss. Para cada grado de libertad hay una tabla de valores que pueden obtenerse variando el nivel de significacin, parecida arecida a la de Gauss. El problema de calcular los valores crticos, para un nivel de confianza dado, se resuelve de dos maneras: usando computadoras para resolver los clculos, y la otra ms comn, usando tablas resumidas, en forma anloga a la vista para el modelo de t-Student. Student. La distribucin de 2 se usa principalmente para analizar dispersiones. Se compara la dispersin muestral expresada a travs de sus cuadrados medios contra la dispersin poblacional cuantificada a travs de la varianza (2).

EJEMPLO.
Un n bioqumico sospecha que su micro-centrfuga micro centrfuga no mantiene constante su velocidad mientras trabaja, lo cual le da una variabilidad indeseada en sus determinaciones. Para controlarla, consigue un tacmetro regulado y mide cada minuto la velocidad durante dur 10 minutos. Los resultados fueron: una velocidad promedio en las 10 mediciones de 3098 rpm con una desviacin de 100,4 rpm. Testear para un error relativo mximo del 2% o menos, si la centrfuga es estable.

La desviacin estndar es max=2%*3098=62 rpm, luego,

H0: max62 rpm H1: max62 rpm (n 1)s 2 (10 1) * 100.4 2 = = = 23.6 2 62 2
2

De la Tabla de valores crticos surge: 20,99;9=21,666 y 20,991;9=27,877. Por lo tanto, el bioqumico ha encontrado una muy fuerte evidencia que la velocidad del equipo oscila en forma indeseada, tal como sospechaba. Y deber ajustarlo si desea disminuir la variabilidad de sus mediciones. Los resultados fueron muy significativos 2 = 23,6

En estadstica, la distribucin Chi-cuadrado, tambin denominada Chi-cuadrado de Pearson, es una distribucin de probabilidad continua con un parmetro k que representa los grados de libertad de la variable aleatoria:
2 2 X = Z1 + Z2 2 + L + Zk

donde Zi son variables de distribucin normal, N(0,1) o de media cero y varianza uno. Se suele usar la denominada prueba Chi-cuadrado como test de independencia y como test de bondad de ajuste. La funcin de densidad Chi-cuadrado es:

(1 / 2) k / 2 k / 21 x / 2 f k (x ) = x e (k / 2)

x0

es la funcin gamma. La funcin de distribucin es (k / 2, x / 2) Fk ( x ) = ( k / 2) donde (k,z) es la funcin gamma incompleta. El valor esperado y la varianza de una variable aleatoria X con distribucin Chicuadrada son E[X] = k V[X] = 2k La distribucin Chi-cuadrado tiene muchas aplicaciones en inferencia estadstica, por ejemplo en el test Chi-cuadrado y en la estimacin de varianzas. Tambin est involucrada en el problema de estimar la media de una poblacin normalmente distribuida y en el problema de estimar la pendiente de una recta de regresin lineal, a travs de su papel en la distribucin t-Student, y participa en todos los problemas de anlisis de varianza, por su papel en la distribucin F-Snedecor, que es la distribucin del cociente de dos variables aleatorias de distribucin Chi-cuadrado e independientes.

Relacin con otras distribuciones. La Chi cuadrado es una distribucin binomial inversa cuyo coeficiente de variabilidad es 10.1, esta tiene un intervalo de confianza de

2.3 grados en la escala de desviaciones estndar. Posee una distribucin de Poisson elevada la cual asciende a 56.5 m Eq en los tres primeros cuartiles de la recta. Para k=2 la distribucin es una distribucin exponencial. La prueba de Chi-cuadrado es una prueba no paramtrica que mide la discrepancia entre una distribucin observada y otra terica (bondad de ajuste), indicando en qu medida las diferencias existentes entre ambas, de haberlas, se deben al azar. Tambin se utiliza para probar la independencia de dos muestras entre s, mediante la presentacin de los datos en tablas de contingencia. La frmula que da el estadstico es la siguiente: 2 ( Valor Observado Valor Terico ) 2 = Valor Terico
Los grados de libertad nos vienen dados por: gl= (r-1)(k-1). Donde r es el nmero de filas y k el de columnas.
2 Criterio de decisin: Se acepta H0 cuando 2 < , n 1 . En caso contrario se rechaza.

Donde representa el valor proporcionado por las tablas, segn el nivel de significacin elegido. Cuanto ms se aproxima a cero el valor de Chi-cuadrado, ms ajustadas estn ambas distribuciones.

8.1 CORRECCIN DE YATES


La correccin de Yates se aplica a la prueba Chi-cuadrado cuando la frecuencia de las observaciones en alguna de las celdas es menor de 10. La Chi-cuadrado corregida: =
2

( Valor

Observado Valor Terico 0.5) Valor Terico

En general, se aplica la correccin de Yates o tambin correccin por continuidad cuando aproximamos una variable discreta a una distribucin continua. La correccin consiste en aadir y substraer 0,5 a la variable en cuestin. Por ejemplo, obtener 3 caras al lanzar una moneda es una medida discreta (nominal) que se ajusta a la distribucin binomial. Mientras que si la aproximramos a la distribucin normal, su valor oscilar entre 2,5 y 3,5.

8.2 DISTRIBUCIN T-STUDENT


Si (X,X1,X2,...,Xn) son n+1 variables aleatorias normales independientes de media 0 y varianza 2, la variable X Yn = 1 n 2 Xi n i =1 tiene una distribucin t-Student con n grados de libertad. Su funcin de densidad es

n + 1 n +1 2 1 2 1 + x 2 f (x ) = n n n 2

x>0

siendo (P) = X P 1e x dx la funcin gamma de Euler con P>0. La media de la


0

distribucin t-Student es E(X)=0 y su varianza V(X)=n/(n-2), la cual no existe para grados de libertad menores que 2. Esta distribucin aparece en algunos contrastes del anlisis normal. La distribucin tStudent se construye como un cociente entre una normal Z~N(0,1) y la raz de una Chi 2 n independientes. De modo preciso, llamamos distribucin t-Student con n grados de libertad, tn a la de una variable aleatoria T, X Z T= t n y adems, T = tn 2 1 2 n 1 X i i n n n i =1 i

Para calcular
n +1 ( n +1) / 2 t t 2 x2 P(T t ) = f ( t )dt = dx 1 + n n n 2

Sea un estadgrafo t calculado para la media con la relacin

t=

(x )
n

0,375

n=120 n=2 n=11

0,125

-3,50

+3,50

EJEMPLO
En 16 recorridos de prueba de una hora cada uno, el consumo de gasolina de un motor es de 16.4 gal, con una desviacin estndar de 2.1 gal. Demuestre que la afirmacin que el consumo promedio de gasolina de este motor es 12.0 gal/hora. Sustituyendo n=16, =12.0, x =16.4 y s=2.1 en la formula de t-Student, se tiene

= 8.38 s n 2.1 16 Para el cual en las tablas, para =5% y 15 gl es insignificante, y por tanto se puede concluir que el consumo de 12 gal/h es real =

t=

16.4 12.0

Los intervalos de confianza para esta distribucin se arman en forma anloga a la vista para el caso de Gauss. Con la nica diferencia en cmo se calcula el valor crtico t; en lugar de z. ( e t , * e )
La teora de decisiones se usa en forma anloga, empleando los intervalos de confianza visto ms arriba. Pero para poder aplicar este modelo se deben tener en cuenta los requisitos siguientes: - Las muestras fueron extradas de una poblacin normal o aproximadamente normal. - La seleccin de las muestras se hizo en forma aleatoria. - Las muestras son independientes entre s. Si alguno de ellos no se cumple, las conclusiones que se obtengan no son vlidas. Los supuestos se pueden resumir as: para poder usar t-Student, se deben tener muestras normales, aleatorias e independientes. Notar que el error estndar de estimacin es e.

T-STUDENT PARA MEDIAS MUESTRALES: En este caso e =.x luego: e= y e2=s2/n . Por lo tanto el valor de comparacin se calcula,

t=

(x )
s n

T-STUDENT PARA PROPORCIONES: En este caso e=P y p== luego con se puede obtener el valor del estadgrafo de comparacin con la relacin, (P ) t= (1 ) n

Das könnte Ihnen auch gefallen