Sie sind auf Seite 1von 7

Definicin. La variable 2 de Pearson.

Este modelo de probabilidad puede ser introducido como caso particular de la familia de distribuciones Gamma de prametros y p ,constantes positivas, cuya funcin de densidad responde a la siguiente forma:

Concretamente, si se considera = 1/2 y p = r/2 , donde r es un entero positivo, el modelo de probabilidad resultante se denomina 2Chi-cuadrado, con r grados de libertad. Grfica de la funcin de densidad de la variable 2 con 10 grados de libertad :

Resultado que afecta a la distribucin de S2. Si X1, X2, ..., Xn son variables aleatorias independientes con ley de probabilidad normal N(,) , es decir, una muestra aleatoria de tamao n extrada de una poblacin N(,), entonces

sigue la ley de probabilidad del modelo 2 con (n-1) grados de libertad.

Distribucin de Ji- cuadrado (x) Distribucin de datos discretos, que es funcin de la densidad poblacional y cuyos valores varan desde cero hasta +(infinito positivo). A diferencia de la distribucin Normal o la de t (Test de Student o de t), la funcin se aproxima asintticamente al eje horizontal slo en la cola derecha de la curva y NO en ambas colas. Como en la distribucin de t, no hay solo una distribucin de ji- cuadrado (x) sino que existe una distribucin para cada nmero de grados de libertad (v). Por tanto, es funcin v. Las curvas son en forma de (jota invertida) al principio, pero ms o menos acercndose a la simetra para los grados de libertad superiores. Frecuencia relativa esperada

x x para v=1 x para v=2 x para v=3 x para v=6 Las tablas de x convencionales muestran que cada x es el valor a partir del cual el rea bajo la curva de la distribucin para v grados de libertad, representa la probabilidad indicada. Frecuencia relativa esperada

x x tabulado Anlisis de frecuencias. Pruebas de Bondad de Ajuste. Para evaluar el ajuste entre frecuencias observadas y esperadas existen estadsticos que prueban en qu medida difieren las mismas y si esa diferencia es significativa o no. Hay dos mtodos que son los ms utilizados: Mtodo de Ji- cuadrado o Chi- cuadrado (x) Mtodo G o prueba del logaritmo de la razn de Verosimilitudes Mtodo de Ji- cuadrado o Chi- cuadrado (x) X= (fo- fe) fe Donde: fo = frecuencia observada fe = frecuencia esperada La razn por la que la que esta prueba se ha denominado Ji- cuadrado y por la que muchos han llamado as tambin al estadstico obtenido X, es que la distribucin de muestreo de esta sumatoria se aproxima a la de una distribucin de x con v= 1 grados de libertad. La prueba es siempre a una cola ya que las desviaciones estn elevadas al cuadrado y conducen siempre a valores positivos de x (de all que tome slo valores positivos hasta +). Desventajas del mtodo 1) Deben agruparse aquellas clases con una frecuencia esperada menor o igual a 5 (fe5), hasta que su suma alcance un valor mayor o igual a 5 (fe5). Por esta restriccin, el agrupamiento produce una reduccin en el nmero de clases y es frecuente entonces que el nmero de grados de libertad no sea suficiente para evaluar estadsticamente el ajuste. Por ello, Cochran (1954; Snedecor & Cochran, 1967) ha considerado que tal restriccin debilita la sensibilidad del test y ha sugerido que los

valores esperados no deben ser menores a 1 (fe1) y no a 5. El nmero de grados de libertad es entonces: v= n de clases luego de la agrupacin a-1 Teniendo a la interpretacin mencionada ms abajo. 2) El nmero de grados de libertad es v= n-a-1, donde a es el nmero de parmetros estimados para ajustar el modelo elegido; de manera que el nmero mnimo de clases que se pueden comparar es: 3 comparaciones , para el modelo de Poisson. El parmetro de este modelo es (lambda) y como los grados de libertad de cualquier distribucin no pueden ser menores a la unidad (v1): v= n-a-1 siendo a==1 parmetro v= n-2 Por tanto n debe ser 3 4 comparaciones , para otros modelos.

Mtodo G o Prueba de razn de Verosimilitudes: Si la proporcin observada po es en realidad igual a la proporcin esperada pe segn la hiptesis nula (Ho), las 2 probabilidades calculadas sern iguales y su razn ser igual a 1. Cuanto mayor sea la diferencia entre po y pe, mayor ser la razn entre ambas. Esto indica que la razn de estas 2 probabilidades o verosimilitudes puede utilizarse como estadstico para medir el grado de ajuste entre las frecuencias observadas y las esperadas. Esta prueba se calcula de la siguiente manera: G= 2 * fo* ln fo fe Siendo ln= logaritmo en base neperiana; fo y fe tienen el mismo significado que antes. El valor de G obtenido tiene una distribucin de x con v= n-1 grados de libertad; pero adems debemos restar un grado de libertad adicional por cada parmetro (a) de la distribucin esperada de frecuencias que se ha estimado de la distribucin muestrada. Para una distribucin: Normal, son estimados 2 parmetros de los datos muestreados: (media o esperanza poblacional) y (desvo estndar de la poblacin). De aqu que los grados de libertad sean v= n-a-1= n-2-1= n-3 Binomial, es estimado un solo parmetro: pe (probabilidad esperada bajo la hiptesis nula) y por ello v= n-a-1= n-1-1= n-2

Cuando el n es menor a 200, se aplica una correccin al valor de G, que se denomina correccin de continuidad o correccin de Yates, aproximando ms estrictamente el valor de G a la distribucin de . Esta correccin consiste en sumar o restar 0.5 de las frecuencias observadas (fo) de tal manera que se haga mnimo el valor de G. Para un caso de 2 clases: G= 2 * fo1 0.5 *ln fo10.5]+fo2 0.5 * ln fo2 0.5} fe1 fe2 Siendo fo1 y fo2 las frecuencias observadas 1 y 2, respectivamente fe1 y fe2 las frecuencias esperadas 1 y 2, respectivamente Eligiendo adems, (+) para fo1 y (-) para fo2 o viceversa, segn cual sea la combinacin que produzca el menor valor de G. La nica desventaja del mtodo es la de clculo, ya que es ms susceptible al error por tener que tomar tantos logaritmos como clases se tengan. No obstante, no es necesario agrupar clases y se puede comparar hasta un mnimo de 2 clases.

De los datos obtenidos en una experimentacin, a veces es necesario conocer el tipo de distribucin a la cual se ajustan adecuadamente (normal, binomial o de Poisson). As, el investigador podr tambin elegir el procedimiento estadstico ms adecuado. Al respecto, es vlido el ejemplo siguiente: Ejemplo: Ajuste de datos para una distribucin normal, de un conjunto de mediciones en la tabla de nios de 5 aos. Tamao de la muestra 100. Eleccin de la prueba estadstica. El modelo experimental tiene una muestra y nuestro objetivo es la bondad del ajuste.

Planteamiento de la hiptesis.

Hiptesis alterna (Ha). Las frecuencias observadas difieren de las que corresponden a una distribucin normal. Hiptesis nula (Ho). Las diferencias observadas entre los valores observados y los tericos se deben al azar.

Nivel de significacin. Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho. Zona de rechazo. Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha. Talla de nios de 5 aos de edad.

Aplicacin de la prueba estadstica. Para calcular el valor terico, se debe aplicar el valor Z; por lo tanto, primero se debe obtener el valor promedio y la desviacin estndar de los valores por ajustar. = 100.1 = 3.91 En seguida se determinan los lmites reales de cada clase y se calcula el valor Z para cada lmite real.

Para cada valor de Z, se localiza el valor del rea bajo la curva de valores Z. Obtencin de valores tericos de la distribucin normal.

Una vez anotados los valores del rea bajo la curva normal para cada Z, se calcula el rea que corresponde a cada talla. Para fines prcticos y a fin de ejecutar el

procedimiento, el signo de Z se mantiene en el valor del rea bajo la curva, y se realiza de la manera siguiente: Clase 90 - 93 = -0.4656 - (-0.4951) = 0.0295 Clase 94 - 97 = -0.2852 - (-0.4656) = 0.1804 Clase 98 - 101 = 0.091 - (-0.2852) = 0.3762 Clase 102 - 105 = 0.3944 - 0.091 = 0.3034 Clase 106 - 109 = 0.4884 - 0.3944 = 0.094 Cada valor del rea para la curva de clase se multiplica por el tamao de la muestra (N); en este caso corresponde a 100. Para obtener los valores tericos, se selecciona el valor entero ms cercano. En seguida se aplica la ecuacin de X2.

X2 =

1.333 + 0 + 0.105 + (-0.1) + (-0.111) = 1.227

Clculo de los grados de libertad. gl = K - 1 - 1 = 5 - 1 - 1 = 3 El valor de X2 calculado con 3 gl se compara con los respectivos valores crticos de la tabla de valores crticos de X2 y corresponde a 7.82 para una probabilidad de 0.05. Decisin. En virtud de que el valor calculado cae en la zona de rechazo, se acepta Ho y se rechaza Ha. Interpretacin. Los valores de las frecuencias observadas para las cinco series de talla tienen una distribucin normal y no difiere de los valores calculados en funcin de las reas bajo la curva normal tipificada.

Das könnte Ihnen auch gefallen