Sie sind auf Seite 1von 16

Saint Johns school Depto.

Matemtica

Estadstica II
5. PRUEBAS DE CHI CUADRADA 5.1. Caractersticas de la distribucin En los captulos anteriores, se ha trabajado mayormente con datos que eran de la escala de intervalo o de razn, como pesos, ingresos o edades. En estas pruebas hemos tenido el supuesto de que los datos provienen de distribuciones normales. En este tema veremos cmo se desarrollan pruebas de hiptesis para datos de escala ordinal o nominal, en las que no se necesita hacer ningn supuesto acerca de la forma de la distribucin de la poblacin de la que provienen los datos. Este tipo de pruebas se conocen con el nombre de pruebas no paramtricas o pruebas de distribucin libre. Esto quiere decir que se realizan a partir de datos nominales u ordinales y que las pruebas estn libres de supuestos acerca de la forma de la distribucin de la poblacin. 5.2. Pruebas de bondad y ajuste (de homogeneidad) La prueba de bondad y ajuste es una de las pruebas no paramtricas ms utilizadas. Esta prueba se puede usar para datos de cualquier nivel. Este tipo de pruebas se utilizan para ver que tan bien se ajusta un conjunto de datos observados a un conjunto de datos esperados. En el primer ejemplo corresponde a frecuencias igualmente esperadas o de frecuencias homogneas. Ejercicio El Sr. Juventino Rosas tiene una empresa dedicada a hacer tarjetas coleccionables con temas deportivos y quiere iniciar una nueva serie de tarjetas de jugadores de la liga mexicana de ftbol. Un problema es qu jugadores elegir para ponerlos en las nuevas ediciones de tarjetas. El fin de semana pasado puso un stand en las afueras del Estadio Azteca y tuvo las siguientes ventas:

Saint Johns school Depto. Matemtica

Jugador Quiqun Fonseca Cuauhtmoc Blanco El Bofo Bautista Oswaldo Snchez Rafael Mrquez El Chelo Delgado TOTAL

Tarjetas vendidas 13 33 14 7 36 17 120

Nmero esperado 20 20 20 20 20 20 120

Con base en esta informacin, se puede concluir que se vende el mismo nmero de tarjetas de cada jugador? Si no hay una diferencia significativa entre las frecuencias observadas y las frecuencias esperadas, se supondra que las frecuencias observadas fueran iguales o aproximadamente iguales. Es decir, se esperara vender el mismo nmero de tarjetas del Quiqun o del Chelo. En este caso cualquier diferencia observada entre el conjunto de frecuencias observadas y esperadas, podra atribuirse al muestreo o a la casualidad. Como hay 120 tarjetas en la muestra, esperaramos que a cada jugador le correspondieran 20 tarjetas. Sin embargo un examen del conjunto de frecuencias observadas indica que las tarjetas de Oswaldo Snchez se vendieron muy poco, mientras que las de Rafa Mrquez se vendieron mucho. Se debe esta diferencia de ventas a la casualidad, o podramos concluir que hay preferencia por las tarjetas de algn jugador? Paso 1 H0: fo = fe H1: fo fe Paso 2 = 0.05 Paso 3 La estadstica de prueba adecuada es ji cuadrada que se designa por 2

Saint Johns school Depto. Matemtica

Con k 1 grados de libertad, donde: k = nmero de categoras fo = frecuencia observada en una categora determinada fe = frecuencia esperada en una categora determinada Para realizar el clculo de 2 se siguen los siguientes tres (sub) pasos: Columna 1: Determinar las diferencias entre fo y fe. La suma de estas diferencias es cero. Columna 2: Elevar al cuadrado cada una de las diferencias observadas entre fo y fe. Esto es (fo - fe)2 Columna 3: Dividir los resultados de la columna 2 entre la frecuencia esperada y sumar estos valores. La suma es el valor de 2.

Jugador Quiqun Fonseca Cuauhtmoc Blanco El Bofo Bautista Oswaldo Snchez Rafael Mrquez El Chelo Delgado TOTAL

Tarjetas vendidas 13 33 14 7 36 17 120

Nmero esperado 20 20 20 20 20 20 120

(1)

(2)

(3)

(fo - fe)
-7 13 -6 -13 16 -3 0

(fo - fe)2
49 169 36 169 256 9 2 =

(fo - fe)2 fe
2.45 8.45 1.8 8.45 12.8 0.45 34.4

Paso 4 Al igual que la distribucin t, la distribucin 2 es en realidad una familia de distribuciones, cada distribucin de la familia cambia de acuerdo al nmero de grados de libertad.

Saint Johns school Depto. Matemtica

Como ya dijimos, el nmero de grados de libertad en este tipo de problemas, se calcula por k 1. Dado que hay 6 categoras o jugadores k 1 = 6 1 = 5 grados de libertad. Luego entonces, buscando en las tablas de 2, encontramos que el valor crtico para 5 grados de libertad con = 0.05 es 11.070. Que se encuentra localizando 5 grados de libertad en el margen izquierdo y movindose horizontalmente hasta la columna marcada con 0.05. De esta manera, la regla de decisin es: No rechazar H0 si el valor que se encuentre para 2 es menor que 11.070. Si el valor calculado es igual o mayor al valor crtico, se rechaza H0 y se acepta H1 Paso 5 Dado que el valor que se encontr para 2 fue de 34.40, se rechaza la hiptesis nula y se acepta la hiptesis de investigacin. En otras palabras, la diferencia entre las frecuencias observadas y esperadas no se debe a la casualidad, sino que estas diferencias son lo suficientemente grandes para considerarlas significativas. As concluimos que es muy improbable que todas las tarjetas se vendan en la misma cantidad. 5.3. Pruebas de bondad y ajuste: frecuencias desigualmente esperadas (de independencia) En los ejercicios anteriores se esperaba que la frecuencia de todas las variables fuera igual, como el caso de las tarjetas deportivas, dnde se esperaba que se vendieran igual nmero de tarjetas de cada jugador. La prueba de ji cuadrada tambin se puede usar cuando las frecuencias esperadas no son iguales. El siguiente ejemplo ilustra el caso de las frecuencias desiguales y tambin proporciona un uso prctico de esta herramienta estadstica, encontrar si una experiencia local difiera de una experiencia nacional. Ejercicio Un estudio nacional sobre el nmero de veces que fue hospitalizado un enfermo de la tercera edad durante un lapso de dos aos revel que 40% ingres slo una vez, 20% dos veces, 14% tres, 10% cuatro, 8% cinco, 6% seis y 2% siete.

Saint Johns school Depto. Matemtica

Un estudio del municipio de Tlalnepantla quiere comparar la experiencia del esta demarcacin con las cifras nacionales. De este modo se toma una muestra de 400 enfermos de la tercera edad y se determina cuntas veces fueron hospitalizados, las frecuencias observadas se presentan en la siguiente tabla:
Nmero de hospitalizaciones 1 2 3 4 5 6 7 Nmero de enfermos de la tercera edad (fo) 165 79 50 44 32 20 10 400

Obviamente el nmero de frecuencias locales no se puede compara con los porcentajes nacionales, sera como comparar peras con manzanas; pero los porcentajes nacionales se pueden convertir en frecuencias esperadas. Como ya se mencion, a nivel nacional 40% de los enfermos de la tercera edad que necesitaron hospitalizacin en dos aos, la necesitaron slo una vez, as que si no hubiera diferencia entre las cifras de Tlalnepantla y las nacionales, entonces 40% de los cuatrocientos muestreados habran sido hospitalizados slo una vez durante este perodo, 20% de los 400 muestreados habran sido hospitalizados dos veces y as sucesivamente. Es decir, se esperara que la frecuencia de hospitalizaciones en Tlalnepantla coincidiera con la frecuencia observada a nivel nacional. En la siguiente tabla se muestran las frecuencias observadas y las esperadas.
Nmero esperado de hospitalizaciones (fe) 160 = 40% X 400 80 = 20% X 400 56 = 14% X 400 40 = 10% X 400 32 = 8% X 400 24 = 6% X 400 8 = 2% X 400 400

Nmero de hospitalizaciones 1 2 3 4 5 6 7

Nmero observado de hospitalizaciones (fo) 165 79 50 44 32 20 10 400

Una vez determinadas las frecuencias esperadas, se procede a plantear las hiptesis.

Saint Johns school Depto. Matemtica

Paso 1 H0: fo = fe No hay diferencia entre la experiencia local y la experiencia nacional H1: fo fe S hay diferencia entre la experiencia local y la experiencia nacional Paso 2 = 0.05 Paso 3 La estadstica de prueba adecuada es ji cuadrada que se designa por 2

Con k 1 grados de libertad (fo - fe)2 fe


0.156 0.013 0.643 0.400 0.000 0.667 0.500 2 = 2.378

Nmero de hospitalizaciones 1 2 3 4 5 6 7 TOTAL

fo
165 79 50 44 32 20 10 120

fe
160 80 56 40 32 24 8 120

(fo - fe)
5 -1 -6 4 0 -4 2 0

(fo - fe)2
25 1 36 16 0 16 4

Paso 4 El valor crtico se encuentra utilizando la tabla de la distribucin de ji cuadrada, considerando k 1 grados de libertad; es decir 7 1 = 6 grados de libertad y un nivel de significancia de 0.05. De esta manera el valor crtico es 12.592. La regla de decisin es entonces: No rechazar H0 si el valor que se encuentre para 2 es menor que 12.592. Si el valor calculado es igual o mayor al valor crtico, se rechaza H0 y se acepta H1

Saint Johns school Depto. Matemtica

Paso 5 Dado que el valor que se encontr para 2 fue de 2.378, no se rechaza la hiptesis nula. En otras palabras, el municipio de Tlalnepantla podr concluir que la situacin del municipio respecto a la hospitalizacin de enfermos de la tercera edad es la misma que en otras partes del pas. Limitaciones de la ji cuadrada La ji cuadrada puede llevara conclusiones errneas cuando en una celda (o en varias) se tiene una frecuencia esperada demasiado pequea. Esto puede ocurrir porque las frecuencia esperadas aparecen en el denominador de la frmula, y al dividir entre un nmero muy pequeo se obtiene un cociente muy grande. Existen dos reglas generales en relacin con las celdas con frecuencias muy pequeas: a) Si slo hay dos celdas (tablas de 2 X 2), la frecuencia esperada en cada celda debe ser de 5 o ms. De otro modo no se puede utilizar la ji cuadrada. b) Si hay ms de dos celdas, no se debe utilizar la ji cuadrada cuando ms del 20% de las celdas tienen una frecuencia esperada menor a 5.

5.4. Anlisis de cuadros de contingencia En las pruebas de bondad y ajuste que vimos anteriormente, se analizaba nicamente una variable y un rasgo. Sin embargo, la prueba de ji cuadrada tambin se puede utilizar cuando se analizan dos rasgos a ala vez. En estos casos, se utiliza para saber si existe alguna relacin entre estos dos rasgos. Ejercicio El Centro de Readaptacin Social (CERESO) de la ciudad de Tamaulipas, quiere investigar si es diferente la readaptacin a la vida civil de un hombre liberado de prisin, si regresa a vivir en su lugar de origen, o si se va vivir a otro lado. Dicho de otra forma, existe alguna relacin entre la readaptacin a la vida civil y el lugar de residencia despus de haber sido liberado de prisin?

Saint Johns school Depto. Matemtica

Paso 1 H0: No hay relacin entre la readaptacin a la vida civil y el lugar en donde vive el individuo despus de haber sido liberado de prisin. H1: Hay relacin entre la readaptacin a la vida civil y el lugar en donde vive el individuo despus de haber sido liberado de prisin. Paso 2 = 0.01 Los psiclogos del CERESO de Tamaulipas entrevistaron a una muestra aleatoria de 200 prisioneros ya liberados, y con base en los resultados, clasificaron su readaptacin como excelente, buena, regular e insatisfactoria. En la siguiente tabla se muestran los resultados obtenidos para esta muestra.
Readaptacin a la vida civil Residencia despus de liberado de prisin Lugar de origen Otro lugar Total Excelente 27 13 40 Buena 35 15 50 Regular 33 37 60 Insatisfactoria 25 25 50

Paso 3 La estadstica de prueba adecuada es ji cuadrada que se designa por 2

Para conocer las frecuencias observadas se utiliza la siguiente frmula:

Saint Johns school Depto. Matemtica

Utilizando esta frmula se obtiene el siguiente cuadro:

Readaptacin a la vida civil Residencia despus de liberado de prisin Lugar de origen Otro lugar Total Excelente Buena Regular Insatisfactoria Total

fo
27 13 40

fe
24 16 40

fo
35 15 50

fe
30 20 50

fo
33 27 60

fe
36 24 60

fo
25 25 50

fe
30 20 50

fo
120 80 200

fe
120 80 200

Sustituyendo la frmula para el clculo de ji cuadrada y comenzando por la celda superior izquierda, tenemos:

ji cuadrada =

(27-24)2 (35-30)2 (33-36)2 (25-30)2 (13-16)2 (15-20)2 (27-24)2 (25-20) + + + + + + + 24 30 36 30 16 20 24 20

2 = 5.729 Paso 4 El valor crtico se encuentra utilizando la tabla de la distribucin de ji cuadrada. Para conocer los grados de libertad se utiliza la siguiente frmula: gl = (nmero de renglones 1) (nmero de columnas 1) gl = (r 1) (c 1) En este problema: gl = (2 1) (4 1) gl = 3 El nivel de significancia, como ya se determin es = 0.01. Luego entonces, buscando en las tablas de la distribucin de ji cuadrada, se obtiene el valor crtico de 11.345.

Saint Johns school Depto. Matemtica

La regla de decisin es entonces: No rechazar H0 si el valor que se encuentre para 2 es menor que 11.345. Si el valor calculado es igual o mayor al valor crtico, se rechaza H0 y se acepta H1 Paso 5 Dado que el valor que se encontr para 2 fue de 5.729, no se rechaza la hiptesis nula. En otras palabras, concluios que no hay relacin entre la readaptacin a la vida civil y el lugar donde residan los prisioneros despus de ser liberados. 5.5. Pruebas para la varianza Otro de los usos de la ji cuadrada es elaborar inferencias acerca de una varianza poblacional. A continuacin se expone un ejemplo: Una compaa productora de alambrn va a surtir a una compaa que produce micro-alambre para soldadura. Para aceptar a sus proveedores, la empresa compradora tiene las siguientes polticas de calidad con respecto al alambrn. resistencia a la tensin de 50 kg/mm2 desviacin estndar mxima de 5 kg/mm2 (varianza de 25)

El proveedor cuenta con tres plantas de produccin en diferentes plazas de la repblica, los gastos de embarque que se erogaran por las tres plantas son similares. Dado que este es un proyecto de gran envergadura, el director de la empresa compradora quiere saber con un nivel de significancia de 0.05, cul de las tres plantas cubrira mejor los requerimientos establecidos en sus polticas de compra, a fin de hacer una correcta seleccin de la planta que les surtir. Para tal efecto, se toman muestras en las tres plantas y, despus de realizar una serie de pruebas, se encuentra lo siguiente: a) Planta Norte. Nmero de muestras = 10 Varianza (s2) = 26 Resistencia media a la tensin = 50 kg/mm2 10

Saint Johns school Depto. Matemtica

Se desea saber si la varianza es significativamente mayor que la requerida. b) Planta Sur. Nmero de muestras = 15 Desviacin estndar (s) = 3 kg/mm2 Resistencia media a la tensin = 50 kg/mm2 Se desea saber si la varianza es significativamente menor que la requerida. c) Planta Centro. Nmero de muestras = 9 Desviacin estndar (s) = 5.1 kg/mm2 Resistencia media a la tensin = 50 kg/mm2 Se desea saber si la varianza es significativamente diferente que la requerida. Paso 1, inciso a) H0: 20 25 H1: 20 > 25 Paso 2, inciso a) = 0.05 Paso 3, inciso a) La estadstica de prueba adecuada es ji cuadrada que se designa por 2

2 = [(10 1) 26] 25 2 = 9.36

11

Saint Johns school Depto. Matemtica

Paso 4, inciso a) El valor crtico se encuentra utilizando la tabla de la distribucin de ji cuadrada. Para conocer los grados de libertad se utiliza la siguiente frmula: gl = n 1 gl = 10 1 gl = 9 El nivel de significancia, como ya se determin es = 0.05. Luego entonces, buscando en las tablas de la distribucin de ji cuadrada, se obtiene el valor crtico de 16.919. La regla de decisin es entonces: No rechazar H0 si el valor que se encuentre para 2 es menor que 16.919. Si el valor calculado es igual o mayor al valor crtico, se rechaza H0 y se acepta H1 Paso 5, inciso a) Dado que el valor que se encontr para 2 fue de 9.36, no se rechaza la hiptesis nula. En otras palabras, con un nivel de significancia de 0.05 se puede asegurar que la varianza en la resistencia a la tensin de la produccin de la planta norte es igual o menor de 25; es decir, se encuentra dentro de los lmites requeridos. Paso 1, inciso b) H0: 20 25 H1: 20 < 25 Paso 2, inciso b) = 0.05 Paso 3, inciso b) La estadstica de prueba adecuada es ji cuadrada que se designa por 2

12

Saint Johns school Depto. Matemtica

2 = [(15 1) 32] 25 2 = 5.040 Paso 4, inciso b) El valor crtico se encuentra utilizando la tabla de la distribucin de ji cuadrada. Para conocer los grados de libertad se utiliza la siguiente frmula: gl = n 1 gl = 15 1 gl = 14 El nivel de significancia, como ya se determin es = 0.05. En este caso, como la regin de rechazo se encuentra en la cola izquierda, para encontrar el valor crtico se resta de 1 el valor de . As: (1 ) (1 0.05) = 0.95 Luego entonces, buscando en las tablas de la distribucin de ji cuadrada, se obtiene el valor crtico de 6.570. La regla de decisin es entonces: No rechazar H0 si el valor que se encuentre para 2 es mayor que 6.570. Si el valor calculado es igual o menor al valor crtico, se rechaza H0 y se acepta H1 Paso 5, inciso b) Dado que el valor que se encontr para 2 fue de 5.040, se rechaza la hiptesis nula.

13

Saint Johns school Depto. Matemtica

En otras palabras, con un nivel de significancia de 0.05 se puede asegurar que la varianza en la resistencia a la tensin de la produccin de la planta norte es significativamente menor de 25; es decir, se encuentra, incluso por debajo de los lmites requeridos.

Paso 1, inciso c) H0: 20 = 25 H1: 20 25 Paso 2, inciso c) = 0.05 Paso 3, inciso c) La estadstica de prueba adecuada es ji cuadrada que se designa por 2

2 = [(9 1) 5.12] 25 2 = 8.3 Paso 4, inciso c) El valor crtico se encuentra utilizando la tabla de la distribucin de ji cuadrada. Para conocer los grados de libertad se utiliza la siguiente frmula: gl = n 1 gl = 9 1 gl = 8 El nivel de significancia, como ya se determin es = 0.05. 14

Saint Johns school Depto. Matemtica

En este caso, como la regin de rechazo se encuentra en ambas colas, los valores crticos se encuentran en dos sub-pasos: 1) Para encontrar el valor crtico de la izquierda se resta de 1 el valor de .dividido entre 2. As: (1 / 2 ) (1 0.05 / 2) = 0.975 Luego entonces, buscando en las tablas de la distribucin de ji cuadrada, se obtiene el valor crtico de 2.179. 2) Para encontrar el valor crtico de la derecha, el valor de alfa se divide entre dos. As: ( / 2 ) (0.05 / 2) = 0.025 Luego entonces, buscando en las tablas de la distribucin de ji cuadrada, se obtiene el valor crtico de 17.534. La regla de decisin es entonces: No rechazar H0 si el valor que se encuentre para 2 es mayor que 2.179 y menor que 17.534. Si el valor calculado no cae en este rango, se rechaza H0 y se acepta H1 Paso 5, inciso c) Dado que el valor que se encontr para 2 fue de 8.3, no se rechaza la hiptesis nula. En otras palabras, con un nivel de significancia de 0.05 se puede asegurar que la varianza en la resistencia a la tensin de la produccin de la planta norte es igual 25; es decir, se encuentra dentro de los lmites requeridos. Decisin General Se concluye despus del anlisis de la produccin de las tres plantas, que las tres producciones estn cumpliendo actualmente con las especificaciones de la fbrica de micro-alambre y, por tanto, es factible que se surta desde los tres puntos y as asegurar ampliamente la capacidad de abastecimiento. 15

Saint Johns school Depto. Matemtica

Por otro lado, la produccin de la planta Sur, tiene una mayor calidad (dado que su varianza es significativamente menor a los estndares requeridos). Por ello sera conveniente realizar un estudio de su capacidad de produccin a fin de explorar la posibilidad de surtir todas las necesidades a partir nicamente de esta planta.

16

Das könnte Ihnen auch gefallen