Sie sind auf Seite 1von 16

Prueba de Χ 2 Una, dos y más de dos muestras independientes

Prueba de Χ 2

Muestras independientes

Introducción

Es frecuente que en la investigación educativa, y en general en la investigación, el investigador se interese por variables y/o cualidades, las cuales se presentan en categorías, que pueden ser dos o más. Así, por ejemplo, no es infrecuente hablar de rendimiento bajo y alto; de clase social alta, media y baja; del éxito en selectividad entendiendo por tal el superar/no superar el reto; del sexo de los alumnos en varón y hembra; etc. La prueba Chi Cuadrado es adecuada para analizar los datos, que no son otros que frecuencias dentro de cada categoría. Es decir, los datos se presentan en escala nominal y lo que se analiza son las frecuencias dentro de cada categoría, es decir, cuántos hombres, cuántos han superado la selectividad, cuántos alumnos son de rendimiento bajo, etc.

Ahora bien, con el análisis ¿qué se pretende? En esencia la Prueba de Chi Cuadrado es una prueba del tipo de bondad de ajuste; es decir, permite contrastar si unas determinadas frecuencias observadas o empíricas en las categorías en que se ha dividido la variable se comportan conforme a las frecuencias que fueran de esperar si se comportaran conforme a una hipótesis nula –es decir, la hipótesis de no diferencia entre las frecuencias; o más bien hay que interpretarlas conforme a una hipótesis alterna, es decir, de diferencias entre las respuestas a las categorías. Afirma Siegel (1976, 64):

“Con el fin de comparar un grupo de frecuencias observado con uno esperado, debemos, por supuesto, ser capaces de indicar qué frecuencias son esperadas. La hipótesis de nulidad establece la proporción de objetos que caen en cada una de las categorías de la población presumida. Esto es, a partir de la hipótesis de nulidad podemos deducir cuáles son las frecuencias esperadas. La técnica χ 2 prueba si las frecuencias observadas están suficientemente próximas a las esperadas que podrían ocurrir conforme a H 0 ”.

Se van a insertar dos ejemplos, que son los ejemplos que se van a considerar en este documento, esto es, el caso de una muestra y el de dos muestras. Si bien en ambos casos se contrasta, como se ha dicho, si las frecuencias encontradas en las categorías se distribuyen conforme fuera esperable bajo la hipótesis nula, o no, cada uno de los casos añade algo específico, sobre todo en el caso de dos muestras, que añadirá el poder comprobar si entre las variables puestas en juego existe entre relación.

  • 1. Supóngase el caso de una muestra en que se le pregunta a 100 universitarios si son/no son partidarios de la selectividad (no se admite –se podría admitir, en cuyo caso se trataría de tres categorías- la opción de “no sabe-no contesta”). Esa es la pregunta: ¿Son los universitarios partidarios de la selectividad?

Prueba de Χ 2 Una, dos y más de dos muestras independientes

El investigador parte de la hipótesis (nula) de no diferencia o inclinación hacia una de las opciones; es decir, en principio, no hay por qué esperar que los universitarios se decanten hacia una de las opciones con preferencia a la otra. Por ello, la primera distribución de las 100 respuestas sería equilibrada en las dos categorías u opciones: Sí-50 a su favor, no-50 a su favor.

¿Es Ud. partidario de la selectividad? N = 100 universitarios

No

Total

 

50

50

100

Frecuencias esperadas/teóricas (bajo H 0 ) ¿Cuáles son las frecuencias observadas?

?

?

100

 

100

0

100

0

100

100

24

 
  • 76 100

Si ésa es la frecuencia teórica o esperada bajo la hipótesis nula, las frecuencias empíricas u observadas serán las que resulten de la consulta a la muestra. Si fueran 100 sí/0 no ó 0 sí/100 no los alumnos se decantarían por una de las opciones absolutamente. Entonces se puede pensar que la relación o inclinación de los alumnos hacia una de las opciones es total y en consecuencia la relación es perfecta. Existe relación cuando las frecuencias se alejan del modelo teórico, que es el de 50/50, que es una inclinación o relación nula.

Y si fuera del tipo 24/76 las frecuencias se han alejado de lo esperable en un grado al parecer considerable, pero habría que ver si suficiente como para decir que dichas frecuencias no pueden explicarse por azar ó H 0 . Esto lo determina la prueba Chi Cuadrado a un determinado nivel de confianza, para un determinado tipo de muestra, etc., es decir, según cuales sean los presupuestos de los que la investigación parta.

La base de la prueba en esencia es ésta: Si la frecuencia observada es 24/76, la prueba contabiliza el grado de divergencia, o convergencia, según se mire, entre la frecuencia observada 24 vs. 50, que era lo esperable (24 - 50), y entre 76 vs. 50, que era también lo esperable (76 – 50). Cuanta mayor sea la divergencia entre 24 y 50 y entre 76 y 50, más se incrementará la probabilidad de que tales divergencias se deban no al azar sino a un factor sistemático, en este caso, que los universitarios se decanten a favor de la selectividad o por el contrario se inclinen contra la selectividad.

  • 2. Analicemos el caso de dos muestras. En efecto, utilizando el mismo ejemplo, la pregunta se formula no a una muestra sino a dos muestras, por ejemplo, una de chicos universitarios y otra de universitarias, en total 100, 50 chicos y 50 chicas.

 

¿Es Ud. partidario de la selectividad?

Sub

 

Sexo de los alumnos: N = 100

No

total

Varón: Universitarios (n = 50)

25

  • 25 50

 

Hembra: Universitarias (n = 50)

25

  • 25 50

 

Prueba de Χ 2 Una, dos y más de dos muestras independientes

En este caso la pregunta del problema varía: ¿Existe relación entre el sexo y las preferencias por la selectividad? El sexo presenta dos categorías –varón y hembra- lo que hace que el diseño sea de dos muestras. ¿Qué pueden responder los universitarios? Si son 50 chicos y 50 chicas y se les formulan dos opciones –sí partidario/no- lo lógico es que, si no se inclinan especialmente por una de las opciones (hipótesis nula de no relación entre sexo y preferencia por selectividad), respondan los chicos 25 que sí/25 que no; y las chicas 25 que sí/25 que no.

Ahora bien, supongamos que obtenemos de la consulta la siguiente respuesta: Los chicos se decantan por la selectividad en su totalidad y las chicas por la no selectividad. En este caso la inclinación de los chicos por una opción es total y de las chicas también. Existe relación perfecta entre sexo y preferencias por selectividad, ya que la divergencia es total: (50 – 25), (0 – 25), (0 – 25) y (50-25).

 

¿Es Ud. partidario de la selectividad?

Sub

 
 

Sexo de los alumnos: N = 100

No

total

Varón: Universitarios (n = 50)

50/25

0/25

50

Hembra: Universitarias (n = 50)

0/25

50/25

50

Sin embargo, lo ordinario es que las muestras de chicos y chicas no sean iguales y que la decantación de las submuestras por una de las opciones no sea total sino intermedia, por ejemplo del tipo de los datos que se incluyen a continuación:

 

¿Es Ud. partidario de la selectividad?

Tota

 
 

Sexo de los alumnos: N = 100

No

les

Varón: Universitarios (n = 50)

38

12

50

Hembra: Universitarias (n = 50)

16

34

50

 

54

46

100

En estos casos el cálculo de las frecuencias esperadas de cada casilla interior requiere otro procedimiento que la mera partición igualitaria de las frecuencias, ya que el porcentaje de partidarios y no partidarios no es equilibrado. Las frecuencias esperadas respetarán las frecuencias subtotales, es decir, serán las que corresponda para el porcentaje de casos en las categorías subtotales. Por tanto, la frecuencia esperada de cada casilla se calcula dividiendo el producto de sus correspondientes subtotales por el total. Así:

 
  • - Para el 36: 54 (50) / 100 = 25.92

 
  • - Para el 12: 46 (50) /100 = 22.08

  • - Para el 18: 54 (50) / 100 = 28.08

 
  • - Para el 34: 46 (50) / 100 = 23.92.

 

¿Es Ud. partidario de la selectividad?

Tota

 
 

Sexo de los alumnos: N = 100

No

les

Varón: Universitarios (n = 50)

38/27

12/23

50

Hembra: Universitarias (n = 50)

16/27

34/23

50

 

54

46

100

Prueba de Χ 2 Una, dos y más de dos muestras independientes

Estas frecuencias son las que correspondería tener cada casilla de ser cierta la hipótesis de nulidad. Es precisamente la prueba de Chi Cuadrado la que registra el grado de divergencia entre lo obtenido y lo esperable bajo la hipótesis nula, y comprueba si esa divergencia es fácilmente asumible por Ho ó es preciso acudir a una prueba alternativa.

La Prueba de Chi Cuadrado

Por tanto, esta técnica “puede usarse para probar la existencia de una diferencia significativa entre el número observado de objetos o respuestas de cada categoría y un número esperado, basado en la hipótesis de nulidad” (Siegel, 1976, p. 64). La prueba de Chi Cuadrado registra la magnitud del acuerdo entre las frecuencias observadas y las esperadas a través de la fórmula:

2 ( Fo Fe − ) Χ 2 = Σ k i=1 Fe
2
(
Fo Fe
)
Χ 2 = Σ k
i=1
Fe

En la fórmula e elemento Σ k i=1 señala la necesidad de sumar todas las categorías de k desde la primera –i- cuando empieza en uno, es decir, sin descontar ninguna.

Desde luego si el acuerdo entre los dos tipos de frecuencias para cada casilla es grande, la diferencia (F o – F e ) “será pequeña y, consecuentemente, Χ 2 será también pequeña. Sin embargo, si la divergencia es grande, el valor de Χ 2 calculado con la fórmula, también será grande. A grandes rasgos, podemos decir que para valores mayores de Χ 2 , aumentarán las probabilidades de que las frecuencias observadas no provengan de la población en la que se basó la hipótesis de nulidad” (Siegel, 1976, 65). ¿Cuándo eso se puede decir?

La respuesta no puede ser otra que depende de varios supuestos, como siempre ocurre en los contrastes de hipótesis, siendo el punto de partida la hipótesis de nulidad, ya que todo el proceso se pone en marcha para probarla o contrastarla:

  • 1. En primer lugar, es preciso formular la hipótesis de nulidad;

  • 2. Será preciso fijar el nivel máximo de error que se está dispuesto a cometer cuando, si se rechazara la hipótesis nula, sin embargo, ésta fuera verdadera: Nivel de significación;

  • 3. Dependerá del tamaño de las muestras en lo que las muestras tienen de específico, en este caso, categorías, con las restricciones de los estadísticos: Grados de libertad;

  • 4. Será preciso acudir a la prueba estadística adecuada al problema, naturaleza de los datos, condiciones del modelo, etc. ;

  • 5. Habrá que identificar la distribución muestral del estadístico, que va a ser el modelo teórico al que se ajuste el suceso empírico, identificando la probabilidad que corresponde al suceso empírico en ese modelo teórico; y, finalmente,

  • 6. Todo lo anterior nos delimitará el valor crítico a partir del cual el suceso empírico deja de ser mero producto explicable por azar (Ho), pasando a buscarse una explicación alternativa, ya que, aun siendo posible, no es probable.

Prueba de Χ 2 Una, dos y más de dos muestras independientes

Veamos con algo más de detalle estos supuestos. Se comenzará, lógicamente, por la hipótesis nula, dado que todo el proceso estadístico se habilita para dar la oportunidad de probar la hipótesis nula:

1)

Hipótesis nula: Ho: Fo = Fe. Es decir, a nivel poblacional las frecuencias obtenidas u observadas en las distintas categorías en que se dividen las variables coinciden con las teóricamente esperables.

2) Nivel de significación: Poco puede decirse, excepto que el nivel “alfa” (α) lo fija previamente el investigador en función del control de variables, de las consecuencias del estudio, etc. 3) Prueba estadística: La prueba estadística, tal como se ha dicho, corresponde al valor obtenido del cálculo con la fórmula siguiente:

2 ( Fo Fe − ) χ 2 = Σ k i=1 Fe
2
(
Fo Fe
)
χ 2 = Σ k
i=1
Fe

Todos los autores hablan de condiciones, suposiciones o precauciones en el uso de χ 2 Welkowitz et al. (1981, 314/6) en concreto mencionan cuatro:

.

Las observaciones son independientes; es decir, ninguna respuesta o frecuencia puede estar relacionada o depender de otra; Cada sujeto debe formar parte solamente de una de las categorías de la variable;

Los cálculos deben integrar a todos los sujetos de la muestra. La precaución o forma de comprobación consistirá en hacer coincidir las frecuencias observadas con las esperadas; Cuantos más grados de libertad, menos estricta es la exigencia respecto del valor mínimo de las frecuencias esperadas. «Esta prueba se basa en la hipótesis de que dentro de cualquier categoría las frecuencias muestrales están normalmente distribuídas en torno a la población, o valor esperado» (Welkowitz et al., 1981, 315). Esto significa que la hipótesis de normalidad no crea problemas cuando las frecuencias esperadas son bastante grandes, pero cuando éstas son pequeñas y a medida que son más pequeñas menos válidos son los resultados de la prueba de χ 2

.

4) La distribución muestral de χ 2 , grados de libertad y valor crítico de rechazo:

Si sabemos el valor de la prueba estadística - Χ 2 - precisamos saber cuál es su distribución muestral para juzgar ese evento particular de Χ 2 y decidir si se rechaza o no la hipótesis nula. Pues bien, puede mostrarse que la distribución muestral de Χ 2 conforme a H 0 , calculada con la fórmula de arriba, sigue la distribución Chi Cuadrada con grados de libertad –gl- igual a: k – 1. En la tabla correspondiente se obtienen ciertos valores críticos, los más usuales, bien entendido que no hay una distribución muestral sino tantas cuantos valores de gl. Vayamos a unos ejemplos para fundamentar el concepto de distribución Chi Cuadrado.

Prueba de Χ 2 Una, dos y más de dos muestras independientes

Se han calculado los valores de Chi Cuadrado en tres ejemplos distintos, el de las 100 monedas lanzadas al aire, el de los 270 dados lanzados al aire y el de los 180 alumnos medidos en rendimiento e inteligencia.

En el caso de las monedas las frecuencias no son independientes, porque si salen 45 caras, no queda otra alternativa que salir 55 cruces. Sólo una frecuencia puede variar libremente, tiene un grado de libertad, estando la otra determinada. Del cálculo de las frecuencias esperadas y observadas, y aplicando la prueba de Chi Cuadrado se llega a obtener un valor de χ 2 , que en este caso vale la unidad, 1. Si se lanzaran otras 100 monedas se obtendrían otras frecuencias probablemente y otro valor de χ 2 . Y así sucesivamente con otros lanzamientos. Cuantos más lanzamientos se hagan, más valores de χ 2 se obtendrán. En el caso de los dados ocurre otro tanto pero aplicado a las posibilidades de figuras, que son seis. Es decir, al lanzar los 270 dados pueden salir seis figuras pero, conocidas cinco figuras, la sexta no puede variar, está fijada y condicionada por el número de veces que hayan salido las otras cinco. Existen cinco grados de libertad. Pero, como se decía, si se lanzan de nuevo 270 dados muchas otras veces nos saldrán modelos de otras figuras y en consecuencia se obtendrán nuevos valores de χ 2 . Y cuantos más lanzamientos se efectúen, más valores de χ 2 se obtendrán.

Algo similar ocurre si se examinan nuevos 180 alumnos medidos en dos variables, inteligencia (alta / media l baja) y rendimiento (alto/medio/bajo). En este caso, el análisis es preciso hacerlo por categorías de variables, esto es, en las tres categorías de inteligencia y en las tres de rendimiento. Si dos de las categorías de inteligencia adquieren las frecuencias que fueren en los subtotales, la tercera categoría no tiene la libertad de tener una frecuencia arbitraria sino la que reúna la condición de que los alumnos sumen 180 en inteligencia. Otro tanto ocurre en la variable rendimiento, que tiene asimismo dos grados de libertad. Luego en total los grados de libertad del problema son: (3-1) (3-1) = 4.

Se ha dicho que cuantos más lanzamientos de 100 monedas ó de 270 dados y cuantos más análisis del rendimiento e inteligencia en muestras de 180 alumnos se hagan, más valores de χ 2 se obtendrán. Pues bien, la distribución de frecuencias de los valores de χ 2 es una distribución muestra! de χ 2 para un grado de libertad en el caso de las monedas, de cinco grados de libertad para los dados y de cuatro grados de libertad para los alumnos. La distribución muestral teórica de χ 2 ya se conoce pero es distinta para cada número distinto de grados de libertad; es decir, existen tantas distribuciones muestrales de χ 2 como grados de libertad. En los apéndices de los manuales de Estadística se contiene una tabla con ciertos valores de χ 2 de las distintas distribuciones de Chi Cuadrado asociados a ciertos niveles de probabilidad de ocurrencia de sucesos, los cuales valores se comportan como valores críticos de χ 2

.

La utilidad de dichas tablas radica en que permiten comparar un valor empírico de χ 2 , que lleva asociado un valor de probabilidad, con el valor crítico de la tabla correspondiente a un determinado grado de libertad y nivel de probabilidad. Es decir, el valor crítico se comporta como el mínimo exigido al valor de χ 2 del correspondiente problema para que pueda ser considerado como improbable y permita decidir que la diferencia entre las frecuencias esperadas y las obtenidas no son mera casualidad, probablemente (1- α).

Prueba de Χ 2 Una, dos y más de dos muestras independientes

Distribuciones Chi Cuadrado, para gl = 1 y 6 Distribuciones Chi Cuadrado, regiones críticas (alfa =
Distribuciones Chi Cuadrado, para gl = 1 y 6
Distribuciones Chi Cuadrado, regiones
críticas (alfa = 0.05) y varios gl

Es decir, los valores mínimos exigidos al valor de χ 2 de un problema concreto para que sea significativo a diferentes niveles de significación, vienen fijados en dichas tablas. Si se consultan las tablas y se desea clarificar el ejemplo de χ 2 igual a 1 y a un grado de libertad, se puede afirmar que para que χ 2 fuera significativo a un nivel de significación, p.e. de 0.01, como mínimo debería ser de 6.63. Como esta condición no se cumple, es preciso afirmar y concluir que las frecuencias observadas no son tan disonantes de las esperadas como para poder afirmar que las (no sólo esas) monedas estén probablemente (1 - 0.01 = 0.99) trucadas.

Si esto se aplica al problema de los dados, puede afirmarse que para que las divergencias entre las frecuencias esperadas y las obtenidas no sean mera casualidad sino sesgo en las caras de los dados, de los cuales los 270 son una muestra, se precisa que el valor χ 2 del problema, a un nivel de probabilidad de 0.01 y con 5 grados de libertad, sea como mínimo:

0.01 χ 2 5gl = 15.09, tal como se puede consultar en las tablas. La realidad es que: χ 2 (=20.568) 0.01 χ 2 5gl (= 15.09). Luego las divergencias entre las frecuencias esperadas y las obtenidas no son mera casualidad probablemente (1 - 0.01 = 0.99) sino sesgo en las caras de los dados, de los cuales los 270 son una muestra.

Si se centra la atención en el estudio de la relación entre inteligencia y rendimiento, es preciso comparar el valor empírico de χ 2 con el crítico de las tablas al nivel de probabilidad de 0.01 y con 4 grados de libertad. Es decir, χ 2 (= 52.277) 0.01 χ 2 4gl (=13.28). Se puede concluir que son significativas o no debidas probablemente (1 - 0.01) al azar o casualidad las divergencias entre las frecuencias esperadas y las obtenidas. Dicho de modo más práctico, existe relación entre inteligencia y rendimiento; en concreto, los alumnos de inteligencia alta suelen ser asimismo alumnos de rendimiento alto y al revés, los alumnos de inteligencia baja suelen ser alumnos de rendimiento también bajo.

Se verá en la tabla de Chi Cuadrado que los grados de libertad son los equivalentes a 30. Esto no quiere decir que no existen casos en los que los grados de libertad sean superiores, pero, justo es decirlo, no son nada frecuentes; son, más bien, muy raros. Cuando los grados de libertad son superiores a 30 –gl > 30- la expresión (2χ 2 ) - [(2gl-1)] tiene una distribución que

Prueba de Χ 2 Una, dos y más de dos muestras independientes

es aproximadamente normaL En consecuencia, en prueba de una cola ambas distribuciones arrojan unos valores críticos similares:

0.05 χ 2 gi>30 = 0.05 t gl >30 (=1.64) y 0.01 χ 2 gi>30 = 0.01 t gl>30 (=2.326).

Se van a comentar a continuación dos casos, el de una muestra y el de dos, dejando de lado los aspectos técnico-estadístico-matemáticos de la distribución Chi Cuadrado. Me parece oportuno remitir a la obra de Glass y Stanley (1974) titulada Métodos estadísticos aplicados a las ciencias sociales, quienes insertan el capítulo 11, titulado Distribuciones teóricas empleadas en Estadística Inferencial y donde se habla, entre otras, de Distribuciones Chi- Cuadrado (págs. 230-234).

  • I. El caso de una muestra

En ocasiones el investigador se interesa por el número de sujetos que se clasifican en diversas categorías (dos o más), para comprobar si esa clasificación es conforme a lo esperable por azar, es decir, si los sujetos se distribuyen de una manera no tendenciosa (hipótesis nula) o más bien existe un sesgo en dicha distribución. Esta “técnica es del tipo de bondad de ajuste, que puede usarse para probar la existencia de una diferencia significativa entre el número observado de objetos o respuestas de cada categoría y un número esperado, basado en la hipótesis de nulidad” (Siegel, 1976, 64).

Un ejemplo: ¿Existe relación entre el puesto que se ocupa en la clase según la proximidad al profesor y la obtención de una alta calificación?

Siegel (1976, 66-68) inserta el ejemplo de la relación entre la posición en la posta de salida de los caballos de carrera y la probabilidad de obtención del triunfo en una. Para ello, parte de 8 postas de salida o “boxes” en una carrera y recoge en qué lugar de partida salieron 144 ganadores, para comprobar si los que salieron en las posiciones externas tenían menor probabilidad de ganar. En nuestro caso se puede hablar, por ejemplo, de 24 aulas en un centro o en diversos centros, que tienen filas de 8 en fondo, en las cuales se registra la posición de los 6 alumnos con más alta calificación. Se quiere comprobar si la cercanía del pupitre del alumno a la mesa del profesor se relaciona con la probabilidad de sacar más alta calificación. La distribución esperada es la que se tiene en la tabla adjunta, si no hubiera relación.

   

Posición en la fila del aula (1:1ª fila; 8:última)

 

Total

1

2

3

4

5

6

7

8

Frec.Esperadas

18

18

18

18

18

18

18

18

144

Es decir, los 144 ganadores se distribuyen por igual entre las filas de proximidad a la mesa del profesor. Sin embargo, lo que el investigador quiere comprobar es si existe divergencia

Prueba de Χ 2 Una, dos y más de dos muestras independientes

significativa entre las frecuencias teóricamente esperadas y las que en un estudio concreto puede obtener. Esto es lo que tiene que resolver el contraste estadístico, si esta divergencia es producto del azar o es algo más. Para ello, sigamos las etapas del proceso de decisión.

Supuestos:

  • 1. Hipótesis nula:

Ho:

F o1

=

F o2

=

F o3

=

=

F o8 .

Son varias las formas de redactar la

hipótesis; otra es escribiendo: F on = F en . En esencia, viene a decir que no hay diferencias

en el número esperado de alumnos de alto rendimiento ubicados en las distintas posiciones de asiento de clase; las diferencias observadas son meramente variaciones aleatorias esperadas en una muestra al azar de la población rectangular.

  • 2. Nivel de significación: α = 0.01 y N = 144, el número total de estudiantes de alto rendimiento identificados en 18 clases diferentes.

  • 3. Grados de libertad: k – 1 = 8 – 1 = 7. Donde k: número de puestos de fondo.

  • 4. Prueba estadística: Prueba de Chi Cuadrado, ya que estamos comparando los datos de una muestra con alguna presunta población en la que se comparan las frecuencias observadas y esperadas en categorías discretas, que son las 8 poblaciones de tipos de asiento (8 postas en el caso de los caballos). Su fórmula es ésta:

2 ( Fo Fe − ) χ 2 = Σ k i=1 Fe
2
(
Fo Fe
)
χ 2 = Σ k
i=1
Fe

Aunque no es el caso, ¿qué sucede cuando las frecuencias esperadas son pequeñas? Podemos distinguir dos casos:

Cuando los gl = 1, esto es, cuando k = 2, cada frecuencia esperada debe ser por lo menos de 5.

Cuando gl > 1, esto es, cuando k > 2, la prueba de χ 2 no debe usarse, si más del 20 % de las frecuencias esperadas es menor de 5 ó cuando cualquier frecuencia esperada es menor de 1. ¿Qué hacer en estos casos? Caben dos opciones:

Combinar categorías próximas para que las condiciones se cumplan, siempre que tenga lógica la combinación, y así poder recurrir a Chi Cuadrado; ó Recurrir a la prueba binomial, si son dos categorías por combinación.

  • 5. Distribución muestral: Distribución Chi Cuadrado.

  • 6. Valor que delimita la región de rechazo: ω : 0.01 χ 2 7 (= 18.48). Por tanto, para

poder

rechazar la Ho tiene que darse: χ 2 0.01 χ 2 7 (= 18.48). En caso contrario, no se podrá rechazar.

Resultados y análisis estadístico:

Recogidos los 6 resultados mejores de alumnos en cada una de las 24 aulas identificadas, se obtuvieron las frecuencias en los ranking siguientes:

Prueba de Χ 2 Una, dos y más de dos muestras independientes

Posición en la fila del aula (1:1ª fila; 8:última) Total 1 2 3 4 5 6
Posición en la fila del aula (1:1ª fila; 8:última)
Total
1
2
3
4
5
6
7
8
Frec.Observadas
29
19
18
25
17
10
15
11
144

De la simple observación de las frecuencias parece concluirse que la distribución no es aleatoria, ya que se han podido localizar alumnos con más alto rendimiento en las posiciones de primera línea que en las finales. En efecto, de los 144 alumnos con alto rendimiento, nada menos que 29 se ubicaban en primera fila, mientras que en la última se han podido identificar a solamente 11. Ya se ha visto más arriba que, sin embargo, si actuáramos bajo el supuesto de que la distribución de las altas calificaciones es aleatoria entre los puestos, las frecuencias que cabría esperar en cada una de las filas hubiera sido de 18 alumnos de alto rendimiento:

 

144/8.

Es decir, existe una clara divergencia entre las frecuencias observadas y las esperadas para cada ranking de puesto:

   

Posición en la fila del aula (1:1ª fila; 8:última)

 

Total

 

1

2

3

4

5

6

7

8

 

Frec.Observadas

29

 
  • 19 18

25

17

10

15

11

144

 

Frec.Esperadas

18

 
  • 18 18

18

18

18

18

18

144

 

Diferencia: O-E

+11

+1

0

+7

-1

-8

-3

-7

 
 

Este es el valor de Chi Cuadrado: χ 2 =16.3.

 
   

χ 2 = Σ k

(

Fo Fe

)

2

 

i=1

Fe

 

( 29

18) 2

+

(19 18)

2

2

2

2

 

2

2

2

+

(18 18)

 

+

( 25 18)

+

(17 18)

+

(10 18)

+

(15 18)

+

(11 18)

= 16.3.

18

  • 18 18

 
  • 18 18

18

  • 18 18

Decisión estadística:

Dado que no se cumple que: χ 2 (= 16.3) 0.01 χ 2 7 (= 18.48): No se puede rechazar la Ho.

Conclusión

No existe relación

entre el

alto rendimiento de los alumnos

y

la posición

de

proximidad al profesor que ocupen en los pupitres.

Prueba de Χ 2 Una, dos y más de dos muestras independientes

II.

El caso de dos muestras independientes

Cito textualmente de Siegel (1976, 130) cuando habla de la función de la prueba de Chi Cuadrado para dos muestras independientes:

“Cuando los datos de investigación consisten en frecuencias de categorías discretas, puede usarse la prueba de χ 2 para determinar la significación de las diferencias entre dos grupos independientes. La medición implicada puede ser tan vaga como una escala nominal.

“La hipótesis que usualmente se pone a prueba supone que los dos grupos difieren con respecto a alguna característica y, por lo tanto, con respecto a la frecuencia relativa con que los miembros del grupo son encontrados en diferentes categorías. Para probar esta hipótesis, contamos el número de casos de cada grupo en cada categoría y comparamos la proporción de casos en las diferentes categorías de un grupo con la del otro grupo”.

Lo que se está diciendo es que las variables que se estudian pueden ser cualidades, discretas por tanto, y pueden ser variables pero la medición implicada se presenta en escala nominal, es decir, cada “variable” está dividida en dos, tres o más categorías. Lo que se estudia es si las frecuencias correspondientes a cada categoría se distribuyen aleatoriamente o más bien conforme a ciertas reglas, lo que podría implicar que existe relación entre las variables.

El formato de presentación de los datos puede ser diverso. Existe un formato, el más sencillo

y probablemente el más común, que es el que corresponde a una tabla de contingencia

2 × 2

y

tiene una fórmula sencilla, que además presenta una corrección –por continuidad-, a la que se aludirá más adelante cuando se hable en los supuestos de la prueba estadística. El formato se ha ilustrado anteriormente al hablar en la introducción de la relación entre el sexo de los alumnos y la probabilidad de superar la selectividad. Se ilustrará en el problema de superación

de la selectividad y la especialidad cursada en Bachillerato. Siegel (1976, 135) presenta el ejemplo de la relación entre cambio de carrera –acertada y desacertada- y deserción de los estudios –desertan o continúan- entre un grupo de alumnos brillantes. El formato es el siguiente:

Variable 2

Variable 1

 

Categoría 1

Categoría 2

Categoría A

Frecuencia de 1A

Frecuencia de 2A

Subtotal de A

Categoría B

Frecuencia de 1B

Frecuencia de 2B

Subtotal de B

 

Subtotal de 1

Subtotal de 2

Frecuencia total

Un problema: ¿Existe relación entre la opción de especialidad en Bachillerato –Ciencias Puras y Letras- y la superación de la selectividad –sí/no?

Prueba de Χ 2 Una, dos y más de dos muestras independientes

Por tanto, el planteamiento del problema es conforme a este esquema:

Superación

de

Especialidad en Bachillerato

 

selectividad

Ciencias Puras

Letras

 

Frecuencias (?)

Frecuencias (?)

Subtotales (?)

Superan No superan

Frecuencias (?)

Frecuencias (?)

Subtotales (?)

 

Subtotales: 100

Subtotales: 100

Total: 200

En su momento los alumnos de Bachillerato eligieron Ciencias Puras o Letras. Para el estudio fueron seleccionados al azar de varios centros 100 alumnos de cada especialidad. Lo que procede es esperar a que realicen la selectividad, les den los resultados y se podrán incluir los subtotales de los que superaron y los que no superaron de entre los doscientos alumnos. Además, cuántos de Ciencias Puras superaron y no superaron, así como los de Letras.

Supuestos y plan de análisis de datos:

1)

Ho: Fo = Fe en cada una de las cuatro casillas;

 

2) Nivel de significación: α = 0.05;

 

3)

Prueba estadística: χ 2 . En tablas de contingencia 2x2, como es el caso, cuando “tanto r como k son iguales a 2, deberá usarse la fórmula” (Siegel, 1976, 133), que es una fórmula que, además de otras ventajas, “incorpora una corrección por continuidad, que mejora marcadamente la aproximación de la distribución de χ 2 calculada por medio de la distribución de Chi cuadrado” (pág. 133).

=

  • 2 /

(/

N AD BC

N ) 2
N
)
2

2

χ

(

A

+

).(

B C

+

D

).(

A C

+

).(

B D

+

)

4) Distribución muestral: Conforme a χ

2

5)

Grados de libertad: (r – 1) . (k – 1) = (2 - 1) . (2 - 1) = 1. Donde: r = núm. filas; k = núm. columnas.

6)

Valor de la región crítica ω: 0.05 χ 2 1 gl (= 3.84).

Esto significa que el valor empírico de χ 2

debe ser igual o mayor que el valor crítico

para poder rechazar la Ho: ω: χ 2

0.05 χ 2 1 gl (= 3.84).

En el supuesto de una relación significativa entre las variables, es posible calcular dicha relación en términos de un índice de correlación, que es un índice general de relación entre variables a partir de Chi Cuadrado, llamado Phi de Cramer, cuya fórmula es la siguiente:

φ =

Prueba de Χ Una, dos y más de dos muestras independientes Por tanto, el planteamiento del

2

χ N k

/

(

1)

Prueba de Χ 2 Una, dos y más de dos muestras independientes

Donde: “k” es el número menor de las filas o columnas y el resto de los símbolos son conocidos, siendo χ 2 el valor empírico de la prueba estadística y N el del tamaño de la muestra. Dicho

índice se interpreta de idéntica forma a como se interpreta el coeficiente de correlación de Pearson.

Resultados:

Una vez efectuadas las pruebas de selectividad, corregidos los ejercicios y asignada la decisión sobre el pase de selectividad, se obtuvieron los siguientes resultados:

Superación

de

Especialidad en Bachillerato

Subtotales

selectividad

Ciencias Puras

Letras

Superan

90-A

60-B

A+B:150

 

10-C

40-D

C+D:50

No superan Subtotales

A+C:100

B+D:100

Total: 200

Análisis estadístico:

Dado que la prueba de Chi Cuadrado requiere el contraste de las frecuencias esperadas y las observadas, se calcularon las frecuencias esperadas:

1)

150 (100) / 200 = 75;

2)

150 (100) / 200 = 75;

3)

100 (50) /200 = 25;

4)

100 (50) /200 = 25.

Por tanto, queda la tabla siguiente (se indican entre paréntesis las frecuencias esperadas):

Superación

de

Especialidad en Bachillerato

Subtotales

selectividad

Ciencias Puras

Letras

Superan

90 (75)-A

  • 60 (75)-B

150

 

10 (25)-C

  • 40 (25)-D

50

No superan Subtotales

100

100

Total: 200

El valor de χ 2 se va a calcular mediante las dos fórmulas, para que se vea la diferencia entre ambas, si bien, como se ha indicado, es válida la primera, que está corregida por continuidad:

χ

  • 2 200 (/(90) 40 60(10) /

=

200

) 2
)
2

2

(90 60).(10 40).(90 10).( 60 40)

+

+

+

+

= 22.43

Mediante la fórmula standard nos da lo siguiente:

Prueba de Χ 2 Una, dos y más de dos muestras independientes

χ 2 =

(90

75) 2

(60 75)

2

(10 25)

2

( 40 25)

2

+

+

+

75

75

25

25

=

24

.

Decisión estadística:

La decisión estadística surge de la comparación entre la χ 2 empírica y la crítica, en el sentido que se indicó en el supuesto de la región crítica, así:

Conclusión:

χ 2 (22.43)

0.05 χ 2 1 gl (= 3.84): Rechazo de la Ho.

Existe relación significativa entre la opción de especialidad en Bachillerato

Ciencias Puras y Letras- y la superación de la selectividad –sí/no. Es decir, los

alumnos que eligen Ciencias tienen más altas probabilidades (0.95) de superar la selectividad que los alumnos de Letras.

Relación entre variables:

Acaba de afirmarse que existe relación significativa entre la opción de especialidad en Bachillerato y la superación de la selectividad. Si esto es así, ¿cuánta es esa relación?

φ = 22.43 / 200( 2 1) = 0.33.

Prueba de Χ Una, dos y más de dos muestras independientes χ = (90 − 75)

Por tanto, la correlación –significativa (p < 0.05)- entre especialidad y superación de la selectividad es de 0.33, la cual, aunque significativa, es modesta.

III. El caso de > dos muestras independientes

No se va a desarrollar este diseño puesto que en esencia tiene idéntica resolución. Los grados de libertad siempre son: (c – 1). (f – 1), esto es, columnas menos uno por filas menos uno. Siegel (1976, 205-210) propone un problema, del que se incluye el planteamiento, los datos y el valor final de la prueba estadística.

El problema consiste básicamente en comprobar si existía relación entre nivel social y especialidad cursada por los estudiantes adolescentes de una ciudad estadounidense en el nivel secundario. La clase social se midió según su apreciación subjetiva, es decir, a cuál de las cinco clases sociales consideraban que pertenecían (I-V); la especialidad era: Preparatoria, General y Comercial. La muestra fueron 390 estudiantes. Debido a que de la clase social I tenía pocos representantes, se unieron la I y la II, puesto que Chi cuadrado requiere que las frecuencias esperadas de cada celda no sean demasiado pequeñas. Cuando no se cumple, los resultados carecen de sentido. Por ello, se recomienda que en pruebas con gl mayores a 1, menos del 20 por ciento de las celdillas deberán tener una frecuencia esperada menor a 5 y ninguna celdilla deberá tener una frecuencia esperada menor que 1.

Prueba de Χ 2 Una, dos y más de dos muestras independientes

Estos son los valores de la muestra o la frecuencia de inscripción de los jóvenes procedentes de cinco clases sociales en tres cursos de la escuela secundaria. Se indican entre paréntesis la frecuencia teórica o esperada:

 

Curso o especialidad

 

Clase social

 

Total

 

I y II

III

IV

V

Preparatoria

23(7.3)

40(30.3)

16(38.0)

2(5.4)

81

General

11(18.6)

75(77.5)

107(97.1)

14(13.8)

207

Comercial

1(9.1)

31(38.2)

60(47.9)

10(6.8)

102

 

Subtotales

35

146

183

26

390

El valor empírico de Chi Cuadrado es: χ 2 = 69.2.

Prueba de Χ 2 Una, dos y más de dos muestras independientes

Prueba de Χ Una, dos y más de dos muestras independientes Eduardo López Página 16 26/04/2011