Sie sind auf Seite 1von 22

2.2.

2 Inferencia sobre
la varianza de dos
poblaciones (Anova).
› Anteriormente vimos varias situaciones en las que
deseábamos comparar las medias de dos
poblaciones distintas. Recuerde que hicimos esto
buscando la diferencia de las medias de dos
muestras tomadas de dichas poblaciones. Aquí,
queremos comparar las varianzas de dos
poblaciones.

› Sin embargo, más que buscar la diferencia de dos


varianzas muestrales, es más conveniente estudiar
su cociente. Los siguientes dos ejemplos muestran
cómo se hace esto.
› Una prominente socióloga de una importante
universidad del medio oeste estadounidense cree de
que los ingresos de los graduados de la universidad
tienen una variabilidad mucho mayor que los ingresos
de las personas que no cursaron la universidad. Con el
fin de probar esta teoría, envía a dos ayudantes de
investigación a Chicago a investigar los ingresos de estas
dos poblaciones. El primer ayudante toma una muestra
aleatoria de 21 graduados de la universidad y encuentra
que sus ingresos tienen una desviación estándar de la
muestra 𝑠1 = $17,000. El segundo ayudante toma una
muestra de 25 no graduados y obtiene una desviación
estándar en los ingresos 𝑠2 = $7,500.
› Los datos de nuestro problema se pueden resumir
de la siguiente manera:

𝑠1 = 17,000 ← Desviación estándar de la primera muestra


𝑛1 = 21 ← Tamaño de la primera muestra
𝑠2 = 7,500 ← Desviación estándar de la segunda muestra
𝑛2 = 25 ← Tamaño de la segunda muestra
› Debido a que la socióloga tiene la teoría de que los
ingresos de los egresados de la universidad son más
variables que los ingresos de las personas que no
cursaron la universidad, una prueba de una cola es
apropiada. La socióloga desea verificar su teoría al nivel
de significancia de 0.01. Podemos establecer de manera
formal sus hipótesis:

𝐻0 : 𝜎12 = 𝜎22 ( 𝑜 𝜎12 / 𝜎22 = 1) ← Hipótesis nula: las dos varianzas son
iguales.
𝐻1 : 𝜎12 > 𝜎22 ( 𝑜 𝜎12 / 𝜎22 > 1) ← Hipótesis alternativa: los ingresos
de los egresados de la universidad
tienen una varianza más grande.
𝛼 = 0.01 ← Nivel de significancia para probar
estas hipótesis.
Sabemos que 𝑠12 se puede utilizar para estimar 𝜎12 , y
𝑠22 se puede usar para estimar 𝜎22 . Si la hipótesis
alternativa es verdadera, esperaríamos que 𝑠12 fuera
mayor que 𝑠22 (o de manera equivalente que 𝑠12 /𝑠22
fuera mayor que uno). Pero, ¿qué tanto deberá ser
mayor 𝑠21 para que podamos rechazar la hipótesis
nula? Para responder a esta pregunta, debemos
conocer la distribución de 𝑠21 /𝑠22 . Si suponemos que
las dos poblaciones están razonablemente bien
descritas por distribuciones normales, entonces el
cociente:
Cociente F para inferencias acerca de dos varianzas
𝑠12
𝐹= 2
𝑠2
Cociente F para inferencias acerca de dos varianzas
𝑠12
𝐹= 2
𝑠2

tiene una distribución F con 𝑛1 − 1 grados


de libertad en el numerador y 𝑛2 − 1 grados
de libertad en el denominador.
𝑠12
𝐹= 2
𝑠2
17,000 2
=
7,500 2
17,000 2
=
7,500 2
289,000,000
=
56,250,000

= 5.14
Para 20 grados de libertad (21 − 1) en el numerador y
24 grados de libertad (25 − 1) en el denominador, la
tabla 6 del apéndice nos indica que el valor crítico que
separa a las regiones de aceptación y de rechazo es 2.74.
La figura muestra la región de aceptación y el estadístico
F observado de 5.14. Nuestra socióloga rechaza la
hipótesis nula y concluye que los datos de la muestra
apoyan su teoría.
› En este punto son necesarias unas palabras de advertencia
respecto al uso de la tabla 6 del apéndice. Se habrá dado
cuenta de que la tabla da los valores del estadístico F que son
apropiados sólo para pruebas de cola superior.
› ¿De qué manera podemos manejar hipótesis alternativas de
la forma 𝜎12 > 𝜎22 ( 𝑜 𝜎12 / 𝜎22 < 1 )? Es sencillo si notamos
que 𝜎12 / 𝜎22 , que también sigue una distribución F (pero
con 𝑛2 − 1 grados de libertad en el numerador y 𝑛1 − 1
grados de libertad en el denominador), y después usamos la
tabla 6 del apéndice. Existe otra forma de decir lo mismo:
siempre que realice una prueba de una cola de dos
varianzas, numere las poblaciones de modo que la hipótesis
alternativa tenga la forma:
𝐻0 : 𝜎12 > 𝜎22 ( 𝑜 𝜎12 / 𝜎22 > 1)
y luego proceda como en el ejemplo de los ingresos.
› El procedimiento para la prueba de dos colas de dos
varianzas es parecido al de la prueba de una cola. El único
problema surge en la búsqueda del valor crítico de la cola
inferior. Éste se relaciona con el problema de las pruebas
de cola inferior analizadas en el último párrafo, y lo
resolveremos de manera parecida.
› Un criterio para la evaluación de anestésicos orales
odontológicos es la variabilidad de la cantidad de tiempo
entre la inyección y la pérdida completa de sensibilidad en
el paciente. (Esto se conoce como tiempo de demora del
efecto.) Una compañía farmacéutica grande ha
desarrollado dos nuevos anestésicos orales, que
comercializará con los nombres de Oralcaine y Novasthetic.
A partir de similitudes en la estructura química de los dos
compuestos, se ha predicho que deben mostrar la misma
varianza en el tiempo de demora del efecto. En la tabla 11-
16 se presentan los datos para las pruebas sobre los dos
compuestos (en las que se controlaron otras variables
como la edad y el peso del paciente).
Tamaño de Varianza de muestra
muestra (segundos al cuadrado)
Anestésico (𝑛) (𝒔𝟐 )
Oralcaine 31 1,296
Novasthetic 41 784
› La compañía desea probar a un nivel de
significancia del 2% si los dos anestésicos tienen la
misma varianza en el tiempo de demora del
efecto. En símbolos, las hipótesis son:

𝐻0 : 𝜎12 = 𝜎22 ( 𝑜 𝜎12 / 𝜎22 = 1) ← Hipótesis nula: las dos


varianzas son iguales.
𝐻1 : 𝜎12 ≠ 𝜎22 ( 𝑜 𝜎12 / 𝜎22 ≠ 1) ← Hipótesis alternativa:
las dos varianzas son
diferentes
𝛼 = 0.02← Nivel de significancia
de la prueba
Para probar estas hipótesis, de nuevo
hacemos uso de la ecuación :
𝑠12
𝐹= 2
𝑠2
1,296
=
784
= 1.65
Este estadístico viene de una distribución F con 𝑛1 − 1
grados de libertad en el numerador (30, en este caso) y
𝑛2 − 1 grados de libertad en el denominador (40, en
este caso)
› Usemos la notación:
𝐹(𝑛, 𝑑, 𝛼)
para denotar el valor de 𝐹 con 𝑛 grados de libertad
en el numerador, d grados de libertad en el
denominador y un área 𝛼 en la cola superior. En
nuestro problema, la región de aceptación se
extiende de 𝐹(30, 40, 0.99) a 𝐹(30, 40, 0.01),
como se ilustra en la figura
› Podemos obtener el valor de
𝐹(30, 40, 0.01) directamente de la tabla 6 del
apéndice; éste es 2.20. Sin embargo, el valor de
𝐹(30, 40, 0.99) no está en la tabla. Ahora bien,
𝐹(30, 40, 0.99) corresponderá a un valor pequeño
de 𝑠12 /𝑠22 y, por tanto, a un valor grande de 𝑠22 /𝑠12 ,
que es justo el recíproco de 𝑠12 /𝑠22 . Dado el análisis
de las pruebas de cola inferior que acabamos de
hacer, podríamos sospechar que:
Valor de cola inferior de F para pruebas de dos colas
1
𝐹(𝑛. 𝑑, 𝛼) =
𝐹(𝑑, 𝑛, 1 − 𝛼)
› y esto resulta ser verdadero. Podemos utilizar
esta ecuación para encontrar 𝐹(30, 40, 0.99):

1
𝐹 30, 40, 0.99 =
𝐹(𝑑, 𝑛, 1 − 𝛼)

1
=
2.30

= 0.43
En la figura se ilustró la región de aceptación para
esta prueba de hipótesis y el valor observado de 𝐹.
Vemos ahí que la hipótesis nula se acepta, de modo
que concluimos que la diferencia observada en las
varianzas de muestras de los tiempos de demora del
efecto para los dos anestésicos no es
estadísticamente significativa.
Esta sección se refiere al uso de la prueba F para
comparar las varianzas de dos poblaciones examinando
el cociente de las varianzas de dos muestras.
Advertencia: a tabla Sugerencia: si desea hacer una prueba
6 del apéndice de cola inferior, asegúrese de
proporciona valores convertirla a una prueba de cola
de F que son superior como se hizo un par de
apropiados sólo páginas atrás. Si desea hacer una
para las pruebas de prueba de dos colas, utilice la
la cola superior. 1
ecuación: 𝐹(𝑛. 𝑑, 𝛼) =
𝐹(𝑑,𝑛,1−𝛼)
para convertir un valor de cola superior
de la tabla en el de cola inferior
requerido para la prueba.

Das könnte Ihnen auch gefallen