Beruflich Dokumente
Kultur Dokumente
PRUEBAS DE HIPTESIS
CONCEPTOS BSICOS DE PRUEBAS DE HIPTESIS
La inferencia estadstica est relacionada con los mtodos para obtener conclusiones o
generalizaciones acerca de una poblacin. Estas conclusiones acerca de la poblacin pueden estar
relacionadas con la forma de la distribucin de una variable aleatoria, con los valores de uno o
varios parmetros de la misma.
El campo de la inferencia estadstica se divide en dos:
a) Por un lado, el inters de la estimacin de los parmetros de una distribucin y,
b) Las pruebas de hiptesis.
En el caso de la estimacin, se trata de elegir el valor de un parmetro de la poblacin, mientras que
en las pruebas de hiptesis se trata de decidir entre aceptar o rechazar si un valor especificado del
parmetro corresponde a la poblacin (por ejemplo, si el tiempo de vida de un artculo es un valor
0 o no lo es).
En el campo de las pruebas de hiptesis se pueden considerar dos reas:
a) Pruebas de hiptesis respecto a los parmetros, para determinar si un parmetro de una
distribucin toma o no un determinado valor, o si puede tomar un conjunto de valores y,
b) Pruebas de Bondad de Ajuste, para definir o establecer si un conjunto de datos se puede
modelar mediante una determinada distribucin.
En las secciones siguientes solamente se aborda, el primer inciso, es decir, las pruebas de hiptesis.
Una hiptesis estadstica es una proposicin o conjetura que se hace de la poblacin o poblaciones
respecto a sus respectivos parmetros. Por ejemplo, si con base en una muestra aleatoria se tiene
que decidir si un proceso est produciendo una determinada media, digamos = 100, o si hay que
decidir si una determinada droga sirve a un grupo especfico de pacientes, lo anterior, puede
traducirse en un lenguaje de Pruebas de Hiptesis, y utilizar metodologas estadsticas para tomar
una decisin al respecto.
Estadsticamente una prueba de hiptesis es una afirmacin o conjetura de una o ms poblaciones.
Nunca se sabe con absoluta certeza la verdad o falsedad de una hiptesis estadstica, a no ser que se
examine la poblacin entera. Esto ltimo, por supuesto sera imprctico en la mayora de las
situaciones, es por esto que en lugar de la poblacin, se toma una muestra aleatoria representativa
de la poblacin de inters y se utilizan los datos de tal muestra para proporcionar evidencia que
confirme o no la hiptesis planteada.
Una prueba de hiptesis consiste en contrastar dos hiptesis estadsticas. Tal contraste involucra la
toma de decisin acerca de las hiptesis. La decisin consiste en rechazar o no una hiptesis en favor
de la otra. En el proceso de una prueba de hiptesis para una toma de decisin estadstica se
involucran dos tipos de hiptesis: Hiptesis nula e hiptesis alternativa, stas se abordan con ms
detalle a continuacin.
91
92
0 es verdadera
Decisin correcta
1 a = Nivel de confianza
Error tipo I
a = Nivel de significancia
0 es falsa
Error tipo II
b = caracterstica de la prueba
Decisin correcta
1 b = potencia de la prueba
Una hiptesis es una afirmacin sobre un parmetro poblacional, la cual ser aceptada o rechazada
en base a la evidencia que proporciona la muestra. La hiptesis inicial que se define sobre la
poblacin se llama hiptesis nula; pero si rechazamos esa hiptesis nula debemos tener una hiptesis
alternativa, la cual tomaremos como cierta si la hiptesis inicial o nula es falsa.
Ejemplo
En un juzgado se le acusa a una persona de un delito, desde el punto de vista legal la persona acusada
se le considera inocente (hiptesis nula o inicial) hasta que se demuestre lo contrario. Si el juez con
todas las evidencias presentadas determina ms all de toda duda razonable que la persona es
culpable; entonces rechaza la hiptesis nula y determina como verdadera una hiptesis alternativa
(culpable!).
Para que las reglas de decisin sean buenas, deben disearse de modo que minimicen los errores de
decisin, y no es una cuestin sencilla, porque para cualquier tamao de la muestra, un intento de
disminuir un tipo de error (por ejemplo error tipo I) suele ir acompaado de un crecimiento del otro
tipo de error (error tipo II). En la prctica un tipo de error puede ser ms grave que el otro, y debe
alcanzarse un compromiso que disminuya el error ms grave, la nica forma de disminuir ambos a
la vez es aumentar el tamao de la muestra, que no siempre es posible.
P(Error tipo I) = a
Bajo Ha
Valor crtico
En general, en una prueba de hiptesis se trata de minimizar el error tipo I, es decir, el error de
rechazar 0 y aceptar la hiptesis alternativa, por lo que hay que cuidar que la probabilidad de
este error sea lo ms pequea posible. Como se mencion anteriormente, la hiptesis del
investigador se encuentra en la hiptesis alternativa, por lo que se tratar de buscar evidencia en la
Prof. Felipe R. Tuz Poot
93
muestra para rechazar la hiptesis nula y aceptar la alternativa, esto trae como consecuencia que se
tenga probabilidad de cometer el error tipo I pero con la probabilidad ms pequea.
Las dos decisiones posibles que se pueden hacer nos llevan a una de las dos siguientes conclusiones:
1) La conclusin de que hay suficiente evidencia para apoyar la hiptesis alternativa (rechazar
la hiptesis nula a favor de la alternativa)
2) La conclusin de que no hay pruebas suficientes que apoyen la hiptesis alternativa (no
rechazar la hiptesis nula a favor de la alternativa)
Estadstico de Prueba: El estadstico de prueba es el que permite tomar la decisin en una prueba
de hiptesis establecida por el investigador, ya que es una funcin de la muestra con la caracterstica
de tener una distribucin, misma que se utiliza para calcular probabilidades que permiten definir la
regin de rechazo y la regin de aceptacin respecto a la hiptesis nula. Sin el conocimiento de dicha
distribucin no sera posible definir dichas regiones, pues todo lo relacionado a inferencia estadstica
es basado en probabilidades de una distribucin terica de la poblacin.
94
Regin crtica o
zona de rechazo de
la hiptesis nula
Zona de aceptacin
de la hiptesis
nula
Regin crtica o
zona de rechazo de
la hiptesis nula
95%
=0.025
=0.025
y ( > 2 ) = /2.
2 = 1.96
Las reas sombreadas en la figura, son las llamadas regiones crticas o zonas de rechazo de la hiptesis
nula, los valores 1 y 2 son denominados puntos crticos. As que si al calcular el estadstico de
prueba e, el valor de este se encuentra dentro de la regin de rechazo, entonces se rechaza 0 , en
caso contrario, se dice que no hay suficiente evidencia para rechazarla. Ahora, si el valor de e
correspondiente a la muestra observada cae dentro de la zona de aceptacin en la figura, el
investigador se inclinara a pensar que no reuni suficiente evidencia para poder rechazar la hiptesis
nula a favor de la alternativa, aunque aqu tambin cabe la posibilidad de cometer un error en la
decisin, que ser del tipo II.
En la prctica, los niveles de significancias ms usuales son: 1%, 5% o bien el 10%.
Las pruebas de hiptesis pueden ser de una o de dos colas dependiendo del planteamiento que se
desee probar en la hiptesis alternativa. Si al establecer la hiptesis alternativa, sta es de la forma
: > 0 , entonces se considera que se trata de una prueba de hiptesis de una cola a la derecha, o
sea, que la regin de rechazo estar en el lado derecho de la distribucin del estadstico de prueba y
se considera la prueba con nivel de significancia ; ahora, si se establece la hiptesis alternativa
: < 0 , entonces se trata de prueba de hiptesis de una cola a la izquierda y se especifica la
prueba con nivel de significancia ; por ltimo si el signo es de desigualdad en la hiptesis alterna o
sea, es : 0 , se trata de una prueba de hiptesis de dos colas, una a la derecha y otra a la
izquierda, como son dos las zonas de rechazo, se tendr que dividir el nivel de significancia entre
dos (ste el caso presentado en la figura anterior). Observe, en las siguientes grficas se presentan
las regiones de rechazo que se dan en cada caso mencionado:
95
96
vs
: 50
)
2.5/10
2.5/10
2.5/10
= (4.43 0.63)
= (0.63 4.43)
= ( 0.63) ( 4.43)
= 0.2643 0000
= 0.2643
Entonces la potencia de la prueba es: 1 = 1 0.2643 = 0.7357 cuando = 52.
La potencia de la prueba es una medida descriptiva y concisa de la sensibilidad de una estadstica,
donde la sensibilidad se entiende como la habilidad de la prueba para detectar diferencias; en el caso
del ejemplo, la sensibilidad de la prueba para detectar la diferencia entre la rapidez de combustin
media de 50 cm/s y 52 es 0.7357, o sea, si la media verdadera es en realidad 52 cm/s, esta prueba
rechazar : = 50 y detectar esta diferencia en un 73.57% de las veces. Podra decirse tambin
que la prueba tiene la capacidad de rechazar : = 50 con un 73.57% de confianza cuando la
verdadera media es = 52. Si este valor potencia, se considera muy bajo, el investigador podra
incrementar el tamao de la muestra.
97
As, por la teora de distribuciones muestrales, y considerando el error tipo I se tiene que el
estadstico de prueba adecuado es:
0
=
donde:
es la media muestral con el tamao de muestra
0 es la media poblacional planteada en la hiptesis nula
es la desviacin estndar poblacional.
El estadstico tiene una distribucin normal estndar o aproximadamente normal, entonces, la
regin de rechazo de 0 con el nivel de significancia es:
a) Para las hiptesis planteadas en I la regin de rechazo est dada por los valores que se
obtienen de z y que cumplen || > 2
b) Para las hiptesis planteadas en II la regin de rechazo est dada por los valores que obtienen
de z que cumplan >
c) Para las hiptesis planteadas en III la regin de rechazo est dada por los valores que se
obtienen de z que cumplan <
Ejemplo
Un ingeniero establece que en promedio las mediciones del dimetro del tubo de albail es mayor
que 30. Para comprobar que lo que establece el ingeniero efectivamente es lo correcto se toma una
muestra aleatoria de 100 tubos del cual resulta una media de 32 cm y una varianza de 4. Apoya la
muestra la aseveracin del ingeniero? Responda con un 95% de confianza.
98
Solucin
La hiptesis que se desea probar es:
0 : = 30 : > 30.
Este ejemplo es el caso ii) planteado en esta seccin pues es desconocida pero el tamao de
muestra = 100 es grande.
Se estima la varianza poblacional 2 a travs de la varianza muestral 2 = 4. As, el estadstico de
prueba es
32 30
=
=
= 10
100
Y el valor crtico es z = 0.05 = 1.64. Ya que calculada cumple que > 0.05 = 1.64 entonces se
rechaza la hiptesis nula a favor de la hiptesis alternativa, esto es, se acepta la hiptesis que plantea
el ingeniero con un 95% de confianza.
Prueba de hiptesis para la media , con desconocida.
Las hiptesis que pueden ser de inters al investigador respecto a la media son:
I 0 : = 0 : 0
II 0 : = 0 : > 0
III 0 : = 0 : < 0
donde 0 es una constante.
Para las hiptesis establecidas es importante que la muestra aleatoria obtenida est bajo cualquiera
de las siguientes condiciones:
la muestra aleatoria es obtenida de una poblacin con distribucin normal o aproximadamente
normal
ii) Se desconoce la distribucin poblacional correspondiente a la muestra, pero el tamao de la
muestra n es grande, mayor o igual a 30.
i)
As, bajo cualquiera de estas condiciones que cumpla la muestra, se tiene por teora de distribuciones
muestrales y considerando el error tipo I que, el estadstico de prueba adecuado para cualquiera de
las hiptesis planteadas es:
0
=
99
a) Para las hiptesis del caso I, la regin de rechazo es vlida para cada valor que cumple:
|| > 2,1
b) Para las hiptesis del caso II, la regin de rechazo es vlida para cada valor t que cumple: >
,1
c) Para las hiptesis del caso III, la regin de rechazo es vlida para cada valor que cumple:
< ,1
Notas
1) En el caso i) no importa el tamao de muestra, siempre ser vlido utilizar el estadstico .
2) En el caso ii) cuando el tamao de muestra es grande, la distribucin con 1 grados de
libertad se aproxima a la distribucin normal estndar, por lo que podemos utilizar el
estadstico de prueba
0
=
10
El valor crtico es ,1 = 0.025,9 = 2.262.
La regin de rechazo est dada por || > /2,(1). Entonces el valor del estadstico cae en la regin
de rechazo, por tanto se rechaza la hiptesis nula y se concluye que los datos favorecen la hiptesis
planteada por el ingeniero, por lo que se sugiere que la maquinaria entre a revisin con un 95% de
confianza.
Prof. Felipe R. Tuz Poot
100
la cual tiene aproximadamente una distribucin normal estndar, justificada por el teorema del
lmite central, debido a que el tamao de la muestra es 30.
En este estadstico de prueba:
es la proporcin poblacional estimada con el tamao de muestra
0 es la proporcin hipottica planteada en la hiptesis nula y 0 = 1 0
Considerando la distribucin aproximada de es posible definir las regiones de rechazo para cada
hiptesis planteada, las cuales resultan ser:
a) Para las hiptesis del caso I, la regin de rechazo es vlida para los valores de que cumplan
|| > 2
b) Para las hiptesis del caso II, la regin de rechazo es vlida para los valores de que cumplan
>
c) Para las hiptesis del caso III, la regin de rechazo es vlida para los valores de que cumplan
<
Ejemplo
Un fabricante de insecticidas para moscas, desea comprobar que una nueva marca Matamos K es
mucho ms efectivo que una determinada marca X que se encuentra en el mercado. La marca X
mata en promedio 800 de 1000 moscas. Para comprobar si la nueva marca es ms efectiva, se realiza
un experimento en el cual, se colocan 1000 moscas en un cuarto y se usa el insecticida Matamos K
y resulta que sucumben 815. De acuerdo a estos datos es estadsticamente ms efectiva esta nueva
marca? Justifique con un 99% de confianza.
Solucin
La hiptesis de inters a probar es: 0 : = 0.80 : > 0.80.
Se est en el caso de que la muestra es grande, por lo que el siguiente proceso tiene validez
=
815
=
= 0.815
1000
101
0
0 0
0.815 0.800
(0.8)(0.2)1000
0.015
= 1.186
0.01265
Adems se tiene que el valor crtico es = 0.01 = 2.33. Por lo tanto como el estadstico = 1.186
calculado es tal que < 0.01 = 2.33, es decir, el valor del estadstico no cae en la regin de rechazo,
no es posible rechazar 0 a favor de la hiptesis alternativa.
Se concluye que no hay razn suficiente para decir que el nuevo insecticida es ms eficiente que el
de la marca X, es decir, los datos no apoyan a la hiptesis del fabricante.
( 1) 2
02
La cual tiene una distribucin Chi- cuadrada con 1 grados de libertad y donde
02 es la varianza establecida en la hiptesis nula
2 es la varianza muestral con tamao de muestra
A partir de esta distribucin correspondiente al estadstico de prueba, es posible definir las regiones
de rechazo para cada hiptesis planteada:
102
a) Para las hiptesis del caso I, la regin de rechazo est formada por los valores de 2 que
2
cumplen que 2 > 2,1 o 2 < 1
,1
2
b) Para las hiptesis del caso II, la regin de rechazo est formada por los valores de 2 que
2
cumplen que: 2 > ,1
c) Para las hiptesis del caso III, la regin de rechazo est formada por los valores de 2 que
2
cumplen que: 2 < 1,1
Ejemplo
Un experimentador est convencido de que su equipo de medicin tiene una variabilidad medida por
una desviacin estndar de = 2. Durante un experimento, obtuvo las observaciones 4.1, 5.2, 10.2.
Estn en desacuerdo estos datos con su posicin? Si esta respuesta es afirmativa, es necesaria la
revisin del equipo. Responda con un nivel de significancia de a = 0.1. Supngase que los datos de
medicin tienen una distribucin normal.
Solucin
La hiptesis que se desea probar es:
0 : = 2 : 2
que es equivalente a
0 : 2 = 4 : 2 4
La varianza muestral de estos datos es
3
1
= ( )2 = 10.57
2
2
=1
El estadstico de prueba es
2 =
( 1) 2
02
2(10.57)
= 5.285
4
2
Los valores crticos obtenidos de la tabla de la distribucin Ji-cuadrada son 2,1 = 0.05,2
= 5.99 y
2
2
2
1
= 0.95,2
= 0.103, por lo que el valor del estadstico de prueba no cae en la regin de
,1
2
rechazo, no se puede rechazar la hiptesis nula a favor de la hiptesis alternativa. Como consecuencia
no hay razn suficiente para dar una revisin al equipo con 90% de confianza.
103
Las poblaciones de donde son extradas las muestras tienen distribucin normal o
aproximadamente normal y entre las muestras hay independencia.
Las distribuciones poblacionales de donde son extradas las muestras son desconocidas
pero los tamaos de las muestras son mayores o iguales a 30 y entre las muestras hay
independencia.
Hiptesis
alternativa
= 0
= 0
> 0
= 0
< 0
Medida Estadstica
de Prueba
Regin de rechazo
( ) 0
|| > 2
2 2
+
>
<
El valor 0 se refiere a la posible diferencia entre las medias poblacionales. Cuando en el estudio se
desea probar si los promedios poblacionales son diferentes, entonces se considera 0 = 0 y los
planteamientos de las hiptesis se reducen a cualquiera de las dos formas siguientes que se
presentan a manera de ejemplo:
0 : = 0
0 :
: 0
:
Ejemplo
Se desea analizar el peso de las varillas fabricadas por dos compaas, por tanto se toman muestras
aleatorias de 100 varillas de acero que se fabrican en cada una de las compaas A y B. De la muestra
de la compaa A se obtiene un peso medio de 6.5 kg., asimismo, la muestra de la compaa B indica
un peso medio de 6.3 kg. Considerando que las desviaciones estndar poblacionales de cada
compaa son respectivamente = 0.4 kg. y = 0.3 kg. Se puede concluir que alguna de las
compaas fabrica las varillas con mayor peso? Responda estadsticamente con un 99% de confianza.
Solucin
Se desea probar la hiptesis:
0 : = :
La informacin que se tiene es = = 100, = 6.5 = 6.3. Adems las desviaciones son
conocidas, a saber, = 0.4 kg y = 0.3 kg. De manera natural, las muestras son independientes,
por lo que el estadstico de prueba es:
Prof. Felipe R. Tuz Poot
104
2 2
+
6.5 6.3
2
2
(0.4) + (0.3)
100
100
0.2
=4
0.05
El valor crtico es /2 = 0.005 = 2.58 y como el valor del estadstico de prueba es tal que || >
0.005 = 2.58, se rechaza la hiptesis nula a favor de la alternativa con una confianza del 99%, es
decir, los datos apoyan que efectivamente una de las fbricas produce varillas con mayor peso.
Hiptesis
alternativa
= 0
= 0
> 0
= 0
< 0
Medida Estadstica de
Prueba
=
( ) 0
1
1
+
Regin de rechazo
|| > 2,
> ,
= + 2
2 =
( 1)2 +( 1)2
< ,
+ 2
Ejemplo
Se llev a cabo un experimento para comparar el deterioro abrasivo de dos materiales laminados
diferentes. Se probaron doce piezas del material 1, exponiendo cada una a una mquina para medir
el deterioro. De la misma manera, se probaron diez piezas del material 2. En cada caso, se observ la
profundidad del deterioro. Las muestras del material 1 dieron un deterioro promedio (registrado)
de 85 unidades con una desviacin estndar muestral de 4, mientras que las muestras del material 2
dieron un promedio de 81 y una desviacin estndar muestral de 5. Puede concluirse en el nivel de
105
significancia de 0.05 que el deterioro abrasivo del material 1 excede al del material 2 por ms de dos
unidades? Asuma que las poblaciones son aproximadamente normales con varianzas iguales.
Solucin
Si 1 y 2 representan las medias poblacionales de los deterioros abrasivos para el material 1 y 2
respectivamente, entonces se tienen las hiptesis siguientes:
0 : 1 2 = 2
: 1 2 > 2
Se trata de una prueba de hiptesis de una cola a la derecha con = 0.05 y = 12 + 10 2 = 20
grados de libertad. De la tabla de distribucin de student se obtiene el valor crtico de 1.725.
De la informacin del ejemplo se tiene que:
1 = 85
2 = 81
1 = 4
2 = 5
1 = 12
2 = 10
(1 2 ) 0
1
1
+
1 2
(85 81) 2
1
1
4.47812 + 10
= 1.04
0.45
1.04 1.725
La medida estadstica de prueba 1.04 es menor que el valor crtico 1.725 por lo que cae en la regin
de aceptacin y se acepta la hiptesis nula.
Decisin: No se est en condiciones de concluir que el deterioro abrasivo del material 1 excede al del
material 2 por ms de dos unidades, la muestra no aporta evidencia para esta conclusin.
Ejemplo
Se deben eliminar gases cidos de otros gases de refinera en una instalacin de productos qumicos,
esto para reducir al mnimo la corrosin de las plantas. Dos mtodos para eliminar estos gases
produjeron el ritmo de corrosin (mm./ao), medidas que se representan a continuacin:
Mtodo A: 0.3, 0.7, 0.5, 0.8, 0.9, 0.7, 0.8
Mtodo B: 0.7, 0.8, 0.7, 0.6, 2.1, 0.6, 1.4, 2.3
Se puede concluir que el mtodo A tiene una media menor en el ritmo de corrosin que el mtodo
B? Justifique estadsticamente con un nivel de significancia de 0.1. Qu hiptesis se deben hacer para
comprobar la validez de la respuesta?
Prof. Felipe R. Tuz Poot
106
Solucin
Se desea probar la hiptesis:
0 : = : <
Equivalente a:
0 : = 0 : < 0
La informacin que se tiene es:
2 = 0.0424
2 = 0.4886
= 0.6714
= 1.15
2 =
= 7
= 8
Para poder utilizar el estadstico de prueba descrito previamente es necesario realizar los siguientes
supuestos:
Las muestras aleatorias provienen de poblaciones con distribucin normal y son
independientes.
Las poblaciones tienen desviaciones estndar iguales, o sea = .
Luego, el estadstico de prueba es:
(1 +
1 )(2 )
0.6714 1.15
(17 + 18)(0.2827)
= 1.7392
Hiptesis
alternativa
= 0
= 0
> 0
Medida Estadstica de
Prueba
( )
=
2 2
+
Regin de rechazo
|| > 2,
> ,
donde
2
= 0
< 0
2
2
( + )
< ,
2
(2 )2 (2 )
+
1
1
107
Ejemplo
Un fabricante de unidades reproductoras de video est probando el diseo de dos microcircuitos
para determinar si producen un flujo de corriente medio equivalente. El departamento de ingeniera
de desarrollo ha obtenido los siguientes datos:
Para el Diseo 1 = 15
Para el Diseo 2 = 10
= 24.2
= 23.9
2 = 10
2 = 20
Se desea determinar si hay alguna diferencia en el flujo de corriente medio entre los dos diseos,
donde se supone que las poblaciones tienen distribucin normal, pero no se desea suponer que las
varianzas son iguales. Utiliza un nivel de significancia de 0.1 para dar respuesta a esta hiptesis.
Solucin
La hiptesis de inters a probar es:
0 : =
Ya que se considera que los datos de las muestras provienen de distribuciones normales, adems las
varianzas son desconocidas y diferentes, el estadstico de prueba adecuado a emplear es:
=
( )
2 2
+
2
2
+
(
)
24.2 23.9
10 + 20
15 10
0.3
= 0.184
1.632993
10 20 2
( + )
7.111
=
= 152 10 2 =
= 14.93
2
0.032 + 0.444
10
20
(2 )2 (2 )
( )
( )
15 + 10
1 + 1
14
9
es decir = 15 pues el valor de se redondea al entero ms cercano.
El valor crtico es , = 0.05,15 = 1.753 y como el estadstico de prueba es tal que || < /2, se
2
concluye que no se rechaza 0 por lo que los datos no proporcionan evidencia suficiente para
concluir que existe diferencia entre las medias.
Una vez presentada la condicin i) se abordar a continuacin la condicin ii) que tiene las siguientes
caractersticas:
Las distribuciones poblacionales son desconocidas
Las desviaciones estndar y son desconocidas
Los tamaos de las muestras son mayores o iguales a 30 y,
Las muestras son independientes.
Como las desviaciones estndar son desconocidas se estiman con las desviaciones muestrales
por ser estos estimadores consistentes de sus desviaciones estndar poblacionales
respectivas. Por ello pueden ser tratadas como desviaciones estndar poblacionales conocidas, lo que
permite utilizar la estadstica de prueba y regiones de rechazo presentadas en la tabla siguiente:
108
Hiptesis
nula
H0
Hiptesis
alternativa
= 0
= 0
> 0
= 0
< 0
Medida Estadstica
de Prueba
Regin de rechazo
( ) 0
|| > 2
2 2
+
>
<
Esta tabla es exactamente la misma que la empleada en el caso cuando las muestras provienen de
distribuciones normales y sus desviaciones estndares son conocidas.
Hiptesis
alternativa
1 2 = 0
1 2 0
1 2 = 0
1 2 > 0
1 2 = 0
1 2 < 0
Medida Estadstica
de Prueba
(1 2 ) 0
=
1
1
( + )
1 2
1 + 2
=
1 + 2
= 1
Regin de rechazo
|| > 2
>
<
Ejemplo
Considere un proceso de produccin que tiene una fraccin defectuosa 1 desconocida. A este
proceso se le realizan unas mejoras para reducir el porcentaje de defectuosos que est produciendo,
y queremos saber si estos cambios s reducen sustancialmente la proporcin de artculos defectuosos
del proceso. Para ello, se toma una muestra de 200 artculos del proceso original, y se encuentran 12
defectuosos, por otro lado se examinan 150 artculos del nuevo proceso y se observan 6 defectuosos.
Cree usted que los cambios efectuados al proceso han reducido el porcentaje de artculos
defectuosos? Use un nivel de confianza del 95%.
Solucin
Sean 1 y 2 proporciones poblacionales del proceso original y del nuevo respectivamente, entonces
se desea probar la hiptesis:
Prof. Felipe R. Tuz Poot
109
0 : 1 = 2 : 1 > 2
Los datos que se tienen son
1 = 12
2 = 6
1 = 200
2 = 150
1 + 2
12 + 6
=
= 0.05143
1 + 2 200 + 150
1 2
1
1
( + )
1 2
0.06 0.04
(0.05143)(0.94857) ( 1 + 1 )
200 150
0.02
= 0.8382
0.02386
El valor crtico es = 0.05 = 1.64 y como el valor del estadstico es tal que < = 1.64 entonces
la hiptesis nula no puede ser rechazada, es decir, los datos no presentan evidencia para concluir que
los cambios efectuados al proceso ayudan a disminuir el porcentaje de defectuosos con una confianza
del 95%.
2 2
2 2
tiene una
2
2
110
Hiptesis
nula
Hiptesis
alternativa
12 = 22
12
22
12 = 22
12 > 22
12
12
22
<
22
Medida Estadstica
de Prueba
12
= 2
2
con 1 = 1 1
grados de libertad en
el numerador y 2 =
2 1 grados de
libertad en el
denominador.
Regin de rechazo
1
<
2,(2 ,1 )
> 2,(1 ,2 )
> ,(1 ,2 )
<
1
,(2 ,1 )
La notacin (1 , 2 ) indica que se debe considerar el valor crtico de la tabla F-Fisher con 1 grados
de libertad en el numerador, 2 grados de libertad en el denominador y con un nivel de significancia
.
En las siguientes grficas se presentan los diferentes casos de pruebas de hiptesis de una cola y de
dos colas, as como las frmulas para calcular los valores crticos; tambin se muestran las regiones
de rechazo identificadas como la parte sombreada. En el caso de pruebas de hiptesis de una cola, ya
sea a la izquierda o a la derecha, el nivel de significancia es el valor de mientras que cuando la
prueba de hiptesis es de dos colas el nivel de significancia es /2.
a
f
111
Ejemplo
Un mdico asegura que la variabilidad entre el peso de las nias () y los nios () es diferente. Para
comprobar estadsticamente dicha afirmacin se realiza el experimento de seleccionar dos muestras,
una de 10 nias y otra de 8 nios, de los cuales se tuvieron varianzas de 2 = 2.1 y 2 = 3.21,
respectivamente. Presentan las varianzas muestrales suficiente evidencia que indique que la
afirmacin del mdico es cierta? Compruebe con un nivel de significancia de 0.1
Solucin
Se desea probar la hiptesis
0 : 2 = 2 : 2 2
Supngase que las poblaciones tienen distribuciones que son razonablemente monticulares y que
por lo tanto satisfacen la suposicin de que las poblaciones son normales, dado esto el siguiente
proceso es vlido, estadsticamente.
El estadstico de prueba es
=
2
2.1
=
= 0.6542
2
3.21
Se sabe que la regin de rechazo es para cualquier valor que cumple cualquiera de los siguientes
casos: > ,
2
1, 1
< (,
2
1,
1 ) .
Se tiene que:
,
1, 1
= 0.05,9,7 = 3.68
1
(,
2
1,
1 )
= (0.05,7,9 )
= (3.29)1 = 0.3039.
Como el estadstico f no cumple con ninguna de las condiciones entonces no pertenece a la regin de
rechazo. Como consecuencia no hay suficiente evidencia para concluir que la variacin en pesos entre
los nios difiera con respecto a la variacin en el peso entre las nias con 90% de confianza. Los datos
no apoyan a la hiptesis que plantea el mdico.
112