Sie sind auf Seite 1von 11

UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II

UNIDAD 5: PRUEBA O CONTRASTE DE HIPTESIS


INTRODUCCIN
Iniciamos el estudio de la inferencia estadstica con el desarrollo del concepto de distribucin muestral.
Despus, se utiliz una estadstica obtenida de una muestra aleatoria (como la media de la muestra, la
varianza de la muestra o la proporcin de la muestra) para estimar su parmetro de poblacin
correspondiente.
En el proceso de estimacin se trat de asignar al parmetro de una distribucin, un nico valor
(estimacin puntual) o un conjunto de valores (estimacin por intervalos).
En la presente seccin, pondremos nuestra atencin en otra fase de la inferencia estadstica que tambin
se basa en la informacin de la muestra: la prueba de hiptesis. En particular, desarrollaremos una
metodologa que nos permitir hacer inferencias con respecto al valor especfico de un parmetro de
poblacin mediante el anlisis de diferencias entre los resultados que en realidad observamos (es decir,
nuestra estadstica de muestra) y los resultados que esperaramos obtener si alguna hiptesis subyacente
fuera realmente verdadera. Adems del desarrollo de la metodologa de prueba de hiptesis como una
tcnica para analizar diferencias y tomar decisiones, tambin evaluaremos los riesgos implicados al
tomar tales decisiones basndonos nicamente en la informacin de la muestra. Pondremos nfasis en
las bases conceptuales y fundamentales de la metodologa de prueba de hiptesis.
METODOLOGA DE LA PRUEBA DE HIPTESIS
Con el propsito de desarrollar la metodologa de la prueba de hiptesis, analizaremos el ejemplo
siguiente. En una compaa, que se dedica al empaque de cajas de cereal, las mquinas han sido
ajustadas para vaciar un contenido promedio de 368 gramos de cereal en cada caja. El gerente de
produccin est preocupado por evaluar si el proceso sigue funcionando o no de una manera que asegure
que, en promedio, la cantidad adecuada de cereal (es decir, 368 gramos) est siendo depositada en cada
caja. Decide seleccionar una muestra aleatoria de 25 cajas del proceso de empaque y examinar su peso
para determinar qu tanto se acerca cada una de tales cajas a la especificacin de la compaa de 368
gramos en promedio en cada caja. El gerente de produccin espera encontrar que el proceso est
funcionando apropiadamente. Sin embargo, podra encontrar que las cajas muestreadas pesan mucho
menos o, quizs, mucho ms y tener la sensacin de que debera detener la produccin hasta que el
personal de mantenimiento pueda examinar las mquinas y, si fuera necesario, reparar o sustituir una
parte de mquina. Por consiguiente, al analizar las diferencias entre los pesos obtenidos de la muestra y
los 368 gramos esperados, obtenidos de la especificacin de la compaa, se tomar una decisin basada
en la informacin de la muestra y se llegar a una de las siguientes dos conclusiones:
1. El contenido promedio en el proceso completo de empaque de cajas de cereal es de 368
gramos. No es necesario realizar acciones correctivas.
2. El contenido promedio no es de 368 gramos; es menor a esta cantidad o es mayor. Se
necesitan acciones correctivas.
Hiptesis nula y alternativa
La prueba de hiptesis empieza con una afirmacin o asercin con respecto a un parmetro particular de
una poblacin. Para fines de anlisis estadstico, el gerente de produccin escoge como hiptesis inicial
que el proceso est bajo control; esto es, el contenido promedio es de 368 gramos y no es necesario
efectuar acciones correctivas. La hiptesis de que el parmetro de la poblacin es igual a la
LIC. JUSTA CARIDAD HUAROTO SUMARI

Pgina 1

UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II


especificacin de la compaa se conoce como la hiptesis nula. Por lo general se la identifica con el
smbolo H0. En nuestro ejemplo se puede establecer como:
H 0 : 368
Obsrvese que la hiptesis nula se escribe en trminos del parmetro de la poblacin. Esto es as debido
a que el gerente est interesado en el proceso de empaque completo, es decir, la poblacin de todas las
cajas de cereal que se estn llenando. Las estadsticas muestrales se utilizarn para hacer inferencias
acerca de la condicin del proceso completo de llenado. La base terica de la prueba de hiptesis
requiere que la hiptesis nula sea considerada verdadera hasta que las evidencias, que son los resultados
de la muestra, indiquen que sta es falsa. Si la hiptesis nula se considera falsa, alguna otra debe ser
verdadera.
Siempre que especifiquemos una hiptesis nula, tambin debemos especificar una hiptesis alternativa,
H1, que indique lo opuesto a la hiptesis nula. Para el ejemplo, la hiptesis alternativa se puede
establecer como:
H 1 : 368
La hiptesis alternativa representa la conclusin a la que se llegara si hubiera suficiente evidencia de la
informacin de la muestra para decidir que es improbable que la hiptesis nula sea verdadera y, por
tanto, rechazarla. En el ejemplo, si los pesos de las cajas muestreadas estuvieran lo suficientemente
alejados de 368 gramos especificados por la compaa, el gerente de produccin rechazara la hiptesis
nula en favor de la hiptesis alternativa; por consiguiente, detendra la produccin y llevara a efecto
cualquier accin necesaria para corregir el problema.
Valor crtico de la estadstica de prueba
La decisin de rechazar o no la hiptesis nula, en base a la evidencia emprica, se basa en la creencia de
que los elementos de la muestra aleatoria representan fielmente las caractersticas de los elementos de la
poblacin de donde ha sido tomada. El hecho de no rechazar la hiptesis nula no es una prueba de que
sta sea verdadera, lo nico que podemos decir es que la evidencia fue insuficiente para garantizar su
rechazo. Para tomar cualquier decisin, se requiere usar la distribucin muestral de la estadstica de
inters (en nuestro ejemplo, de la media muestral) y luego calcular el valor de la estadstica de prueba
particular, basndonos en el resultado de la muestra. Como la distribucin muestral de la estadstica de
prueba, a menudo, sigue una distribucin normal o t , podemos utilizar estas distribuciones para
determinar la probabilidad de que una hiptesis nula sea verdadera (la estadstica de prueba es la funcin
pivote ya conocida). El valor de la estadstica de prueba se llama valor crtico.
Regiones de rechazo y de no rechazo
La distribucin muestral de la estadstica de prueba se divide en dos regiones, una regin de rechazo
(conocida tambin como regin crtica) y una regin de no rechazo. Si el valor de la estadstica de
prueba cae en la regin de rechazo, se rechaza la hiptesis nula (porque el valor sera improbable si H0
fuese verdadera). En el ejemplo, el gerente de produccin llegara a la conclusin de que la media de la
poblacin no es 368.Si el valor de la estadstica de prueba cae dentro de la regin de no rechazo, no se
puede rechazar la hiptesis nula. En nuestro ejemplo, el gerente de produccin llegara a la conclusin
de que la cantidad promedio de contenido no ha cambiado.
Con el fin de tomar una decisin respecto de H0, primero debemos determinar el valor crtico de la
estadstica de prueba, el cual separa las regiones de no rechazo y de rechazo.
LIC. JUSTA CARIDAD HUAROTO SUMARI

Pgina 2

UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II


Riesgos en la toma de decisiones al utilizar la metodologa de la prueba de hiptesis
Cuando se usa una estadstica muestral para tomar decisiones acerca de un parmetro poblacional, existe
el riesgo de llegar a una conclusin incorrecta. Dos tipos diferentes de error se pueden presentar cuando
se aplica la metodologa de prueba de hiptesis:
Un error de tipo I se presenta si la hiptesis nula, H0, es rechazada cuando, de hecho, es verdadera
y deba ser aceptada.
Un error de tipo II se presenta si la hiptesis nula, H0, es aceptada cuando, de hecho, es falsa y
deba ser rechazada.
Nivel de significacin: es la probabilidad de cometer un error del tipo I. Se especifica antes de que
se lleve a cabo la prueba de hiptesis. Se le denota como y una vez que se ha especificado su valor
se conoce el tamao de la regin crtica y se puede determinar el valor crtico. Su complemento,
1 , es el coeficiente de confianza y representa la probabilidad de que la hiptesis nula, H0, no sea
rechazada cuando de hecho es verdadera.
Ahora, a manera de resumen, presentaremos los conceptos necesarios de una prueba de hiptesis.
REVISIN DE CONCEPTOS PARA LA METODOLOGA DE LA PRUEBA DE HIPTESIS
Hiptesis estadstica: Supuesto o conjetura acerca de un parmetro poblacional o acerca de la
distribucin de probabilidad de una variable aleatoria.
Contraste de Hiptesis: Una prueba de una hiptesis estadstica es una regla de decisin que permite
rechazar o no la hiptesis nula planteada, en base a la informacin proporcionada por la muestra
aleatoria.
Hiptesis nula y alternativa: La hiptesis nula es la que establece que el parmetro estudiado tiene un
valor especfico.
La hiptesis alternativa, sobre la cual se enfoca la atencin, generalmente representa la suposicin que el
investigador quiere probar. Se establece como lo opuesto a la hiptesis nula y representa la conclusin a
la que se llegara si la hiptesis nula fuera rechazada.
El rechazo de la hiptesis nula implicar la aceptacin de la hiptesis alternativa.
Para formular las hiptesis podemos seguir los pasos siguientes:
Formular las hiptesis, estableciendo como alternativa aquella que se desea probar.
1. En la hiptesis nula se plantea que el parmetro es igual a un valor especfico.
2. Considerar el nivel de significacin como medida de la confiabilidad de la decisin de
rechazar la hiptesis nula. Este valor de debe ser pequeo.
3. Si no existe suficiente informacin en la muestra como para rechazar la hiptesis nula, es
preferible indicar que la hiptesis nula no puede ser rechazada en lugar de aceptarla.

Error tipo I y Error tipo II: La decisin de rechazar o no la hiptesis nula, en base a la informacin
contenida en una muestra, est sujeta a dos tipos de errores; estos errores se deben a fluctuaciones
aleatorias en el muestreo. Se comete un error tipo I cuando se rechaza una hiptesis nula verdadera. Se
LIC. JUSTA CARIDAD HUAROTO SUMARI

Pgina 3

UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II


comete un error de tipo II cuando se decide a favor de una hiptesis nula que en realidad es falsa. Para
controlar estos errores se le asigna una probabilidad pequea.
ESTADO REAL
DECISIN
H0 es verdadera
H0 es falsa
Rechazar H0
Error tipo I
Aceptar H0
Error tipo II
Nivel de Significacin: Es la probabilidad de cometer el error tipo I. Se le denota como .
= P[Rechazar H0 / H0 es verdadera]
La probabilidad de equivocarse al rechazar la hiptesis nula, siendo sta verdadera, es a lo ms .
Estadstica de prueba: Variable aleatoria utilizada para tomar la decisin no se rechaza Ho se
rechaza Ho.
Generalmente, la estadstica de prueba es la funcin pivote que se usa en la estimacin por intervalos.
Regin crtica: Conjunto de valores de la estadstica de prueba que causan el rechazo de la hiptesis
nula.
Punto crtico: Primer valor (o valor frontera) en la regin crtica.
Regla de decisin: Si el valor calculado de la estadstica de prueba queda localizado dentro de la regin
crtica, se rechaza Ho; caso contrario no se podr rechazar Ho.
Regla para la conclusin: Si la decisin es rechazar Ho, entonces la conclusin ser existe
evidencia suficiente al nivel de significacin para indicar que ... (el significado de la hiptesis
alternativa). Si la decisin es no se rechaza Ho, entonces la conclusin debe ser no existe suficiente
evidencia al nivel de significacin que indique que ... (el significado de la hiptesis alternativa).
Notar que: (1) la decisin se refiere a Ho, y (2) la conclusin es una aseveracin que sostiene o no lo
afirmado en H1.
PROCEDIMIENTO PARA REALIZAR UNA PRUEBA O CONTRASTE DE HIPTESIS
Dado el nivel de significacin , para hallar la regin de rechazo RR, que proporcione una regla de
decisin para aceptar o no la hiptesis nula H 0 : 0 frente a una hiptesis alternativa, se procede del
modo siguiente:
1.
2.
3.
4.
5.

Formular las hiptesis H0 y H1.


Fijar el nivel de significacin y usar este valor para determinar la regin crtica.
Elegir la estadstica de prueba adecuada, dependiendo del parmetro que interese probar, y
calcular su valor en base a la informacin proporcionada por la muestra.
Tomar la decisin: se rechaza H0 o no se rechaza H0.
Conclusin: interpretacin de la decisin.

LIC. JUSTA CARIDAD HUAROTO SUMARI

Pgina 4

UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II


A continuacin, haremos las pruebas de hiptesis para los parmetros y 2 de una poblacin normal,
y para el parmetro p de una poblacin de Bernoulli.
PRUEBAS DE HIPOTESIS USUALES
PRUEBA DE HIPTESIS PARA LA MEDIA CUANDO SE MUESTREA UNA POBLACIN
NORMAL
Sean X1, X2, ..., Xn una muestra aleatoria de una distribucin normal con media desconocida. Interesa
probar uno de los siguientes conjuntos de hiptesis con respecto a .
A)

H0 : = 0
H1 : < 0

B)

H0 : = 0
H1 : > 0

C)

H0 : = 0
H1 : 0

CASO 1.- Supongamos que la varianza poblacional 2 es conocida. En este caso, la estadstica de
prueba es
Z=

X 0

la cual tiene distribucin normal estndar.


La regin crtica de tamao correspondiente a cada conjunto de hiptesis es:
A)
B)

RR = { Z: Z -Z }
RR = { Z: Z Z }

C)

RR = { Z: Z -Z/2 } { Z: Z Z/2 }

Ejemplo:
Ante un reclamo de la gerencia, sobre el tiempo de realizacin de una tarea, los empleados de una
compaa sostienen que ellos completan la tarea en a lo ms 13 minutos. Qu conclusin obtiene la
gerencia si para una muestra de 400 tareas se obtiene un promedio de tiempo de terminacin de 14
minutos? Se sabe por informacin de trabajos similares, que los tiempos de ejecucin de la tarea tiene
una distribucin normal con desviacin estndar de 10 minutos. Usar el nivel de significacin 0.05
Solucin:
El problema se plantea de la siguiente manera:
H0 : = 13 versus H1: >13
con un nivel de significacin 0.05 .
En este caso la hiptesis alternativa se toma mayor que 13 pues el gerente justificara el reclamo de la
compaa si la media poblacional es superior a 13 minutos.
X 0
14 13
2
El valor de la estadstica de prueba es Z =
=
10/ 400
n
. , .
La regin de rechazo correspondiente al nivel de significacin 0.05 est dada por 1645

LIC. JUSTA CARIDAD HUAROTO SUMARI

Pgina 5

UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II


Como el valor de la estadstica de prueba cae en la regin de rechazo, el gerente puede rechazar la
hiptesis nula H0. El riesgo de que el gerente se equivoque al rechazar la hiptesis nula, sobre la base
del resultado encontrado en la muestra, es menor o igual que 0.05.
CASO 2.- Supongamos que la varianza poblacional 2 es desconocida. En este caso se utiliza como
estadstica de prueba
T=

X 0
s

la cual tiene distribucin t de Student con n-1 grados de libertad.


La regin crtica de tamao correspondiente a cada conjunto de hiptesis es:
A)
C)

RR = { t: t -t }
B)
RR = { t: t t }
RR = { t: t -t/2 t: t t/2 }

Ejemplo: En 10 mediciones sobre la resistencia de un alambre, se obtuvieron los siguientes resultados:


X = 10.48 y S = 1.36.
Suponiendo que la variable aleatoria X que representa a las mediciones sigue una distribucin normal
con media y varianza 2 desconocida, probar la hiptesis nula H0: =10 versus H1: > 10, al nivel
de significacin = 0.01
Solucin:
Siendo la varianza poblacional desconocida y la muestra pequea, la estadstica de prueba es
T=
X 0
la cual tiene distribucion t con 9 g.l.
s n
El valor calculado de esta estadstica de prueba es 1.1160.
La regin crtica al nivel de significacin = 0.01 es [1.83, ) .
Como el valor de la estadstica de prueba no cae en la regin crtica, no se rechaza H0.
La muestra aleatoria no es significativa.
PRUEBA DE HIPTESIS CON RESPECTO A LA VARIANZA CUANDO SE MUESTREA UNA
POBLACIN NORMAL
Sean X1, X2, ..., Xn una muestra aleatoria de una distribucin normal con media desconocida y
varianza 2 desconocida. Sea la hiptesis nula
H0 : 2 = 20
frente a una de las siguientes alternativas:
H1 : 2 < 20

H1 : 2 > 20

H1 : 2 20

La estadstica de prueba es:


LIC. JUSTA CARIDAD HUAROTO SUMARI

Pgina 6

UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II


2

(n 1) S 2

20

la cual tiene distribucin Ji cuadrado con n 1 grados de libertad.


Se rechazar H0 si el valor de la estadstica de prueba se encuentra dentro de la regin de rechazo de
tamao , correspondiente a cada hiptesis:
RR = { 2 2 }

RR = { 2 2 }

RR = { 2 2/2 2 2/2 }

Ejemplo:
Un fabricante de mquinas de llenado de leche en bolsas asegura que cada una de estas mquinas llena
bolsas con un contenido promedio de un litro y una varianza igual a 0.01. La varianza de una muestra de
10 bolsas fue S 2 = 0.02.
Suponiendo que la cantidad vertida tiene distribucin normal probar la hiptesis H0: 2 =0.01 frente a
H1: 2 >0.01, al nivel de significacin 0.05
Solucin:
El valor de la estadstica de prueba es

(n 1) S 2

9 x 0.02
18
0.01

Para 0.05 el valor crtico de la distribucin chi cuadrado con 9 g.l. es 16.92 de
modo que la regin crtica para esta prueba es 16.92, .
Como el valor calculado de la estadstica de prueba cae en la regin crtica, se rechaza H0.
Las mquinas del fabricante no son muy precisas.

2
0

PRUEBA DE HIPTESIS PARA LA PROPORCIN DE UNA POBLACIN DE BERNOULLI.


Sea X1, X2, ..., Xn una muestra aleatoria de una poblacin de Bernoulli con media (la proporcin
poblacional de elementos que poseen cierta caracterstica de inters) y con varianza (1 ) . Se sabe
que, cuando la muestra es grande, la proporcin muestral p de elementos que poseen la caracterstica de
inters, tiene distribucin normal, aproximadamente, con media y varianza (1 ) /n. Esto es, p
~

(1 )
N ,
o lo que es lo mismo,
n

p
Z=
~ N(0,1).
(1 )
n

Supngase que se desea probar la hiptesis nula


H0:

LIC. JUSTA CARIDAD HUAROTO SUMARI

0
Pgina 7

UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II


contra una de las siguientes alternativas:
H1:

<

H1:

>

H1:

En este caso, la estadstica de prueba es:

Z=

p 0
0(1 0)
n

la cual tiene distribucin normal estndar.


La regin crtica de tamao , correspondiente a cada una de las hiptesis es:
RR = { z -z}

RR = { z z}

RR = { z -z/2 z z/2 }

Ejemplo:
Un ministro de trabajo afirma que en su pas existe el 40% de desocupados. Con el fin de evaluar esta
afirmacin se tom una muestra aleatoria de 500 personas resultando que 300 eran desocupadas. En base
a la informacin obtenida Qu se puede decir acerca de la afirmacin del ministro?.
Solucin:
Considerando que la v.a. X definida en la poblacin y descrita por
X = 1, si individuo es desocupado
= 0, si no es desocupado
sigue una distribuci de Bernoulli con parmetro , se trata de probar
Ho: =0.40 frente a H1: >0.40, con 0.05 .
En la muestra de tamao 500, la proporcin de desocupados es p = 300/500 = 0.6
El valor de la estadstica de prueba, si H0 es verdadera, es
Z=

p 0
0(1 0)
n

0 .6 0 .4
9.28
0.4(0.6) / 500

Este valor es mayor que el cuantil z0.95 1.645 y por tanto podemos afirmar, con un riesgo de 5%, que
los resultados muestrales son significativos y el porcentaje de desocupados es mayor que 40%.
PRUEBAS DE HIPTESIS PARA DOS POBLACIONES NORMALES
PRUEBA DE HIPTESIS REFERENTE A LA IGUALDAD DE MEDIAS
En muchas investigaciones es necesario comparar dos procedimientos diferentes; as, se comparan dos
procedimientos para fabricar componentes electrnicos, se comparan dos mtodos de enseanza, etc.
Usualmente el problema se traduce en comparar las medias de dos variables aleatorias.
La metodologa se presenta a continuacin.

LIC. JUSTA CARIDAD HUAROTO SUMARI

Pgina 8

UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II


Sean X1, X2, ..., Xn1 y Y1, Y2, ..., Yn2 muestras aleatorias provenientes de dos distribuciones normales
independientes con medias 1 y 2 y varianzas 12 y 22 , respectivamente. Supngase que se quiera
probar la hiptesis nula
H0 : 1 2 = 0
contra una de las siguientes alternativas:
H1 : 1 2 < 0

H1 : 1 2 > 0

H1 : 1 2 0

CASO 1.- Las varianzas poblacionales 12 y 22 son conocidas.


En este caso, la estadstica de prueba es:
Z=

( X 1 X 2 ) ( 1 2 )

12
n1

22
n2

la cual tiene distribucin normal estndar.


La regin crtica de tamao correspondiente a cada una de las hiptesis es:
RR = { Z: Z -z }

RR = { Z: Z z }

RR = { Z: Z -z/2 } { Z: Z z/2 }

CASO 2.- Las varianzas poblacionales son desconocidas pero son iguales.
En este caso, la estadstica de prueba es:
T=

( X 1 X 2 ) ( 1 2 )
S c2 (

1
1
)
n1 n2

la cual tiene distribucin t de Student con n1 + n2 2 grados de libertad, y donde S c2 es el estimador


combinado de la varianza 2.
Las regiones crticas correspondientes a las hiptesis mencionadas son:
RR = { T: T -t }

RR = { T: T t }

RR = {T: T -t/2 } {T: T t/2 }

CASO 3.- Las varianzas poblacionales no se conocen y son diferentes.


La estadstica de prueba que se utiliza en este caso es:

LIC. JUSTA CARIDAD HUAROTO SUMARI

Pgina 9

UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II


( X 1 X 2 ) ( 1 2 )

T=

S12 S 22

n1 n2

cuya distribucin es t de Student con g grados de libertad, donde g es el mnimo entre (n1 1) y (n2 2).

PRUEBAS DE HIPTESIS REFERENTES A LA IGUALDAD DE LAS VARIANZAS DE DOS


POBLACIONES NORMALES INDEPENDIENTES
Sean X1, X2, ..., Xn1 y Y1, Y2, ..., Yn2 muestras aleatorias provenientes de dos distribuciones normales
independientes con medias desconocidas 1 y 2 y varianzas desconocidas 12 y 22 , respectivamente. Se
desea probar la hiptesis nula
H0 : 12 = 22
frente a una de las siguientes alternativas:
H1 : 12 < 22

H1 : 12 > 22

H1 : 12 22

La estadstica de prueba que se utiliza es:


F=

S12 22
S 22 12

la cual tiene distribucin F con n1 1 y n2 1 grados de libertad.


Pero, bajo la hiptesis nula, 12 = 22 , entonces la estadstica se reduce a:

S12
S22
La regin crtica asociada a cada una de las hiptesis alternativas es:
F=

RR = { f 1/ f1-,

RR = { f f1-,

n 2 -1, n 1 -1 }

RR = { f

1
f

1 , n2 1.n1 1
2

n 1 -1, n 2 -1

f f

1 , n2 1.n2 1
2

PRUEBA DE HIPTESIS REFERENTE A LA IGUALDAD DE PROPORCIONES DE DOS


POBLACIONES INDEPENDIENTES DE BERNOULLI

LIC. JUSTA CARIDAD HUAROTO SUMARI

Pgina 10

UNMSM FISI EAPIS CURSO: ESTADSTICA II SEMESTRE 2014-II


Sean X1, X2, ..., Xn1
y Y1, Y2, ..., Yn2 muestras aleatorias de sendas poblaciones de Bernoulli
independientes, con medias p1 y p2 y varianzas p1(1p1) y p2(1p2), respectivamente. En las muestras
de tamao n1 y n2 sean X e Y el nmero observado de elementos que poseen la caracterstica de inters.
X
Y
Luego, las proporciones muestrales p 1
y p 2
tienen distribuciones muestrales que se
n1
n2
comportan aproximadamente como una distribucin normal, cuando n1 y n2 son grandes.
Entonces, la estadstica p 1 p 2 tiene distribucin normal con media p1 p2 y con varianza
p1 1 p1 n1 + p2 1 p2 n2 , de modo que la variable aleatoria

p 1 p 2 p1 p 2
p1 1 p1 p 2 1 p 2

n1

~ N(0,1)

n2

Usaremos esta distribucin muestral para hacer inferencias con respecto a


p1 p2.
Si se desea probar la hiptesis nula
H0: p1 p2 = 0
frente a una de las siguientes alternativas:
H1: p1 p2 < 0

H1: p1 p2 > 0

H1: p1 p2 0

seguiremos el procedimiento ya conocido. Dado que bajo H0 se supone que las dos proporciones son
iguales, sea p = p1 = p2 la proporcin comn.
Si H0 es verdadera, la estadstica p 1 p 2 tiene distribucin normal con media 0 y varianza
1
1
p1 1 p1 n1 + p2 1 p2 n2 = p(1 p)( ).
n1 n2
Como no se conoce el valor de p, se combina la informacin de las dos muestras para obtener el
estimador combinado
n p n2 p 2
p* 1 1
.
n1 n2
As,

1
1
p 1 p 2 ~ N(0, p * (1 - p * ) ) .
n 1 n2
Z

En este caso, usaremos como estadstica de prueba

p 1 p 2
p * (1 p * )(1 / n1 1 / n2 )

la cual tiene distribucin normal estndar, para valores grandes de n1 y n2.


Las regiones de rechazo para cada uno de los conjuntos de hiptesis son, respectivamente,
RR = { Z: Z -z}

RR = { Z: Z z}

LIC. JUSTA CARIDAD HUAROTO SUMARI

RR = {Z: Z -z/2 Z z/2 }.


Pgina 11

Das könnte Ihnen auch gefallen