Sie sind auf Seite 1von 35

Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones.

83

Captulo 3

INTERVALOS DE CONFIANZA Y PRUEBA DE


HIPOTESIS PARA MEDIAS Y PROPORCIONES.
3.1. Introduccin.

El objetivo es dar algunos mtodos que se usan para tomar decisiones sobre
poblaciones, a partir de los resultados de una muestra aleatoria escogida de esa
poblacin. Para llegar a tomar decisiones estadsticas se debe partir de afirmaciones
o conjeturas con respecto a la poblacin en el que estamos interesados. Tales
suposiciones, pueden ser verdaderas o no. Una conjetura hecha sobre una poblacin
o sobre sus parmetros deber ser sometida a comprobacin experimental con el
propsito de saber si los resultados de una muestra aleatoria extrada de esa
poblacin, contradicen o no tal conjetura.

3.2. Intervalo de confianza para la media poblacional .

3.2.1. Intervalo de confianza para la media : Varianza 2 supuestamente


conocida.
Se utiliza la distribucin muestral de la media X para determinar el intervalo de
confianza del parmetro .

Si la poblacin es normal N (, 2 ) , entonces, la distribucin del estadstico X es


normal N (, 2 /n) para cualquier valor de n (n 2).

Si la poblacin no es normal, pero tiene media y varianza 2 finitas, entonces,


siempre que el tamao n de la muestra sea suficientemente grande (n 30), por el
teorema del lmite central, la distribucin de X es aproximadamente normal
N (, 2 /n) .

Por tanto, segn sea el caso, la distribucin de la variable aleatoria:

X
Z
/ n

es exactamente (o aproximadamente) normal N(0,1).

Por tanto, el intervalo de confianza del (1- ) x 100% para es dado por:


X Z /2 X Z /2
n n

El valor de Z / 2 se busca en la tabla normal N(0,1), tal que P( Z Z / 2 ) / 2 .


Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 84


En la figura 3.1, tenemos que los valores a X Z / 2 y b X Z / 2 son los
n n
lmites de confianza de , inferior y superior, respectivamente.

Z
- z1-/2 0 z1-/2

a X b X
intervalo de

Figura 3.1. Intervalo de estimacin para .

Observacin 1. Cuando la poblacin es finita de tamao N y el tamao de la muestra


constituye ms del 5% del tamao de la poblacin, se debe usar el factor de
correccin de poblacin finita para modificar la desviacin estndar. As, el intervalo
de confianza del (1- ) x 100% para es dado por:

Nn Nn
X - Z /2 X Z /2
n N 1 n N 1

Ejemplo 3.1. Una muestra aleatoria de 100 hogares de una ciudad indica que el
promedio de los ingresos mensuales es de $ 500. Encuentre un intervalo de confianza
del 95% para la media poblacional de los ingresos de todos los hogares de esa
ciudad. Suponga que = $100.

Solucin.
Sea X el ingreso familiar mensual de esa ciudad cuyo promedio se quiere estimar a
partir de una muestra aleatoria de tamao n =100. La estimacin puntual de es
X 500 . Para el nivel de confianza 1- =0.95, en la tabla normal estndar se
encuentra: z / 2 z 0.025 1.96 .

100
Entonces X z 0.025 500 1.96 500 19.6
n 100

Luego, el intervalo de confianza del 95% para es: [480.4, 519.6]

Esto es, se tiene una confianza del 95% que el promedio del ingreso familiar
de esa ciudad, est en el intervalo [$480.4, $519.6].

Ejercicio. Un analista de investigacin de mercados escoge una muestra aleatoria de


100 clientes de un conjunto de 500 clientes de un gran centro comercial que
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 85

declararan ingresos mayores a 1,500 soles. El encuentra que los clientes de la


muestra gastaron en la tienda un promedio de S/. 2500.
Estimar el gasto promedio de la poblacin finita al nivel de confianza del 95% .
Suponga que la desviacin estndar de la poblacin es = S/.300.

3.2.2. Intervalo de confianza para la media : Varianza 2 desconocida.

A) Poblacin no normal
Si la poblacin no es normal pero el tamao de la muestra es suficientemente grande
(n 30), se utiliza la desviacin estndar S de la muestra, como estimacin puntual
de la desviacin estndar de la poblacin. Entonces, el intervalo de confianza del
(1- ) x 100% para es aproximadamente:
S S
X Z /2 X Z /2
n n

Observacin 2. Cuando la poblacin es finita de tamao N y el tamao de la muestra


constituye ms del 5% del tamao de la poblacin, el intervalo de confianza del
(1- ) x 100% para la media de una poblacin con varianza desconocida y muestra
grande es:
S Nn S Nn
X Z /2 X Z /2
n N 1 n N 1

B) Poblacin normal
Si X y S son la media y la desviacin estndar respectivamente de una muestra
aleatoria de tamao n (n <30) escogida de una poblacin normal con varianza 2
desconocida, entonces, el intervalo de confianza del (1- ) x 100 para es:
S S
X t /2, n 1 X t /2, n 1
n n

Observacin 3. Cuando la poblacin es finita de tamao N y el tamao de la muestra


constituye ms del 5% del tamao de la poblacin, el intervalo de confianza del (1-
)x100% para de una poblacin normal con varianza desconocida y muestra
pequea es:
S Nn S Nn
X t /2, n 1 X t /2, n 1
n N 1 n N 1

Ejemplo 3.2. El peso neto de las latas de caf instantneo de un producto, debe tener
un peso neto de 280 gramos. Un inspector de la oficina de defensa al consumidor
tomo una muestra aleatoria de 5 latas de caf obteniendo los siguientes pesos netos
en gramos:
280, 290, 285, 275, 284
a) Indicar si es razonable que el inspector, usando un intervalo de confianza del
95% ordene que se multe al productor.
b) Con que grado de confianza se estima que el contenido promedio de caf tenga
los lmites de confianza 277.432 y 288.168?
Suponga una distribucin normal de los pesos netos.
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 86

Solucin.

a) Sea X el peso de los contenidos de caf por lata, cuyo promedio se quiere
estimar a partir de una muestra aleatoria de tamao n = 5. Se supone que la
distribucin de X es normal con desviacin estndar no conocida.

Para 1 - = 0.95 y n -1 = 4 grados de libertad en la tabla t- Student se encuentra


t / 2 , n 1 = t 0.025, 4 2.776 .

De la muestra se obtiene X 282.8 y S 5.63

Luego tenemos:
S
X t /2, n 1 282.8 2.776 5.63/ 5 282.8 6.99
n

Luego, el intervalo de confianza del 95% para es: [275.81, 289.79]

Como el intervalo cubre al valor de 280 gramos, entonces es posible que el inspector
no multe al productor.

b)
[277.432, 288.168] con confianza 1- . El lmite superior es:

X t /2, n 1 S/ n 282.8 t /2, n 1 5.63/ 5 288.168

de donde resulta: t / 2, 4 2.132 , / 2 0.05 , 0.10 y 1 0.90 .

3.2.3. Determinacin del tamao de muestra necesario para estimar la media.


Se puede determinar que tan grande debe ser el tamao de la muestra, n, de manera
que si se estima por X , el error de estimacin no sea mayor que un valor dado e.

Entonces, si X estima a , entonces, se tiene una confianza del (1- ) x 100% de


que el error no ser mayor que el valor dado e cuando el tamao de la muestra sea
2
Z
n /2
e

Si la poblacin es finita de tamao N y el muestreo es sin sustitucin, error estndar


de X ( / n ) ( N n) /( N 1) y el valor de n se calcula por:
z2 2N
n 2 2 / 2 2
z / 2 e ( N 1)

Ejemplo 3.3. Se desea realizar una encuesta en un gran sector de un rea


metropolitana para determinar el ingreso familiar promedio de los 30 000 hogares de
ese sector. Se desea que el valor del estimador de la media se encuentre a S/.30.00 de
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 87

la media verdadera con un nivel de confiabilidad de 99%. Se va utilizar una


desviacin estndar muestral igual a S/.200.00 que se obtuvo en una encuesta
anterior como estimador de la desviacin estndar de la poblacin. Qu tamao
debe tener la muestra que se necesita?

Solucin. Tenemos

e = 30, =200, N = 30000, 1- = 0.99 y Z 0.995 2.58

Si sustituimos estos valores en la formula para n, se tiene:

z2 / 2 2 N (2.58) 2 (200) 2 (30000)


n 292.96 293
z2 / 2 2 e 2 ( N 1) (2.58) 2 (200) 2 (30) 2 (29999)

Por tanto, se necesitar una muestra de tamao n = 293 hogares.

3.3.1. Intervalo de confianza para la diferencia entre dos medias: Varianza 12


y 12 conocidas.

3.3. Intervalo de confianza para la diferencia entre dos medias.

Si X 1 y X 2 son las medias que resultan de dos muestras aleatorias independientes de


tamaos n1 y n2 escogidas respectivamente de dos poblaciones con varianzas 12 y 12
conocidas, entonces, el intervalo de confianza del (1- ) x 100% de 1 2 es:

(X 1 X 2 ) Z /2 12 /n 1 22 /n 2 1 2 (X1 X 2 ) Z /2 12 /n 1 22 /n 2

Ejemplo 3.4. Un agente de compras de una compaa est tratando de decidir si


compra la marca A o la marca B de cierto tipo de focos ahorradores de energa. Para
estimar la diferencia entre las dos marcas se lleva a cabo un experimento con dos
muestras aleatorias independientes de 10 focos de cada marca resultando las medias
de vida til respectivas de 1,230 horas y 1,190 horas. Estimar la verdadera diferencia
de las dos medias de vida til, mediante un intervalo de confianza del 95%. Es
acertada la decisin del agente si adquiere cualquiera de las dos marcas?-
Suponga que las dos poblaciones tienen distribucin normal con desviaciones
estndares de 120 y 60 horas.

Solucin.
La estimacin puntual de 1 2 es la diferencia de las medias muestrales:

X 1 X 2 = 1230 - 1190 = 40
12 22 (120) 2 (60) 2
El error estndar de X 1 X 2 es: X X 42.43
1 2
n1 n2 10 10
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 88

Para 1 - = 0.95 se encuentra que Z / 2 Z 0.025 1.96

Los lmites de confianza inferior y superior respectivamente de 1 2 son:

( X 1 X 2 ) Z / 2 12 / n1 22 / n2 40 1.96( 42.43) 40 83.1628

Luego, el intervalo de confianza aproximado del 95% para 1 2 es:

43.16 1 2 123.16

Dado que el valor 0 [-43.16, 123.16], se concluye que 1 2 y que no hay


diferencias significativas entre las medias de las vidas tiles de los focos de las
marcas A y B. Por tanto, el agente de compras puede adquirir cualquiera de las dos
marcas.

3.3.2. Intervalo de confianza para la diferencia entre dos medias: Varianza 12 y


12 desconocidas.

A) Poblaciones no normales.

Si X 1 y X 2 son las medias que resultan de dos muestras aleatorias independientes


de tamaos n1 y n2 seleccionadas respectivamente de dos poblaciones cuyas
distribuciones son no normales con varianzas 12 y 12 desconocidas, entonces,
siempre que los tamaos de las muestras sean (n1 30 y n2 30), los parmetros 1 y
2 se estiman puntualmente por S1 y S2. El intervalo de confianza del (1- ) x 100%
de 1 2 es entonces:

( X 1 X 2 ) Z / 2 S12 / n1 S 22 / n2 1 2 ( X 1 X 2 ) Z / 2 S12 / n1 S 22 / n 2

B) Poblaciones normales.
B1) Varianzas supuestas iguales: 12 22 2

Si X 1 y X 2 son las medias que resultan de dos muestras aleatorias independientes de tamaos n1
y n2 seleccionadas respectivamente de dos poblaciones normales con varianzas 12 y 12
desconocidas e iguales, entonces, el intervalo de confianza del (1- ) x 100% de 1 2 es:

(X1 X 2 ) t /2,n1 n 2 2 Sc 1/n 1 1/n 2 1 2 (X1 X 2 ) t /2,n1 n 2 2 Sc 1/n 1 1/n 2

El valor de t / 2 , n1 n2 2 , se encuentra en la tabla t - student con n1 + n2 - 2 grados de


libertad, tal que P (T t / 2, n1 n2 2 ) / 2 .

El estimador de la varianza comn, S c2 , es definida por:


Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 89

(n1 1) S12 ( n2 1) S 22
S c2
n1 n 2 2

B2) Varianzas supuestas distintas: 12 22

Si X 1 y X 2 son las medias que resultan de dos muestras aleatorias independientes de tamaos n1
y n2 seleccionadas respectivamente de dos poblaciones normales con varianzas 12 y 22
desconocidas pero distintas, entonces, el intervalo de confianza del (1- ) x 100% de 1 2 es:

( X 1 X 2 ) t /2,g S12 /n 1 S 22 /n 2 1 2 ( X 1 X 2 ) t /2,g S12 /n 1 S 22 /n 2

El valor de t1 / 2, g , se encuentra en la tabla t-student con g grados de libertad,


siendo,
2
S12 S 22

g n1 n2 2
2 2
S12 S 22

n1 n2
n1 1 n2 1

Ejemplo 3.5. Se someten a una prueba 95 alumnos de un curso de estadstica para


determinar las diferencias de rendimiento entre hombres y mujeres. Las 50 mujeres
tienen un puntaje medio de 60 con una desviacin estndar de 19 y los 45 hombres,
una media de 66 con una desviacin estndar de 16. Cules son los lmites de
confianza del 99%, para la diferencia entre los puntajes medios de los hombres y
mujeres?

Solucin.
No se conoce la forma de la distribucin de los puntajes obtenidos en el curso de
Estadistica.

Mujeres: n 1 = 50 x1 60 puntos S1 = 19 puntos

Hombres: n 2 = 45 x 2 66 puntos S2 = 16 puntos

Para 1 - = 0.99, se halla: Z 0.005 2.58

Como las muestras son grandes (n1 30 y n2 30), entonces los lmites de confianza
inferior y superior respectivamente de 1 2 son:

S12 S22 19 2 16 2
(X1 X 2 ) Z 0.005 6 (2.58) 6 9.27
n1 n 2 50 45
Por lo tanto, el intervalo de confianza aproximado del 99% para 1 2 es:
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 90

15.27 1 2 3.27

Dado que el valor de cero [-15.27, 9.27], se concluye que 1 2 y que no hay
diferencias significativas entre las medias de los rendimientos (puntajes) entre las
mujeres y hombres en el curso de Estadistica.

Ejemplo 3.6. Una compaa est tratando de decidir cul de los dos tipos de
neumticos A y B va a comprar. Como prueba, compra 8 neumticos de cada marca y
las pone a trabajar regularmente. El registro de duracin de cada tipo de neumtico,
proporciona las estadsticas siguientes:

Marca A: X 1 250 km S1 = 40 km
Marca B X 2 280 km S2 = 30 km

Suponga que los tiempos de duracin de cada tipo de neumtico se distribuyen


normalmente con la misma varianza. Basndose en la construccin de un intervalo de
confianza del 95%, Podra Ud. inferir respecto de cul marca de neumticos
preferira comprar la compaa?-

Solucin. Se supone que las poblaciones de los tiempos de duracin son normales
con varianzas desconocidas supuestamente iguales.
De los resultados muestrales, tenemos:

n1= 8 X 1 250 km S1 = 40 km
n2 = 8 X 2 280 km S2 = 30 km

(n1 1) S12 ( n2 1) S 22 7(40) 2 7(30) 2


Sc 35.3553
n1 n2 2 882

Para 1 - = 0.95 y 14 grados de libertad, se halla: t 0.025, 14 2.145

Los lmites de confianza inferior y superior respectivamente de 1 2 son:

( X 1 X 2 ) t 0.025,14 S c 1 / n1 1 / n 2 30 (2.145)(35.3553) 1 / 8 1 / 8 30 37.9186


Luego, el intervalo de confianza aproximado del 95% para 1 2 es:

67.92 1 2 7.92

Dado que el valor de cero [-67.92, 7.92], se concluye que 1 2 y que no hay
diferencias significativas entre las medias de los tiempos de duracin de las dos
marcas de neumticos. Por tanto, la compaa puede comprar cualquiera de las dos
marcas de neumticos.

Ejercicio. Se lleva a cabo un estudio para comparar el tiempo que tardan hombres y
mujeres para realizar determinada tarea. Las experiencias anteriores indican que la
distribucin de tiempos tanto para hombres como para mujeres es normal con
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 91

varianzas diferentes. Una muestra aleatoria de 9 hombres y 8 mujeres han dado los
siguientes tiempos en minutos:
Hombres: 12, 28, 10, 25, 24, 19, 22, 23, 17
Mujeres: 16, 20, 16, 20, 16, 17, 15, 21
Mediante un intervalo de confianza del 95% para la verdadera diferencia de los
promedios de hombres y mujeres, se puede concluir que los hombres emplean
mayor tiempo que las mujeres para hacer la tarea.

3.4. Intervalo de confianza para una proporcin.


Si p es la proporcin de xitos en una muestra aleatoria de tamao n, entonces, el
intervalo de confianza del (1- ) x 100% para p es:

p (1 p ) p (1 p )
p Z / 2 p p Z / 2
n n

El valor de Z / 2 se halla en la tabla normal N(0,1), de manera que


P( Z z / 2 ) 1 / 2 (o tambin que P ( Z z / 2 ) / 2 ).

Ejemplo 3.7. Una encuestadora utiliza una muestra aleatoria de 600 electores que
acaban de votar y encontr que 240 votaron a favor del candidato A.
a) Estimar el porcentaje de electores a favor de A en toda la poblacin, utilizando
un intervalo de confianza del 95%.
b) Si con la misma muestra la proporcin a favor de B se estima en 38% con una
confianza del 98% que el error no es mayor a 4.62%, Se puede proclamar a A
como ganador?

Solucin.
a) La estimacin puntual de la proporcin p a favor de A en la poblacin, es la
proporcin a su favor en la muestra de n = 600 electores, es decir,
240 / 600 0.40
p

Para 1 - = 0.95 se tiene Z 0.025 1.96

Los lmites de confianza inferior y superior de p son respectivamente:

p (1 p ) (0.4)(0.6)
p Z / 2 0.40 (1.96) 0.4 0.0392
n 600

Luego, el intervalo de confianza aproximado del 95% para p es:

0.3608 p 0.4392

Es decir, p 36.08%, 43.92% con confianza del 95%.


Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 92

b) En este caso el error mximo de estimacin de p es:

p (1 p )
e Z / 2 0.0462
n

Entonces,

El intervalo de confianza del 98% a favor de A es 35.34%, 44.66%


El intervalo de confianza del 98% a favor de B es 33.38%, 42.62%

Dado que la interseccin de los intervalos no es vaci, no se puede proclamar a A


como ganador. En este caso se dice que hay un empate tcnico.

Observacin 1. Si se utiliza el valor previo de p de una muestra preliminar o


piloto, el error mximo de estimacin de p es:

p (1 p )
e Z / 2
n

Entonces dado el error mximo e de la estimacin de p con confianza de (1- ) x


100%, el tamao n de la muestra resulta:

( Z / 2 ) 2 p (1 p )
n
e2

Ejemplo 3.8. Antes de una eleccin presidencial, un determinado partido poltico


est interesado en estimar la proporcin de electores favorables a su candidato. Una
muestra piloto de 100 electores revel que 60% de los electores eran favorables al
candidato en cuestin.
a) Determine el tamao de muestra necesario para que el error cometido en la
estimacin, sea a lo ms 0.02 con probabilidad de 0.90
b) Si, en la muestra final (con tamao igual al obtenido en (a), se observ que 55%
de los electores eran favorables al candidato en cuestin, construya un intervalo
de confianza para la proporcin p.
Solucin.
a) El estimador puntual de p es 0.60 .
p

Para 1- = 0.90 se tiene Z / 2 Z 0.05 1.645 . Luego, se tiene una confianza de


90% que el error al estimar p no ser mayor que 0.02 si el tamao de la muestra
es:
(1.645) 2 (0.6)(0.4)
n 1623.615 1624 electores
(0.02) 2

b) Respuesta [0.55447, 0.56553]


Observacin 2. Si el muestreo es sin reemplazo en una poblacin finita de tamao
N, entonces el valor del tamao de la muestra n se calcula por:
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 93

( Z / 2 ) 2 p (1 p )N
n
( Z / 2 ) 2 p (1 p ) e 2 ( N 1)

Si se desconoce p , se puede utilizar el valor de 0. 5 .


p

Ejemplo 3.9. Una empresa va a hacer un estudio de mercado antes de lanzar un


nuevo producto hacia una poblacin de 30,000 consumidores.
Qu tamao de muestra deber escoger si quiere tener una confianza del 95% de
que el error de la estimacin de la proporcin a favor del producto no sea superior al
4%?

Solucin.
Para 1- = 0.95 resulta Z / 2 Z 0.025 1.96 .

Utilizando el valor p (1 p ) 1 / 4 y N = 30, 000 se tiene:

( Z / 2 ) 2 p (1 p )N (1.96) 2 (0.25)(30,000)
n 588.49 589
( Z / 2 ) 2 p (1 p ) e 2 ( N 1) (1.96) 2 (0.25) (0.04) 2 (30,000 1)

3.5. Intervalo de confianza para la diferencia entre dos proporciones.

Si p1 y p 2 son las proporciones de xitos en dos muestras aleatorias


independientes de tamaos n1 y n2 respectivamente, entonces, el intervalo de
confianza del (1- ) x 100% de p1 p 2 es

p 1 (1 p 1 ) p 2 (1 p 2 ) p 1 (1 p 1 ) p 2 (1 p 2 )
( p 1 p 2 ) Z / 2 p1 p 2 ( p 1 p 2 ) Z / 2
n1 n2 n1 n2

El valor de Z / 2 se halla en la tabla normal N(0,1), de manera que


P ( Z z / 2 ) / 2 .

Ejemplo 3.10. Un fabricante afirma que su nuevo producto de consumo popular


prefieren ms los hombres que las mujeres. Para comprobar tal afirmacin, se toma
una muestra aleatoria de 250 hombres y otra de 200 mujeres, y se encuentra que 175
hombres y 120 mujeres prefieren el nuevo producto. Utilizando un intervalo de
confianza del 95% para la verdadera diferencia de proporciones de preferencias entre
los hombres y mujeres, se puede concluir que el fabricante del nuevo producto tiene
la razn?

Solucin.
175 120
De los datos del problema se obtiene: p 1 0.7 p 2 0.6
250 200
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 94

La estimacin puntual del parmetro p1 p 2 , es la diferencia de proporciones


muestrales: p 1 p 2 0.1

El error estndar de la diferencia de proporciones, p 1 p 2 es:

p 1 (1 p 1 ) p 2 (1 p 2 ) (0.7)(0.3) (0.6)(0.4)
p1 p 2 0.045
n1 n2 250 200

Para 1- = 0.95, se tiene Z 1 / 2 Z 0.975 1.96 .

Luego,
p 1 (1 p 1 ) p 2 (1 p 2 )
( p 1 p 2 ) Z 1 / 2 0.1 (1.96)(0.045) 0.1 0.0882
n1 n2

En consecuencia, el intervalo de confianza del 95% para p1 p 2 es

0.0118 p1 p 2 0.1882

Dado que el intervalo no contiene al valor cero, debemos concluir que las
proporciones de preferencias en la poblacin son diferentes, esto es, p1 p 2 y dado
que el intervalo contiene valores positivos, hay razones para concluir que p1 p 2 , es
decir que su nuevo producto de consumo popular prefieren ms los hombres que las
mujeres.

Ejercicio. En una universidad de Lima se toma una muestra aleatoria de 600


mujeres, 300 de las cuales indican que estn a favor de la supresin de los exmenes
preparatorios y la sustentacin de tesis en pblico. En una muestra de 400 hombres,
240 indican que estn a favor de lo mismo.
Construya un intervalo de confianza del 95%, para la diferencia en las proporciones
de todas las alumnas y alumnos, que estn a favor de la supresin de los
preparatorios y sustentacin. Se puede concluir que existen diferencias entre las
proporciones? Se puede inferir que la los hombres estn ms a favor supresin de los
exmenes preparatorios y la sustentacin de tesis en pblico.

3.6. Hiptesis estadsticas.


Se denomina hiptesis estadstica a cualquier afirmacin o conjetura que se hace
acerca de la distribucin de una o ms poblaciones. La afirmacin puede referirse
bien a la forma o tipo de distribucin de probabilidad de la poblacin o bien referirse
al valor o valores de uno o ms parmetros de la distribucin conocida su forma. En
las aplicaciones, se supone conocida la forma de la distribucin de la poblacin. En
este caso, las hiptesis estadsticas consisten en suponer que los parmetros, que
definen a la poblacin, toman determinados valores numricos.
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 95

3.6.1. Prueba de hiptesis.

La prueba de hiptesis, denominada tambin prueba de significacin, tiene como


objetivo principal evaluar suposiciones o afirmaciones acerca de la forma o tipo de
distribucin de la poblacin o de los valores de uno o ms parmetros de la
distribucin conocida su forma.

Cuando se hace indispensable tomar una decisin sobre la validez de la


representacin en una poblacin, con base en los resultados obtenidos a travs de una
muestra, se dice que se toman decisiones estadsticas. Para tomar una decisin es
necesario, ante todo plantear posibilidades acerca de la caracterstica o caractersticas
a estudiar en una poblacin determinada. La suposicin puede ser cierta o falsa. Estas
suposiciones se llaman hiptesis estadsticas.

Hiptesis estadsticas: es un supuesto acerca de un parmetro o de algn valor


estadstico de una poblacin. Con esta definicin, encontramos que no todas las
hiptesis son hiptesis estadsticas. Se debe tomar con referencia a un parmetro, ya
sea una media aritmetica, una proporcin (porcentaje), varianza, etc., para que sea
hiptesis estadstica.

Son hiptesis estadsticas, por ejemplo:

1. El promedio poblacional de la altura de los peruanos es 1.65 metros, esto es,


1.65 .
2. La proporcin de unidades defectuosas de produccin por cierto proceso es
menor o igual a 0.08, esto es, P 0.08.
3. La varianza poblacional de los salarios de obreros de la industria textil es 1800
soles al cuadrado, es decir, 2 1800 .
4. La distribucin de los pesos de los alumnos de la Universidad Nacional de Piura
es normal.
5. El nmero de llegada de los navos al puerto de Paita tiene distribucin de
Poisson.

3.6.2. Hiptesis nula y alternativa.

Se denomina hiptesis nula y se representa por H0, a la hiptesis que es aceptada


provisionalmente como verdadera y cuya validez ser sometida a comprobacin
experimental. Los resultados experimentales nos permitirn seguir aceptndola como
verdadera o si, por el contrario, debemos rechazarla como tal.

Se denomina hiptesis alternativa y se representa por H1 o por Ha, a la hiptesis que


se acepta en caso de que la hiptesis nula H 0 sea rechazada. La hiptesis alternativa
H1, es pues una suposicin contraria a la hiptesis nula.

Si se asume que 0 es un valor del parmetro desconocido de una poblacin cuya


distribucin se supone conocida, entonces son hiptesis nulas y alternativas
respectivamente las siguientes afirmaciones:

1) H0 : = 0 , y H1 : 0
2) H0 : 0 , y H1 : > 0
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 96

3) H0 : 0 , y H1 : < 0

3.6.3 Tipos de prueba de hiptesis.

El tipo de prueba depende bsicamente de la hiptesis alternativa H1. Se denomina


prueba de una cola a toda hiptesis donde la alternativa H1 es unilateral. Si la
alternativa H1 es bilateral, la prueba se denomina prueba de dos colas.

H0 : = 0 contra H1 : 0 se denomina prueba bilateral o de dos colas.

H0 : 0 , y H1 : > 0 se denomina prueba unilateral de cola a la derecha.

H0 : 0 , y H1 : < 0 se denomina prueba unilateral de cola a la izquierda.

3.6.4. Errores tipo I y tipo II.

Al tomar la decisin de aceptar o rechazar la hiptesis nula H0 : = 0 en base a los


resultados obtenidos de una muestra aleatoria seleccionada de la poblacin en
estudio; hay cuatro posibles situaciones que determinan si la decisin tomada es
correcta o incorrecta, como se muestra en la tabla 1.1.

Definicin 1. Se denomina error tipo I o error de primera especie, al error que se


comete al rechazar una hiptesis nula H0 cuando se ha debido aceptar.

La probabilidad de cometer un error tipo I se denota por . Entonces,

= P[error tipo I] = P[rechazar H0 cuando H0 es verdadera]

Definicin 2. Se denomina error tipo II o error de segunda especie, al error que se


comete al aceptar una hiptesis nula H0 cuando se ha debido rechazar.

La probabilidad de cometer un error tipo II se denota por . Entonces,

= P[error tipo II] = P[rechazar H0 cuando H0 es falsa]

Tabla 3.1.

H0 verdadera H0 falsa
Decisiones

Aceptar H0 Decisin correcta. Error tipo II


Probabilidad: 1 - Probabilidad:

Rechazar H0 Error tipo I Decisin correcta.


Probabilidad: Probabilidad: 1 -

Ejemplo 3.11. Lo ms indicado y utilizado para comprender mejor lo anterior, es el


siguiente ejemplo: supongamos que se detiene a una persona por robo y se le enva al
juez quin podr declararlo inocente o culpable. Al juez se le presentan los pro y los
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 97

contra y, con base en toda la informacin, decide dejarlo libre o condenarlo. El juez,
no sabr si hubo error en su decisin, slo lo podr saber la persona que ha sido
juzgada.

Si lo deja libre y el acusado es culpable se estar cometiendo un error tipo II, si por el
contrario, lo condena siendo inocente, tambin se estar cometiendo error tipo I;
hasta ah va nuestra decisin: aceptar o rechazar pero no sabemos exactamente el
error cometido, solo sabemos que se puede cometer. Un comentario adicional: para la
sociedad cul de las decisiones es la mejor? Qu opina usted?

Tabla 3.2. Decisiones a tomar

Persona juzgada
Decisiones

Del juez Inocente Culpable

Libre Decisin correcta. Error

Condenado Error Decisin correcta.

Definicin 3. Se denomina nivel de significancia de una prueba de hiptesis a la


probabilidad de cometer un error tipo I. El nivel de significancia se fija previamente
por lo general en = 0.05 o = 0.01.

3.6.5. Procedimiento de la prueba de hiptesis.

El procedimiento general de la prueba de una hiptesis de parmetro se resume en


los siguientes pasos:
1) Formular la hiptesis nula H0 : = 0 y la hiptesis alternativa adecuada,

H1 : 0 H1 : > 0 H1 : < 0

2) Especificar el tamao del nivel de significancia.

3) Seleccionar la estadstica apropiada a usar en la prueba.


4) Determinar los valores crticos y sus regiones de rechazo.

5) Calcular el valor del estadstico de la prueba a partir de los datos de la


muestra.

6) Tomar la decisin estadstica de rechazar la hiptesis H0 si el valor del


estadstico de la prueba est en la regin critica. En caso contrario, no
rechazar H0.

3.6.6. Prueba de hiptesis acerca de una media.


Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 98

3.6.6.1. Prueba de hiptesis acerca de una media, con varianza 2 conocida.


Sea X la media de una muestra aleatoria de tamao n seleccionada de una
poblacin con media y varianza 2 supuestamente conocida.

Si la poblacin es normal N(, 2 ), entonces, la distribucin de la estadstica X


es exactamente N(, 2 / n ) para cualquier valor de n (n 2).

Si la poblacin no es normal, pero el tamao de la muestra n es suficientemente


grande (n 30 ), entonces, la distribucin de X es aproximadamente normal
N(, 2 / n ).

X 0
Como consecuencia segn sea el caso, la estadstica: Z se distribuye
/ n
exactamente o aproximadamente como una normal estndar N(0,1).

Si se supone verdadera la hiptesis nula H 0 : = 0 , la estadstica especificada


por la hiptesis es entonces, ahora:
X 0
Z
/ n

1. Prueba unilateral de cola a la derecha.

1. Hiptesis: H0 : = 0 contra H1 : > 0

2. Nivel de significancia: (0 < < 1)

X 0
3. Estadstica de prueba: Z
/ n

4. Regin crtica: La regin critica en el rango de variacin de z es:

R.C Z / Z Z

Z
0 z1-

Aceptar H0 Aceptar H1

Figura 3.2. Regin critica cola a la derecha en escala Z.


Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 99

X 0
5. Decisin conclusin: Si el valor de Z > Z , se rechazara H0 al nivel
/ n
de significancia . No se rechazara en caso contrario.

2) Prueba unilateral de cola a la izquierda.

1. Hiptesis: H0 : = 0 contra H1 : < 0

2. Nivel de significancia:
X 0
3. Estadstica de prueba: Z
/ n

4. Regin crtica: La regin crtica en el rango de variacin de z es:


R.C Z - Z

Z
- z1- 0

Rechazar H0 Aceptar H1

Figura 3.3. Regin critica cola a la izquierda en escala Z.

3) Prueba bilateral o de dos colas.

En este caso las Hiptesis son: H0: = 0 contra H1: 0

La regin crtica es: R.C Z - Z / 2 Z Z /2

Z
- z1-/2 0 z1-/2

Rechazar H0 Aceptar H0 Rechazar H0

Figura 3.4. Regin critica bilateral en escalas Z.


Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 100

Ejemplo 3.12. En un test de psicologa se sabe por experiencia pasadas que tiene una
puntuacin media de 78 puntos y una desviacin estndar de 6 puntos. Se seleccion
al azar un grupo de 16 estudiantes siendo su puntuacin de 80 puntos. Puede
afirmarse al nivel de significancia del 1% que la puntuacin de este grupo fue
superior? Suponga que la poblacin de los puntajes del test se distribuye como un
normal.
Solucin.

Sea X la variable aleatoria que se representa el puntaje obtenido en el test


psicologico.

1. Hiptesis: H 0 : = 78
H 1 : > 78

2. Nivel de significancia: = 0.01

3. Estadstica de prueba: Como la poblacin de los puntajes obtenidos en el test es


normal, N(78, 62 ), la estadstica apropiada es:

X 0
Z ~ N(0, 1)
/ n

4. Regin critica: Para = 0.01 y la alternativa unilateral de cola a la derecha, en la


distribucin de z, se encuentra el valor critico.

Z = Z 0.01 = 2.33

= 0.01

Z
0 2.33
Luego la regin critica en la variable Z es: R.C = { Z > 2.33 }

5. Clculos: De la muestra se tiene X 80 , entonces el valor de Z es:

X 0 80 78
Z 1.33
/ n 6 / 16

6. Decisin. Dado que el valor Z = 1.33 R.C, no debemos rechazar H0 y concluir


que la puntuacin promedio en el test de psicologa para este grupo de estudiantes no
es superior.

Ejemplo 3.13. Al estudiar si conviene tener o no una sucursal en la ciudad de


Sullana, la gerencia de una gran tienda comercial de Lima, establece el siguiente
criterio para tomar una decisin.: Abrir la sucursal slo si el ingresos promedio es no
menos de S/ 1,500 y no abrirla en caso contrario.
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 101

Si una muestra aleatoria de 100 ingresos familiares de esa ciudad a dado una media
de S/ 1,440. cual es la decisin a tomar al nivel de significancia del 5%?.

Suponga que la distribucin de los ingresos tiene una desviacin estndar igual a 240
nuevos soles.

Solucin.
Sea X la variable aleatoria que representa los ingresos familiares mensuales de los
pobladores de Sullana.

1. Hiptesis: H0 : = 1500 ( H0 : 1500 ) (se abre la sucursal)

H1: < 1500 ( no se abre la sucursal)

2. Nivel de significancia: = 0.05

3. Estadstica de prueba: como la poblacin de los ingresos no se conoce, pero


como el tamao de muestra, n = 100 es grande, entonces la estadstica
apropiada a utilizar es:

X 0
Z
/ n

cuya distribucin es aproximadamente normal N(0,1).

4. Regin critica: Si se supone verdadera la hiptesis nula H0 : = 1500, para


= 0.05 y la alternativa unilateral de cola a la izquierda, en la distribucin de
Z, se encuentra el valor critico:

Z = Z 0.05 = -1.645

= 0.05

z 0.05 = -1.645 0 Z
Luego la regin critica en la variable de Z es : R.C Z - 1.645
5. Clculos: De la muestra n = 100, se obtiene X 1440 soles, entonces:
X 1440

X 0 1440 1500
Z 2.5
/ n 240/ 100

6.- Decisin.- Dado que Z = -2.5 R.C, debemos rechazar H 0 y concluir con no
abrir la sucursal en Sullana.

NOTA.(Mtodo del valor P de la prueba)


Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 102

Otra forma de establecer la regla de decisin, es calculando el valor de P, a partir del


valor absoluto de Zk= ( Z k (X 0 )/(/ n ) , que se obtiene de la muestra, de
manera que:
a) P = P(Z > zk) (cola a la izquierda)
b) P = P(Z < zk) (cola a la derecha)
c) P = P(Z < - zk) + P(Z > zk) = 2P(Z > zk ) (para dos colas)

Si el valor de P < , entonces, se rechazar H 0. No se rechazar H 0, en caso


contrario.

Los programas estadsticos (Statgraphics, SPSS, Minitac, entre otros) contienen el


mtodo del valor P en las pruebas de hiptesis.

En el ejemplo 1.2, el valor absoluto de Zk es igual a 2.5, entonces,

P P(Z 2.5) P(Z 2.5) 0.5 P(0 Z 2.5) 0.0062

Dado que P = 0.0062 < = 0.05, se debe rechazar H 0 , al nivel de significancia =


0.05 y que este valor de Z k slo ocurrir en 62 casos de 10,000 experimentos. Una
regin critica de tamao 0.0062 es muy pequea y, por tanto, es poco probable
que se cometa error tipo I.

3.6.6.2. Prueba de hiptesis acerca de una media, con varianza 2 desconocida.

A) Poblacin no normal.

Si la poblacin no tiene distribucin normal y si la varianza es desconocida, para


probar hiptesis acerca de la media , slo si, el tamao de la muestra es grande
(n 30), se utiliza la estadstica:

X 0
Z cuya distribucin es aproximadamente N (0,1).
S/ n

Luego, las regiones criticas de las pruebas de H 0: = 0 contra las alternativas


respectivas H1: 0 H1: > 0 H1: < 0 son las mismas (aproximadamente
de la seccin anterior).

B) Poblacin normal.

Si la poblacin tiene distribucin normal N ( , 2 ) , donde y 2 son


desconocidas, para n 30 la estadstica de prueba acerca de la media es:

X 0
T ~ t ( n 1)
S/ n
1) Prueba bilateral o de dos colas.
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 103

1. Hiptesis: H0 : = 0 contra H1 : 0

2. Nivel de significancia: ( 0 < < 1)


X 0
3. Estadstica de prueba: T
S/ n
4. Regin critica: la regin critica en el rango de variacin de t es:

R.C { T t (/2 ,n 1) T t (/2, ,n 1) }

/2 /2

t
- t1-/2 0 t1-/2

Rechazar H0 Aceptar H0 Rechazar H0

Figura 3.5. Regin critica bilateral en escala t.

5. Decisin. Se rechazar H0 con riesgo , si el valor de t R.C. No se rechazar H0


en caso contrario.

2) Prueba unilateral de cola a la derecha.

En este caso las hiptesis son H0 : = 0 contra H0 : > 0

La regin critica en el rango de variacin de T es: R.C = {T > t (, n-1)}

t
0 t
Aceptar H0 Rechazar H0

Figura 3.6. Regin critica cola a la derecha en escala t.

3) Prueba unilateral de cola a la izquierda.

En este caso las hiptesis son H0 : = 0 contra H0 : < 0

La regin critica en el rango de variacin de T es: R.C = {T < - t (, n-1)}


Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 104

t
- t 0

Rechazar H0 Aceptar H0

Figura 3.7. Regin critica cola a la izquierda en escala t.

Ejemplo 3.14. Los siguientes nmeros son las notas promocionales de 15 estudiantes
de la asignatura de Estadstica aplicada a la educacin.

13 , 08, 10, 12, 15, 07, 16, 09, 14, 11, 08, 11, 17, 13, 11

Suponiendo que la poblacin de notas promocionales est normalmente distribuida,


pruebe la hiptesis de que la nota promedio promocional es de 12 puntos frente a la
alternativa de que es diferente, al nivel de significacin del 5%.

Solucin.
Sea variable aleatoria X: notas promocionales obtenidas por los alumnos en la
asignatura de Estadstica aplicada. Se supone que la distribucin de X es normal con
media = 12 y varianza 2 desconocida.
1. Hiptesis: H 0: = 12
H 1: 12

2. Nivel de significancia: = 0.05

3) Estadstica de prueba: Poblacin normal, con varianza desconocida y muestra


pequea n =15 < 30, emplearemos la siguiente estadstica de prueba:

X 12
T
S/ n
que se distribuye segn una
distribucin t- Student con 14 grados de libertad.

4) Regin critica: Con el nivel de significancia = 0.05 y para una prueba de


hiptesis bilateral o de dos colas, en la tabla de probabilidades t- Student se
encuentra el valor de t(/2, n-1) = t(0.025, 14) = 2.145.

Consecuentemente, la regin critica es: R.C = { T <-2.145 o T >2.145 }

5) Clculos: De los datos de la muestra encontramos:

n = 15 , X 11.6667 , s 2 9.09524 s= 3.0158

X 12 11 .6667 12
T 0.4280
S/ n 3.0158 / 15
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 105

6) Decisin: Dado que el valor T = -0.4280 R.C, debemos aceptar H0 y concluir


que la nota promedio promocional sigue siendo de 12 puntos.

Nota. Mediante la aplicacin del software SPSS 17 se obtiene el siguiente resultado:

Prueba T
Estadsticos para una muestra

Desviacin Error tp. de


N Media tp. la media
Notas promocionales 15 11.67 3.016 .779

Prueba para una muestra

Valor de prueba = 12
95% Intervalo de
confianza para la
Diferencia diferencia
t gl Sig. (bilateral) de medias Inferior Superior
Notas promocionales -.428 14 .675 -.333 -2.00 1.34

Como el P-valor de la prueba es 0.675, es decir, p = 2*P(T>0.428)= 2(0.337581) =


0.6751, es mayor que = 0.05 no se rechaza H 0.

3.6.7. Prueba de hiptesis acerca de dos medias.

Esta prueba est indicada en aquellos casos cuando se quiere establecer si la


diferencia entre dos medias muestrales, extradas de dos poblaciones independientes,
son significativamente o si una media es mayor o menor que la otra.

3.6.7.1. Prueba de hiptesis acerca de dos medias con varianzas 12 y 22


supuestamente conocidas.

Sean X 1 y X 2 las medias de dos muestras aleatorias independientes de tamaos n 1


y n2 seleccionadas respectivamente de dos poblaciones independientes, con medias 1
y 2 y varianzas 12 y 22 respectivas supuestamente conocidas.

Si las dos poblaciones son normales, entonces las estadsticas:

X 1 ~ N( 1 , 12 /n 1 ) y X 2 ~ N( 2 , 22 /n 2 )

Luego la estadstica X1 - X 2 ~ N( 1 - 2 , 12 /n 1 22 /n 2 ) .

Si las dos poblaciones no son normales, pero n1 y n2 son suficientemente


grandes (n1 30 y n2 30), entonces:

X1 - X 2 N( 1 - 2 , 12 /n 1 22 /n 2 )
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 106

Luego, segn sean las dos poblaciones normales o no, la estadstica:

X1 X 2 ( 1 2 )
Z
12 22

n1 n 2

tiene distribucin exactamente o aproximadamente norma N (0,1).

Si se supone verdadera la hiptesis nula H0 : 1= 2 H0 : 1 - 2 = 0, la estadstica


de prueba es:

X1 X 2
Z ~ N(0, 1)
12 22

n1 n 2

El valor obtenido de Z, se utiliza para probar H 0 contra cualquiera de las hiptesis


alternativas H0 : 1 2 , H0 : 1 > 2 H0 : 1 < 2.

1) Prueba unilateral de cola a la derecha.

1) Hiptesis: H0 : 1 = 2 contra H1 : 1 > 2

2) Nivel de significancia:

X1 X 2
Z
3) Estadstica de prueba: 12 22

n1 n 2

4) Regin crtica: En el rango de variacin de Z es: R.C = { Z > Z }

Z
0 Z1-

Aceptar H0 Rechazar H0

Figura 3.8. Regin critica cola a la derecha en escalas Z


5) Decisin: Se rechazar H0, si el valor de Z R.C. No se rechazar H 0 en caso
contrario.
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 107

2) Prueba unilateral de cola a la izquierda.

Las Hiptesis son: H0 : 1 = 2 contra H1 : 1 < 2

La regin crtica en los valores de Z es:

R.C = {Z < - Z }

3) Prueba bilateral o de dos colas.

En este caso las Hiptesis son: H0 : 1 = 2 contra H1 : 1 2

La regin crtica en el rango de variacin de Z es:

R.C = {Z < - Z/2 Z > Z/2 }

Ejemplo 3.15. Un fabricante quiere comparar dos marcas de maquinas, A y B; para


fabricar un tipo de articulo. Observa dos muestras aleatorias de 60 artculos
procesados por A y B respectivamente y encuentra que las medias de proceso
respectivas son 1230 y 1190 segundos. Suponga que 1 = 120 segundos y 2 = 90
segundos.
Al nivel de significancia del 5%, se puede inferir que la maquina B es ms rpida
que la mquina A?-

Solucin.
Sean X1 y X2 los tiempos de proceso con las maquinas A y B respectivamente y 1 y
2 sus medias respectivas.
Se desconocen las distribuciones de probabilidad de X 1 y X2, pero las muestras son
grandes.

1) Hiptesis : H0 : 1 = 2 contra H1 : 1 > 2

2) Nivel de significancia: = 0.05

3) Estadstica de prueba : Si se supone verdadera H0 : 1 = 2 y para muestras


grandes n1 = 60 y n2 = 60, la estadstica apropiada es:

X1 X 2
Z N(0, 1)
12 22

n1 n 2

4) Regin critica: En el rango de variacin de Z es: R.C = { Z > 1.645 }

= 0.05
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 108

Z
0 Z0.95=1.645

5) Clculos . De los datos se tiene:

n1 = n2 = 60 X1 1230 y X 2 1190 1 120 y 2 90

Luego,
1230 - 1190 40
Z 2.0655
(120) 2
(90) 2 19.365

60 60

6) Decisin. Como el valor de Z = 2.0655 R.C, debemos rechazar H0 y


concluir que la maquina B utiliza menor tiempo en el proceso de fabricacin
para dicho tipo de articulo.

3.6.7.2. Prueba de hiptesis acerca de dos medias con Varianzas 12 y 22


supuestamente desconocidas.

A) Poblaciones no normales

Si las dos muestras aleatorias n1 y n2 independientes seleccionan respectivamente de


dos poblaciones cuyas distribuciones son no normales con varianzas 12 y 22
supuestas desconocidas, entonces, siempre que los tamaos de las muestras sean
grandes: n1 30 y n2 30, las varianzas 12 y 22 se estiman por S12 y S 22 . En este
caso, para probar la hiptesis H0 : 1 2 = 0 se utiliza la estadstica:

X1 X 2
Z N(0,1)
S12 S 22

n1 n 2

B) Poblaciones normales

Sean X 1 y X 2 las medias y S12 y S 22 las varianzas de dos muestras aleatorias


independientes de tamaos n1 y n2 respectivamente, seleccionadas de dos poblaciones
N( 1 , 12 ) y N( 2 , 22 ) donde 1, 2, 12 y 22 son desconocidas.

B1) Varianza desconocidas supuestamente iguales ( 12 22 2 ).

1) Prueba unilateral de cola a la derecha

Hiptesis: H0: 1 = 2 ( H0 : 1 - 2 = 0)
H1: 1 > 2 ( H1 : 1 - 2 > 0)
Si la prueba nula H0 es verdadera y si las poblaciones son normales con varianzas
desconocidas supuestas iguales, entonces la estadstica de prueba es:
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 109

X1 X 2 X1 X 2
T
Sc2 Sc2 1 1
Sc
n1 n 2 n1 n 2

que tiene distribucin t- Student con n1 + n2 2 grados de libertad.


2
Donde Sc el estimador insesgado de la varianza comn 2 es:

(n 1 1)S12 (n 2 1)S22
S c2
n1 n 2 2

La regin critica en el rango de variacin de T es: R.C T t ( , n1 n 2 2)

T
0 t

Aceptar H0 Rechazar H0

Figura 3.9. Regin critica cola a la derecha en T.

2) Prueba unilateral de cola a la izquierda.

Las hiptesis son H0 : 1 = 2 contra H1 : 1 < 2

La regin critica en este caso ser:


R.C T t ( , n1 n 2 2)
Rechazar H0 si el valor de T R.C. No rechazar H0 en caso contrario.

3) Prueba bilateral o de dos colas.

Las hiptesis son H0 : 1 = 2 contra H1 : 1 2

La regin critica en este caso ser:



R.C T t (/2, , n1 n 2 2) T t (/2, , n1 n 2 2)
Rechazar H0 si el valor de T R.C.

B2) Varianza desconocidas supuestamente distintas ( 12 22 ) .


Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 110

Si las varianzas de las dos poblaciones normales independientes son desconocidas


supuestamente diferentes, entonces la estadstica.

(X1 X 2 ) ( 1 2 )
T ~ t
S12 S 22 (g)

n1 n 2

siendo el grado de libertad g dado por:

2
S12 S22
n n
si g no es entero, se aproxima g 12 2 2
al entero mayor ms cercano. S12 S22
n n
Si la hiptesis nula H 0 : 1 = 1 2
2 se supone verdadera, n1 1 n 2 1
entonces

( X1 X 2 )
T ~ t
S1 S2 2 2 (g)
El valor del estadstico T se
utiliza para probar H0 contra n1 n 2
cualquiera de las hiptesis
alternativas H1 : 1 2 H1 : 1 > 2 H1 : 1 < 2 , las regiones criticas y las
reglas de decisin son similares a los del caso B1.

Ejemplo 3.16. Supongamos que una empresa desarroll un curso de entrenamiento


para sus tcnicos, formando dos grupos y aplicando mtodos distintos de
entrenamiento. Los dos grupos se consideran homogneos en capacidad. El primer
grupo lo componen 36 tcnicos que obtuvieron un puntaje de 6 (en una escala de 0 a
10 puntos) y una desviacin estndar de 4 puntos y el segundo grupo de 40 tcnicos
cuyo promedio fue 8.2 y desviacin estndar de 4.3 puntos.Se puede concluir que el
mtodo aplicado al segundo grupo fue superior al primero? Use un nivel
significancia del 1%

Solucin.
Sean X1 y X2 las variables aleatorias que representan los puntajes obtenidos por los
tcnicos con los mtodos de entrenamiento 1 y 2 respectivamente.

1) Hiptesis: H0 : 1 = 2 contra H1 : 1 < 2

2) Nivel de significancia: =0.01


3) Estadstica de prueba: Si se supone H0 verdadera y dado que los tamaos de las
muestras (n1 = 36 y n2 = 40) son grandes, entonces la estadstica de prueba a
utilizar es:
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 111

X1 X 2
Z N(0,1)
S12 S 22

n1 n 2

4) Regin critica: Para = 0.05 y una prueba de hiptesis unilateral hacia la


izquierda, en la distribucin N(0,1) se encuentra Z 0.01 = 2.33. La regin critica en
la variacin de Z es:
R.C = { Z / Z <- 2.33}

5) Clculos: de los datos se tiene:

n1 = 36, X 1 6 , S1 = 4 n2 = 40, X 2 8.2 , S2 = 4.3

Entonces,
X1 X 2 6 - 8.2 - 2.2
Z - 2.31
2
S S 2 2
(4) (4.3) 2 0.9522

1 2

n1 n 2 36 40

6) Decisin: Como Z = -2.31 R.C, no debemos rechazar la hiptesis H0 y


llegamos a la conclusin de que no existe una diferencia significativa que permita
conluir que el mtodo aplicado al segundo grupo fue superior al del primer grupo
al nivel del 1%.

Nota. Con el mtodo del P-valor para la prueba de dos muestras se obtiene: P(Z<-
2.31) = 0.0104. Dado que p = 0.0104 > 0.01 no se debe rechazar H 0 en una prueba
unilateral.

Ejemplo 3.17. Las calificaciones promocionales obtenidas a travs de dos muestras a


estudiantes de los turnos diurno y nocturno, respectivamente fueron:
Diurno 14.0 16.8 15.2 14.4 16.0 14.4 16.8 19.2 16.0 14.4
Nocturno 12.8 14.4 13.6 15.2 16.0 12.8 14.4 13.6

A un nivel = 0.05, Los anteriores resultados, permiten concluir que hay una
diferencia en el rendimiento diurno y nocturno?. Suponer que las calificaciones se
distribuyen como una normal con varianzas poblacionales desconocidas, pero iguales
(es decir, 12 22 ).

Solucin.
Sean X1 y X2 las variables aleatorias que representan los nmeros de cuentas nuevas
de las ejecutivas y ejecutivos respectivamente.
Se sabe que X 1 ~ N( 1 , 12 ) y X 2 ~ N( 2 , 22 ) , donde las varianzas 12 y
22 son desconocidas, pero iguales.
Realizaremos el contraste de medias de poblaciones normales con varianzas
desconocidas pero iguales y muestras pequeas.

1) Hiptesis: H0: 1 = 2 contra H1: 1 2


Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 112

2) Nivel de significancia: =0.05

3) Estadstica de prueba: Si se supone H0 verdadera y dado que los varianzas


poblacionales son iguales, la estadstica de prueba es:

X1 X 2 X1 X 2
T
S c2 S c2 1 1
Sc
n1 n 2 n1 n2

que se distribuye segn una t- Student con n1 + n2 2 =16 grados de libertad.

4) Regin critica: Para = 0.05 y una prueba de hiptesis bilateral, en la distribucin


t(16) se encuentra t(0.025, 16) = 2.12. La regin crtica en la variacin de T es:

R.C = {T <-2.12 T > 2.12}

5).Clculos: de los datos se tiene:

n1 = 10, X 1 15.72 , S12 2.5619 n2 = 8, X 2 14.1 , S 22 1.2685

(n 1 1) S12 (n 2 1) S 22 9(2.5619) 7(1.2685)


Sc 1.4128
n1 n 2 2 16

entonces,
X1 X 2 15.72 - 14.1 1.62
T 2.41737
1 1 1 1 0.67015
Sc (1.4128)
n1 n 2 10 8

6) Decisin: Como T = 2.41737 R.C, debemos rechazar la hiptesis H0 al nivel


del 5% y concluir que hay diferencias en el rendimiento.

Nota. Con el Software SPSS 17 para la comparacin de dos muestras se obtiene:


p-valor = 2 x P(T >2.41737) = 0.028. Dado que p = 0.028 < 0.05 se debe rechazar H0
en una prueba bilateral.

Prueba T
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 113

Estadsticos de grupo

Desviacin Error tp. de


Turno N Media tp. la media
Calificaciones Diurno 10 15.720 1.6006 .5061
promocionales Nocturno 8 14.100 1.1263 .3982

Prueba de muestras independientes

Prueba de
Levene para la
igualdad de
varianzas Prueba T para la igualdad de medias
95% Intervalo de
confianza para la
Sig. Diferencia Error tp. de diferencia
F Sig. t gl (bilateral) de medias la diferencia Inferior Superior
Calificaciones Se han
promocionales asumido
varianzas .816 .380 2.42 16 .028 1.6200 .6701 .1993 3.0407
iguales

3.6.8. Prueba de hiptesis acerca de una proporcin.

Sean X1, X2, ..., Xn una muestra escogida de una poblacin Bernoulli B(1, p), donde
p es la proporcin de xitos en la poblacin.

Sea
X 1 X 2 ... X n X
p
n n

la proporcin de xitos en la muestra, siendo X el nmero de xitos en la muestra.


La estadstica X tiene distribucin exactamente binomial B(n, p).

Si n es suficientemente grande (n 30), la estadstica

X np p p
Z N (0, 1)
np(1 p) p(1 p) / n

Si se supone verdadera la hiptesis nula H 0 : p = p0 , entonces, la distribucin


muestral de la variable aleatoria

X np0 p p 0
Z N (0, 1)
np0 (1 p 0 ) p 0 (1 p 0 ) / n

Dado el nivel de significancia , la prueba de la hiptesis nula H0 : p = p0 , contra


cualquiera de las alternativas H1 : p p0 H1 : p > p0 H1 : p < p0 se basa en la
estadstica Z.
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 114

1). Prueba bilateral. (Muestra grande)

La prueba es, H0 : p = p0 contra H1 : p p0

Luego, la regin critica en los valores de Z es el intervalo:

R.C { Z Z /2 Z Z /2 }

X np 0 p p 0
Se rechaza H0 si el valor de Z
np0 (1 p 0 )

p 0 (1 p0 ) / n
R.C. No se

rechazar en caso contrario.

2). Prueba unilateral de cola a la derecha.

Las hiptesis son : Ho : p = po contra H1 : p > po

En este caso, la regin crtica en los valores de Z es el intervalo:

R.C = {Z >Z }

Se rechaza H0 si el valor de Z R.C.

3). Prueba unilateral de cola a la izquierda.

Las hiptesis son: Ho: p = po contra H1 : p < po

La regin crtica en los valores de Z es: R.C = { Z < - Z }

Luego se rechaza H0 si el valor de Z R.C.

Ejemplo 3.18. Un fabricante afirma que el 30% de todos los consumidores prefieren
su producto. Con el fin de evaluar est afirmacin se tomo una m.a de 400
consumidores y se encontr que 100 de ellos prefieren dicho producto.
es sta, suficiente evidencia para inferir que el porcentaje de preferencia del
producto no es 30% ?.- Utilice el nivel de significancia del 1%.

Solucin. Sea p la proporcin poblacional de preferencia del producto.

1) Hiptesis: H0: p = 0.30 contra H1 : p 0.30

2) Nivel de significancia: = 0.01.

3) Estadstica de prueba: Si Ho es verdadera y n es grande, la estadstica

p p 0 p 0.3
Z N (0, 1)
p 0 (1 p 0 ) (0.3)(0.7)
n n
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 115

4) Regin critica: Para =0.01 y una prueba bilateral, en la distribucin de Z se


encuentra el valor critico Z0.005 = 2.575.

Luego, R.C = { Z < -2.575 Z > 2.575 }

5) Clculos:
x 100
n = 400 , x = 100 , p 0.25
n 400

p p 0 0.25 0.3
Z 2.18
Luego se tiene: p 0 (1 p 0 ) (0.3)(0.7)
n 400

6) Decisin: Como Z =-2.18 R.C, no debemos rechazar H0, y concluimos que


el fabricante tiene la razn.

Ejercicio. Una empresa al seleccionar su personal lo somete a un curso de


entrenamiento. Por experiencia el 76% de los aspirantes aprueban el curso. Se
efectan ciertos cambios en el programa para el cual se inscriben 40 y 24 lo
aprueban. Podra afirmarse que los cambios introducidos reducen la seleccin?.-
Use = 0.01.

Solucin. p 24 / 40 0.60 , Z=-2.07. No se rechaza la hipotesis H 0. La seleccin


no se reduce con los cambios introducidos, al nivel del 1%.
3.6.8. Prueba de hiptesis sobre dos proporciones.

Sean X1 y X2 el nmero de xitos en dos muestras aleatorias independientes de


tamaos n1 y n2 seleccionadas respectivamente de dos poblaciones de Bernoulli
B(1, p1) y B(1, p2), donde los parmetros p1 y p2 son las proporciones de xitos
poblacionales.

Sean las proporciones de xitos muestrales respectivamente:

X1 X2
p1 y p 2
n1 n2

Para n1 y n2 suficientemente grandes (n1 30 y n2 30 ), la variable

p 1 p 2 ( p1 p 2 )
Z N (0,1).
p1 (1 p1 ) p 2 (1 p 2 )

n1 n2

Si H0 : p1 = p2 se supone verdadera, la estadstica es:


Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 116

p 1 p 2
Z N (0,1).
p c (1 p c ) p c (1 p c )

n1 n2
donde pc es el valor comn de los parmetros p1 y p2 cuya estimacin insesgada es:

x 1 x 2 n 1p1 n 2 p 2
p
n1 n 2 n1 n 2

1) Prueba unilateral de cola a la derecha.

1) Hiptesis: H 0 : p1 = p2 contra H 1: p1 > p2.

2) Nivel de significancia:

3) Estadstica de prueba:
p 1 p 2
Z .
p (1 p ) p (1 p )

n1 n2

4) Regin critica: R.C Z Z

5) Decisin: Se rechaza H0 si el valor de Z R.C. No se rechaza H0 en caso


contrario.

2) Prueba unilateral de cola a la izquierda.

Hiptesis:
H0: p1 = p2 contra H 1: p1 < p2.

La Regin crtica es R.C Z Z

Se rechaza H0 si el valor de Z R.C.

3) Prueba bilateral o de dos colas.

Hiptesis:
H0: p1 = p2 contra H 1: p1 p2.

La Regin crtica es :

R.C Z Z /2 Z Z /2
Capitulo 3. Intervalos de confianza y Prueba de hiptesis para medias y proporciones. 117

Ejemplo 3.19. En una encuesta se pregunt sobre los hbitos de lectura, utilizando
una muestra aleatoria de 350 seoras que trabajan y otra muestra independiente de
325 que no lo hacen. En el primer caso, 105 manifestaron que estaban suscritas a
cierto tipo de revista. En el segundo, la respuesta fue de 130 que no estaban suscritas
ni mostraban inters por ninguna revista, argumentando la falta de tiempo. Al nivel
del 1% se podra afirmar que las seoras que trabajan leen menos que las seoras que
no trabaja?.

Solucin.

Sean p1 y p2 , respectivamente, las proporciones de seoras que trabajan y seoras


que no trabajan que leen con mucha frecuencia.

1) Hiptesis: H 0 : p1 = p2 contra H 1: p1 < p2.

2) Nivel de significancia: = 0.01

3) Estadstica de prueba: Si H0: p1 = p2 es verdadera y las muestras son grandes, la


estadstica es:
p 1 p 2
Z N (0,1)
p (1 p ) p (1 p )

n1 n2

4) Regin critica: Para = 0.01 y una prueba unilateral de cola a la izquierda, la


regin critica es:
R.C Z 2.33

5) Clculos: los datos de la muestra dan:

105
Seoras que trabajan : n1 = 350, X1 = 105 , p 1 0.3
350

130
Seoras que no trabajan : n2 = 325, X2 = 130, p 2 0.4
325

x 1 x 2 105 130 235


p 0.348
n 1 n 2 350 325 675

p 1 p 2 0.3 0.4
Z 2.725
p (1 p ) p (1 p ) (0.348)(0.652) (0.348)(0.652)

n1 n2 350 325

6) Decisin. Como el valor de Z = -2.725 R.C., debemos rechazar H0 y al nivel


del 1%, si se puede afirmar que las seoras que trabajan leen menos que las
seoras que no trabajan.

Das könnte Ihnen auch gefallen