Sie sind auf Seite 1von 15

Intervalos de Confianza

para la diferencia de
medias

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS


Sean x11 , x12 , ... x1n1 , una muestra aleatoria de n1 observaciones
tomadas de una primera poblacin con valor esperado

1, y varianza

de

2
1

; y 21 , 22 , ... 2n2 , una muestra aleatoria

2 observaciones tomada de la segunda poblacin con valor

esperado

2 y varianza 22.

Si

x1

x2

son las medias

muestrales, la estadstica x1 x2 es un estimador puntual de

1 2 , y tiene una distribucin normal si las dos poblaciones son


normales, o aproximadamente normal si cumple con las condiciones del
teorema del limite central (tamaos de muestras relativamente grandes).
Por lo tanto,

x 1 x2 (1 2)
z=
12 22
+
n1 n 2
Para calcular el intervalo de confianza para la diferencia de dos medias se
debe saber si las varianzas poblacionales son conocidas o desconocidas,
y en caso de que sean desconocidas, se debe probar si son iguales o
diferentes. Cada uno de estos tres casos se analizarn por separado
Varianzas conocidas pero diferentes, 1 2
Si las varianzas poblacionales son conocidas y diferentes, los pasos a seguir
para encontrar el intervalo de confianza son los siguientes:
a)

El estadstico usado como estimador puntual de la diferencia de

medias

1 2 , ser T = x1 x2 , que es un estimador suficiente

b)
La variable aleatoria asociada con el estimador ser la variable normal
estndar dada por:

z = x 1 x2 (1 2)
12 +22 n1 n 2
c) Para calcular el intervalo de confianza se debe tener en cuenta el nivel

de confianza que se quiere considerar.

Teorema. Si

x1 x2 son las medias de dos muestras aleatorias

independientes de tamao

1y

2 tomadas de poblaciones que tienen

varianzas conocidas 12y 22, respectivamente, entonces el intervalo de


confianza para 1 2 es:

x1 x2 Z

12 2
+ 2 1 2 x1 x2 +Z 12 +2 2 n1 n2
n1 n 2

Ejemplo. Construya un intervalo de confianza del 94% para la diferencia real


entre las duraciones de dos marcas de focos, si una muestra de 40 focos
tomada al azar de la primera marca dio una duracin media de 418 horas, y una
muestra de 50 focos de otra marca dieron una duracin media de 402 horas. Las
desviaciones estndares de las dos poblaciones son 26 horas y 22 horas,
respectivamente.
Solucin.

Tenemos que: x1 =418 , x1 =

402 , 1 = 26,2

= 22, n1 = 40, n2 = 50, Z = 1.88


2
1

2
2

El intervalo de confianza es, entonces:


2

x1 x2 Z

+ 1 2 x1 x2 + Z 1 +2 n1 n2 n1 n 2
26 2 22 2 262 22 2

(418 402 ) 1.88 + 1 2 (418 402 ) + 1.88 +


40 50 40 50
6.3 1 2 25.7

Varianzas desconocidas e iguales

(12 =22 = 2 )

Cuando las varianzas son desconocidas, se debe realizar previamente


una prueba estadstica para verificar si stas son iguales o diferentes.
Para hacerlo debemos hacer uso de la distribucin F, bien sea mediante
el clculo de la probabilidad de que la muestra tomada provenga de dos
poblaciones con varianzas iguales, o mediante el uso de un intervalo de
confianza para la relacin de dos varianzas, segn se estudiar ms
adelant
. Como se desconocen las varianzas de la poblacin, se
usan rianzas de las muestras como estimadores.
e

b) La variable eatoria
al
asoci
ada co
n el estima
dor sera lvariable
las va
El procedimiento a seguir para el clculo del intervalo de
definida
como (se
usa
en caso de
peque
as):
t la diferencia
confianza
para
demuestras
dos medias
ser el siguiente:

a) El estadstico
como
estimador
puntual de la
x1usado
x2
( 1

2)
=
diferenciatde

1 1
sp
+

n
medias
2 un estimador suficiente.
1 2 ser x1 x2 ,1quenes
dondesp

2
2
s
,
s
es un estimador combinado
de lass , mejor que1 2

por separ
ado, d
o nde

2
2
(
n
1
)
s
(
n
1)
s
s2p = 1 1 + 2 2
n1 +n2 2

c) Para calcular intervalo


el
denf
coianza se de
be ten
er en cuent
a el
nivel de confianza
que se uqiere con
siderar ylo s grados debertad
li
que
se calculan

g.l.= 1n+ n
2 2

De nuevo, manipulando la expresin anterior en forma similar al caso


previo se llega al siguiente teorema que nos define el intervalo de
confianza para la diferencia entre dos medias 1 2con varianzas
desconocidas pero iguales:

x s2s

Teorema. Si 1, 2, 1 , 2
son las medias y las varianzas de dos
muestras aleatorias de tamaos n1,n2, respectivamente, tomadas de dos
poblaciones normales e independientes con varianzas desconocidas pero
iguales, entonces un intervalo de confianza para la diferencia entre
medias 1 2es:

1
x1 x2 t sp

11 1

+ 1 2 x1 x2 + t sp +
n1 n2 n1 n 2

Ejemplo. La siguiente tabla presenta los resultados de dos muestras aleatorias


para comparar el contenido de nicotina de dos marcas de cigarrillos.

Suponiendo que los conjuntos de datos provienen de muestras tomadas al


azar de poblaciones normales con varianzas desconocidas e iguales,
construya un intervalo de confianza del 95% para la diferencia real de
nicotina de las dos marcas.
Solucin. Como las varianzas son iguales, calculamos s2p que est dado por:

s2p = (9)0.52 + (7)0.72 = 0.355 sp = 0.596


16

2
1

2
2

Varianzasdesconocidasdiferente
y
s
El
intervalo de confianza del 95%
t dado
es por (t(0.
025 ,g.l.16) = 2.21):
a) El estadstico usadoocom
estimado r puntual de la diferencia
e d
medias1 2 , ser
x2 , qu e es un estimador suficiente
1 x1 1
1 1

x1 x2 t sp

1 2 x1 x2 +t sp

n1 an
2 a da co
b) La vari
able al
eatoria
s oci
n
definida como:

1 1
1 1
3
.
1
2
.
7
2
.
21
(
0
.
596
)
+ 1 2 +
+
10
8
10
8
x1 x2 (
)

3.12.72.21(0.596)

t=

+
el estimador ser
a variable
l n1t n2

1 2
2
2
s
s
0
.
2
1 21 2 1.0
+
n1 n2

c) El intervalo e
d confian
z a esta addo porel siguiente teorema,
basado
en la idstribuci
n t con n grados
de libertad.

Teorema. . Si

x x s2s

, 2, 1 ,

son las medias y las varianzas de dos

muestras aleatorias de tamaos n1,n2, respectivamente, tomadas de dos


poblaciones normales e independientes con varianzas desconocidas y
diferentes, entonces un intervalo de confianza para la diferencia entre
medias 1 2es (nuevamente para el caso de muestras pequeas):

x1 x2 t

ns121 ns222 x1 x2 + t
+ 1 2

ns121 + s22
n2

Los grados de libertad estn dados


por:2
2

(s / n +s / n )
1

(s /n ) /(n 1) + (s

11

/n2)2 /(n2 1)

Nota: el valor obtenido se redondea al entero ms prximo.


Nota.
Si llevamos a cabo un clculo de intervalo de confianza para
diferencia de medias, suponiendo que las varianzas no son
iguales, en el dado caso que s lo fueran, perderamos muy
poco, y el intervalo obtenido sera un poco conservador.
El caso de que supongamos que las varianzas son iguales,
siendo que no lo son, nos produce un error mayor que puede
ser considerable por lo que una sugerencia es usar varianzas
diferentes como regla general.
Problema. Cierto metal se produce, por lo comn, mediante un proceso
estndar. Se desarrolla un nuevo proceso en el que se aade una
aleacin a la produccin del metal. Los fabricantes se encuentran
interesados en estimar la verdadera diferencia entre las tensiones de
ruptura de los metales producidos por los dos procesos. Para cada metal
se seleccionan 12 ejemplares y cada uno de stos se somete a una
tensin hasta que se rompe.
La siguiente tabla muestra las tensiones de ruptura de los ejemplares, en
kilogramos por centmetro cuadrado:

Si se supone que el muestreo se llev a cabo sobre dos distribuciones


normales e independientes, obtener los intervalos de confianza estimados
del 95 y 99% para la diferencia entre los dos procesos.
Interprete los resultados.

Das könnte Ihnen auch gefallen