Beruflich Dokumente
Kultur Dokumente
TRABAJO COOPERATIVO N 2.
ESTADISTICA 2.
GRUPO 02T
CONTENIDO:
INTERVALOS DE CONFIANZA.
DOCENTE:
Lic. Mauricio Crdova.
ESTUDIANTES:
Rosa Castillo, Marta Gabriela RC140811
Montoya, Garca ngel Eduardo MG090573
Orellana Escobar, Fernando Alfredo OE151616
Posada Cern, Josu Daniel PC120905
Trigueros Cern, Jorge Alberto TC120225
25 Septiembre de 2017
1
Contenido
Introduccin. ....................................................................................................................................... 3
1. Inferencias acerca de la diferencia entre dos medias poblacionales.......................................... 4
1.1. Intervalos de confianza para diferencias de medias con 1 y 2 conocidas (n130^n230)
.4
1.1.1. Estimacin por intervalo de 1 - 2 ................................................................................ 4
1.2. Intervalos de confianza para diferencias de medias con 1 y 2 desconocidas
(n1<30^n2<30) ................................................................................................................................. 7
1.2.1. Estimacin por intervalo de 1 - 2 ................................................................................ 7
2. Inferencias acerca de la diferencia entre dos proporciones poblacionales ................................ 9
2.1. Intervalos de confianza para diferencias de proporciones ................................................. 9
2.1.1. Estimacin por intervalo para p1 - p2 (n1p15, n1q15 ^ n2p25, n2q25) ......................... 9
3. Inferencias relativas a proporciones ......................................................................................... 12
3.1. Estimacin de proporciones .............................................................................................. 12
3.1.1. Intervalos de confianza unilaterales ............................................................................. 12
Conclusin ......................................................................................................................................... 14
Anexos ............................................................................................................................................... 15
Bibliografa ........................................................................................................................................ 16
2
Introduccin.
La "estimacin por intervalo" consiste en determinar un par de valores a y b , tales que constituidos
en intervalo [a ,b] ; y para una probabilidad 1- prefijada (nivel de confianza) se verifique en relacin
al parmetro a estimar se cumpla :
en otros trminos
Podemos considerar el nivel de confianza (1-) que hemos prefijado para la expresin anterior
como la probabilidad que existe (antes de tomar la muestra) de que el intervalo a construir a partir
de la muestra incluya el verdadero valor del parmetro a estimar. Refleja la "confianza" en la
"construccin" del intervalo y de que ste tras concretar la muestra contendr el valor a estimar.
De ah que en trminos numricos dicho nivel o probabilidad haya de tomar un valor alto
(0.9,0.95,0.99).
3
1. Inferencias acerca de la diferencia entre dos medias
poblacionales
Sean 1 la media de la poblacin 1 y 2 la media de la poblacin 2, lo que interesa aqu son inferencias
acerca de la diferencia entre las medias: 1 - 2. Para hacer una inferencia acerca de esta diferencia,
se elige una muestra aleatoria simple de n1 unidades de la poblacin 1 y otra muestra aleatoria
simple de n2 unidades de la poblacin 2. A estas dos muestras que se toman separada e
independientemente se les conoce como muestras aleatorias simples independientes.
Suponiendo que se cuenta con informacin que permite considerar que las dos desviaciones
estndar 1 y 2 se conocen antes de tomar las muestras, se estar trabajando con el caso 1 y 2
conocidas.
Para estimar 1 - 2, se toma una muestra aleatoria simple de n1 individuos de la poblacin 1 y una
muestra aleatoria simple de n2 individuos de la poblacin 2, y se calculan las dos medias muestrales
1 y 2
La estimacin puntual de la diferencia entre dos medias poblacionales es la diferencia entre las dos
medias muestrales 1 2
Como otros estimadores puntuales, el estimador puntual 1 2 tiene un error estndar que
describe la variacin de la distribucin muestral del estimador. Cuando se tienen dos muestras
aleatorias simples independientes, el error estndar de 1 2 es el siguiente:
12 22
1 2 = +
1 2
Si ambas poblaciones tienen distribucin normal o si los tamaos de las muestras son
suficientemente grandes para que el teorema del lmite central permita concluir que las
distribuciones muestrales de 1 y 2 puedan ser aproximadas mediante una distribucin normal, la
distribucin muestral de 1 y 2 tendr una distribucin normal cuya media es 1 - 2.
4
Como se sabe, una estimacin por intervalo est dada por una estimacin puntual un margen de
error. En el caso de la estimacin de la diferencia entre dos medias poblacionales, una estimacin
por intervalo tendr la forma siguiente:
: 1 2
12 22
= 1 2 = +
2 2 2
1
En consecuencia, la estimacin por intervalo de la diferencia entre las dos medias poblacionales es
la siguiente:
12 22
: 1 2 2 + =
1 2
EJEMPLO 1
Greystone Department Stores, Inc. tiene dos tiendas en Buffalo, Nueva York, una en el centro de la
ciudad y otra en un centro comercial. El gerente regional ha observado que los productos que se
venden bien en una tienda no se venden bien en la otra. El gerente cree que esto se debe a
diferencias demogrficas entre los clientes de las dos tiendas. Debe haber diferencias de edad,
educacin, ingreso, etc., entre los clientes de una y otra tienda. Suponga que el gerente pide que se
investigue la diferencia entre las medias de las edades de los clientes de las dos tiendas.
Si la poblacin 1 es la poblacin de clientes que compra en la tienda del centro de la ciudad y la
poblacin 2 es la poblacin de clientes que compra en la tienda del centro comercial, se tiene:
1= media de la poblacin 1 (es decir, media de las edades de los clientes que compran en la tienda
del centro de la ciudad)
1= media de la poblacin 2 (es decir, media de las edades de los clientes que compran en la
tienda del centro comercial).
De acuerdo con datos de anteriores estudios demogrficos sobre los clientes, las dos desviaciones
estndar poblaciones se conocen y son 1 = 9 aos y 2 = 10 aos. De los datos de las dos muestras
aleatorias simples independientes de los clientes de Greystone se obtuvieron los resultados
siguientes.
5
Tienda en el centro de la
ciudad
Tamao de la muestra 1 =36 2 = 49
Media muestral 1 = 40 aos 2 = 35 aos
Mediante estos datos se encuentra que la estimacin puntual de la diferencia entre las dos medias
poblacionales es 1 2 = 40 - 35 = 5 aos. Por ende, se estima que, en promedio, los clientes de
la tienda en el centro de la ciudad son cinco aos mayores que los clientes de la tienda del centro
comercial. Ahora, se calcula el margen de error y se proporciona una estimacin por intervalo de
1 - 2. Si tiene 95% de confianza y = 0.025 = 1.96:
2
12 22
+
2 2
1
92 102
: 40 35 1.96 +
36 49
La estimacin por intervalo de 95% de confianza de la diferencia entre las medias poblacionales va
desde:
[0.94 , 9.06]
EJEMPLO 2
Durante el 2003 los precios de la gasolina alcanzaron record de precios altos en 16 estados de
Estados Unidos (The Wall Street Journal, 7 de marzo de 2003). Dos de los estados afectados fueron
California y Florida. La American Automobile Association encontr como precio medio muestral por
galn $2.04 en California y $1.72 por galn en Florida. Use 40 como tamao de la muestra de
California y 35 como tamao de la muestra en Florida. Suponga que estudios anteriores indican que
la desviacin estndar poblacional en California es 0.10 y en Florida 0.08.
a) Cul es la estimacin puntual de la diferencia entre los precios medios poblacionales por galn
en California y Florida?
12 22 0.102 0.082
= 2 + = 1.96 + = 0.04
1 2 40 35
6
c) Cul es la estimacin por intervalo de 95% de confianza para la diferencia entre los precios
medios poblacionales por galn en California y en Florida?
12 22
2 +
1 2
: 0.32 0.04
La estimacin por intervalo de 95% de confianza de la diferencia entre los precios medios
poblacionales por galn en California y en Florida va desde:
[0.28 , 0.36] .
El estudio de las inferencias sobre la diferencia entre dos medias poblacionales se extiende al caso
en el que las dos desviaciones estndar poblacionales, 1 y 2 no se conocen. En este caso, para
estimar las desviaciones estndar poblacionales desconocidas se emplean las desviaciones estndar
muestrales, s1 y s2. Cuando se usan las desviaciones estndar muestrales en las estimaciones por
intervalo, se emplea la distribucin t en lugar de la distribucin normal estndar.
La estimacin por intervalo para el caso en el que se conocen las dos desviaciones estndar
poblacionales 1 y 2 es la siguiente:
12 22
: 1 2 2 +
1 2
2
2 2
( 1 + 2)
1 2
= 2 2
1 2 1 2
( 1) + ( 2)
1 1 1 2 1 2
EJEMPLO 1
7
Clearwater National Bank realiza un estudio para identificar diferencias entre las cuentas de cheques
de sus clientes en dos de sus sucursales; toma una muestra aleatoria simple de 28 cuentas de la
sucursal Cherry Grove y otra muestra aleatoria simple e independiente de 22 cuentas de cheques
de la sucursal Beechmont. El saldo se registra en las cuentas de cheques. A continuacin se presenta
un resumen de los saldos en estas cuentas de cheques.
Cherry Grove Beechmont
Tamao de la muestra 1 = 28 2 = 22
Media muestral 1 = $1,025 2 =$910
Desviacin estndar muestral 1= $150 2= $125
El banco desea estimar la diferencia entre el saldo medio en las cuentas de cheques de la poblacin
de clientes de Cherry Grove y el saldo medio en las cuentas de cheques de la poblacin de clientes
de Becchmont. A continuacin se calcular el margen de error y se dar una estimacin por intervalo
para la diferencia entre estas dos medias poblacionales, con un nivel de confianza de 95%.
2 2
2 2 (150)2 (125)2
(1 + 2 ) ( + )
1 2 28 22
= 2 = = 47.8
1 12
2
1 22 1 (150)2 2 1 (125)2 2
( ) + ( ) ( ) + ( )
1 1 1 2 1 2 28 1 28 22 1 22
Como el resultado no es un nmero entero, se redondea hacia abajo a 47 para tener un valor t
mayor y dar una estimacin por intervalo ms prudente. En la tabla de la distribucin t para 47
grados de libertad, se encuentra t0.025 = 2.012. De acuerdo con la expresin dada, el intervalo de
confianza de 95% para la diferencia entre las dos medias poblacionales se calcula como sigue.
12 22
: 1 2 +
2 2
1
(150)2 (125)2
: 1025 910 2.012 +
28 22
: 115 78
La estimacin puntual de la diferencia entre las dos medias poblacionales de los saldos en las
cuentas de cheques es $115. El margen de error es $78 y la estimacin por intervalo de 95% de
confianza para la diferencia entre las dos medias poblacionales es el que va de
[37 , 193]
EJEMPLO 2
8
Muestra 1 Muestra 2
Tamao de la muestra 1 = 20 2 = 30
Media muestral 1 = 22.5 2 = 20.1
Desviacin estndar muestral 1= 2.5 2= 4.8
d. D el intervalo de 95% de confianza para la diferencia entre las dos medias poblacionales.
2.4 2.1
[0.3,4.5]
Para las inferencias acerca de estas diferencias, se seleccionan dos muestras aleatorias
independientes, una de n1 unidades de la poblacin 1 y otra de n2 unidades de la poblacin 2.
La diferencia entre las dos proporciones poblacionales est dada por p1- p2. La estimacin puntual
de p1- p2 es la siguiente:
= 1 2
Por ende, el estimador puntual de la diferencia entre dos proporciones poblaciones es la diferencia
entre las proporciones muestrales de dos muestras aleatorias simples independientes.
9
Como ocurre con otros estimadores puntuales, 1 2 tiene una distribucin muestral que refleja
los valores que podra tomar 1 2 si se tomaran repetidas muestras aleatorias simples
independientes. La media de esta distribucin muestral es p1- p2 y el error estndar de 1 2 es
el siguiente:
1 1 2 2
1 2 = +
1 2
Si los tamaos de las muestras son suficientemente grandes para que n1p1, n1q1, n2p2 y n2q2 sean
todos mayores o iguales que 5, la distribucin muestral de 1 2 puede ser aproximada por una
distribucin normal.
Como se sabe, una estimacin por intervalo est dada por una estimacin puntual un margen de
error. En la estimacin de la diferencia entre dos proporciones poblacionales, una estimacin por
intervalo toma la forma siguiente:
: 1 2
1 1 2 2
= 2 +
1 2
La forma general de una estimacin por intervalo para la diferencia entre dos proporciones
poblacionales es la siguiente:
1 1 2 2
: 1 2 2 +
1 2
Donde 1 - es el coeficiente de confianza.
EJEMPLO 1
Una empresa que se dedica a elaborar declaraciones de impuestos desea comparar la calidad del
trabajo que se realiza en dos de sus oficinas regionales. Con muestras aleatorias de las declaraciones
de impuestos elaboradas en dichas oficinas y verificando la exactitud de las declaraciones, la
empresa podr estimar la proporcin de declaraciones con errores elaboradas en cada una de estas
oficinas. Interesa conocer la diferencia entre las proporciones siguientes:
10
2 = proporcin muestral en una muestra aleatoria simple de la poblacin 2
Se encuentra que de las muestras independientes aleatorias simples de las dos oficinas se obtienen
los datos siguientes:
Oficina 1 Oficina 2
1 = 250 2 = 300
Nmero de declaraciones con errores = 35 Nmero de declaraciones con errores = 27
Las proporciones muestrales en cada una de las oficinas son las siguientes.
35
1 = = 0.14
250
27
2 = = 0.09
300
La estimacin puntual de la diferencia entre las proporciones de declaraciones con errores en las
dos poblaciones es 1 2 = 0.14 - 0.09 = 0.05. Entonces se estima que la oficina 1 comete 0.05 o
5% ms errores que la oficina 2.
Ahora se puede calcular el margen de error y la estimacin por intervalo para la diferencia entre las
dos proporciones poblacionales. Con un intervalo de 90% de confianza con 2 = 0.05 = 1.645, se
tiene
1 1 2 2
: 1 2 2 +
1 2
EJEMPLO 2
220
1 = = 0.55
400
192
2 = = 0.48
400
11
n1p1=(400)(0.55)= 2205 n2p2=(400)(0.48)= 1925
n1q1=(400)(0.45)= 1805 n2q2=(400)(0.52)= 2085
1 1 2 2
: 1 2 2 +
1 2
Cuando es muy cercano a cero, como en el caso de problemas de alta confiabilidad, y cuando es
la probabilidad de fracaso, ninguno de los intervalos de confianza estudiados da una solucin
satisfactoria. Lo que en realidad necesitamos aqu son intervalos de confianza unilaterales de la
forma < , donde es una constante que depende del nivel de confianza y del tamao de la
muestra. Como ya se sabe, la distribucin binomial se aproxima mejor con una distribucin de
Poisson con = cuando es pequea y es grande. Con base en esta aproximacin, puede
mostrarse que:
1
< 2
2
Es un intervalo de confianza unilateral para donde 2 es tal que el rea bajo la distribucin chi-
cuadrado a su derecha es igual a ; y el nmero de grados de libertad es igual a 2( + 1).
.
EJEMPLO 1
2
Dado que 0.01 = 23.209 para 2(4 + 1) = 10 grados de libertad, sustituyendo en la formula se
obtiene:
1
< 23.209
2(2000)
< 0.0058
Esto es, 0.0058 es una cota superior aproximada del 99% de confianza para .
12
EJEMPLO 2
En una muestra al azar de 500 controles remotos para aparatos de recreo domsticos, 7 fallaron
durante el periodo de garanta de 90 das. Constryase un lmite superior del 95% de confianza para
la probabilidad verdadera de falla durante el periodo de garanta.
2
Dado que 0.05 = 26.296 para 2(7 + 1) = 16 grados de libertad, sustituyendo en la formula se
obtiene:
1
< 26.296
2(500)
< 0.026
Esto es, 0.026 es una cota superior aproximada del 95% de confianza para .
13
Conclusin
Los intervalos de confianza para la diferencia de medias, se aplica en situaciones como las siguientes:
El clculo de intervalos de confianza para la estimacin de parmetros son tecnias que nos permiten
hacer declaraciones sobre que valores podemos esperar para un parmetro. El intervalo calculado
depender de:
14
Anexos
Supongamos un riesgo del 5% (o un nivel de confianza del 95% ), =0.05, y grados de libertad
v=10.
15
Bibliografa
16