Beruflich Dokumente
Kultur Dokumente
x1 x2 ... xi
Segn la definicin anterior, la distribucin de mues-
treo de la media es la distribucin de frecuencias rela-
tivas de las medias obtenidas a partir de una serie infi-
nita de experimentos de muestreo, consistiendo cada
uno en seleccionar una muestra aleatoria de tamao n
de la poblacin y calcular la media muestral.
Distribucin de
muestreo de x
nmero infinito de experimentos de muestreo, es de- =
cir necesitaramos tomar todas las muestras posibles c) La forma de la distribucin de muestreo para la
de la poblacin. Afortunadamente para nosotros, los media es aproximadamente normal independien-
matemticos han logrado determinar sus principales temente de la forma de la poblacin.
caractersticas media, desviacin estndar y su
forma y, por tanto, podemos establecer qu pasara
si una serie infinita de experimentos de muestreo se Distribucin de
llevara a cabo. Y conociendo la distribucin de mues- muestreo basada en
treo, estaramos en posicin de contestar a la pre- n=9. Media y error
Distribucin de
gunta fundamental planteada al inicio: Qu tipos de estndar = /9. muestreo basada en
resultados son factibles de obtener a partir de una n=3. Media y error
Poblacin con
muestra como resultado de la variacin de muestreo? estndar = /3.
media y
La distribucin de muestreo de una media puede ser desviacin es-
caracterizada por su media, su varianza y su forma. El tndar .
siguiente teorema nos ayudar a visualizar estas tres
caractersticas
Teorema del lmite central: Si una muestra alea- Debido al TLC, la distribucin normal puede ser
toria de tamao n es tomada de una poblacin con usada para aproximar la distribucin de muestreo
media y varianza 2, entonces, la distribucin de de una media en una gran variedad de situaciones
muestreo de tiene aproximadamente una distri- prcticas.
bucin normal con media y varianza 2 n
cuando . Esto se escribe matemticamente Ejemplo: Una mquina que llena cajas de cartn con
como cereal tiene un peso de llenado cuya media es de 12.02
~(, 2 ) onzas, con una desviacin estndar de 0.03 onzas. Un
lote consta de 40 cajas, tomadas aleatoriamente, que
En la pgina siguiente se presenta la salida de una si-
fueron llenadas por la mquina.
mulacin que muestra al TLC en accin, y que nos
ayuda a comprenderlo de manera visual. Asegrese de
a) Determine la media del peso de llenado promedio
comprender como funciona el teorema.
por caja de cereal en el lote.
El teorema nos proporciona unos de los resultados b) Determine la desviacin estndar del peso de lle-
ms importantes para la inferencia estadstica que po- nado promedio por caja de cereal en el lote.
demos dividir en tres partes: si tomramos muestras c) Cul es la distribucin de muestreo del peso pro-
repetidas de la misma poblacin, entonces, a la larga: medio de llenado?
d) Cuntas cajas se deben incluir en un lote para
a) Simbolizada por , la media de la distribucin de
que el error estndar del peso promedio de la caja
muestreo de las medias ser la misma que la de la
sea 0.005 onzas?
poblacin
e) Cul es la probabilidad aproximada de que el
=
peso promedio por caja del cereal en el lote sea
menor que 12 onzas?
b) Simbolizada por , la desviacin estndar de las
Respuestas:
medias en una distribucin de muestreo, conocida
2Pgina
como el error estndar de la media, y que refleja a) 12.02 b) 0.0047 c) ~(12.02, 0.00472 ) d) 36
la cantidad de variabilidad entre las medias de las cajas e) 0
muestras est dada por
Teorema del Lmite Central.
1 2 3
Explicacin: en la parte superior tenemos tres poblaciones hipotticas con medias diferentes y desconocidas (por tratarse de una simulacin podemos fijar
estas medias a cualquier valor, pero en la prctica, sus valores en realidad nos son desconocidos y son precisamente los que estamos tratando de estimar). De
la poblacin 1 se extrajeron 1000 muestras de tamao 5, mil muestras de tamao 15 y mil muestras de tamao 60. Se calcul la media de cada muestra, lo que
gener 1000 medias para cada tamao de muestra y se construy su histograma, que muestra la distribucin de probabilidad de estas mil medias, es decir la
distribucin de muestreo para la media muestral. De manera similar se construyeron las distribuciones de muestreo para las poblaciones 2 y 3. En resumen:
Cada histograma est centrado en el valor de la media de la poblacin de donde procede. Esto se escribe matemticamente como () = .
La varianza de los histogramas disminuye a medida que aumentamos el tamao de muestra. Matemticamente, esto significa que la varianza de cada
histograma est relacionada con la varianza de la poblacin por la ecuacin y que a medida que n aumenta nuestra estimacin se hace ms precisa.
La forma de cada histograma se asemeja a la de una distribucin normal. La aproximacin mejora a medida que n se hace ms grande.
3
Estas tres caractersticas se resumen escribiendo ~(, 2 ) que se lee tiene una distribucin aproximadamente normal con media y varianza
Pgina
2
Ejemplo: Una mquina dispensadora de caf se disea Considere el siguiente ejemplo ilustrativo que nos ayu-
de manera que dispense un volumen de 7.00 onzas dar a establecer las principales caractersticas de la
fluidas de caf por taza, con una desviacin estndar distribucin de muestreo de la proporcin muestral.
de 0.25 onzas fluidas. La distribucin de los contenidos
de caf en los vasos es aproximadamente normal. Ejemplo: transmisin de hepatitis en las transfusio-
Cul es la probabilidad de que, cuando se toma una nes de sangre.
muestra aleatoria de 12 tazas, su contenido promedio El desarrollo de hepatitis viral despus de una transfu-
sea de ms de 7.15 onzas fluidas? Explique por qu po- sin puede causar serias complicaciones en un pa-
demos usar la distribucin normal en estos clculos. ciente. El artculo Lack of Awareness Result in Poor
Autologous Blood Transfusion (Health Care Manage-
Solucin: Como la distribucin de contenidos de caf ment, May 15, 2003) reporta que la hepatitis se pre-
es aproximadamente normal senta en un 7% de pacientes que han recibido transfu-
~(7.00 , 0.252 12) sin de sangre durante una ciruga de corazn. Pode-
Entonces mos simular el muestreo repetido de esta poblacin
7.15 7.00 de pacientes que han recibido transfusin de sangre.
( > 7.15) = ( > )
0.25/12 Un paciente que contraiga la enfermedad ser consi-
( > 7.15) = ( > 2.08) = 1 (2.08) derado un xito. En la siguiente figura se muestran 4
histogramas para n = 10, 25,50 y 100. Para cada ta-
( > 7.15) = 1 0.9812 = 0.0188 mao muestral se tomaron 500 rplicas. Para los dos
En este caso, la distribucin normal es adecuada a pe- primeros histogramas, vemos que la distribucin nor-
sar de tener un tamao de muestra pequeo porque mal no es un modelo adecuado.
la poblacin es aproximadamente normal.
Enunciado 1: El estimado puntual = 0.668 nunca di- Ejemplo: Una gra se disea para levantar 50 tonela-
ferir del verdadero valor actual de la proporcin po- das. La gra se usa para levantar paquetes de 1.2 to-
blacional por ms de 0.0462. neladas cada uno. Los pesos de estos paquetes estn
normalmente distribuidos con una desviacin estn-
Enunciado 2: Es improbable que el estimado = dar de 0.2 toneladas. Si la gra levanta 40 de estos pa-
0.668 difiera del valor actual de la proporcin pobla- quetes a la vez, cul es la probabilidad de que se ex-
cional por ms de 0.0235. ceda el peso de diseo?
5
Enunciado 3: Es improbable que el estimado = Solucin: sea para = 1,2, ,40 el peso de cada
Pgina
0.668 difiera del valor actual de la proporcin pobla- uno de los paquetes. El peso total de los 40 paquetes
cional por ms de 0.0462. Respuesta: enunciado 2 es:
= 1 + 2 + + 40 el valor esperado es que cada medicin individual, pero la desviacin es-
tndar se ve reducida por un factor igual a la raz cua-
() = (1 ) + (2 ) + + (40 )
drada del tamao de muestra. En otras palabras, el
() =
1.2 + + 1.2 = 40(1.2) = 48 toneladas promedio de muchas mediciones repetidas, tienen la
40 misma exactitud, pero es ms preciso que cualquier
Para encontrar la desviacin estndar del peso total de medicin individual.
los paquetes debemos calcular la varianza de la si-
guiente manera Ejemplo: Se va a medir la longitud de una pieza usada
para ensamblar una parte mecnica por medio de un
() = (1 ) + (2 ) + + (40 ) proceso cuya incertidumbre es 0.05 cm. Si se hacen 25
0.22 + 0.22 + + 0.22 = 40(0.22 ) = 1.6
() = de estas mediciones de manera independiente y su
40 promedio se usar para estimar la longitud de la pieza
cul ser la incertidumbre? cunto ms precisa es el
Entonces, = 1.26 .
promedio de las 25 mediciones que una sola medida?
Como los pesos de los paquetes son aproximada-
Solucin: la incertidumbre del promedio de las 25 me-
mente normales ~(48, 1.262 ) y 0.05
diciones es = 0.01 . La incertidumbre en una
50 48 25
( > 50) = 1 ( ) sola medida es 0.05 cm. La incertidumbre de las 25
1.26
mediciones promediadas es menor que la de una sola
( > 50) = 1 (1.59) = 1 0.9441 = 0.0559 medida por un factor de 5, que es la raz cuadrada del
nmero de medidas que se promedian. As, el prome-
Del resultado podemos concluir que la probabilidad de
dio de las 25 medidas independientes es cinco veces
que se rebase el lmite de peso soportado por la gra
ms precisa que una sola medicin.
es pequea (a largo plazo, cerca del 6% de las veces
que se use la gra para levantar los 40 paquetes, se Distribucin de muestreo para la diferencia
exceder el peso permitido)
de medias
Mediciones repetidas
Caso de muestras grandes
Una de las aplicaciones de las combinaciones lineales
en ingeniera es cuando se trabaja con mediciones que Si estamos interesados en comparar dos medias po-
involucran alguna incertidumbre. Una de las maneras blacionales, podemos hacerlo estimando la diferencia
de reducir la incertidumbre es tomar muchas medicio- entre ellas.
nes de manera independiente y promediarlas. Las me- Suponga que las poblaciones de inters tienen medias
diciones en este caso son una muestra aleatoria simple 1 2 y varianzas 12 22 respectivamente. Estamos
de una poblacin conceptual. Entonces interesados en estimar la diferencia 1 2 e intuiti-
Si 1 , 2 , , son mediciones independientes, vamente escogemos 1 2 para hacerlo. Suponga
cada una con media e incertidumbre , entonces la que ambas muestras, de tamaos 1 2 respectiva-
++ mente, se toman de manare independiente una de la
media muestral = 1
es una medicin con
otra.
una media = y una incertidumbre
Para cada tem seleccionado se mide la caracterstica
= de inters y se calculan las medias muestrales. La dife-
rencia 1 2 es un estimador insesgado de 1 2
6
prcticas, ya que nos dice que, si realizamos muchas Entonces, la distribucin de muestreo para la diferen-
mediciones independientes de la misma cantidad, el cia de medias 1 2 para muestras grandes, es apro-
promedio de estas mediciones tiene la misma media ximadamente normal, con media 1 2 y varianza
12 22
+ . la aproximacin mejora a medida que el ta-
1 2
mao de muestra se incrementa.
Como estamos interesados en que la diferencia no Si no podemos asumir que las varianzas son igualges,
supere los 10ml, esta condicin puede ser pero las poblaciones son aproximadamente normales,
representada como |1 2 | 10. Entonces tal como lo muestra la siguiente figura
Cemento 1 Cemento 2
1 = 14 2 = 16
1 = 17 2 = 19
12 = 1.5 22 = 1.8
grados de libertad.
1 2 = 80 75 = 5