Sie sind auf Seite 1von 8

Universidad de El Salvador

Facultad de Ingeniera y Arquitectura


Unidad de Ciencias Bsicas
Probabilidad y Estadstica
Unidad V: Distribuciones de Muestreo.
Por Oscar Daz

L os conceptos presentados en esta unidad nos


proporcionan las bases para los procedimien-
tos que los investigadores utilizan para tomar
en cuenta la variacin de muestreo en sus estudios, es
decir los procedimientos de la estadstica inferencial.
Por la variacin de muestreo sabemos que las medias
de cada una de las muestras sern diferentes. Si esta-
mos usando una muestra para hacer alguna inferencia
sobre la poblacin, obviamente nuestra inferencia de-
pender de la muestra seleccionada. Lo anterior plan-
tea las siguientes preguntas:
Distribucin de Muestreo de la media.
Qu tan grande es la diferencia entre la media de
Considere una poblacin con media y desviacin es-
una muestra en particular y la media de la pobla-
tndar . Suponga que tomamos infinitas muestras
cin en trminos probabilsticos?
aleatorias del mismo tamao de esta poblacin y cal-
Qu valores de la media muestral son ms proba-
culamos la media para cada muestra seleccionada,
bles que ocurran?
como lo indica el siguiente esquema
Qu valores en la media muestral son menos pro-
bables que ocurran?
Poblacin
con media Para responder a estas preguntas, necesitamos anali-
y desviacin zar la distribucin de probabilidad de la media mues-
estndar . tral a la cual llamaremos distribucin de muestreo de
la media muestral.

etc. Definicin: una distribucin de


muestreo es la distribucin de pro-
Muestra 1 Muestra 2 ... Muestra i
babilidad de un estadstico.

x1 x2 ... xi
Segn la definicin anterior, la distribucin de mues-
treo de la media es la distribucin de frecuencias rela-
tivas de las medias obtenidas a partir de una serie infi-
nita de experimentos de muestreo, consistiendo cada
uno en seleccionar una muestra aleatoria de tamao n
de la poblacin y calcular la media muestral.

Como quiz intuya, es imposible construir una distri-


1

bucin de muestreo, debido a que se necesitara un


Pgina

Distribucin de
muestreo de x
nmero infinito de experimentos de muestreo, es de- =
cir necesitaramos tomar todas las muestras posibles c) La forma de la distribucin de muestreo para la
de la poblacin. Afortunadamente para nosotros, los media es aproximadamente normal independien-
matemticos han logrado determinar sus principales temente de la forma de la poblacin.
caractersticas media, desviacin estndar y su
forma y, por tanto, podemos establecer qu pasara
si una serie infinita de experimentos de muestreo se Distribucin de
llevara a cabo. Y conociendo la distribucin de mues- muestreo basada en
treo, estaramos en posicin de contestar a la pre- n=9. Media y error
Distribucin de
gunta fundamental planteada al inicio: Qu tipos de estndar = /9. muestreo basada en
resultados son factibles de obtener a partir de una n=3. Media y error
Poblacin con
muestra como resultado de la variacin de muestreo? estndar = /3.
media y
La distribucin de muestreo de una media puede ser desviacin es-
caracterizada por su media, su varianza y su forma. El tndar .
siguiente teorema nos ayudar a visualizar estas tres
caractersticas

Teorema del lmite central: Si una muestra alea- Debido al TLC, la distribucin normal puede ser
toria de tamao n es tomada de una poblacin con usada para aproximar la distribucin de muestreo
media y varianza 2, entonces, la distribucin de de una media en una gran variedad de situaciones
muestreo de tiene aproximadamente una distri- prcticas.
bucin normal con media y varianza 2 n
cuando . Esto se escribe matemticamente Ejemplo: Una mquina que llena cajas de cartn con
como cereal tiene un peso de llenado cuya media es de 12.02
~(, 2 ) onzas, con una desviacin estndar de 0.03 onzas. Un
lote consta de 40 cajas, tomadas aleatoriamente, que
En la pgina siguiente se presenta la salida de una si-
fueron llenadas por la mquina.
mulacin que muestra al TLC en accin, y que nos
ayuda a comprenderlo de manera visual. Asegrese de
a) Determine la media del peso de llenado promedio
comprender como funciona el teorema.
por caja de cereal en el lote.
El teorema nos proporciona unos de los resultados b) Determine la desviacin estndar del peso de lle-
ms importantes para la inferencia estadstica que po- nado promedio por caja de cereal en el lote.
demos dividir en tres partes: si tomramos muestras c) Cul es la distribucin de muestreo del peso pro-
repetidas de la misma poblacin, entonces, a la larga: medio de llenado?
d) Cuntas cajas se deben incluir en un lote para
a) Simbolizada por , la media de la distribucin de
que el error estndar del peso promedio de la caja
muestreo de las medias ser la misma que la de la
sea 0.005 onzas?
poblacin
e) Cul es la probabilidad aproximada de que el
=
peso promedio por caja del cereal en el lote sea
menor que 12 onzas?
b) Simbolizada por , la desviacin estndar de las
Respuestas:
medias en una distribucin de muestreo, conocida
2Pgina

como el error estndar de la media, y que refleja a) 12.02 b) 0.0047 c) ~(12.02, 0.00472 ) d) 36
la cantidad de variabilidad entre las medias de las cajas e) 0
muestras est dada por
Teorema del Lmite Central.

1 2 3

Explicacin: en la parte superior tenemos tres poblaciones hipotticas con medias diferentes y desconocidas (por tratarse de una simulacin podemos fijar
estas medias a cualquier valor, pero en la prctica, sus valores en realidad nos son desconocidos y son precisamente los que estamos tratando de estimar). De
la poblacin 1 se extrajeron 1000 muestras de tamao 5, mil muestras de tamao 15 y mil muestras de tamao 60. Se calcul la media de cada muestra, lo que
gener 1000 medias para cada tamao de muestra y se construy su histograma, que muestra la distribucin de probabilidad de estas mil medias, es decir la
distribucin de muestreo para la media muestral. De manera similar se construyeron las distribuciones de muestreo para las poblaciones 2 y 3. En resumen:

Cada histograma est centrado en el valor de la media de la poblacin de donde procede. Esto se escribe matemticamente como () = .
La varianza de los histogramas disminuye a medida que aumentamos el tamao de muestra. Matemticamente, esto significa que la varianza de cada
histograma est relacionada con la varianza de la poblacin por la ecuacin y que a medida que n aumenta nuestra estimacin se hace ms precisa.
La forma de cada histograma se asemeja a la de una distribucin normal. La aproximacin mejora a medida que n se hace ms grande.
3

Estas tres caractersticas se resumen escribiendo ~(, 2 ) que se lee tiene una distribucin aproximadamente normal con media y varianza
Pgina

2
Ejemplo: Una mquina dispensadora de caf se disea Considere el siguiente ejemplo ilustrativo que nos ayu-
de manera que dispense un volumen de 7.00 onzas dar a establecer las principales caractersticas de la
fluidas de caf por taza, con una desviacin estndar distribucin de muestreo de la proporcin muestral.
de 0.25 onzas fluidas. La distribucin de los contenidos
de caf en los vasos es aproximadamente normal. Ejemplo: transmisin de hepatitis en las transfusio-
Cul es la probabilidad de que, cuando se toma una nes de sangre.
muestra aleatoria de 12 tazas, su contenido promedio El desarrollo de hepatitis viral despus de una transfu-
sea de ms de 7.15 onzas fluidas? Explique por qu po- sin puede causar serias complicaciones en un pa-
demos usar la distribucin normal en estos clculos. ciente. El artculo Lack of Awareness Result in Poor
Autologous Blood Transfusion (Health Care Manage-
Solucin: Como la distribucin de contenidos de caf ment, May 15, 2003) reporta que la hepatitis se pre-
es aproximadamente normal senta en un 7% de pacientes que han recibido transfu-
~(7.00 , 0.252 12) sin de sangre durante una ciruga de corazn. Pode-
Entonces mos simular el muestreo repetido de esta poblacin
7.15 7.00 de pacientes que han recibido transfusin de sangre.
( > 7.15) = ( > )
0.25/12 Un paciente que contraiga la enfermedad ser consi-
( > 7.15) = ( > 2.08) = 1 (2.08) derado un xito. En la siguiente figura se muestran 4
histogramas para n = 10, 25,50 y 100. Para cada ta-
( > 7.15) = 1 0.9812 = 0.0188 mao muestral se tomaron 500 rplicas. Para los dos
En este caso, la distribucin normal es adecuada a pe- primeros histogramas, vemos que la distribucin nor-
sar de tener un tamao de muestra pequeo porque mal no es un modelo adecuado.
la poblacin es aproximadamente normal.

Distribucin de Muestreo de una propor-


cin.

En algunas ocasiones deseamos aprender a cerca de la


proporcin de individuos u objetos que poseen una ca-
racterstica en particular. Por ejemplo, La proporcin
de personas que votarn por determinado partido po-
ltico, la proporcin de mujeres que optan a puestos
en el gobierno, la proporcin de personas que prefie-
ren caf descafeinado, etc.
Sin embargo, para tamaos de muestra grandes, la dis-
Un individuo u objeto que posea la caracterstica se co-
tribucin binomial parece un modelo razonable para
noce como xito. Si no la posee se conoce como fra-
la distribucin de muestreo de .
caso. El valor de la proporcin poblacional general-
mente no se conoce. Cuando una muestra aleatoria de Propiedades generales de la distribucin de
tamao n es tomada al azar de la poblacin, algunos 1. =
de los individuos en la muestra son xitos y otros fra- (1)
casos. El estadstico que usaremos para obtener con- 2. =
clusiones sobre la proporcin poblacional es , la pro-
4

3. Cuando n es grande y p no es cercana a 0 1, la


Pgina

porcin de xitos en la muestra. distribucin de muestreo de es aproximada-


mente normal.
La primera propiedad establece que la distribucin de Ejemplo: USA Today (Octubre 14, 2002) reporta que el
muestreo de est siempre centrada en el valor de la 36% de los conductores adultos admitieron usar regu-
proporcin poblacional, es decir que los valores de larmente el telfono mvil mientras manejan. Este es-
calculados de muchas muestras diferentes tendern a timado se bas en una muestra representativa de
concentrarse alrededor del valor actual de la propor- 1004 conductores adultos. Un margen de error del
cin poblacional. 3.1% tambin fue reportado en el artculo. Es este
margen de error correcto? Respuesta: es incorrecto
La segunda propiedad implica que, como el tamao de
muestra aparece en el denominador de la expresin, Distribucin de una combinacin lineal de
la variabilidad de muestra en muestra de disminuye
variables independientes.
a medida que n se incrementa.
Suponga que tiene un conjunto de variables aleatorias
La tercera propiedad establece que, en algunos casos,
independientes
la distribucin es aproximadamente normal. La simu-
lacin muestra que ambos valores, n y p, deben consi- 1 , 2 , ,
derarse cuando se decide si la distribucin de es Una combinacin lineal de estas variables la podemos
aproximadamente normal. representar algebraicamente como

Cundo es la distribucin de muestreo de = 1 1 + 2 2 + +


aproximadamente normal? Donde W es la combinacin lineal y las son constan-
Una regla conservativa es que si se cumple tes. Como las son variables aleatorias, tienen una
distribucin de probabilidad. La combinacin lineal W,
10 (1 ) 10 por depender de ellas, tambin tendr una distribu-
cin de probabilidad en la cual:
Entonces, la distribucin de muestreo de es aproxi-
madamente normal. () = (1 1 + + )
Ejemplo: un fabricante de automviles est intere- () = 1 (1 ) + + ( ) y
sado en averiguar acerca de la proporcin de personas
que compraron uno de sus modelos y que planean () = (1 1 + + )
comprar el mismo modelo en el futuro. Una muestra () = 12 (1 ) + + 2 ( )
aleatoria de 400 de estos compradores incluye 267
que dijeron estar dispuestos a comprar de nuevo el Si adems las variables aleatorias son aproximada-
mismo modelo. Para cada uno de los siguientes enun- mente normales, entonces, W tendr una distribucin
ciados, indique si el enunciado es correcto o inco- aproximadamente normal (propiedad reproductiva de
rrecto. Si es incorrecto, explique por qu. la distribucin normal).

Enunciado 1: El estimado puntual = 0.668 nunca di- Ejemplo: Una gra se disea para levantar 50 tonela-
ferir del verdadero valor actual de la proporcin po- das. La gra se usa para levantar paquetes de 1.2 to-
blacional por ms de 0.0462. neladas cada uno. Los pesos de estos paquetes estn
normalmente distribuidos con una desviacin estn-
Enunciado 2: Es improbable que el estimado = dar de 0.2 toneladas. Si la gra levanta 40 de estos pa-
0.668 difiera del valor actual de la proporcin pobla- quetes a la vez, cul es la probabilidad de que se ex-
cional por ms de 0.0235. ceda el peso de diseo?
5

Enunciado 3: Es improbable que el estimado = Solucin: sea para = 1,2, ,40 el peso de cada
Pgina

0.668 difiera del valor actual de la proporcin pobla- uno de los paquetes. El peso total de los 40 paquetes
cional por ms de 0.0462. Respuesta: enunciado 2 es:
= 1 + 2 + + 40 el valor esperado es que cada medicin individual, pero la desviacin es-
tndar se ve reducida por un factor igual a la raz cua-
() = (1 ) + (2 ) + + (40 )
drada del tamao de muestra. En otras palabras, el
() =
1.2 + + 1.2 = 40(1.2) = 48 toneladas promedio de muchas mediciones repetidas, tienen la
40 misma exactitud, pero es ms preciso que cualquier
Para encontrar la desviacin estndar del peso total de medicin individual.
los paquetes debemos calcular la varianza de la si-
guiente manera Ejemplo: Se va a medir la longitud de una pieza usada
para ensamblar una parte mecnica por medio de un
() = (1 ) + (2 ) + + (40 ) proceso cuya incertidumbre es 0.05 cm. Si se hacen 25
0.22 + 0.22 + + 0.22 = 40(0.22 ) = 1.6
() = de estas mediciones de manera independiente y su
40 promedio se usar para estimar la longitud de la pieza
cul ser la incertidumbre? cunto ms precisa es el
Entonces, = 1.26 .
promedio de las 25 mediciones que una sola medida?
Como los pesos de los paquetes son aproximada-
Solucin: la incertidumbre del promedio de las 25 me-
mente normales ~(48, 1.262 ) y 0.05
diciones es = 0.01 . La incertidumbre en una
50 48 25
( > 50) = 1 ( ) sola medida es 0.05 cm. La incertidumbre de las 25
1.26
mediciones promediadas es menor que la de una sola
( > 50) = 1 (1.59) = 1 0.9441 = 0.0559 medida por un factor de 5, que es la raz cuadrada del
nmero de medidas que se promedian. As, el prome-
Del resultado podemos concluir que la probabilidad de
dio de las 25 medidas independientes es cinco veces
que se rebase el lmite de peso soportado por la gra
ms precisa que una sola medicin.
es pequea (a largo plazo, cerca del 6% de las veces
que se use la gra para levantar los 40 paquetes, se Distribucin de muestreo para la diferencia
exceder el peso permitido)
de medias
Mediciones repetidas
Caso de muestras grandes
Una de las aplicaciones de las combinaciones lineales
en ingeniera es cuando se trabaja con mediciones que Si estamos interesados en comparar dos medias po-
involucran alguna incertidumbre. Una de las maneras blacionales, podemos hacerlo estimando la diferencia
de reducir la incertidumbre es tomar muchas medicio- entre ellas.
nes de manera independiente y promediarlas. Las me- Suponga que las poblaciones de inters tienen medias
diciones en este caso son una muestra aleatoria simple 1 2 y varianzas 12 22 respectivamente. Estamos
de una poblacin conceptual. Entonces interesados en estimar la diferencia 1 2 e intuiti-
Si 1 , 2 , , son mediciones independientes, vamente escogemos 1 2 para hacerlo. Suponga
cada una con media e incertidumbre , entonces la que ambas muestras, de tamaos 1 2 respectiva-
++ mente, se toman de manare independiente una de la
media muestral = 1
es una medicin con
otra.
una media = y una incertidumbre

Para cada tem seleccionado se mide la caracterstica
= de inters y se calculan las medias muestrales. La dife-

rencia 1 2 es un estimador insesgado de 1 2
6

Este resultado es muy importante para las aplicaciones


Pgina

prcticas, ya que nos dice que, si realizamos muchas Entonces, la distribucin de muestreo para la diferen-
mediciones independientes de la misma cantidad, el cia de medias 1 2 para muestras grandes, es apro-
promedio de estas mediciones tiene la misma media ximadamente normal, con media 1 2 y varianza
12 22
+ . la aproximacin mejora a medida que el ta-
1 2
mao de muestra se incrementa.

Ejemplo: Cierto fabricante tiene dos mquinas que se


usan para llenar botellas con un litro de leche. Por me-
dio de mediciones hechas a lo largo de varios aos se
sabe que la varianza de la cantidad de leche deposi-
tada por botella es de 200 2 para ambas mquinas.
Suponga que 30 muestras de la cantidad de leche ser-
vida por cada una de las mquinas son tomadas alea- Entonces, la distribucin de
toriamente. Calcular la probabilidad de que la diferen-
cia en las medias muestrales de ambas mquinas sea (1 2 ) (1 2 )
a lo sumo 10 ml. 1 1
2 +
1 2
Solucin: en este caso como ambas muestras son
grandes, la diferencia de medias tiene una distribucin Es una distribucin con 1 + 2 2 grados de
aproximadamente norma con media 1 2 = 0 y va- libertad. La varianza combinada de las muestras est
(1 1)12 +(2 1)22
rianza
200 200
+ 30 = 13.333, es decir dada por 2 = .
30 1 +2 2

(1 2 )~(0,13.333) Caso 2: varianzas diferentes

Como estamos interesados en que la diferencia no Si no podemos asumir que las varianzas son igualges,
supere los 10ml, esta condicin puede ser pero las poblaciones son aproximadamente normales,
representada como |1 2 | 10. Entonces tal como lo muestra la siguiente figura

(|1 2 | 10) = (10 1 2 10)


100 100
(|1 2 | 10) = ( )
3.651 3.651

(|1 2 | 10) = (2.74 2.74)

(|1 2 | 10) = (2.74) (2.74)


(|1 2 | 10) = 0.9969 0.0031 = 0.9938 Entoces la distribucin de muestreo de
Es muy probable que las medias tengan una diferencia
(1 2 ) (1 2 )
de a lo sumo 10 ml
2 2
Caso de muestras pequeas 1+ 2
1 2
Caso 1: varianzas iguales.
Tiene aproximadamente una distribucin t con
Si ambas poblaciones son aproximadamente normales 2
con varianzas desconocidas pero que pueden 2 2
(1 + 2 )
asumirse iguales, como lo indica la siguiente figura 1 2
=
(12 /1 )2 (22 /2 )2
+
1 1 2 1
7
Pgina

Grados de libertad (se recomienda redondear al


siguiente entero).
Ejemplo: los siguiente datos representan el tiempo de
secado, en das, para dos tipos de cemento

Cemento 1 Cemento 2
1 = 14 2 = 16
1 = 17 2 = 19
12 = 1.5 22 = 1.8

Suponga que las poblaciones son normales con


varianzas iguales.

a) Cul es la distribucin de muestreo de 1 2 ?


Solucin: como los tamaos de muestra son pe-
queos y las varianzas son conocidas
1 2 tiene aproximadamente una distribucin
con 28 grados de libertad.
b) Calcule un estimado puntual para 1 2
Solucin: el estimado puntual est dado por
1 2 = 17 19 = 2 das. cmo interpreta
el signo negativo?
c) Calcule el estimado de la varianza comn 2
Solucin: una estimacin de la varianza comn es
la varianza combinada de las muestras
(1 1)12 +(2 1)22
2 =
1 +2 2
(141)1.5+(161)1.8
2 = 14+162
= 1.66

Ejemplo: Una muestra aleatoria de tamao 1 = 25


es tomada de una poblacin normal con 1 = 5 tiene
una media 1 = 80. Una segunda muestra aleatoria
de tamao 2 = 25 es tomada de una segunda pobla-
cin normal con desviacin estndar 2 = 3 resul-
tando 2 = 75.
a) Cul es la distribucin de muestreo de 1 2 ?
Solucin: como las varianzas son diferentes y las
poblaciones normales, 1 2 tiene aproximada-
mente una distribucin con
2 2 2
( 1+ 2) 25 9 2
1 2 ( + )
= 2 2 = (252525)2 25(925)2 = 39.29 40
(2 2
1 /1 ) +(2 /2 ) +
24 24
1 1 2 1

grados de libertad.

b) Calcule un estimado puntual para 1 2


8

Solucin: el estimado puntual est dado por


Pgina

1 2 = 80 75 = 5

Das könnte Ihnen auch gefallen