Sie sind auf Seite 1von 67

DISTRIBUCIONES

MUESTRALES
Induccin
Unidad de estudio

Unidad de muestreo

Muestreo
Es una tcnica de obtencin de un subconjunto de una poblacin
(muestra) para estimar e inferir con respecto a la caracterstica de una
poblacin (parmetro).
La poblacin ideal que se pretende estudiar se denomina poblacin
objetivo.
Ventajas

1. La naturaleza destructiva de algunas pruebas


2. La imposibilidad fsica de chequear todos los elementos
de la poblacin.
3. El costo de estudiar a toda la poblacin es muy alto.
4. El resultado de la muestra es muy similar al resultado de
la poblacin.
5. El tiempo para contactar a toda la poblacin es inviable.
Ejemplos

Estimar la proporcin de lavadoras que se descomponen antes del


tiempo de garanta. Para estimar esta probabilidad es necesario recopilar
informacin acerca del nmero de lavadoras descompuestas en cierto perodo
o de una produccin dada. El parmetro o caracterstica de inters no es
conocida, pero puede ser aproximada de la informacin recopilada.

Estimar el tiempo promedio que un apersona permanece en un banco, se


hace necesario conocer la distribucin de dichos tiempos (lo cual no siempre
es posible). Es necesario observar los tiempos empleados por n personas
para obtener una aproximacin del tiempo promedio real (parmetro de
inters).

En un proceso de elaboracin de materiales para construccin


establecer la variacin en los dimetros de las varillas usadas para
columnas de concreto. Se recopila informacin acerca de los dimetros de
un conjunto de varillas y se aproxima dicha variabilidad con estos datos.
Muestra aleatoria de tamao n

Es un conjunto de n v.a independientes e idnticamente distribuidas.


Es decir, si X1, , Xn es una muestra aleatoria, entonces cumple
que:

Ejemplo
Sea X e Y v.a discretas independientes con
Halle la distribucin conjunta de X e Y.

Solucin

Por independencia tenemos: p(x, y) = p(x).p(y)


Muestra probabilstica: Muestra que se selecciona de
modo que cada integrante de la poblacin en estudio tenga una
probabilidad conocida ( no igual a cero) de ser incluido en la
muestra

Tipos de muestreo probabilsticas


Muestreo aleatorio simple (m.a.s.) En general, las tcnicas de
Muestreo estratificado inferencia estadstica
Muestreo sistemtico suponen que la muestra ha sido
elegida usando m.a.s.
Muestreo por conglomerados

Muestra no probabilstica: Mtodos en los que no todos


los integrantes tienen probabilidad de ser incluidos en la muestra
Constante Variable aleatoria
Error de Muestreo
Si seleccionamos una muestra por el mtodo de muestreo aleatorio
simple, por otro tipo de muestreo, es poco probable que la media de
la muestra sea idntica a la media de la poblacin de donde fue
obtenida. De la misma forma, es probable que la desviacin estndar
de la muestra no sea exactamente igual al valor correspondiente de
la poblacin.

Por lo tanto podemos esperar alguna diferencia entre un estadstico


muestral y el correspondiente parmetro poblacional. Esta diferencia
es llamada error de muestreo.

Error de muestreo es la diferencia entre un estadstico muestral y


su correspondiente parmetro poblacional
El error de muestreo es no direccional o no sigue un patrn de
comportamiento o sistema, porque las medidas al exhibir error aleatorio
son igual de probables para ser demasiadas altas como bajas.

Es importante diferenciar de:

El Error de Respuesta: Algunos encuestados "pueden distorsionar" la


verdad (para ponerla bondadosamente) al responder a una pregunta.
Puede exagerar su ingreso, le puede quitar importancia a su edad, o puede
proveer que las respuestas que piensan son " aceptable.

Error de no respuesta: No todo el mundo en la muestra cooperar


devolviendo el cuestionario o en contestar las preguntas de un
entrevistador. Esto no sera un problema, excepto que esos que responden
pueden ser diferentes a esos que no lo hacen. Por ejemplo, si estamos
usando un cuestionario del correo para averiguar la extensin para la cual
las personas estn familiarizadas con las obras de William Shakespeare,
esos que son menos literatos o menos interesados en este autor clsico
tambin puede tener menos probabilidad de completar y devolver nuestros
cuestionarios. Como consecuencia, nosotros "podramos medir" un nivel
muy alto de inters que realmente es.
Distribucin muestral de la media
La distribucin muestral de la media es una distribucin probabilstica
que consta de una lista de todas las medias muestrales posibles de un
tamao de muestra dado de una poblacin y la probabilidad de
ocurrencia asociada con cada media muestral. La media muestral es un
estadstico con media y varianza como sigue:

2
[ ]
E X = [ ]
y V X =
n
Poblacin infinita

2 N n
[ ]
E X = [ ]
y V X =
n N 1
Poblacin finita
Ejemplo Finita

Posibles muestras de tamao n=2

[ ] 1 1 1
E X = 1.5( ) + 2( ) + 2.5( ) = 2
3 3 3
[ ] 1 1 1
V X = 1.52 ( ) + 2 2 ( ) + 2.52 ( ) 2 2 = 0.167
3 3 3
2 N n 0.67 3 2
[ ]
V X =
n N 1
=
2 3 1
= 0.1675
Si la distribucin de X es Normal

Poblacin infinita

Si la distribucin de X es desconocida o no es normal

Poblacin infinita
Cuando se considera que n es suficientemente
grande?

No hay por desgracia ninguna respuesta universal, depende de la


forma de la distribucin de X: si esta no es muy diferente de una
distribucin Normal, no hace falta un n muy grande para que la
aproximacin de la distribucin de la media muestral por una Normal
sea satisfactoria.

En cambio, si es muy distinta de una distribucin Normal, ser


necesario una muestra grande. Se suele considerar como indicacin
que n mayor de 30 es suficiente en la mayora de los casos (pero no
es ms que una indicacin...).
Ejemplo

Una habitacin requiere 8 focos de cierto tipo, cuya intensidad


lumnica promedio sea superior a 9.8 L/W (lmen por vatios). Si la
intensidad lumnica de este tipo de focos es aproximadamente normal
con media 9.9 L/W y desviacin estndar 0.3 L/W. Qu proporcin
de veces se cumple el requisito exigido?
Solucin
Suponga que X1,,Xn es una m.a de v.a. que representan las
intensidades lumnicas de los 8 focos elegidos al azar.

El 82.64% de las muestras de 8 focos de este tipo cumplen el


requisito acerca de la intensidad lumnica requerida
Ejemplo

La resistencia a la compresin del concreto es una v.a. con una


resistencia media de 2500 psi y una desviacin estndar de 50 psi.
Encuentre la probabilidad de que en una muestra de 36 especimenes
de concreto, la resistencia promedio est entre 2497 y 2505 psi.
Solucin
Suponga que X1,,X36 es una m.a. donde cada Xi representa la
resistencia de cada espcimen de concreto, i=1,2,,36
Ejemplo
La acidez de los suelos se indica usualmente por el PH, el cual vara de 0 a
14. Se desea estimar el PH de un gran campo, para lo cual, se toman n
mediciones de PH aleatoriamente sobre este campo. La experiencia ha
mostrado que las mediciones de PH fluctan en un rango de 5 a 8. Si se
toman 40 mediciones. Cul es la probabilidad de que el PH promedio de
sta muestra se desve a lo ms 0.2 unidades de PH del valor real de PH
para ste campo?
Solucin
Suponga que X1,,X40 es una m.a. de mediciones de PH para este
campo y suponga
CASO PRCTICO

Segn viene publicado en una prestigiosa revista de economa, el salario


semanal medio de trabajadores de construccin es de 406,15 u.m. Se
estima adems que la desviacin estndar de dichos salarios es de 55,5
u.m. Si suponemos que se toma una muestra aleatoria de 100 trabajadores
para estudiar sus salarios, calcular las siguientes probabilidades referentes
a la media de dicha muestra:

1. La probabilidad de que la media de la muestra sea menor de 400 u.m.


2. La probabilidad de que la media de la muestra est entre 400 y 410 u.m.
3. La probabilidad de que la media de la muestra sea mayor de 415 u.m.
4. Hallar el valor del salario medio c tal que excluya el 5% de los salarios
promedio semanales superiores
Solucin
Distribucin muestral de la media con 2 desconocida*

En caso de que la poblacin sea normal con varianza desconocida,


puede evaluarse el comportamiento de la media muestral con:

X
t= (Poblacin finita)
S
n

X
t= (Poblacin infinita)
S N n
n N 1

Para muestras grandes la distribucin t se aproxima a la normal)


Ejemplo

En un recorrido de 16 pruebas de una hora cada uno, el consumo


promedio de gasolina de un motor fue 16.4 galones, con una
desviacin estndar de 2.1 galones. Se quiere saber si es cierta la
afirmacin de que el consumo promedio de gasolina es 12
galones/hora.
Solucin
Tenemos la siguiente informacin:

Para responder la pregunta debemos verificar que tan probable es que una
muestra de 16.4 galones pertenezca a una distribucin con una media de 12.
Por lo tanto, debemos calcular la probabilidad de que la media muestral sea
mayor o igual que 16.4 si la verdadera media de donde proviene dicha muestra
es 12 galones. Esto es:

En la tabla de la distribucin t con 15 grados de libertad, tenemos que para una


probabilidad de 0.005 el respectivo valor de t es 2.947, lo cual implica que la
probabilidad para t = 8.38 es cero). Por lo tanto, concluimos que la probabilidad
de obtener una muestra con una media de 16.4 de una poblacin cuya media es
12.0 es cero, es decir, que el consumo promedio de gasolina no es 12
galones/hora, sino que es superior.
Ejemplo

El gasto diario en llamadas telefnicas en el departamento de


una empresa sigue una distribucin normal con media = 64
nuevos soles. Si para dicho departamento se elige al azar 10
das y se encuentra un gasto promedio de 60 nuevos soles y una
desviacin estndar de 7. Calcular la probabilidad de que el
gasto medio en el periodo muestral sea menor a lo observado.
Solucin

1. Como X es normal con media = 60


2. varianza desconocida
3. Muestra pequea n = 10
Calculamos el valor t- student con 10-1=9 grados libertad:

60 64
t= = 1.81
7 / 10
Distribucin muestral de la proporcin
Ejemplo
Un distribuidor de tornillos determina a travs de pruebas que el 4% de
los tornillos fabricados por una determinada compaa son
defectuosos. El distribuidor vende paquetes de 150 tornillos con
garanta de que el paquete contiene el 92% de tornillos no defectuosos.
Cul es la probabilidad de que un paquete no satisfaga la garanta?
Solucion:

El porcentaje de tornillos defectuosos fabricados por la compaa es


p = 0,04. Como n = 150 > 30, la proporcin muestral se distribuye:

Luego la probabilidad de que un paquete no satisfaga la garanta es:


Ejemplo
Un encuestador considera que el 20% de los votantes de cierta rea,
estn a favor de cierta poltica judicial. Se selecciona al azar 64
votantes de esta rea. Cul es la probabilidad de que la fraccin de
votantes en la muestra a favor de la poltica judicial se aleje a lo ms
0.06 de la fraccin real?
Solucin
Sea X : # personas en la muestra de 64, a favor de dicha poltica

=
Ejemplo
Se supone que el 12% de la poblacin en una ciudad tiene una
segunda residencia. Con el fin de obtener una informacin ms
precisa se toma una m.a. de 250 familias. Cul es la probabilidad
de que la proporcin de familias de la muestra con segunda
residencia est comprendida entre un 10% y un 15%?.

Solucin

Debemos calcular

Pr( 0.10 < P < 0.15) = Pr(P < 0.15) Pr(P < 0.1)

0.15 0.12 0.1 0.12


z1 = = 1.46 z2 = = 0.97
0.12(0.88) 0.12(0.88)
250 250
Luego
Pr( 0.10 < P < 0.15) = 0.927855 - 0.166023
= 0.761832
Ejemplo
Una agencia de publicidad determina que aproximadamente dos de
cada 40 compradores potenciales de un producto ve cierto anuncio en
un peridico, dos de cada 10 ve el anuncio correspondiente en la
televisin y 4 de cada 100 ve los dos anuncios. Adems, uno de 6
compra realmente el producto si ha visto el anuncio, y de cada 10 que
no han visto el anuncio slo uno compra.
a) Si se entrevista a 200 personas, cul es la probabilidad de que por
lo menos 30 de ellos compren realmente el producto?
b) Cul debe ser el nmero de personas entrevistadas para tener un
95% de probabilidad de que la proporcin muestral se desve de su
valor real en no ms. de 0.04?
Solucin
El diagrama de Ven de los compradores del producto que ven el
anuncio en el peridico y TV se muestra en la figura 1.4 y el
diagrama de rbol de probabilidad de compradores y no
compradores del producto se muestra en la figura 1.5

2/40=0.05

2/10=0.20
Distribucin muestral de la Varianza
Ejemplo
La precisin de un instrumento de prueba es admisible si su
variabilidad no es mayor a 10 unidades2 de medida. Para verificar la
precisin de dicho instrumento, se realizan 27 lecturas sobre un
dispositivo los que proporcionan una varianza de 16.8 unidades. Si se
asume que las lecturas son obtenidas de una poblacin normal.
a) Cul es la probabilidad de que la desviacin estndar est entre 3
y 4?
b) Se puede afirmar que el instrumento es aceptable?
Solucin
a) Sea X: lecturas de cierto instrumento N(, 2=10)
P(3<S<4) = P(9<S2<16)

(26)(9) (n 1) S 2 (26)(16)
p < <
10 2
10
(
= P 23.4 < 2 < 41.6 )
= P ( 2
) (
< 41.6 P 2 < 23.4 )
= 0.97302 0.38977 = 0.58325
b) Debemos determinar si probabilsticamente el instrumento
es admisible
P(S2 > 16.8)

(n 1) S 2 (26)(16.8) Poco
p >
= P ( 2
> 43.68) = 0.01636

2 probable
10
Ejemplo
Un fabricante de bateras para automviles garantiza que sus bateras
duran, en promedio tres aos con una desviacin estndar de un ao.
Si cinco de sus bateras tienen duraciones de 1.9, 2.4 , 3.0, 3.5 y 4.3
aos, puede asegurarse que las bateras tiene una duracin estndar
de un ao?. Suponga que la duracin de las bateras sigue una
distribucin normal.
Solucin

Debemos evaluar: P( S 2 < 0.815)


Esto es

Luego
P ( S 2 < 0.815) = P( 2 < 3.26) = 0.572

la cual es excesivamente alta. Por lo tanto, no hay evidencia para


concluir que la muestra no pertenece a una poblacin con una
varianza de uno.
Cociente de varianzas muestrales

Una v.a. F es la razn de


dos v.a. Chi-cuadrados
Ejemplo
Los directores de una empresa que fabrica plsticos desean saber si se
pueden comparar dos procesos de manufactura en relacin con la
variabilidad de la resistencia que tiene el producto respecto de la
traccin. Manifiestan ellos que en su concepto los dos procesos
producirn plsticos con igual resistencia a la traccin si la razn entre
las varianzas muestrales de especimenes de los dos procesos no es
demasiado grande. Consideran que la razn es demasiado grande si la
probabilidad de obtener un valor mayor o igual al cociente observado es
menor que 0,04. Las muestras aleatorias independientes de 25
especimenes cada uno de los procesos dan varianzas de 540 y 256.
Creern los directores que ambos procesos producen plsticos con la
misma variabilidad de resistencia de la traccin?. Suponga que las
resistencias a la traccin de los productos fabricados con los dos
procesos estn normalmente distribuidos.
Solucin
Diferencia de medias muestrales
Ejemplo: Caso a
La vida til de un dispositivo fabricado por la empresa A es de
1.400 horas, con una desviacin estndar de 200 horas. Por su
parte, el mismo dispositivo fabricado por la empresa B de la
competencia tiene una duracin de 1.200 horas con un desvo de
100 horas. Se eligen 125 dispositivos de cada empresa con un
muestreo al azar. Calcular la probabilidad que los de la empresa A
duren 250 das ms que los de B.
Solucin
Poblaciones normales con varianzas conocidas

Entonces, la probabilidad pedida es igual al rea a la derecha de este


valor en la curva de Gauss.

P (Z > 2.5) = 0,0062. Lo que significa que hay un 0,6% de probabilidad


porcentual de que la vida til del dispositivo fabricado por A dure 250
horas ms que el de su competencia.
Ejemplo:
Solucin
Ejercicio
Debido a las buenas perspectivas que presenta la economa peruana, un grupo
de empresarios europeos han decidido invertir en nuestro pas, para lo cual est
evaluando la compra de una de las dos cadenas de restaurantes de comida
rpida que funcionan en Lima. Los empresarios europeos calificaron como muy
buenas alternativas para iniciarse en el negocio de alimentos. Sin embargo. para
tomar su decisin por la compra de una de las cadenas, establecieron los
siguientes criterios:

a) Se elegir a la cadena de tiendas que presente similares niveles de ingresos


en sus locales, pues, esto permitir a los inversionistas planear con mayor
exactitud sus ingresos, esperados para los siguientes aos y lograr una mejor
estimacin del tiempo de recuperacin de su inversin. Debido a la alta volatilidad
en el consumo de clientes de los estratos sociales medio-alto y medio, los
inversionistas presumen que existe mayor dispersin en los niveles de ventas de
la cadena A con respecto a las ventas de la cadena B.

b) Adquirir la cadena de comida rpida que presente mayor nivel de utilidad


promedio, para tal fin definen la variable utilidad mediante la relacin:
UTILIDAD = VENTAS COSTO TOTALES

y asumen que existen diferencias significativas entre la variabilidad de los


niveles de utilidad de ambas cadenas.

c) Los empresarios decidirn invertir si aquella cadena de comida rpida que


presente mayor nmero promedio de clientes potenciales a ser atendidos,
para esto cuentan con la informacin de que. los clientes potenciales de los
restaurantes son aproximadamente el 35% de la poblacin de cada distrito.
Por otro lado, segn estudios anteriores se decidi que el nivel de variabilidad
del nmero de clientes atendidos en ambas cadenas no ha presentado
diferencias significativas. Para tomar una decisin adecuada en base a estos
tres criterios, se recolect informacin sobre los niveles de ventas y los costos
totales de ambas cadenas de comida rpida ubicadas en los distritos en
estudio correspondiente al mes de abril. Estas informaciones se presenta en
los siguientes cuadros.
140052

Promedio venta mensual de A


= 37,903.25
= 6,892.3

Promedio venta mensual de B


A

Tomando en cuenta la informacin proporcionada. en base a cada uno de


los tres criterios expuestos y asumiendo que las variables venta, utilidad y
nmero de habitantes tienen distribucin normal; qu cadena de comida
rpida deberan comprar los empresarios europeos?
Ejercicio
Se registraron los siguientes datos, en minutos, que tardan
algunos empleados varones y mujeres en realizar cierta actividad
en una empresa, los cuales fueron seleccionados aleatoriamente

Suponga que los tiempos para los dos grupos se distribuyen


normalmente
Calcule la probabilidad de que las mujeres tardan mas de 3
minutos en realizar la misma tarea que los varones.
Diferencia de proporciones muestrales
Ejemplo:
Solucin

Das könnte Ihnen auch gefallen