Sie sind auf Seite 1von 17

hay considerable variacin dentro de cada grupo pero los grupos son

esencialmente semejantes entre s.

DISTRIBUCIONES MUESTRALES

1 Distribucin muestral de medias


2 Distribucin muestral para diferencias de medias
3 Distribucin muestral de proporciones y diferencias
4 Distribucin muestral de varianzas

Se define la distribucin muestral de un estadstico (distribucin de


muestreo) en una poblacin, como la distribucin de probabilidad de todos los
posibles valores que un estadstico puede asumir para cierto tamao de la
muestra. Especficamente, se trabajar con las distribuciones muestrales para:
medias, proporciones y varianzas.

Una distribucin muestral es una distribucin de probabilidad de un


estadstico muestral calculado a partir de todas las muestras posibles de tamao
n, elegidas al azar en una poblacin determinada. Si la poblacin es infinita,
tenemos que concebir la distribucin muestral como una distribucin muestral
terica, ya que es imposible sacar todas las muestras aleatorias posibles de
tamao n de una poblacin infinita. Si la poblacin es finita y moderada se puede
construir una distribucin muestral experimental, sacando todas las muestras
posibles de un tamao dado, calculando para cada muestra el valor del estadstico
que nos interesa. Ejemplo, supongamos que se tiene una poblacin de tamao N
= 10 y queremos extraer con reemplazamiento todas las muestras posibles de
tamao n = 5, para esto se utiliza la relacin Nn , es decir,

105 = 100000 muestras de tamao n = 5.


En cambio, si el muestreo es sin reemplazamiento, el nmero de muestras de
tamao n = 5 viene dado por la combinatoria:

N N! 10! 10.9.8.7.6.5!
= = = = 252
n n!(N n)! 5!(105)1 5!.5.4.3.2.1 muestras.

En el caso anterior la distribucin muestral para un estadstico determinado, la


v
media aritmtica ( X )viena dada por:

muestra 1 X1
muestra 2 X2
:
M
muestra 252 X 252

Por lo tanto, X1 , X 2 , X 3 , K , X 252 conforman la distibucin muestral de medias.

Se puede hacer una aproximacin experimental de distribuciones


muestrales basadas en poblaciones infinitas o finitas grandes, sacando un nmero
de muestras aleatorias y siguiendo el mismo procedimiento anterior.

1) DISTRIBUCIN MUESTRAL DE MEDIAS:


Es la distribucin de probabilidad de todas las medias posibles de las
muestras, para un tamao n determinado. Ver ejemplo, anterior. Esta distribucin
de probabilidad tiene asociados (parmetros) tales como la media X y
desviacin estndar X . Para calcular, estos parmetros de la distribucin

muestral de medias se utilizan las siguientes relaciones:

X =
N n
X = para poblaciones finitas
n N 1


X = para poblaciones infinitas
n

La expresin


X
=
n
Es la desviacin estndar de la distribucin muestral de medias, se le llama
error tpico o estndar de la media y nos indica la diferencia promedio entre los
diversos valores de X y . Como se observa, a medida que el tamao de la
muestra aumenta este error disminuye, las diversas medias muestrales se hacen
ms uniforme en su valor, y en consecuencia, cualquier media muestral es una
buena estimacin de la media poblacional .

Anteriormente se mostr la manera de calcular la media y la desviacin


estndar de la distribucin de las medias muestrales. Ahora se va a distinguir dos
situaciones:

a) Muestreo en una poblacin distribuida normalmente: Si X es la


media de la muestra aleatoria de tamao n, tomada de una poblacin distribuida

rmalmente, con media y desviacin tpica , entonces la distribucin
n
muestral de X est normalmente distribuida. Para hallar la probabilidad asociada
a X , se transforman los valores de X a valores de la distribucin normal
estandarizada, mediante la frmula:

X-
Z=
/ n

Ejemplo: Cierta marca de neumticos tiene una vida til media de 21.000
Km con una desviacin tpica de 800 Km.

a. suponiendo que las vida til de los neumticos estn distribuidas


normalmente. Cul es la probabilidad de que un neumtico cualquiera
dure menos de 20.900 Km?

b. Cul es la probabilidad de que la vida til media de 64 neumticos sea


inferior a 20.900 Km?

Solucin:
1. Como la variable X = vida til de los neumticos, est distribuida normalmente.
Entonces la probabilidad de que un neumtico cualquiera dure menos de
20.900 km se calcula de la forma siguiente:
Estandarizacin

20.900 21.000 -0,13 0

20.900 21.000
P ( X 20.900) = P Z = P(Z 0,13) =0,4483
800

Es decir, el porcentaje de que un neumtico tenga una vida til menor que 20.900
Km es de 44,83 %.

Para calcular esta probabilidad, se recurre a una tabla de distribucin normal


estandarizada.

2. Si se seleccionan todas las muestras posibles de tamao 64 de la poblacin de


neumticos, entonces por lo anteriormente mencionado esta distribucin muestral
de medias es normal, con media y desviacin tpica igual a 21.000 Km y 100 Km
respectivamente.
Luego la probabilidad de que la vida til media de 64 neumticos sea inferior a
20.900 Km se calcula de la forma siguiente:

20.900 21.000
P ( X 20.900) = P Z = P(Z 1) = 0,1587
800 / 64

Por lo que el porcentaje de que la vida til media de 64 neumticos sea inferior a
20.900 Km es de 15,87 %.
b) Distribucin en poblaciones que no estn distribuidas normalmente.
Existen mtodos que se pueden emplear cuando se necesita hacer inferencia
sobre este tipo de poblacin. Una solucin usada con frecuencia es que se
extraiga una muestra grande. Una vez extrado ese n grande, el investigador
puede utilizar el Teorema del Lmite Central, el cual se enuncia a
continuacin:

sin tomar en cuenta la forma funcional de la poblacin de donde se


extrae la muestra, la distribucin de medias muestrales, calculadas con
muestras de tamao n extradas de una poblacin con media y
desviacin estndar , se aproxima a una distribucin normal con media
y desviacin / n , cuando n aumenta. Si n es grande, la distribucin
de las medias muestrales puede aproximarse mucho a una distribucin
normal.

Este teorema expresa que sin tomar en cuenta la forma de la poblacin que se
est estudiando, se puede seguir empleando la teora normal para obtener
inferencias sobre la media poblacional a condicin de que obtengamos una
muestra grande, porque la distribucin muestral de X ser aproximadamente
normal cuando n sea grande. Generalmente, muchos investigadores consideran
que a partir de n = 30 se puede usar el teorema del Lmite Central.

Ejemplo:
Una empresa emplea 1500 personas. La cantidad promedio gastada
durante un ao determinado, en servicios mdicos personales por empleados fue
de 25,75 $ y la desviacin estndar de 5,25 $. Cul es la probabilidad de que
una muestra de 100 empleados arroje una media comprendida entre 25 y 27 $?.
En este problema no se especfica si la poblacin es normal, pero como el tamao
de la muestra n = 100 > 30 podemos aplicar el teorema del lmite central, por lo
que la distribucin muestral de X es aproximadamente normal y por lo tanto
podemos hallar su probabilidad, esto es:

25 25,75 27 25,75
P (25 X 27) = P Z = P( 1,48 Z 2,46 ) =0.9237
5, 25 / 100 5, 25 / 100

Es decir, se tiene un porcentaje del 92,37 % de que el promedio de gastos


mdicos por empleado durante un ao este entre 25 y 27 $.
est distribuido segn la distribucin t de Student con v = n1 + n2 2 grados de
libertad.

c) Distribucin t de student:

Esta distribucin permite realizar inferencias sobre medias poblacionales


cuando se desconoce la varianza de la poblacin con muestras de tamao n < 30.
En consecuencia para hallar la probabilidad asociada a t transformamos los
valores t (de la distribucin normal) a valores de la distribucin normal
estandarizada mediante la siguiente frmula:

X-
t=
S/ n

Para hallar la probabilidad asociada a t se usa la tabla de distribucin de


Student.

Caractersticas de la distribucin t:

a) tiene forma de campana como la distribucin normal, solo que es


ms ancha en las colas (mayor rea)
b) los grados de libetad vienen dados por: v = n-1

c) Se aproxima a la normal a medida que aumentan los grados de


libertad.

Ejemplo: Considerando el ejemplo anterior, con = 25, 75 $ y


desconocida. Cul es la probabilidad de que una muestra de 20 empleados, con
una desviacin de 5 $, arroje una media comprendida entre 25 y 27 $ ?.

Solucin: Como n < 30 y es desconocida, se tienen pequeas


muestras, por lo que se utiliza la distribucin t de Student:



25 25,75 X 27 25,75
P (25 X 27) = P = P( 1,12 t 1,12 ) = 0,72
5 / 20 S 5 / 20

n

Es decir, se tiene una probabilidad de 0,72 (72 %) de que la media de gastos


mdicos por empleado para una muestra de tamao n = 20 est entre 25 y 27 $.

2) DISTRIBUCIN MUESTRAL PARA LA DIFERENCIA DE MEDIAS

( X 1 X 2 ).-

A veces interesa hacer inferencias sobre la diferencia poblacional de


medias 1 - 2, o saber si es razonable concluir que dos medias poblacionales no
son iguales, considerando que se tienen sendas muestras para las poblaciones 1
y 2, respectivamente, donde:

Entonces, la diferencia de las medias muestrales X 1 X 2 , estima a 1 -

2. La forma funcional de la distribucin muestral de X 1 X 2 depende de la forma


funcional de las poblaciones donde se extraen las muestras tomando en cuenta:

Si ambas poblaciones son normales la distribucin muestral de la


diferencia de medias es normal.

Si una o ambas de las poblaciones no es normal, la distribucin


muestral de las diferencias de medias X 1 X 2 es normal si n1 +
n2 2 >30 (grandes muestras), este resultado se deduce del
teorema del lmite central.
En estos casos, los parmetros que definen esta distribucin muestral de las
diferencias de medias vienen dados por:

X X = 1 2
1 2

12 2 2
X X = +
1
n1 n2

El cual se aplica para dos casos especficos dependiendo de la muestra:


a) Para grandes muestras, cuando v = n1+n2 - 2 > 30, se trabaja con la
distribucin normal. En estos casos, estandarizando la diferencia de
medias muestrales, se tiene:
( X 1 X 2 ) ( 1 2 )
Z=
12 2 2
+
n1 n2

Ejemplo: La siguiente tabla nos muestra informacin del tiempo medio en


minutos que tarda un cliente en ser atendido en dos bancos:

Banco A Banco B
A2 = 3 min B2 = 5 min
A = 14 min B = 13 min
n A = 20 nB = 13

Hallar la probabilidad de que la diferencia media entre los dos bancos no


exceda de 2 minutos.

Solucin: como los grados de libertad 20 + 13 2 =33 2=31 > 30, se


tienen grandes muestras se trabaja con la distribucin normal:



( X A X B ) ( A B ) 2 ( A B ) 1
P ( X A X B 2) = P = P Z = P(Z 1,37) =
A2 B2 3 5 0,73
+ +
n n 20 13
A B

0, 9146

Existe un 91,46 % que la diferencia media entre los dos bancos no exceda de 2
minutos.
b) Para pequeas muestras, Cuando v = n1 + n2 2 < 30, se trabaja con la
Distribucin t de Student. Por lo tanto, el valor viene dado por:

( X 1 X 2 ) ( 1 2 )
t=
2 2
Sp Sp
+
n1 n2

donde:

2 2
2 (n 1) S1 + (n 2 1) S 2
Sp = 1
n1 + n 2 2

Ejemplo: Considerando los ingresos mensuales de empleados de dos empresas,


se tiene informacin de dos muestras mediante la siguiente tabla:

Empresa 1 Empresa 2
S12 = 400000000 Bs S 22 = 342250000 Bs
1 = 180000 Bs 2 = 210000 Bs
n1 = 20 n 2 = 10

Hallar la probabilidad de que la diferencia de medias muestrales sea a lo menos


3500.
Solucin: : como los grados de libertad 20 + 10 2 =30 2=28 < 30, se
tienen pequeas muestras se trabaja con la distribucin t de Student:



( X X ) ( ) 3500 + 30000 33500
P ( X 1 X 2 3500) = P A B 1 2
= P t = P(t 4,43)
2
Sp Sp 2
381437500 381437500 7564,10
+ +
n1 n2 20 10

19..400000000 + 9.342250000
donde S p2 = = 381437500
28

Entonces para v = 28 gl y usando la tabla t de Student:

P ( X 1 X 2 3500) = P(t 4,43) = 0,99

Es decir, la probabilidad de que la diferencia media de los salarios sea mayor que
3500 es del 0,99.

)
3). DISTRIBUCIN DE UNA PROPORCION MUESTRAL ( P ).-
Se define una proporcin poblacional como el cociente:

nmero de casos favorables


p=
total de casos

Por ejemplo: si de una poblacin de N = 50, empleados de una empresa, 15


de ellos no cumplen con su horario de trabajo, la proporcin de empleados que no
cumplen horario con relacin al total, viene dado:
P = 15/50 = 0,3; es decir, el 30 % de los empleados no cumplen su horario.

La proporcin muestral ( p ), se define como:

nmero de casos favorables


p =
tamao de la muestra

Ejemplo:
Si se toma una muestra aleatoria de tamao n = 1000 y 425 personas
satisfacen un evento, entonces p = 425 / 1000 = 0,425. Esto significa que el 42,5
% de las personas satisfacen dicho evento.
La distribucin de una proporcin muestral, se define de una manera
anloga a a la distribucin de media, o sea:
Muestra 1---- p1
Muestra 2---- p2
Muestra 3---- p3

Muestra X---- p k
De esta forma: p1 , p2 , p3 ,..., p k corresponden a la distribucin de una

proporcin muestral.

De acuerdo a lo expuesto, la distribucin muestral de proporciones


corresponde a una distribucin de probabilidad de todas las proporciones posibles
de las muestras, para un tamao n determinado.

Los parmetros que definen esta distribucin vienen dados por:


p = p = P
p.q N n
X = para poblacione s finitas
n N 1

p.q
X = para poblacione s infinitas
n

Para el clculo de probabilidades relativa a proporciones, se trabaja de


manera anloga al caso de la distribucin muestral de medias.

Ejemplo: Un encuestador sabe que en cierta rea el 20 % est a favor de


las emisiones en bonos. Considerando una muestra de 64 personas, hallar la
probabilidad de que la proporcin muestral difiera de la proporcin real a lo sumo
en un 0,06.

Solucin:
p = 0.20 proporcin de personas de la poblacin que estn a favor de la emisin
p = proporcin de personas de la muestra que estn a favor de la emisin

entonces nos estn pidiendo la siguiente probabilidad:



0,06 p p 0,06
P ( p p 0,06) = P = P( 0,27 Z 0,27 ) = 0,20 4
0,2.0,8 p.q 0,2.0,8

64 n 64

4) DISTRIBUCIN MUESTRAL DE VARIANZAS.


Con esta distribucin, se estudia las probabilidades relativas a la varianza
de una poblacin. De esta forma, la distribucin muestral de varianzas, viene dada
por todas las posibles varianzas de las muestras para un tamao de muestra n
determinado. Para encontrar probabilidades relativas a varianzas se usa la
distribucin 2 (chi cuadrado), para ello se transforman los valores S2 (varianzas
muestrales) a valores de 2 mediante la siguiente relacin:

2 = (n - 1). S2 / 2 para v = n - 1 (grados de libertad).

Nota: El nico requisito para usar la distribucin chi cuadrado es que la


poblacin est distribuida normalmente

Ejemplo:
En una empresa, la desviacin estndar del sueldo de los empleados es de
Bs. 75000, correspondiente a valores distribuidos normalmente. Para un nuevo
estudio se escogen 17 empleados cuyos salarios se muestran a continuacin:

SUELDOS
156000 174000 162000
175000 269000 298000
185000 320000 450000
200000 260000 364000
225000 158000 300000

Se desea conocer si estos resultados muestran consistencia con respecto a


la desviacin, en cuanto a la variabilidad del sueldo de los empleados de dicha
empresa.
Solucin:

Cuando se habla de variabilidad nos referimos a la varianza desviacin


estndar, por lo que debemos calcular la desviacin muestral, esto es S =
87325,99 Bs. Por lo tanto:

(n 1) S 2 16.(87325,99) 2
P( S > (87325,99) ) = P
2 2
> ( )
= P 2 > 21,69 = 0,15 .

2
5625000000

Los resultados muestran consistencia ya que es ms probable que la


varianza muestral para muestras de tamao n = 17 estn por debajo de Bs.
87325,99

5) DISTRIBUCIN F DE FISHER.
Cuando se quiere estudiar la relacin entre las varianzas de dos
poblaciones distribuidas normalmente se usa la distribucin F de Fisher. Es decir,
dadas dos muestras aleatorias independientes de tamao n1 y n2 de dos

S 2M
poblaciones independientes, la distribucin muestral de la razn F = 2 (razn
Sm
de varianzas) se conoce como distribucin de Fisher, suponiendo que las
varianzas poblacionales son iguales ( 21 = 22 ). Donde:

S M2 : es la varianza mayor
S m2 : es la varianza menor
con (v1 , v 2 ) donde v1 = n 1 1 grados de libertad del numerador
v 2 = n 2 - 1 grados de libertad del denominador
Ejemplo:
Considerando que las varianzas poblacionales de dos poblaciones son
iguales, 21 = 22 , n1= 6 y n2 = 10, hallar la probabilidad de que la razn
de las varianzas muestrales no exceda a 3,48.

Solucin: Cuando se quieren comparar las varianzas muestrales de


S12
dos poblaciones se utiliza la distribucin F de Fisher, por lo tanto, F =
S 22

con v1 = 5 y v2=9 grados de libertad.Tambin la probabilidad pedida viene


dada por:

S12
P 2 3,48 = P(F 3,48) = 1 P( F > 3,48) = 1 0,05 = 0,95
S2

Ntese que an cuando las varianzas de las poblaciones son iguales, la


probabilidad de que la razn de las varianzas de las muestras exceda a 3,48 es
de 0,05 suponiendo tamaos de muestras de n1 = 6 y n2 = 10.

Tamao de la Muestra.
La clave del problema estriba en escoger una muestra cuyo seleccin
garantice la representatividad de la poblacin objeto de estudio. En los estudios
socio-econmicos, una muestra de un 30% de la poblacin, tiene un elevado nivel
de representatividad (Ramrez 1995); sin embargo, esta representatividad
depende mayormente, del tipo de muestreo. Obviamente, que el trabajar con
muestras, por muy confiables que sean, no se obtiene el 100% de exactitud, sin
embargo, ese pequeo error que acompaa siempre a los estudios por muestreo,

Das könnte Ihnen auch gefallen