Beruflich Dokumente
Kultur Dokumente
DISTRIBUCIONES
MUESTRALES
CONTENIDO
DISTRIBUCIONES MUESTRALES
127
6 DISTRIBUCIONES MUESTRALES
6.1 INTRODUCCIN
En el captulo 1 hemos definido la inferencia estadstica como un proceso que usa
informacin proveniente de la muestra para generalizar y tomar decisiones acerca de toda la
poblacin en estudio. Sin embargo, hasta el momento hemos trabajado la muestra y la
poblacin por separado.
En el captulo 2, trabajamos herramientas tiles en el anlisis exploratorio de los datos
provenientes de una muestra, tanto grficos como resmenes numricos para extraer
informacin de inters para la inferencia. Hablamos de distribuciones de frecuencias y
estadsticos.
En los captulos 3, 4 y 5, a travs del lenguaje de la probabilidad, tratamos los modelos para
las poblaciones que pueden ser de inters, sobre las cuales nos interesa sacar conclusiones, o
tomar una decisin. Definimos las variables aleatorias, sus distribuciones de probabilidad,
parmetros y algunos modelos frecuentes.
Podemos hacer un cuadro comparativo entre caractersticas del anlisis exploratorio de datos y
de la inferencia estadstica:
Anlisis exploratorio de datos
Su objetivo es la exploracin de los datos
muestrales, en busca de regularidades
interesantes.
Inferencia estadstica
Su objetivo es responder preguntas
concretas sobre la poblacin, planteadas
antes de la obtencin de los datos.
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES
128
As, por ej., si se quiere analizar cierta caracterstica de los alumnos que cursaron en la Fac. Reg. Rosario de la
UTN en los aos 2005 y 2006 y la muestra se elige seleccionando alumnos al azar solamente de los que cursaron
durante esos aos en ISI, las conclusiones que se extraigan a partir de esta muestra sern vlidas slo para la
poblacin de los alumnos de ISI, pero no para todos los alumnos de la Fac. Reg. Rosario.
Ya hemos dicho que en el curso slo se trabajar con muestras aleatorias simples.
En el caso de poblaciones finitas, el muestreo debe ser con reposicin para que la ocurrencia de una observacin
no aumente o disminuya la probabilidad de ocurrencia de otra (ver ej. 1 y 2, pag. 58, Cap. III)
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES
129
Tamao de la poblacin
N=4
Espacio muestral
Sx = {2, 4, 6, 8}
Distribucin de probabilidad
Uniforme discreta
Distribucin de Probabilidad de X
Tabla 1
x
P(X=x)
2
0,25
4
0,25
6
0,25
8
0,25
1
0,30
Probabilidad
0,25
0,20
0,15
0,10
0,05
0,00
2
x = 5
2x = 5
x: edad en aos
V Tomamos muestras de tamao 2, con reposicin. Cada muestra es de la forma (x1 ; x2),
donde:
Tabla 2
Muestra, n=2
xi = 5
y 2xi = 5
x1
2
2
2
2
4
4
4
4
6
6
6
6
8
8
8
8
x2 Promedio
2
2
4
3
6
4
8
5
2
3
4
4
6
5
8
6
2
4
4
5
6
6
8
7
2
5
4
6
6
7
8
8
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES
130
S x = {2, 3, 4, 5, 6, 7, 8}
Espacio muestral
2
3
4
5
6
7
8
Parmetros:
0,30
0,25
Probabilidad
Tabla 3: n=2
Probabilidad
0,0625
0,1250
0,1875
0,2500
0,1875
0,1250
0,0625
1,0000
0,20
0,15
0,10
0,05
0,00
2
x = 5
x2 = 2.5
Esperanza Matemtica
Varianza
Observemos que la distribucin del promedio adopta una forma completamente distinta de
la distribucin uniforme de los datos de origen.
V Repitiendo la experiencia, con muestras de tamaos 3, 4 y 5 respectivamente, obtenemos
las distribuciones de los promedios que mostramos a continuacin, acompaadas de las
grficas respectivas:
n=3
Promedio
2,00
2,67
3,33
4,00
4,67
5,33
6,00
6,67
7,33
8,00
Probabilidad
0,015625
0,046875
0,093750
0,156250
0,187500
0,187500
0,156250
0,093750
0,046875
0,015625
1
n=4
Promedio
2
2,5
3
3,5
4
4,5
5
5,5
6
6,5
7
7,5
8
Probabilidad
0,00390625
0,01562500
0,03906250
0,07812500
0,12109375
0,15625000
0,17187500
0,15625000
0,12109375
0,07812500
0,03906250
0,01562500
0,00390625
1
n=5
Promedio
2
2,4
2,8
3,2
3,6
4
4,4
4,8
5,2
5,6
6
6,4
6,8
7,2
7,6
8
Probabilidad
0,00097656
0,00488281
0,01464844
0,03417969
0,06347656
0,09863281
0,13183594
0,15136719
0,15136719
0,13183594
0,09863281
0,06347656
0,03417969
0,01464844
0,00488281
0,00097656
1
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES
131
0,30
Probabilidad
0,25
0,20
0,15
0,10
0,05
0,00
2
0,20
Probabilidad
0,15
0,10
0,05
0,00
2,00
8,00
0,20
Probabilidad
2,67
0,15
0,10
0,05
0,00
2
0,20
Probabilidad
2,5
0,15
0,10
0,05
0,00
2
2,4 2,8 3,2 3,6 4 4,4 4,8 5,2 5,6 6 6,4 6,8 7,2 7,6
Promedio de la m uestra de tam ao 5
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES
132
En las grficas anteriores podemos comprobar una aplicacin del Teorema Central del Lmite:
a medida que aumenta el tamao de la muestra la distribucin de probabilidad del promedio
muestral se hace cada vez ms acampanada, concentrndose alrededor del promedio de la
poblacin original.
La Tabla 4 permite comparar los parmetros esperanza
matemtica y varianza de la poblacin original, con la
esperanza matemtica y varianza de las poblaciones de
los promedios muestrales antes descriptas.
Vemos que las medias poblacionales se mantienen
iguales a 5 (la esperanza matemtica de las edades de
los 4 hermanos), mientras que las varianzas
poblacionales disminuyen su valor a medida que
aumenta el tamao de la muestra.
Tabla 4
x =5 x2 = 5
Poblacin
Tamao de
muestra
x2
2
3
4
5
5
5
5
5
2,5
1,667
1,25
1
Al considerar la distribucin de los valores tomados por el estadstico X en todas las muestras
de un mismo tamao n de la misma poblacin, obtenemos la distribucin muestral de X .
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES
133
Generalizando:
Distribucin muestral de la media muestral X
Si las muestras aleatorias simples de tamao n son tomadas de una poblacin con
media poblacional y desvo estndar poblacional , la distribucin muestral de
1)
x = E( X ) =
2)
x =
4)
(a)
(X )
S/ n
t n 1;
(a)
La apariencia general de la distribucin t es similar a la de la distribucin normal estndar: ambas son simtricas
y unimodales y el valor mximo de la ordenada se alcanza en la media = 0. Sin embargo esta distribucin tiene
colas ms amplias que la normal. Existe una distribucin t distinta para cada tamao de muestra. Una distribucin t
viene determinada por un parmetro llamado grados de libertad. A medida que aumentan los grados de libertad, la
curva de densidad t se parece ms a la curva de la N(0,1), ya que la estimacin de por s se va haciendo ms
precisa.
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES
134
Parmetro
Estimador
= X
p = fr
2 = Sn2 -1
Estas condiciones permiten controlar los errores de estimacin al aumentar el tamao de la muestra, como
veremos ms adelante.
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES
135
1)
E (fr) = p
2)
p) =
)
Var(p ) =
p(1 p )
n
3)
)
p(1 - p)
p es aproximada mente N p;
n
Para poder aproximar la distribucin Binomial a la Normal, el tamao de muestra n debe ser suficientemente
grande. Como regla emprica esta aproximacin es apropiada si np > 5 (Cap. 4).
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES
136
1)
E ( S2 ) = 2
2)
V(S 2 ) = S2 2 =
24
n -1
3)
la variable
libertad (b):
(n 1) S
2
n2 -1
4)
Las distribuciones ji cuadrado son una familia de distribuciones que slo toman valores positivos y que son
asimtricas hacia la derecha. Una distribucin ji cuadrado viene determinada por un parmetro llamado grados de
libertad. A medida que aumentan los grados de libertad, las curvas de densidad son menos asimtricas y por lo
tanto, los valores mayores son ms probables.
DISTRIBUCIONES MUESTRALES
137
Los ejercicios 1, 3 y 4 fueron extrados y adaptados del mdulo Nmero 7: Distribuciones muestrales de la
Coleccin Mtodos Estadsticos I., redactado por docentes de la UNR y extractado del libro Interactive Statistics
de Martha Aliaga, Universidad de Michigan, 2002.
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES
138
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES
139
APNDICE
1.- Promedio Muestral o Media Aritmtica
X=
1 n
Xi
n 1
E(X) =
Siendo
V(X) = 2
(X1, X2,..Xn),
entonces
E( Xi ) = y V(Xi) = (estas condiciones fueron visualizadas en pag. 129 para
muestras de tamao 2).
Luego
E ( X )= E [
V ( X )=V [
n
1 n
1
1
Xi ] = E Xi =
n 1
n
n
1
E ( Xi) =
1
1
n =
n
n
1 n
1
1 n
1
1
Xi ] = 2 V Xi = 2 VXi = 2 nV Xi = 2
n 1
n
n
n
n
1
1
X N ,
X N ,
fA =
nA
n
La variable aleatoria nA tiene distribucin binomial con E (nA) = n.p y 2 (nA) = n.p.(1-p)
y en consecuencia
E ( fA ) = p
2 ( fA ) =
p(1 p )
n
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES
140
V ( S2 ) = S2 2 =
24
n -1
( X )
N (0, 1)
( X ) 2
21
y en consecuencia :
n
=1
( Xi ) 2
2
2n
Se demuestra que:
n
=1
( Xi X )2
2
2n-1
en forma equivalente:
(n 1) S 2
2
E (2n-1 ) = n 1
2n-1
E (2n) = n
y
V (2n) = 2 n
V (2n-1) = 2(n1)
(1)
Reemplazando en (1)
(n 1) S 2
E
= ( n 1)
2
E ( S2 ) = 2
(n 1) S 2
(n 1) 2 V(S 2 )
V
=
= 2 ( n 1)
2
4
V ( S2 ) =
2 4
(n 1)
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso
DISTRIBUCIONES MUESTRALES
141
nA
n
lm P ( | f A p < ) = 1
es decir, que cuando n tiende a infinito la frecuencia relativa tiende a la probabilidad ( definicin
frecuencial de probabilidad ).
Demostracin :
nA Bi ( n , p )
E ( nA ) = n p
y en consecuencia
E ( fA ) = p
2 ( nA ) = n p ( 1 p )
2 ( fA ) =
p (1 p)
n
P fA p
Sea =
p (1 p)
1
> 1 2
n
k
p (1 p)
n
entonces k 2 =
(1)
n 2
p (1 p)
La ley de los grandes nmeros se puede demostrar tambin a partir del comportamiento del promedio muestral. A
medida que el nmero de observaciones obtenidas aumenta, la media de los valores observados se acerca ms y
ms a .
G.Carnevali-E.Franchelli-G.Gervasoni-M.Grasso