Beruflich Dokumente
Kultur Dokumente
Si una variable aleatoria continua X tiene una distribucin normal con parmetros y 2, entonces:
se le denota X ~ N(,2)
y su funcin de densidad es:
f X ( x)
1
2 2
1
22
x 2
donde:
Valor esperado: X = .
Varianza: 2X = 2.
Propiedades:
1.
2 2
Y c0 ci Xi ~ N c0 cii , ci i ,
i1
i1
i1
Teorema de Lmite Central (TLC): Si X1, X2, , Xn son n variables aleatorias independientes,
donde cada Xi tiene la misma distribucin de media y varianza 2, entonces para n
suficientemente grande (en la prctica n 30) se cumple que aproximadamente:
i1 X i n
n
Zn
3.
X
~ N (0,1)
X np
~ N(0,1)
n p (1 p)
M UESTREO
POBLACIN ESTADSTICA
Poblacin
Fsica
E1 E2 ...
.
.. EN
(1)
Poblacin
Estadstica
(2)
X X .
X(N)...
.
Observacin de
valores de X
v.a.
Observaciones
X(1) X(2)....
X(N)..
......................
Seleccin
aleatoria
X1 X2 .
Xn
Muestra de
tamao n
independientes
idnticamente distribuidas con la distribucin de X
ESTADSTICO.- Es cualquier funcin de los elementos de una m.a. que no dependa de parmetros
desconocidos.
IDEA
Poblacin
Estadstica
X(1) X(2)
..X(N)
Muestra
aleatoria
X1 X2 .
Xn
Seleccin
aleatoria
Estadstico
Inferencia
Por ejemplo.
Consideremos una poblacin de 6 nios cuyas edades (X) son:
Poblacin Estadstica
4
6
6
7
X:
= 5.5
Por ej.:
Muestra
4
6
Xi X
Y calculamos el estadstico
Obtenemos
X = 4.5
= 4.75
=5
= 5.5
=6
:
en total 15 posibles muestras
6
6!
2! 4!
4.5
5.0
0
dado que todas las posibles muestras tienen igual probabilidad de ser seleccionadas la
probabilidad que tiene cada una de ser elegida es 1/15 podemos determinar la probabilidad de cada
uno de los valores de la media muestral.
Xi X 2
n 1
varianza muestral
D ISTRIBUCIONES M UESTRALES
A SOCIADAS A LA N ORMAL
DISTRIBUCIN CHI-CUADRADO
Una variable aleatoria X tiene distribucin chi-cuadrado con n grados de libertad, y se le denota:
si:
X ~ 2(n),
X ~n ,1 .
2 2
2.
W Wi
i 1
n i 1 ni
k
grados de libertad.
n 1 S2 ~ 2n 1
2
g.l. =9
g.l. =16
g.l. =20
10
15
20
25
30
35
40
45
f X ( x)
2
x
n
n 1
n
2
n 1
2
Valor esperado: X = 0.
Varianza: 2X
n
(n > 2)
n2
PROPIEDADES:
1.
g.l. =5
g.l. =1
g.l. =30
-3.0
-2.5
-2.0
-1.5
-1.0
-0.5
0.0
0.5
1.0
1.5
2.0
2.5
3.0
En
particular,
dada
2
X ~ N(, ), se cumple que:
una
muestra
T
Z
W
~ t ( n) .
n
aleatoria
X
~ t (n 1)
S
n
X1 ,
X2 ,
Xn
de
I NTERVALOS
DE
C ONFIANZA
Sea un parmetro desconocido de una variable aleatoria X. Supongamos que basndonos en una
muestra aleatoria X1, X2, , Xn determinamos dos estadsticos Li y Ls tales que:
P(Li Ls) = 1 -
Entonces el intervalo [Li, Ls] se denomina intervalo de confianza al 100 (1 - ) % para .
Ls
Li
N(0,1)
2.
3.
X ~ N ( ,
4.
X ~ N ( 0 ,1)
2
n
)
1-
-z/2
p ( z
2
z ) 1
p( X z
2
donde:
p( Z z )
2
X z
2
X z
2
n = tamao muestral
z/2
) 1
Por lo tanto:
Punto medio
Intervalo de
confianza:
Longitud
2 z X
2
Depende
de:
Ejemplo:
Se toma una muestra aleatoria de tamao 40 de una variable X que sigue una distribucin normal con
varianza conocida. Supongamos que la media muestral que se obtiene es igual a 100.
Calcularemos diferentes IC para la media poblacional:
n
40
100
1.96
1.
0.05
Linf
Punto
medio
Lsup
Longitud
Semilongitud
0.79
98.45
100.00
101.55
3.10
1.55
15
2.37
95.35
100.00
104.65
9.30
4.65
25
3.95
92.25
100.00
107.75
15.50
7.75
aumenta
Linf
Lsup
X
Linf
Linf
Lsup
Lsup
2.
Nivel
15
2.37
Linf
Punto
medio
Lsup
Longitud
Semilongitud
0.10
1.6449
96.10
100.00
103.90
7.80
3.90
95%
0.05
1.9600
95.35
100.00
104.65
9.30
4.65
99%
0.01
2.5758
93.89
100.00
106.11
12.22
6.11
aumenta
90%
Linf
Lsup
Linf
Lsup
Linf
3.
Lsup
0.05
1.96
15
Linf
Punto
medio
Lsup
Longitud
Semilongitud
20
3.35
93.43
100.00
106.57
13.15
6.57
40
2.37
95.35
100.00
104.65
9.30
4.65
80
1.68
96.71
100.00
103.29
6.57
3.29
disminuye
Linf
Lsup
Linf
Lsup
Linf
Lsup
8
X ~ N ( ,
X
~ t ( n 1)
S
n
donde:
p(t (n 1) t
t(n-1)
, n 1
n = tamao muestral
-t/2
1-
p(t
2
, n 1
t/2
X
t ) 1
, n 1
S
2
n
p ( X t
2
X t
S
n
, n 1
S
, n 1
) 1
S
, n 1
X t
2
S
n
, n 1
Var(X) = 2
X1, X2, ...Xn
X z / 2
Entonces si n es grande, una buena aproximacin de un intervalo de confianza al 100 (1) % para
viene dado por:
X z / 2 S / n X z / 2 S / n
Adems:
Esta aproximacin seguir siendo adecuada an cuando la distribucin de la poblacin (v.a. X) no
sea normal (TLC).
9
2.
S
2
(X
i 1
(n 1) S 2
X )2
~ 2 (n 1)
n 1
2(n-1)
p(
(n 1) S 2
2 2
2
2 1
2 )
1 S
2
2
donde:
p( 2 (n 1) 2 )
2
, n 1
n = tamao muestral
10
1 S
2
1
, n 1
X ~ B(n,p)
p(1 p)
X
~ N ( p,
)
n
n
p p
p (1 p )
n
~ N (0,1)
donde:
p( Z z )
N(0,1)
1-
p( z
2
z/2
-z/2
p p
p (1 p )
n
z ) 1
2
p z
2
p (1 p )
p (1 p )
p p z
n
n
2
11
N n
N 1
N n
N n
IC X z
, X z
N
1
N
1
n
n
2
2
2)
Para proporciones
El IC al 100 (1 - ) % para p M es:
N
p 1 p N n
p 1 p N n
IC p z
, p z
n
N
1
n
N
1
2
2
12
T AMAO
DE LA
M UESTRA
= | X | = error al estimar
Un IC para al 100 (1 - ) % implica:
una confianza del 100 (1 - ) % que el intervalo contiene a
I.C.:
Ls
Li
e z
2
N n
N 1
Se puede especificar un valor para e (margen de error) y hallar el valor de n que corresponda.
z2 2
n n0
2
2
n0 N
n0 N 1
n0 N
n0 N 1
Para N finito:
Para N finito:
z2 p 1 p
2
e2
Problema:
desconocida
Soluciones:
1)
Muestra piloto
2)
Alguna estimacin de la variable pero al final se calcula e
3)
En el caso de las proporciones:
mx n
p 1
13
Ejemplos
1.
Se va a adquirir un lote de 500 bolsas de un material de construccin, las cuales deben cumplir
ciertas especificaciones relacionadas al peso del material contenido.
Como no es posible pesar todas las bolsas, se va a tomar una m.a. del lote para estimar el peso
promedio de las bolsas.
Se sabe que el peso de una bolsa del material es una v.a. con distribucin normal y se supone que
la desviacin tpica del peso de una bolsa es de 0.2 kg.
Determine el tamao de muestra necesaria para estimar el peso promedio con una confianza del
95% y un margen de error mximo de 40 gr.
2.
Se han efectuado varios cambios a nivel curricular para las especialidades de una facultad y se
desea conocer el nivel de aprobacin de parte del alumnado (alumnos a favor de cada uno de los
cambios).
La facultad cuenta con 3,014 alumnos y se va a tomar una muestra para la medicin del objetivo
mencionado.
A cuntos alumnos se debe encuestar para tener una informacin adecuada con un margen de
error no mayor a un 5% y un nivel de confianza del 90 %
14