Beruflich Dokumente
Kultur Dokumente
realizacin de
es la estimacin puntual.
2
= E (T^2) - 2 E (T) +
- E (T)] recibe el
nombre de sesgo del estimador. El sesgo de T puede ser positivo, negativo o cero.
Puesto que el cuadrado del sesgo es un componente del error cuadrtico medio,
es razonable insistir que este sea, en valor absoluto, lo ms pequeo posible. En
otras palabras, es deseable que un estimador tenga una media igual a la del
parmetro que se est estimando. Lo anterior da origen a la siguiente definicin.
Un estadstico muestral T = u(X1 , X2 , Xn ) es un estimador insesgado del
parmetro
Si
la esperanza
matemtica
de distribucin
una distribucin
de probabilidad
Si laes
esperanza
matemtica
de una
de probabilidad
cualquiera es
cualquiera
(es
decir,
es
la
media
poblacional),
entonces,
conocida, entonces:
1
n
^2 = i=1
n
) ^2
i=1
S2 =
1
n1
1-
X )2
(Es insesgado)
i=1
es consistente si
T
P
lim
)=1
para todo
> 0.
1
X 1+ X 2+ X 3 ..+X 29
T2=
1
1
=
X 1+ X 2+ X 3+ ...+ X 30 X
f ( X 1, X 2,. . Xn , t)
g (t)
f ( X 1, X 2, , Xn)
g(t )
Para denotar el nivel de significancia se utiliza la letra alfa ( ), y los valores que se
suelen usar para son 0,05 y 0,01.
En la prctica la persona responsable de la prueba especifica el nivel de
significancia. Si el costo de cometer un error es elevado, los valores pequeos de
son preferibles y si el costo no es tan elevado se utilizan valores mayores de .
Enfocndonos en el tema de intervalos de confianza la probabilidad de
equivocarnos se llama nivel de significancia y se simboliza . Generalmente se
construyen intervalos con confianza 1- =95% (o significancia =5%).
Es una decisin del investigador. Se puede leer de dos modos distintos segn se
estime la proporcin o la muestra poblacional. Cuando se estima la proporcin
asume valores entre 0 y 1. Sin embargo, cuando se estima la media poblacional el
error depende de la unidad de medida de la variable en estudio.
La muestra del Error mximo admisible estar condicionada por los recursos
disponibles.
n>30
y se conoce
P z / 2
Donde
z / 2
z 1 /2
g( )1=+ Z
X
z
=1
/ n 1 /2
limite superior
n
P z< Z = /2
P Z < Z 1 =1 /2
limite Inferior
n
g()2=+ Z 1
2
Ahora bien dado que se tiene una Normal Estndar y que esta tiene la
caracterstica de ser simtrica; se cumple que
Z /2=Z 1
2
. Utilizando esta
Z 1
2
1 =P(
Z 1
P( X
P( X
Z 1
X +
Z 1
2
Z 1
+
X
EJEMPLO (1):
100 (1 )
para la media
1.70
1.80
1.70
1.83
1.76
1.72
1.91
1.84
1.90
1.76
1.77
1.76
1.74
1.81
=0.01
1 =99 ),
1 =0.995
, y tenemos que
2
(porque
n=20
=0.15 , podemos
construir el IC:
P X Z 0.995
X +Z 0.995
=0.99
n
n
0.15
0.15
1.75+ 2.5758
=0.99
20
20
P 1.802.5758
( N ( ; ))
con media ( )
y varianza
X
t n1
S
n
P t
n1;
2
X
t
1 =1
n1;
S
2
n
En donde
tiene
n1 ;
una
n1 ;
probabilidad
1
2
de
;n1
P T <t 1
; n1
1
,
2
respectivamente.
Ahora bien, al igual que en la normal, la distribucin t de Student es simtrica
respecto al origen, por lo tanto, se cumple que
n1 ;
=t
n1;
1
2
. Reagrupando
1 =P
P X
1
2
1
2
n1;
n1 ;
1
2
n
t
P X
n1 ;
t
X +
t
X+
n1 ;
1
2
n1;
1
2
n1 ;
1
2
n
S
)
)
=1
para la media
poblacional
P X t 1
100(1 )
;n1
S
S
+t 1
X
=1
;n1
n
n
2
EJEMPLO (2):
Una empresa desea controlar la vida til de sus lmparas. Para ello, se extrae una
muestra de 20 artefactos y se los enciende hasta que fallen. La duracin de cada
artefacto se muestra en la tabla. Si la distribucin de la duracin es normal, Cul
es el intervalo en el cual se encuentra la duracin media con un 99% de
confianza?
14108
X =
=705.4
20
i=1
Y S=60
n1=19 Y
P 705.42.861
60
60
705.4+ 2.861
20
20
X1 , X2 , X3, , Xn
Y 1 ,Y 2 , Y 3 , , Y m
con medias
X y Y
,y
varianzas
Y ) ( X Y )
( X
2
X
2
Y
+
n m
N ( 0 ;1 )
Reemplazando Z tenemos:
P Z 1
( X Y ) ( X Y )
X Y
+
n m
Z 1 =1
2
2X 2Y
2X 2Y
P ( X Y )Z 1
+ ( X Y ) ( X Y ) + Z 1
+
=1
n m
n m
2
2
Una vez se obtengan los datos de las muestras, se obtienen las respectivas
para la diferencia de
varianzas conocidas
100(1 )
P x y z 1
2
2X y 2Y
es:
2X 2Y
2X 2Y
+ X Y x y + z 1
+
=1
n m
n m
2
EJEMPLO (3):
Varones Facultad de Ciencias
Econmicas Universidad de Cartagena
1.83
1.82
1.91
1.80
1.85
P v mz
0.995
El
intervalo
quedara de la
siguiente forma:
]
2
v m
+ v m v m+
z 0.995 v + m =0.99
n m
n m
Para calcular los valores, primero debemos saber que en una Normal Estndar
z 0.995=2.5747
. Luego con la informacin dad tenemos:
v =1.80 m=1.70
2
2
2v 2m
0.15 0.10
+ =
+
=0.038188
n m
20
30
( n1 ) s2x + ( m1 ) s2y
S =
n+m2
2
p
{ X 1 , X 2 ; ; X n } y {Y 1, Y 2 ; ; Y n }
Sean
n ym ,
respectivamente,
provenientes
X y Y
dos
poblaciones
Normales
Entonces:
Y ) ( X Y )
( X
Sp
1 1
+
n m
t n+m 2
P x y t
1
n+ m2:
2
EJEMPLO (4):
S p
1 1
1 1
+ X Y x y +t
+ =1
1 S p
n+ m2:
n m
n m
2
S =
Sp:
( n v 1 ) S 2v +(nm1)S 2m
n v + nm2
20+ 302
0.006464
S p =0.0804
Reemplazando en la expresin dada para este Intervalo De Confianza, tenemos
que:
0.99=P( 1.801.702.68220.0804 v m 1.801.70+ 2.68220.0804)
P(0.1131 v m 0.3182)
En este caso, al incluir valores negativos el intervalo, no se puede asegurar que la
estatura media de los valores sea mayor a la estatura media de las mujeres. Por lo
tanto, la afirmacin del ejemplo anterior estaba basada exclusivamente en los
supuestos respecto de las varianzas poblacionales.
Z=
p
p
N (0 ; 1)
p(1 p)/ n
P Z 1
2
p p
Z 1 =1
p(1p)/n
2
P( p Z 1 p(1p)/n p p + Z 1 p(1p)/n)
2
El Intervalo de Confianza de un
100 (1 )
P p x Z 1
EJEMPLO
(5):
2
p x ( 1 p x )
p (1 p x )
p p x +Z 1 x
=1
n
n
2
0.95=P 0.601.96
0.700.30
0.700.30
p 0.66+ 1.96
500
500
P ( 0.5571 p 0.6429 )
Siendo el lmite inferior del intervalo mayor a 0.50, el resultado de esta encuesta
permite afirmar con un 95% de confianza que el candidato Juan Manuel Santos
ganara las elecciones.
Sean
pA y pB
parmetros
decir,
( Xn Ym )( p p )
A
p A (1p A ) p B (1p B )
+
n
m
N (0 ; 1)
100 (1 )
es:
x y
x y
z 1 s p A p B + z 1 s =1
n m
n m
2
2
x
y
p A = y p B =
n
m
),
EJEMPLO (6):
Tengamos en cuenta el ejemplo anterior y ahora supongamos que en la ciudad de
Bogot se encuestan a 300 personas, y resulta que 150 estn a favor de Juan
Manuel Santos. Cul es el IC al 95% para la diferencia entre las proporciones de
ambas ciudades?
Primero, recordemos que en el ejemplo anterior se obtuvo que 300 personas
estaban a favor de Juan Manuel Santos una muestra de 500: x=300 y n=500 (
x
=0.6
). A su vez, con los datos aqu presentados, tenemos que y = 150 y
n
y
=0.5
m=300 ( m
). Con esta informacin, podemos calcular la desviacin
estndar:
s=
x (nx) y (m y)
+
3
3
n
m
300200 150150
+
0.03624
5003
3003
z 0.975=1.96
2
n1
=
i=1
( x i X )
(n1) ^S
2
X 2n1
nos
dejen
una
Figura: Cuantiles
2
X n1 .
P X n1 < x
la
distribucin
2
n1 ;
de
1
2
]= 2
[
P X2
P X n1 > x
2
n1 ;
1
2
n1,
X 2n1 X 2
n 1,
1
2
]=1
2
n1 ;
X n1 X
2
n1 ;1
(n1) S^
X 2 1
2
n1;
2
2
X2
n1;
^2
(n1) S^ 2
2 (n1) S
2
2
X
X
1
n1;
n 1 ;
(n1) S^ (n1) S^
2
, 2
X
X
1
n1 ;
n 1 ;
EJEMPLO (7):
En un ejemplo anterior se estudiaba la altura de los individuos de una ciudad,
obtenindose en una muestra de tamao 25 los siguientes valores:
x =170 cm
S=10 cm
de la altura
(varianza poblacional) el
del
2,5%
del
97,5%para la distribucin
n1,
2
X X
2
1
n1,
2
X 24 .
2410.206 2
X 224; 0.075=39' 4
2
[ 63.45 ; 201.60 ]
Por tanto, para el valor poblacional de la desviacin tpica tenemos que
7.96 14.19 9 con una confianza del 95%, que por supuesto contiene a las
^
estimaciones puntuales S=10 y S=10.206 calculado sobre la muestra.
5.8 Intervalos de Confianza para el Cociente de Varianza
En clases anteriores, hemos visto que cuando se muestrean dos poblaciones
normales con medias desconocidas, se verifica que:
s 2x
2x
s2y
F (n1,m1)
y
Al igual que en los anteriores casos, una vez conocida la distribucin de muestreo,
la construccin del intervalo es directa. En este caso, por no ser simtrica la
distribucin tenemos que:
sx
P F
( n1 ;m1) ;
sy
( n1 ;m1) ;
1
2
=1
se toman
{ X 1 ; X 2 ; ; X n } y {Y 1 ; Y 2 ; ; Y m }
, de
dos
100 (1 )
es:
S2x
S 2y F
1
( n1 ;m1 ) ;
2
2x
S2x
2y S2y F
=1
( n1; m1) ;
2
EJEMPLO (8):
En el ejemplo (2), se analizo la duracin de las lmparas producidas por una
determinada empresa. Ahora supngase que la empresa esta analizando la
posibilidad de adquirir una nueva maquina, y le interesa especialmente que la
duracin de los productos se mas estable (es decir, que la varianza de la duracin
sea menor). Para decidir respecto de la compra, se toma una muestra de la
produccin de la nueva maquina. Las duraciones de las lamparitas se observan en
la tabla, siendo la varianza muestral calculada con estas observaciones:
S 2y =1871.
S x =3600
681
688
655
771
670
674
635
657
694
619
662
782
751
650
684
700
720
757
614
678
679
706
705
682
663
2
3600
3600
2x
18712.762 y 18710.342
2
P 0.697
x
2y
5.629
Para asegurar que la nueva maquina es menos variable que la actual, el intervalo
debera encontrarse totalmente a la derecha de numero uno (el limite inferior
debera ser mayor a 1), ya que ello implicara que la varianza actual es mayor que
la nueva:
2
1< LI <
1< 2x 2y < 2X
2
y
y
Como el intervalo calculado con un 98% incluye al uno, no se puede asegurar que la
varianza del procedimiento actual sea mayor a la varianza de la nueva maquina.