Beruflich Dokumente
Kultur Dokumente
INFERENCIA ESTADSTICA:
Profesor: Juan Garrido Ziga (Ms. Sc. Estadstica - Matemtica)
Una poblacin la constituyen todos los elementos (entidades) del universo con
respecto al cual se desea investigar, obtener conclusiones, tomar decisiones, etc.
Para una poblacin finita el nmero de elementos se denota por N .
Una muestra aleatoria de tamao n es un conjunto de variables aleatorias
( X 1 , X 2 , .........., X i , ........., X n ) tales que:
i)
Las variables aleatorias X i son independientes
ii) Las variables aleatorias X i tienen la misma distribucin de
probabilidades
Una muestra es un conjunto de valores ( x1 , x2 , ........., xi , ......, xn ) que toman las
variables aleatorias X i que componen una muestra aleatoria de tamao n.
Porque debemos extraer muestras desde una poblacin?
Respuesta: Porque en todo estudio, proyecto, investigacin, etc. existen ciertas
caractersticas numricas que describen a la poblacin y que reciben el nombre
de parmetros. Los verdaderos valores de estos parmetros son desconocidos
debido a que observar (medir, encuestar, etc.) a todas los elementos de la
poblacin (Censo) est descartado por tener costos prohibitivos y adems
demandar mucho tiempo.
Como alternativa entonces, seleccionamos en forma aleatoria, un subconjunto de
la poblacin llamado muestra y a partir de los valores observados en la muestra
calculamos estimaciones de estos parmetros desconocidos.
La Inferencia Estadstica es una tcnica mediante la cual a partir de las
observaciones obtenidas de una muestra aleatoria, se infieren conclusiones para
Media Poblaciona l
x
i 1
y Varianza Poblaciona l 2
( x
i 1
)2
Pr oporcin Poblaciona l
P( X i 1) y
P( X i 0 ) 1
x
i 1
1 si el atributo est
donde xi
0 si el atributo no est
Media muestral X
i 1
( x
i 1
X )2
n 1
X
i 1
Pr oporcin muestral p
in
X
i 1
1 si el atributo est
donde X i
0 si el atributo no est
Media muestral
x
i 1
8 dlares
n
n
Varianzamuestral S n21
( x
i 1
X )2
15.78
n 1
S n 1 3.97 dlares
Proporcin muestral p
X
i 1
1 si xi 8.5
4
0.40 ; donde X i
10
0 si xi 8.5
x1 1 , x2 1 , x3 0 , x4 1 , x5 1 , x6 0 , x7 0 , x8 0 , x9 0 , x10 0
2
Por lo tanto la varianza muestral S n 1 es un estimador insesgado de 2
Es natural preferir, de entre dos estimadores, aquel estimador cuya distribucin
est ms concentrada alrededor del parmetro poblacional que se est estimando.
Var (1 )
ECM ( ) E ( ) 2 E ( 2 2 2 ) E ( 2 ) 2 E ( ) 2 )
E ( 2 ) E 2 () E 2 () 2E ( ) 2 Var () ( E () ) 2
Var ( ) sesgo2 ( )
2
2
Por lo tanto: ECM ( ) E ( ) sesgo () Var ()
El ECM () es la suma de dos cantidades positivas y por lo tanto es positivo
Si un estimador es insesgado se tiene que: sesgo ( ) 0 y en tal caso:
ECM ( ) Var ()
Estimador Consistente: Sea un estimador de un parmetro , calculado para
una poblacin de N elementos y a partir de una muestra aleatoria de tamao n .
Diremos que este estimador es consistente si:
Cuando n N se tiene que , lo cual significa que a medida que si se
incrementa el tamao de la muestra n , entonces el valor del estimador tiende a
ser ms prximo al valor del parmetro.
Criterio para consistencia: Diremos que un estimador de un parmetro es
consistente si:
lim ECM ( ) 0
n
f ( x) tales que : i) P( a X b)
f ( x) dx
ii ) f ( x) 0 , x ; iii )
f ( x) dx 1
ln LX ( ) ln f ( xi ; )
i 1
Paso 4:
ln LX ( )
0 ( xi )
Las diez muestras posibles sin reposicin de tamao n 2 de este ejemplo son:
(1; 2) ; (1; 3 ) ; (1; 4 ) ; (1; 5 ) ; ( 2 ; 3 ) ; ( 2 ; 4 ) ; ( 2 ; 5 ) ; ( 3; 4 ) ; ( 3; 5 ) ; ( 4 ; 5 )
distribuida normal con una media y una varianza 2 se extraen todas las
muestras posibles de tamao n y en cada una de ellas calculamos el valor de un
estadstico, entonces la distribucin de probabilidades del estadstico es la
distribucin muestral de ese estadstico. La figura siguiente muestra la
distribucin muestral del estadstico media muestral X
10
Var ( X )
A la desviacin estndar de
n
X
~ N ( 0 ;1)
: X
Ejemplo:
X ~ r2 E( X ) ( 2r ) (2) r
Var ( X ) ( 2r ) (22 ) 2 r
11
se tiene que:
X
i 1
(n 1) S n21
X1
X2
r
~ t n 1
~ N ( 0 ;1 )
X2
(n 1) S n21
~ n21
X
T
X1
X2
r
n
(n 1) S n21
X
~ t ( n 1 )
S n 1 n
X
~ t ( n 1)
S n 1
n
12
X
La distribucin muestral de la proporcin muestral p n
X
n
por lo tanto
X i ) np p
E ( p ) E (
n
n
Var ( p ) Var (
np (1 p )
p (1 p)
2
n
n
p (1 p )
n
p p
p ( 1 p)
n
~ N ( 0 ;1) ,
equivalentemente Z
np
n p (1 p )
~ N ( 0 ;1)
Intervalos de confianza:
Una estimacin por intervalo de confianza de un parmetro desconocido es un
intervalo de la forma: linf lsup , donde los lmites inferior l inf y superior
l sup dependen del valor numrico del estadstico (estimador) , para una
muestra en particular, y adems de la distribucin muestral de . Dado que
muestras diferentes generan valores distintos del estimador y de los lmites
inferior y superior, estos lmites son variables aleatorias Linf y Lsup tales que la
siguiente proposicin de probabilidad es verdadera: P ( Linf Lsup ) 1
13
~ N ( 0 ;1 )
z1
z1
remplazando Z
X Z1
La expresin Z1
X Z1
n
n
2
ME Z1
14
despejar n resultando:
2
1 2
(X )
2
, donde Z 1
Z12 2
2
E2
N n
. El clculo del tamao de muestra en
N 1
N n
N 1
, de donde despejamos el
N 2
E2
( N 1 ) 2
2
Z1
2
15
t1
X
~ t ( n 1)
S n 1
n
T
1
t1
X
S n 1
n
16
X t1
La expresin t1
S n 1
S n 1
n
X t1
S n 1
n
ME t1
S n 1
.
t12 S n21
2
E2
N S n21
E2
( N 1) S n21
2
t1
Podemos observar que Z 0.975 1.96 y t0.975; 30 2.04 por lo tanto podemos
2
aproximar ambos valores a 2.00 y usar Z 1
t12
= 4.0
17
p p
~ N ( 0 ;1) .
p ( 1 p)
n
Entonces un Intervalo
X
de Confianza (1 ) para el parmetro p n es:
i
p Z1
p (1 p )
p p Z1
2
n
p (1 p )
n
E p p
p p
p ( 1 p)
n
, despejando n queda:
Z Z1
Z12
20
E2
p (1 p) .
Z12
(0.25)
(n 1) S n21
12 ; n 1
2
(n 1) S n21
~ n2
(n 1) S n21
2
2
; n 1