Beruflich Dokumente
Kultur Dokumente
Evaluacin de la bondad
de un estimador puntual
Por:
Pedro Arturo Cordero Daz
Roger Emir Hernndez Ulloa
ndice
Tabla de contenido
ndice 2
Introduccin 3
Qu son las estimaciones? 3
Qu distribucin sigue la media central?
Distribucin de la media muestral
4
Tipos de estimadores 5
Propiedades de los estimadores
5
Bibliografa 13
Introduccin
Qu son las estimaciones?
Podemos conocer el comportamiento del ser humano?
Podemos usar la informacin contenida en la muestra para tratar de adivinar algn
aspecto de la poblacin bajo estudio y sustituirla en lo que sera nuestra verdad
desconocida. Esto, por supuesto, implica que la informacin que obtenemos de nuestras
observaciones debe ser
representativa del particular aspecto
= ^ |
de la poblacin.
Es importante notar que no
siempre coincide la informacin que
hemos observado con la informacin real de la poblacin. Sin embargo, es una buena
aproximacin y la podemos utilizar para la estimacin de las caractersticas propias de
dicha poblacin.
Podemos entonces dar una medida de dicha incertidumbre:
(Esta medida nos ayudar a crear estimadores por intervalo para medias y proporciones
mustrales).
La distribucin de la muestra y de las estadsticas juega un papel crtico en la inferencia
estadstica debido a que la bondad de los estimadores se mide en base a la media y
varianza de estas.
Muestra
Estadstica
Estimador
Distribucin
Las muestras son tomadas para estimar parmetros y para probar hiptesis acerca de
los parmetros.
Un parmetro es una medida numrica de algn aspecto de la poblacin. Cuando no
tenemos la informacin sobre toda la poblacin es necesario estimar el valor del
parmetro en base a la informacin de la muestra sobre dicho aspecto de inters y
tenemos lo que se llama estadstica.
Supongamos que tomamos una muestra de una poblacin y obtenemos la media
muestral. Si tomamos otra muestra obtendremos otro valor de la media muestral, y as
sucesivamente. Todas estas medidas sern variables aleatorias que tienen asociada una
funcin de densidad. Lo mismo sucede con las varianzas muestrales que cambian su
valor de muestra a muestra y con las proporciones muestrales.
Sin embargo, el promedio de todas las medias muestrales posibles con o sin reemplazo
(cada una del mismo tamaa n) es igual a la medida poblacional . La fluctuacin en el
nmero que representa a estas medias muestrales se ve en un histograma de todos los
posibles valores de stas. Estas fluctuaciones son menores que las fluctuaciones de los
valores en la poblacin. Estas variaciones entre las medias muestrales se conoce
comoerror estndar de la media y se obtiene como:
x =
de una poblacin con media y varianza 2, tiene una distribucin normal con media y
varianza 2/n. Se puede medir que tanto se desva la media muestral de la media
poblacional a travs del valor Z, de la siguiente manera
Z=
( X ) n
X
X
=
=
X
Es fcil ver que la Z, que es una estadarizacin de la media muestral, sigue una
distribucin N(0,1).
Con frecuencia estamos interesados en determinar si la media de una poblacin es
diferente de la media de otra poblacin. Si la poblacin 1 tiene una media 1 y una
desviacin estndar 1 y la poblacin 2 tiene una media 2 y una desviacin estndar 2,
nos gustara determinar si 1=2 o si una es mayor que la otra ( 1>2 1<2) para lo cual
nos basamos en la evidencia que tenemos al considerar dos muestras aleatorias, una
dew cada una de las poblaciones y observar la diferencia de las medias muestrales
X 1 X 2 .
X 1
Como
X 1 X 2
varianza
X 2
12
y con
21 22
+
n1 n2
Entonces
^p=
X
n
X
n
p ( 1 p )
n
Tipos de estimaciones
Existen dos tipos principales de estimadores:
Estimadores puntuales
Son aquellos que consisten en un slo valor o estadstica muestral que se usa
para estimar el verdadero valor del parmetro poblacional.
1
X = x i
n
2
S=
2
(X X )
n1
X
n
2
p
^1 << ^2
Donde
k ( ^ )
^
, y debe
^ .
y varianza
2^ , entonces k toma
(1 ) de 0.95 ( 95%).
El nivel de confianza
La desviacin estndar poblacional
El tamao de muestra
Hay que aclarar, que aunque no se conozca el valor real de , ste es una cantidad fija y
constante. Puede suceder que se encuentre entre
^1 y
^2
suceder que no se encuentre entre estos dos valores, y sera incorrecto asignar una
probabilidad a cualquiera de estas posibilidades, aun cuando permanezca desconocida.
Segundo Autor
Como ya se mencion las medias muestrales, los totales muestrales y las proporciones
muestrales tienen distribuciones de muestreo, con propiedades comunes. Las estadsticas
mismas son estimadores no sesgadas de sus equivalentes poblacionales, y sus
distribuciones de muestreo son aproximadamente normales cuando el tamao de
muestras es grande. Este fenmeno no restringe solamente a las estadsticas discutidas
en este trabajo. Muchas otras estadsticas, sobre todo las obtenidas a partir de sondeos
de opiniones, tienen distribuciones muestrales que no pueden definir claramente para
tamaos de muestra pequeos, pero poseen distribuciones muestrales que tienen forma
de montculo, casi aproximadamente normales, cuando el tamao de muestra es grande.
Por tal razn, el procedimiento para evaluar la bondad (es decir, la confiabilidad o
exactitud) de cualquier estos estimadores, es lo mismo para cualquier otro estimador. Por
ejemplo, supngase que se desea estimar un parmetro poblacional utilizando un
estimador, representado por el smbolo. Adems, supondremos que la distribucin
muestral de es aproximadamente normal, y que es un estimador no sesgado de , y que
se conoce la desviacin estndar del estimador, o que se puede aproximarla, y se la
Tercer Autor
Se pueden usar distintos estimadores para estimar un mismo parmetro. Por ejemplo
para estimar la media poblacional se puede usar la media muestral, la mediana, la moda,
el promedio entre el valor ms chico y ms grande de la muestra, etc..
Cada estimador obtenido de muestras de tamao fijo n, vara con cada muestra que se
toma. Por lo tanto, los estimadores son variables aleatorias y pueden considerarse sus
distribuciones muestrales (similar a los estadsticos que se estudiaron la clase pasada).
La distribuciones de muestreo de los estimadores se usan para compararlos y decidir cual
de todos es el mejor. Se prefiere un estimador que tenga una distribucin muestral cuya
media coincida con el parmetro que se desea estimar y cuya extensin o dispersin
(medida con la variancia) sea lo menor posible.
Notacin. Si denota un parmetro entonces
Como dijimos anteriormente, se prefiere una estadstica que tenga una distribucin
muestral cuya media coincida con el parmetro que se desea estimar. Un estimador de
este tipo se llama insesgado.
Si
es un estimador de un parmetro y si la media de la distribucin de
decir,
E(
) = ,
es , es
se llama
Se prefiere una estadstica que adems tenga una distribucin muestral cuya extensin o
dispersin (medida con la variancia) sea lo menor posible. Nota: Para simplificar se habla
de variancia del estimador para referirnos a la variancia de la distribucin muestral del
estimador.
En la figura 6.3, p. 199, aparecen las distribuciones muestrales de dos estimadores
insesgados
, E(
que se encuentre cerca de la media E( ). Pero como la desviacin estndar del primero
es menor que la del segundo, es ms probable que en el primer caso se encuentre ms
cerca de la media que en el segundo caso.
En base a lo anterior se elige de todas las estadsticas disponibles aquella con el menor
sesgo y variancia posible. Ms an, el mejor estimador posible es aquel que es insesgado
y que de todos los insesgados tiene la menor variancia, a este estimador se lo llama
estimador insesgado de menor variancia (EIMV).
Media muestral
tendr media
E( ) = .
y desviacin estndar
=/
p
Proporcin muestral
(estimador insesgado del parmetro p).
Si se seleccionan muestras aleatorias de n observaciones de una poblacin binomial, con
p
parmetro p, la distribucin de muestreo de la proporcin muestral
x
n
tendr media
E( ) = p
y desviacin estndar
pq
n
p
=
x
1
x
2
muestreo de
x
1
x
2
tendr media
E( 1 2) = 1 2
y desviacin estndar
x1 x 2
12 22
n1 n 2
=
p
Si
p
1
de muestreo de
tendr media
E( 1 2) = p1 p2
y desviacin estndar
p1 p2
p1 q1 p 2 q 2
n1
n2
=
Observar que en cada caso, se toma como estimador la estadstica que corresponde al
parmetro que se quiere estimar.
La media muestral, la proporcin muestral, la diferencia de medias muestrales y la
diferencia de proporciones muestrales tienen una distribucin de muestreo que se
aproxima a una normal cuando el tamao de la/s muestra/s es grande. Como regla
prctica se supone que esto se cumple cuando n 30.
Teniendo en cuenta esto y como estamos interesados en muestras grandes, en adelante
supondremos que n 30, y que trabajamos con un estimador insesgado
una distribucin normal.
de que tiene
Error de estimacin. | |.
Como se desea que este error sea lo menor posible, interesa saber si es menor que una
cierta cota que se suele expresar en trminos de la desviacin estndar del estimador:
Cota para el error de estimacin. c
|<c
|<c
P(|
, es decir,
|<c
es normal,
Cuarto Autor
Dados dos estimadores insesgados de un parmetro seleccionamos el estimador con la
menor varianza, permaneciendo constante en todas las condiciones restantes. Algo que
se utiliza en lugar del sesgo y la varianza para describir la bondad de un estimador
puntual es el valor esperado de 2 ( ) .
Definicin:
Sea X X X n , ,..., 1 2 una muestra aleatoria de tamao n de f (x; ) . Un estimador * T de
( ) es denominado un estimador insesgado uniforme de mnima varianza de ( ) s 1. *
T es insesgado para ( ) 2.
Para cualquier otro estimador insesgado T de ( ) , ( ) ( ) * Var T Var T para todo
En algunos casos la cota inferior puede ser derivada de la varianza de un estimador
insesgado. Si T es un estimador insesgado de ( ) , entonces la cota inferior CramerRao basada sobre una muestra aleatoria es ( ln ( ; )) ( ( )) ( ) 2 nE f x Var T =
asumiendo la condicin de diferenciabilidad, se puede obtener dicha expresin.
Definicin:
La media del cuadrado del error de un estimador puntual y se define como el valor
esperado de 2 ( ) , es decir, 2 E( ) . La media del cuadrado del error de un
estimador , MCE() es una funcin al mismo tiempo de su varianza y sesgo 2 MCE()
= V () + B Enseguida se muestran algunos estimadores de parmetros poblacionales.
Eficiencia relativa
Definicin:
Dados dos estimadores insesgados 1 y 2 , de un parmetro , con varianzas V( 1
) y V( 2 ), respectivamente, entonces la eficiencia relativa de 1 con respecto de 2
se define como la razn eficiencia = ) ( ) ( 1 2 V V . Consistencia Definicin El
estimador n es un estimador consistente de si para cualquier nmero positivo se
tiene que | ) 1 lim (| = n n P o en forma equivalente | ) 0 lim (| =
n n P Suele utilizar el siguiente resultado para probar la consistencia de un estimador.
Teorema:
El estimador insesgado n para es un estimador consistente de s ) 0 lim ( = n
n V .
Suficiencia:
En seguida se presentan algunos mtodos para encontrar estadsticos que en cierto
sentido resumen toda la informacin en una muestra con respecto a un parmetro
objetivo, y tales estadsticos tienen la propiedad de la suficiencia.
Definicin:
Bibliografa
Rohen,
V.E.
Estimacin
Puntual
y
por
Intervalo.
Recuperado
de:
http://www.biostat.jhsph.edu/~lcollado/Courses/MEyAdDG/day2/Estimaci%C3%B3n.pdf
Badii, M.H. & Guillen A. Estimaciones Estadsticas: Un Acercamiento Analtico. pp. 242243 Recuperado de: http://www.spentamexico.org/v5-n1/5%281%29237-255.pdf
Annimo.
Estimacin
Estadstica.
http://bd.unsl.edu.ar/download.php?id=795
pp.
2-4.
Recuperado
de:
INEGI.
Curso
de
Estadstica
Inferencial.
Recuperado
de:
http://www.inegi.org.mx/inegi/SPC/doc/INTERNET/19-%20Curso%20estad%C3%ADstica
%20Inferencial.pdf