Sie sind auf Seite 1von 15

Probabilidad & Estadstica

Evaluacin de la bondad
de un estimador puntual
Por:
Pedro Arturo Cordero Daz
Roger Emir Hernndez Ulloa

ndice
Tabla de contenido
ndice 2
Introduccin 3
Qu son las estimaciones? 3
Qu distribucin sigue la media central?
Distribucin de la media muestral
4
Tipos de estimadores 5
Propiedades de los estimadores
5

Cmo evaluar la bondad de un estimador puntual? 6


Primer Autor 6
Segundo Autor
Tercer Autor 8
Cuarto Autor 11

Bibliografa 13

Introduccin
Qu son las estimaciones?
Podemos conocer el comportamiento del ser humano?
Podemos usar la informacin contenida en la muestra para tratar de adivinar algn
aspecto de la poblacin bajo estudio y sustituirla en lo que sera nuestra verdad
desconocida. Esto, por supuesto, implica que la informacin que obtenemos de nuestras
observaciones debe ser
representativa del particular aspecto
= ^ |
de la poblacin.
Es importante notar que no
siempre coincide la informacin que
hemos observado con la informacin real de la poblacin. Sin embargo, es una buena
aproximacin y la podemos utilizar para la estimacin de las caractersticas propias de
dicha poblacin.
Podemos entonces dar una medida de dicha incertidumbre:
(Esta medida nos ayudar a crear estimadores por intervalo para medias y proporciones
mustrales).
La distribucin de la muestra y de las estadsticas juega un papel crtico en la inferencia
estadstica debido a que la bondad de los estimadores se mide en base a la media y
varianza de estas.

Muestra
Estadstica
Estimador

Distribucin
Las muestras son tomadas para estimar parmetros y para probar hiptesis acerca de
los parmetros.
Un parmetro es una medida numrica de algn aspecto de la poblacin. Cuando no
tenemos la informacin sobre toda la poblacin es necesario estimar el valor del
parmetro en base a la informacin de la muestra sobre dicho aspecto de inters y
tenemos lo que se llama estadstica.
Supongamos que tomamos una muestra de una poblacin y obtenemos la media
muestral. Si tomamos otra muestra obtendremos otro valor de la media muestral, y as
sucesivamente. Todas estas medidas sern variables aleatorias que tienen asociada una

funcin de densidad. Lo mismo sucede con las varianzas muestrales que cambian su
valor de muestra a muestra y con las proporciones muestrales.
Sin embargo, el promedio de todas las medias muestrales posibles con o sin reemplazo
(cada una del mismo tamaa n) es igual a la medida poblacional . La fluctuacin en el
nmero que representa a estas medias muestrales se ve en un histograma de todos los
posibles valores de stas. Estas fluctuaciones son menores que las fluctuaciones de los
valores en la poblacin. Estas variaciones entre las medias muestrales se conoce
comoerror estndar de la media y se obtiene como:

x =

Se puede observar que si el tamao de la muestra aumenta, el error estndar disminuye.

Qu distribucin sigue la media muestral?


Consideramos muestras aleatorias de una poblacin con media y varianza 2, conforme
el tamao de la muestra crece, la distribucin de las medias muestrales es
aproximadamente normal, sin importar la forma de la distribucin de la poblacin.

Distribucin de la media muestral


Recordemos que la media muestral

obtenida de una muestra aleatoria de tamaos n

de una poblacin con media y varianza 2, tiene una distribucin normal con media y
varianza 2/n. Se puede medir que tanto se desva la media muestral de la media
poblacional a travs del valor Z, de la siguiente manera

Z=

( X ) n
X
X
=
=
X

Es fcil ver que la Z, que es una estadarizacin de la media muestral, sigue una
distribucin N(0,1).
Con frecuencia estamos interesados en determinar si la media de una poblacin es
diferente de la media de otra poblacin. Si la poblacin 1 tiene una media 1 y una
desviacin estndar 1 y la poblacin 2 tiene una media 2 y una desviacin estndar 2,
nos gustara determinar si 1=2 o si una es mayor que la otra ( 1>2 1<2) para lo cual
nos basamos en la evidencia que tenemos al considerar dos muestras aleatorias, una
dew cada una de las poblaciones y observar la diferencia de las medias muestrales

X 1 X 2 .

X 1

Como

X 1 X 2
varianza

X 2

son variables aleatorias normalmente distribuidas, entonces

es una variable aleatoria distribuida normalmente con media

12

y con

21 22
+
n1 n2

En muchas ocasiones no conocemos la probabilidad de xito en un experimento binomial


y tiene que ser estimado de la muestra. Como p es la probabilidad de xitos en cualquier
prueba, en una poblacin finita, p mide la proporcin de xitos en esa poblacin. As, si en
una muestra de tamao n de una poblacin, X es el nmero de xitos, estimamos la
proporcin de xitos en esta muestra:

Entonces

^p=

X
n

X
n

tiene una distribucin normal con media p y varianza

p ( 1 p )
n

siempre y cuando np(1-p)>5.


Muchos problemas estn enfocados en determinar si la proporcin de gente o cosas en
una poblacin posee cierta caracterstica es la misa que la proporcin que posee dicha
caracterstica en otra poblacin: p1=p2, si es mayor: p1>p2 menor: p1<p2. Cuando
desconocemos estas proporciones es necesario tomar una muestra de cada poblacin y
estimar dichas proporciones.

Tipos de estimaciones
Existen dos tipos principales de estimadores:

Estimadores puntuales
Son aquellos que consisten en un slo valor o estadstica muestral que se usa
para estimar el verdadero valor del parmetro poblacional.

1
X = x i
n
2

S=

2
(X X )
n1

X
n

2
p

Estimadores por intervalo


Consisten en dos valores entre los cuales esperamos que se encuentre el
verdadero valor del parmetro

^1 << ^2
Donde

^1 y ^2 son funcin del estimador puntal de

Propiedades de los estimadores


Algunas de las propiedades deseables de los estimadores son las siguientes:

Que en promedio los estimadores sean igual al parmetro poblacional que


estiman. Es decir, que el estimador sea insesgado.
Que tenga varianza ms pequea que otros estimadores. A esta propiedad se le
llama eficiencia.
Consistencia cuando la diferencia entre el estimador y el parmetro se hace ms
pequea conforme el tamao de muestra crece.

Cmo evaluar la bondad de un estimador puntual?


Primer Autor
Cuando se trata de evaluar la bondad de un estimador, se trata de poner alguna cota en el
error de estimacin que pudiera ocurrir. Este error de estimacin es
ser menor a
distribucin de
Si

k ( ^ )

^

, y debe

donde k es un factor que especifica los lmites de confianza en la

^ .

tiene una distribucin normal con media

el valor 1.96 para un nivel de confianza

y varianza

2^ , entonces k toma

(1 ) de 0.95 ( 95%).

La amplitud de un intervalo de confianza para la media poblacional depende de tres


factores:

El nivel de confianza
La desviacin estndar poblacional
El tamao de muestra

Propiedades que satisfacen un intervalo de confianza


1. Mientras mayor sea el nivel de confianza (1 ) , mayor ser el valor de Z /2
y ms amplio ser el intervalo de confianza, manteniendo constantes la varianza y
el tamao de muestra.
2. Mientras ms pequea sea la desviacin estndar, el intervalo ser ms angosto.
3. Conforme el tamao de muestra se incrementa, la amplitud del intervalo de
confianza ser mayor.
El valor indica la proporcin de veces que supondremos incorrectamente que el
intervalo contiene el parmetro poblacional. La interpretacin del intervalo de confianza
para es como sigue:

De una gran cantidad de intervalos que se construyan para el parmetro


poblacional , 100(1-)% contendrn a dentro de los limites encontrados.

Hay que aclarar, que aunque no se conozca el valor real de , ste es una cantidad fija y
constante. Puede suceder que se encuentre entre

^1 y

^2

pero tambin puede

suceder que no se encuentre entre estos dos valores, y sera incorrecto asignar una
probabilidad a cualquiera de estas posibilidades, aun cuando permanezca desconocida.

Segundo Autor
Como ya se mencion las medias muestrales, los totales muestrales y las proporciones
muestrales tienen distribuciones de muestreo, con propiedades comunes. Las estadsticas
mismas son estimadores no sesgadas de sus equivalentes poblacionales, y sus
distribuciones de muestreo son aproximadamente normales cuando el tamao de
muestras es grande. Este fenmeno no restringe solamente a las estadsticas discutidas
en este trabajo. Muchas otras estadsticas, sobre todo las obtenidas a partir de sondeos
de opiniones, tienen distribuciones muestrales que no pueden definir claramente para
tamaos de muestra pequeos, pero poseen distribuciones muestrales que tienen forma
de montculo, casi aproximadamente normales, cuando el tamao de muestra es grande.
Por tal razn, el procedimiento para evaluar la bondad (es decir, la confiabilidad o
exactitud) de cualquier estos estimadores, es lo mismo para cualquier otro estimador. Por
ejemplo, supngase que se desea estimar un parmetro poblacional utilizando un
estimador, representado por el smbolo. Adems, supondremos que la distribucin
muestral de es aproximadamente normal, y que es un estimador no sesgado de , y que
se conoce la desviacin estndar del estimador, o que se puede aproximarla, y se la

presenta por el smbolo . Si se selecciona una muestra aleatoria de n


observaciones de la poblacin, y se utiliza para calcular una estimacin de , qu tan
exacta ser la estimacin? La grfica de la distribucin muestral normal de, que se
tiene en la Figura 3, nos ayudar a contestar esta pregunta. Supngase que la estimacin
se encuentra en el punto marcado por una flecha. Tal estimacin particular se ubica a la
derecha de , y por lo tanto, sobrestima en una cantidad (- ). El valor absoluto de esta
desviacin, denotado por - , se llama error de estimacin.

Figura 3. Distribucin de muestreo de un estimador .

Tercer Autor
Se pueden usar distintos estimadores para estimar un mismo parmetro. Por ejemplo
para estimar la media poblacional se puede usar la media muestral, la mediana, la moda,
el promedio entre el valor ms chico y ms grande de la muestra, etc..
Cada estimador obtenido de muestras de tamao fijo n, vara con cada muestra que se
toma. Por lo tanto, los estimadores son variables aleatorias y pueden considerarse sus
distribuciones muestrales (similar a los estadsticos que se estudiaron la clase pasada).
La distribuciones de muestreo de los estimadores se usan para compararlos y decidir cual
de todos es el mejor. Se prefiere un estimador que tenga una distribucin muestral cuya
media coincida con el parmetro que se desea estimar y cuya extensin o dispersin
(medida con la variancia) sea lo menor posible.
Notacin. Si denota un parmetro entonces

denotar la estadstica correspondiente.


6

Como dijimos anteriormente, se prefiere una estadstica que tenga una distribucin
muestral cuya media coincida con el parmetro que se desea estimar. Un estimador de
este tipo se llama insesgado.

Si
es un estimador de un parmetro y si la media de la distribucin de
decir,
E(

) = ,

entonces se dice que


sesgado.

es un estimador insesgado. De otra manera,

es , es

se llama

En la figura 6.2., p. 198, aparecen las distribuciones muestrales de dos estimadores , el

primero insesgado, E( ) = y el segundo sesgado, E( ) > . Si se calcula una vez


lo

ms probable es que se encuentre cerca de la media E( ). Entonces en el primer caso lo


ms probable es que se encuentre cerca de y en el segundo que sea ms grande que .

Se prefiere una estadstica que adems tenga una distribucin muestral cuya extensin o
dispersin (medida con la variancia) sea lo menor posible. Nota: Para simplificar se habla
de variancia del estimador para referirnos a la variancia de la distribucin muestral del
estimador.
En la figura 6.3, p. 199, aparecen las distribuciones muestrales de dos estimadores
insesgados

, E(

) = . Si se calcula una vez

, en ambos casos, lo ms probable es

que se encuentre cerca de la media E( ). Pero como la desviacin estndar del primero
es menor que la del segundo, es ms probable que en el primer caso se encuentre ms
cerca de la media que en el segundo caso.
En base a lo anterior se elige de todas las estadsticas disponibles aquella con el menor
sesgo y variancia posible. Ms an, el mejor estimador posible es aquel que es insesgado
y que de todos los insesgados tiene la menor variancia, a este estimador se lo llama
estimador insesgado de menor variancia (EIMV).

Ejemplos de estimadores insesgados.

Media muestral

(estimador insesgado de la media poblacional )

Si se seleccionan muestras aleatorias de n mediciones de una poblacin con media y


desviacin estndar , la distribucin de muestreo de

tendr media

E( ) = .
y desviacin estndar

=/

p
Proporcin muestral
(estimador insesgado del parmetro p).
Si se seleccionan muestras aleatorias de n observaciones de una poblacin binomial, con

p
parmetro p, la distribucin de muestreo de la proporcin muestral

x
n

tendr media

E( ) = p
y desviacin estndar

pq
n

p
=

Diferencia de medias 1 2 (estimador insesgado del parmetro 1 2).


Se tienen dos poblaciones I y II con medias y desviaciones estndar (1, 1) y (2, 2),
respectivamente.
Se seleccionan en forma independiente muestras de tamao n 1 para I y de tamao n2
para II.
Si

x
1

x
2

son las medias muestrales para tales muestras, entonces la distribucin de

muestreo de

x
1

x
2

tendr media

E( 1 2) = 1 2
y desviacin estndar

x1 x 2

12 22

n1 n 2
=

Proporcin muestral 1 2 (estimador insesgado del parmetro p1 p2)


Se tienen dos poblaciones binomiales I y II con parmetros p1 y p2, respectivamente.
Se seleccionan en forma independiente muestras de tamao n 1 para I y de tamao n2
para II.

p
Si

p
1

son las proporciones muestrales de tales muestras, entonces la distribucin

de muestreo de

tendr media

E( 1 2) = p1 p2
y desviacin estndar


p1 p2

p1 q1 p 2 q 2

n1
n2
=

Observar que en cada caso, se toma como estimador la estadstica que corresponde al
parmetro que se quiere estimar.
La media muestral, la proporcin muestral, la diferencia de medias muestrales y la
diferencia de proporciones muestrales tienen una distribucin de muestreo que se
aproxima a una normal cuando el tamao de la/s muestra/s es grande. Como regla
prctica se supone que esto se cumple cuando n 30.
Teniendo en cuenta esto y como estamos interesados en muestras grandes, en adelante
supondremos que n 30, y que trabajamos con un estimador insesgado
una distribucin normal.

de que tiene

Una manera de evaluar la bondad de una estimacin puntual es a travs de la distancia


entre el estimador y el parmetro. Esta cantidad se denomina

Error de estimacin. | |.
Como se desea que este error sea lo menor posible, interesa saber si es menor que una
cierta cota que se suele expresar en trminos de la desviacin estndar del estimador:
Cota para el error de estimacin. c

Ahora bien, no se puede saber si |

|<c

conociendo las caractersticas de la distribucin de


de que |

|<c
P(|

pues desconocemos . Sin embargo,

, se puede calcular la probabilidad

, es decir,

|<c

Por ejemplo, si c = 1.96 y suponiendo que la distribucin de

es normal,

P(| | < 1.96


) = 0.95
En la siguiente figura aparece el rea correspondiente.

Cuarto Autor
Dados dos estimadores insesgados de un parmetro seleccionamos el estimador con la
menor varianza, permaneciendo constante en todas las condiciones restantes. Algo que
se utiliza en lugar del sesgo y la varianza para describir la bondad de un estimador
puntual es el valor esperado de 2 ( ) .
Definicin:
Sea X X X n , ,..., 1 2 una muestra aleatoria de tamao n de f (x; ) . Un estimador * T de
( ) es denominado un estimador insesgado uniforme de mnima varianza de ( ) s 1. *
T es insesgado para ( ) 2.
Para cualquier otro estimador insesgado T de ( ) , ( ) ( ) * Var T Var T para todo
En algunos casos la cota inferior puede ser derivada de la varianza de un estimador
insesgado. Si T es un estimador insesgado de ( ) , entonces la cota inferior CramerRao basada sobre una muestra aleatoria es ( ln ( ; )) ( ( )) ( ) 2 nE f x Var T =
asumiendo la condicin de diferenciabilidad, se puede obtener dicha expresin.
Definicin:
La media del cuadrado del error de un estimador puntual y se define como el valor
esperado de 2 ( ) , es decir, 2 E( ) . La media del cuadrado del error de un
estimador , MCE() es una funcin al mismo tiempo de su varianza y sesgo 2 MCE()
= V () + B Enseguida se muestran algunos estimadores de parmetros poblacionales.

1 y 2 2 son las varianzas de las poblaciones 1 y 2 respectivamente. La manera de


evaluar la bondad de cualquier procedimiento de estimacin puntual estriba en trminos
de la distancia entre las estimaciones generadoras y el parmetro objetivo.
Definicin:
El error de estimacin es la distancia entre un estimador y su parmetro objetivo, es
decir, | =| .

Eficiencia relativa
Definicin:
Dados dos estimadores insesgados 1 y 2 , de un parmetro , con varianzas V( 1
) y V( 2 ), respectivamente, entonces la eficiencia relativa de 1 con respecto de 2
se define como la razn eficiencia = ) ( ) ( 1 2 V V . Consistencia Definicin El
estimador n es un estimador consistente de si para cualquier nmero positivo se
tiene que | ) 1 lim (| = n n P o en forma equivalente | ) 0 lim (| =
n n P Suele utilizar el siguiente resultado para probar la consistencia de un estimador.
Teorema:
El estimador insesgado n para es un estimador consistente de s ) 0 lim ( = n
n V .
Suficiencia:
En seguida se presentan algunos mtodos para encontrar estadsticos que en cierto
sentido resumen toda la informacin en una muestra con respecto a un parmetro
objetivo, y tales estadsticos tienen la propiedad de la suficiencia.
Definicin:

Sean n y , y ,..., y 1 2 observaciones muestrales para las variables aleatorias


correspondientes Y Y Yn , ,..., 1 2 . Entonces si Y Y Yn , ,..., 1 2 son variables aleatorias
discretas, la verosimilitud (factibilidad) de la muestra, ( , ,..., ) 1 2 n L = L y y y se define
como la probabilidad conjunta de n y , y ,..., y 1 2 . Si Y Y Yn , ,..., 1 2 son variables
aleatorias.

Bibliografa
Rohen,
V.E.
Estimacin
Puntual
y
por
Intervalo.
Recuperado
de:
http://www.biostat.jhsph.edu/~lcollado/Courses/MEyAdDG/day2/Estimaci%C3%B3n.pdf
Badii, M.H. & Guillen A. Estimaciones Estadsticas: Un Acercamiento Analtico. pp. 242243 Recuperado de: http://www.spentamexico.org/v5-n1/5%281%29237-255.pdf
Annimo.
Estimacin
Estadstica.
http://bd.unsl.edu.ar/download.php?id=795

pp.

2-4.

Recuperado

de:

INEGI.
Curso
de
Estadstica
Inferencial.
Recuperado
de:
http://www.inegi.org.mx/inegi/SPC/doc/INTERNET/19-%20Curso%20estad%C3%ADstica
%20Inferencial.pdf

Das könnte Ihnen auch gefallen