Sie sind auf Seite 1von 23

MA34B ESTADSTICA

ESTIMACIN POR
INTERVALO
Prof. Rodrigo Abt
ma34b.abt@gmail.com
INTRODUCCIN
En un problema de estimacin puntual, el objetivo es determinar una
frmula o receta que permita dar un valor para el(los) parmetro(s)
desconocidos de una distribucin dada.
Pero, una vez hecha una estimacin, no sabemos si en realidad
estamos cerca o no del parmetro estimado.
Slo tenemos una idea de la precisin de un estimador a travs de su
varianza.
INTRODUCCIN
En la prctica, la estimacin puntual es rara, ya que si bien un
estimador es bueno, la muestra obtenida para la estimacin puede
hacernos dudar de qu tan lejos o cerca est la estimacin del
verdadero valor de un parmetro.
Por lo mismo, es ms frecuente buscar un intervalo de valores entre
los cuales pudiese estar el parmetro buscado con algn grado de
conabilidad.
Por ejemplo, encontrar un intervalo de valores para la media ! de una
Normal con un alto nivel de conabilidad
INTRODUCCIN
Para hacerse una idea, hacer una estimacin puntual es como pescar
con un anzuelo:
Mientras que hacer una estimacin por intervalo es como pescar con
una red.
INTRODUCCIN
Ahora bien, de qu tamao debera ser esta red para lograr atrapar un buen valor?, y
cmo nos aseguramos de que estamos atrapando lo correcto?
Supongamos que estimamos la media ! de una Normal. Sabemos que ! puede tomar
cualquier valor dentro de los reales, por ende, el nico intervalo que nos garantiza un 100%
de conabilidad para encontrar al parmetro en l esde innito a +innito
Sin embargo, dicho intervalo es de muy poca utilidad. De hecho no nos dice nada informativo.
Sin embargo, si tuvisemos un intervalo como [2,3] sera BASTANTE ms informativo.
Desgraciadamente, para tener un intervalo debemos tolerar un margen de error, y
descontarlo de la conabilidad esperada. O sea, podramos encontrar valores a y b tales
que la conabilidad de encontrar ! en [a,b] sea de un 95% por ejemplo?
PLANTEAMIENTO
Formalmente, buscamos a y b tales que:
En este caso el intervalo [a,b] se denomina intervalo de conanza,
donde 1-" es el nivel de conanza o conanza.
Ahora bien, dado que no conocemos la distribucin asociada a #,
debemos utilizar los valores muestrales para determinar los valores
de a y b, es decir, buscamos a=a(X
1
,X
2
,,X
n
) y b=b(X
1
,X
2
,,X
n
).
Por ende a y b son variables aleatorias.
P(a b) = 1
RESOLUCIN
Para resolver la ecuacin anterior, debemos encontrar una variable
aleatoria que dependa de !, pero cuya distibucin NO dependa de #.
Es decir, debemos transformar la ecuacin original.
En que Z es una v.a. con distribucin conocida.
P(a b) = 1
P(L Z U) = 1
CASO 1: MEDIA PARA NORMAL
CON VARIANZA CONOCIDA
Retomemos el caso de la media
Buscamos a y b tales que P(a<!<b)=1-"
Sabemos por otro lado que:
Si hacemos las transformaciones algebraicas correspondientes,
tenemos:

X
/

n
N(0, 1)
P


X b
/

X
/

X a
/

= 1
ANLISIS GRFICO
En trminos grcos, si jamos un nivel de conanza del 95%
buscamos L y U tales que: P(L<Z<U)=1-"
L U
0.95
CONDICIONES DE BORDE
Si nos detenemos un poco en el anlisis grco, veremos que existen
innitos valores de L y U que cumplen la condicin. En efecto, jando
uno podemos obtener el otro.
Cmo elegimos entre uno u otro intervalo?
Criterio: Largo del intervalo
Claramente elegiremos aquellos intervalos que presenten un largo
menor, ya que signica que son ms precisos.
CONDICIONES DE BORDE
Idealmente preferiremos aquellos de largo mnimo.
En el caso de las distribuciones simtricas, el problema est resuelto:
Basta tomar como centro del intervalo el punto de simetra y
tendremos un intervalo de largo mnimo.
Luego, debemos encontrar L tal que P(-U<Z<U) = 1-", que es
equivalente a buscar P(Z>U) = 0,025 ) => U = 1,96
SOLUCIN
Luego, despejando tenemos que L = 1,96, pero:
Y por otro lado:
Finalmente el intervalo buscado es:
OBSERVACIONES DEL RESULTADO
Notemos que el intervalo est centrado en la media muestral.
Adems crece con la varianza, y disminuye con el tamao muestral, lo
que es intuitivamente deseable.
Si queremos aumentar la conanza, debemos estar dispuestos a que
crezca el tamao del intervalo.
CASO 2: MEDIA PARA NORMAL
CON VARIANZA DESCONOCIDA
Cuando la varianza es desconocida, se tiene que:
De donde anlogamente:
CASO 3: INTERVALO PARA UNA
VARIANZA
Queremos resolver:
Un estadstico que depende de s2 y cuya distribucin es conocida es:
Por ende buscamos K1 y K2 tales que:
ANLISIS GRFICO
Si gracamos la distribucin, nos encontramos que NO es simtrica:
SOLUCIN
Debemos encontrar los valores de "
1
y "
2
tales que el largo del
intervalo sea mnimo.
Sin embargo, en la prctica se asigna arbitrariamente "/2 a cada uno
y se procede resolviendo cada cola de manera separada. De este
modo se tiene que:
CASO 4: INTERVALO PARA UNA
PROPORCIN
Queremos resolver:
Del Teorema Central del Lmite sabemos que:
Donde es la proporcin de xitos en la muestra.
El problema en este caso es que desconocemos p, de hecho, es
precisamente lo que queremos estimar. Podemos desarrollar la
expresin de la probabilidad, reemplazando Z.
ECUACIN CARACTERSTICA
Se tiene que para tener un intervalo de largo mnimo se requiere:
Lo que da origen a una ecuacin de 2 grado:
SOLUCIN
Las soluciones de esta ecuacin son:
Lo que se puede reescribir como:
Cuando n es sucientemente grande:
FUNCIONES PIVOTES
Un estadstico T se dir pivote para q si T=T(X
1
,X
2
,...,X
n
, #) y la f.d.p.
de T NO depende de #.
Ejemplos de funciones pivote para diferentes parmetros y
distribuciones:
Si X ~ U[0, #], entonces T = Min{X
i
}/#
Si X ~ exp(#), entonces T = 2#%X
i
TAMAOS DE MUESTRA
Una de las aplicaciones ms frecuentes para los intervalos de
conanza es la determinacin del tamao de muestra para medias o
proporciones.
Por ejemplo, para el caso de las encuestas de opinin un nmero
tpico de tamao muestral conservador inicial es 1100, con un nivel
de conanza de 95% y un error del 3%.
Este resultado se deriva del hecho de que la varianza mxima de una
variable Bernoulli se alcanza cuando p=0.5
NOTAS
Los intervalos de conanza para el caso Bayesiano se pueden derivar
directamente de la distribucin a posteriori.
La interpretacin correcta es que el intervalo de conanza cubre al
parmetro el (1-")100% de las veces.
Las distribuciones muestrales como la Normal, t-Student o Chi
cuadrado se utilizan como distribuciones lmite cuando el tamao
muestral es grande.
Lo ms complicado suele ser encontrar el estadstico que dependa del
parmetro a estimar, pero cuya distribucin NO dependa del mismo,
o sea las funciones pivotes.

Das könnte Ihnen auch gefallen