Sie sind auf Seite 1von 13

Inferencia estadística – Intervalos de confianza

Cuando se obtiene una estimación puntual de un parámetro, es conveniente acompañar


dicha estimación por una “medida” de la precisión de la estimación. Un modo de hacerlo
es informar el estimador y su error standard. Otro modo es reemplazar la estimación
puntual por un intervalo de valores posibles para el parámetro.
Ejemplo: Supongamos que tenemos una m.a. X 1 , X 2 ,..., X n de una distribución
N ( µ , σ o2 ) con varianza σ o2 conocida. Por ser los datos normales, sabemos que

 σ2  X −µ
X ~ N  µ , o 
 ⇔ ~ N (0,1)
 n  σo
n

X −µ
y, por lo tanto, sabemos que la probabilidad de que n se encuentre entre –1.96 y
σo
1.96 es 0.95, es decir

 X −µ 
P − 1.96 ≤ n ≤ 1.96  = 0.95
 σo 

A partir de esta expresión obtenemos

174
 σ σ   σ σ 
P − 1.96 o ≤ X − µ ≤ 1.96 o  = 0.95 ⇔ P X − 1.96 o ≤ µ ≤ X + 1.96 o  = 0.95
 n n  n n

Es decir, que la probabilidad de que el intervalo

 σo σ 
 X − 1.96 , X + 1.96 o 
 n n

contenga al verdadero valor del parámetro µ es 0.95. Este intervalo se denomina intervalo de
confianza para µ de nivel de confianza 0.95.

Observaciones: 1) No es correcto decir “la probabilidad de que θ pertenezca al intervalo (a,b)


es 1 - α” porque θ no es una variable aleatoria. El intervalo es aleatorio ya que sus extremos son
funciones de la muestra y por lo tanto, debemos decir “la probabilidad de que el intervalo (a,b)
contenga al parámetro θ es 1 - α”

2) Una vez construído el intervalo a partir de una muestra dada, ya no tiene sentido hablar de
probabilidad. En todo caso, tenemos “confianza” de que el intervalo contenga a θ. La confianza
está puesta en el método de construcción de los intervalos, que nos asegura que (1 - α) 100% de
las muestras producirán intervalos que contienen a θ.

Intervalos de confianza para los parámetros de una distribución normal

n 1
Distribución t: Sean dos v.a. Z ~N(0,1) y U ~ χ n2 = Γ ,  independientes, entonces
2 2
Z
T= ~ tn
U
n

Se dice que T tiene distribución t de Student con n grados de libertad. Esta distribución
está tabulada para diferentes valores de n. Su densidad es simétrica respecto al 0 y tiene
forma de campana, pero tiene colas más pesadas que la distribución normal standard.
Cuando n tiende a infinito, la distribución de Student tiende a la distribución normal
standard.

Proposición: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µ, σ2), entonces

 σ2  X −µ
a) X ~ N  µ ,  ⇔ n ~ N (0,1)
 n  σ

175
n

(n − 1) S2 ∑ (X
i =1
i − X )2
b) ~ χ n2−1 con S 2 =
σ 2
n −1

c) X y S 2 son independientes

X −µ
d) n ~ t n −1
S

Dem: a) Ya hemos visto que cualquier combinación de v.a. normales independientes es


normal y el promedio es una combinación lineal particular.

b) y c) Están fuera del alcance de este curso.

e) Resulta de a) b) y c) pues

X −µ (n − 1) S 2
n ~ N (0,1) y ~ χ n2−1
σ σ 2

son v.a. independientes. Entonces, por definición de la distribución t de Student,

X −µ
n
σ X −µ
= n ~ t n −1
(n − 1) S 2 S
σ 2 (n − 1)

Intervalo de confianza para la media de la distribución normal con varianza


conocida: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µ, σ o2 ), con varianza σ o2
conocida, entonces

X −µ
n ~ N (0,1)
σo

 X −µ 
P − zα / 2 ≤ n ≤ zα / 2  = 1 − α
 σo 

de donde se deduce el siguiente intervalo de confianza de nivel 1 - α para µ,

176
 σo σ 
 X − zε / 2 , X + zε / 2 o  (1)
 n n

Intervalo de confianza para la media de la distribución normal con varianza


desconocida: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µ, σ 2 ), entonces

X −µ
n ~ t n −1
S

 X −µ 
P − t n −1,α / 2 ≤ n ≤ t n −1,α / 2  = 1 − α
 S 

de donde se deduce el siguiente intervalo de confianza de nivel 1 - α para µ,

 S S 
 X − t n −1,α / 2 , X + t n −1,α / 2 
 n n

Intervalo de confianza para la varianza de la distribución normal con media


conocida: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µo, σ 2 ), con media µo
conocida, entonces

2
X i − µo  X i − µo  1 1
~ N (0,1) ∀1 ≤ i ≤ n ⇒   ~ χ 12 = Γ ,  ∀1 ≤ i ≤ n
σ  σ  2 2

Como además las v.a. son independientes

2
n
 X i − µo  n 1
∑ 
i =1  σ
 ~ χ n2 = Γ , 
  2 2

¿Cómo elegimos los percentiles de la distribución χ2 que encierran un área igual a 1 - α?

177
χ n2,1−α / 2 χ n2,α / 2

Los elegimos de manera tal que quede un área igual a α/2 en cada extremo. Entonces,

 n

 ∑ ( X i − µ o )2 

P χ n ,1−α / 2 ≤
2 i =1
≤ χ n ,α / 2  = 1 − α
2
 σ 2 
 
 

Se obtiene el siguiente intervalo

 n
( X i − µ o )2 
n

∑ i ( X − µ o ) 2

 i =1 2 , i =1 2 
 χ n ,α / 2 χ n ,1−α / 2 
 
 

Intervalo de confianza para la varianza de la distribución normal con media


desconocida: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µ, σ 2 ), entonces

(n − 1) S 2
~ χ n2−1
σ 2

Por lo tanto,

 (n − 1) S 2 
P χ n2−1,1−α / 2 ≤ ≤ χ n2−1,α / 2  = 1 − α
 σ 2

178
Se obtiene el siguiente intervalo

 (n − 1) S 2 (n − 1) S 2 
 2 , 2 
 χ n −1,ε / 2 χ n −1,1−ε / 2 

Ejemplos: Sea X 1 , X 2 ,..., X 49 una m.a., X i ~ N ( µ , σ 2 ) .

a) Supongamos que el verdadero valor del desvío standard es σo = 35 y que se observa


x = 160 y construyamos un intervalo de confianza para la media de nivel 0.95.

Como las v.a. son normales y la varianza es conocida, el intervalo para µ será de la forma

 σ σ 
 X − z ε / 2 o , X + z ε / 2 o 
 n n

con zα / 2 = z 0.025 = 1.96 , σ o = 35, n = 49 y valor observado de X igual a 160. Obtenemos

 35 35 
160 − 1.96 , 160 + 1.96  = (160 − 9.8, 160 + 9.8) = (150.2, 169.8)
 49 49 

b) Supongamos ahora que la varianza es desconocida pero que el valor observado de S


es s=35. El correspondiente intervalo de confianza para µ será de la forma

 S S 
 X − t n −1,α / 2 , X + t n −1,α / 2 
 n n

con t n −1,α / 2 = t 48, 0.025 = 2.01 . Obtenemos

 35 35 
160 − 2.01 , 160 + 2.01  = (160 − 10.05, 160 + 10.05) = (149.95, 170.05)
 49 49 

Notemos que es más ancho que el anterior

c) Suponiendo como antes que observamos x = 160 y s = 35 , hallemos un intervalo de


confianza para σ2 de nivel 0.95.

Por tratarse de una muestra normal con media desconocida, el intervalo para σ2 será de
la forma

 (n − 1) S 2 (n − 1) S 2 
 , 2 
 χ2 
 n −1,ε / 2 χ n −1,1−ε / 2 

179
con χ n2−1,α / 2 = χ 48
2
, 0.025 = 69.02 y χ n −1,1−α / 2 = χ 48, 0.975 = 30.75 . Obtenemos

 48 ⋅ 35 2 48 ⋅ 35 2 
 ,  = (851.93, 1912.20)
 69.02 30.75 

y un intervalo de confianza para σ de nivel 0.95 será

 48 ⋅ 35 2 48 ⋅ 35 2 

 69.02
,
30.75
=

( )
851.93 , 1912.20 = (29.19, 43.73)
 

Esto último resulta de aplicar una función monótona creciente a cada extremo del
intervalo para σ2

Determinación del tamaño de muestra: Consideremos el intervalo de confianza para µ con


varianza conocida en el caso de una m.a. normal. La longitud del intervalo obtenido (1) es

σo
L = 2 zα / 2
n

y depende de

• nivel de confianza (α)


• varianza o desvío standard de las observaciones (σo)
• tamaño de la muestra (n)

Un modo de obtener mayor precisión, es decir un intervalo más angosto, es aumentando


el tamaño de la muestra. Si se desea una longitud menor o igual que Lo, entonces

2
σo 2z σ  2z σ 
L = 2 zα / 2 ≤ Lo ⇔ n ≥ α / 2 o ⇔ n ≥  α / 2 o 
n Lo  Lo 

Ejemplo: Supongamos que σo = 35, ¿qué tamaño de muestra se requiere como mínimo
para obtener un intervalo de nivel 0.95 de longitud menor o igual que 10?.

Por lo tanto, Lo = 10, σ o = 35 y z 0.025 = 1.96 , entonces

2
 2 ⋅ 1.96 ⋅ 35 
n≥  = 188.23 ⇒ n ≥ 189
 10 

En el caso de varianza desconocida el problema es más complejo porque el percentil t


también depende del tamaño de muestra.

180
Método general para obtener intervalos de confianza:

Sea X 1 , X 2 ,..., X n una m.a. de una distribución que depende de un parámetro θ.


Supongamos que existe una función T ( X 1 , X 2 ,..., X n , θ ) (es decir, una función de la
muestra y del parámetro) cuya distribución no depende de θ ni de ningún otro parámetro
desconocido. Entonces, existen dos valores a y b tales que

P(a ≤ T ( X 1 , X 2 ,..., X n ,θ ) ≤ b ) = 1 − α

y, a partir de esta expresión, es posible obtener un intervalo de confianza para θ.

La función T ( X 1 , X 2 ,..., X n , θ ) se denomina pivote.

Ejemplo: Sea X 1 , X 2 ,..., X n una m.a. de una distribución exponencial de parámetro λ.


Hemos demostrado que

∑X
i =1
i ~ Γ(n, λ )

 λ
Usando este resultado y que, si V ~ Γ(α , λ ) y a > 0 entonces aV ~ Γα,  , se puede
 a
demostrar que

n
 2n 1 
2λ ∑ X i ~ χ 22n = Γ , 
i =1  2 2
n
Usando como pivote la función T ( X 1 , X 2 ,..., X n , λ ) = 2λ ∑X
i =1
i , podemos obtener un

intervalo de confianza de nivel 1 - α para el parámetro λ.

 n

P χ 22n ,1−α / 2 ≤ 2λ ∑ X i ≤ χ 22n ,α / 2  = 1 − α
 i =1 

 
 
χ 2 n ,1−α / 2 χ 2 n ,α / 2
P n ≤λ ≤ n  =1−α
 
 2∑ X i 2∑ X i 
 i =1 i =1 

y el intervalo requerido es

181
 
χ χ 
 2 nn,1−α / 2 , 2nn ,α / 2 
 
 2∑ X i 2 ∑ X i 
 i =1 i =1 

Ejemplo: Sea X 1 , X 2 ,..., X n una m.a. de una distribución U(0,θ). Para obtener un intervalo
de confianza para θ , recordemos que el EMV de θ es θˆ = max ( X 1 ,..., X n ) y probemos
que la distribución de θˆ / θ no depende de θ.

Llamemos V a la v.a. max ( X 1 ,..., X n ) . Recordemos que, si X 1 , X 2 ,..., X n es una m.a. de


una distribución FX, entonces la función de distribución de V está dada por

FV (v) = (FX (v) )


n

Queremos demostrar que la distribución de V/θ. no depende de θ.

V 
FV / θ ( w) = P ≤ w  = P(V ≤ θ w) = FV (θ w) = FX i (θ w) ( )n

θ 

Como, en nuestro caso, X i ~U(0,θ),

 0 si θ w ≤ 0  0 si w ≤ 0
 θw  n
(
FV / θ ( w) = FX i (θw) )
n
=   si 0 < θ w < θ

= w n si 0 < w < 1
 θ   1 si w ≥ 1
 1 si θ w ≥ θ 

Por lo tanto, la distribución de V/θ no depende de θ. Derivando, se obtiene la densidad de


V/θ

f V / θ ( w) = n w n −1 I ( 0,1) ( w)

max ( X 1 ,..., X n )
Utilizando T ( X 1 , X 2 ,..., X n , θ ) = como pivote, obtendremos un intervalo
θ
de confianza para θ de nivel 1 - α. Buscamos a y b tales que

 max ( X 1 ,..., X n ) 
P a ≤ ≤ b = 1−α
 θ 

y, obtenemos el siguiente intervalo

182
 max ( X 1 ,..., X n ) max ( X 1 ,..., X n ) 
 , 
 b a 

¿Cómo elegimos a y b?. Observando (2), debemos hallar a y b , 0 < a < b < 1, tales que

b
b
∫nw
n −1
dw = w n = bn − an =1 − α (2)
a
a

Obviamente hay infinitas soluciones de esta ecuación, pero podríamos elegir la solución
que produce el intervalo de menor longitud esperada, es decir, buscar a y b que
minimicen E(L) sujeto a la condición (2), siendo

1 1
L = max ( X 1 ,..., X n ) − 
a b

n
Como ya hemos demostrado que E (max ( X 1 ,..., X n ) = θ , debemos minimizar
n +1

n 1 1
θ −  (3)
n +1  b a 

sujeto a la condición b n − a n = 1 − α .

Esto puede hacerse utilizando multiplicadores de Lagrange o bien, despejando de esta


última expresión a en función de b, reemplazándola en (3) y minimizando la expresión
resultante respecto de a.

El intervalo de mínima longitud esperada es

 max( X 1 ,..., X n ) max ( X 1 ,..., X n ) 


 , 
 1 n
α 

Intervalos de confianza de nivel asintótico 1 - α:

En muchos problemas no es posible encontrar intervalos de confianza de nivel exacto


1 - α, o bien son de muy difícil construcción. En otro casos disponemos de muy poca
información sobre la distribución de las variables aleatorias. En estas situaciones es
posible obtener intervalos de confianza de nivel aproximado cuando tenemos un tamaño
de muestra grande.

Definición: Sea X 1 , X 2 ,..., X n una m.a. de una distribución que depende de un parámetro
θ. Dadas dos sucesiones {a n ( X 1 , X 2 ,...., X n )} y {bn ( X 1 , X 2 ,...., X n )} tales que

lim P(a n ( X 1 , X 2 ,..., X n ) ≤ θ ≤ bn ( X 1 , X 2 ,..., X n ) ) = 1 − α


n→∞

183
la sucesión de intervalos [a n ( X 1 , X 2 ,..., X n ), bn ( X 1 , X 2 ,..., X n )] es una sucesión de
intervalos de confianza de nivel asintótico 1 - α para el parámetro θ. También se dice
que, si n es suficientemente grande, el intervalo [a n ( X 1 , X 2 ,..., X n ), bn ( X 1 , X 2 ,..., X n )]
tiene nivel aproximado 1 - α.

¿Porqué calcular intervalos de nivel asintótico?

• Porque no es posible encontrar una función pivote que no dependa del parámetro
• Porque no se conoce a distribución exacta de la función pivote
• Porque en general es más fácil encontrar la distribución asintótica que la exacta de la
función pivote

Ejemplos: 1) Sea X 1 , X 2 ,..., X n una m.a. de una distribución F con E(Xi) = µ y


2
V(Xi) = σ < ∞. Buscamos un intervalo de confianza para µ.

Sabemos que X es un estimador insesgado y consistente de µ. No conocemos su


distribución exacta porque no conocemos la de Xi, pero sabemos que

X −µ d
n → N (0,1)
σ

Si σ2 es conocido, esta función podría servir de pivote para el intervalo de nivel


aproximado, pero qué usamos si σ2 es desconocido.

Propiedad:

Yn 
→
d
Y
 ⇒ U n Yn 
→
d
aY
Un → a 
p

s p σ p
Como s 
→p
σ por ser un estimador consistente, entonces 
→1 y →1 .
σ s
Luego,

X −µ d 
n → N (0,1) X −µ d
σ  ⇒ n → N (0,1)
σ p  s
→1
s 

A partir de este resultado,

 X −µ 
P − zα / 2 ≤ n ≤ zα / 2  → 1 − α
 s 

184
y se obtiene el siguiente intervalo de nivel aproximado 1 - α

 s s 
 X − zα / 2 , X + zα / 2 
 n n

Intervalo de confianza de nivel asintótico 1 - α para el parámetro p de la


distribución Binomial:

Sea X 1 , X 2 ,..., X n una m.a. de una distribución Bi(1,p) . Entonces


n
X = ∑ X i ~ Bi (n, p) . Queremos construir un intervalo de nivel asintótico 1 - α para p.
i =1

Recordemos que, por el TCL,

X
∑X
i =1
i (a)
 p (1 − p ) 
pˆ = = ~ N  p, 
n n  n 

y, por lo tanto

 X 
 −p 
P − zα / 2 ≤ n ≤ zα / 2  ≅ 1 − α (4)
p (1 − p )
 
 n 

Hay dos formas de obtener un intervalo para p a partir de esta última expresión.

X
∑X
i =1
i
a) Como = 
→p
p por la Ley de los Grandes Números, podemos aplicar la
n n
Propiedad enunciada antes y reemplazar en el denominador del pivote p por su
estimador. Entonces

 X 
 −p 
P − zα / 2 ≤ n ≤ zα / 2  ≅ 1 − α
pˆ (1 − pˆ )
 
 n 

185
 X  X X  X 
 1 −  1 −  
X n  n X n  n 
P − z α / 2 ≤ p ≤ + zα / 2  ≅1−α
n n n n 
 
 

obteniendo un intervalo para p de nivel aproximado 1 – α.

b) Reescribimos la expresión (4) en la forma

   X 2

 X
−p    − p  
 n   n  ≤ z2  ≅1−α
P ≤ zα / 2  ≅ 1 − α ⇔ P α/2 
p(1 − p) p(1 − p)
   
 n   n 
   

Observemos que

2
X 
 − p 2
n  ≤ z2 X  p (1 − p )
α /2 ⇔  − p  ≤ zα / 2
2
p (1 − p ) n  n
n
2
X X p(1 − p )
⇔   − 2 p + p − zα / 2
2 2
≤0
n n n

2
 z2   2 X zα2 / 2   X 
⇔ p 2 1 + α / 2  − p + +  ≤0
 n
 n   n n 

Buscamos las raíces de esta ecuación de segundo grado, que llamaremos p̂1 y p̂ 2 y el
intervalo pedido será

( pˆ 1 , pˆ 2 )

186

Das könnte Ihnen auch gefallen