Intervalo de Confianza

Inferencia estadística – Intervalos de confianza
Cuando se obtiene una estimación puntual de un parámetro, es conveniente acompañar

dicha estimación por una “medida” de la precisión de la estimación. Un modo de hacerlo
es informar el estimador y su error standard. Otro modo es reemplazar la estimación
puntual por un intervalo de valores posibles para el parámetro.
Ejemplo: Supongamos que tenemos una m.a. X 1 , X 2 ,..., X n de una distribución
N ( µ , σ o2 ) con varianza σ o2 conocida. Por ser los datos normales, sabemos que
 σ2  X −µ
X ~ N  µ , o 
 ⇔ ~ N (0,1)
 n  σo
n
X −µ
y, por lo tanto, sabemos que la probabilidad de que n se encuentre entre –1.96 y
σo
1.96 es 0.95, es decir
 X −µ 
P − 1.96 ≤ n ≤ 1.96  = 0.95
 σo 
A partir de esta expresión obtenemos
174
 σ σ   σ σ 
P − 1.96 o ≤ X − µ ≤ 1.96 o  = 0.95 ⇔ P X − 1.96 o ≤ µ ≤ X + 1.96 o  = 0.95
 n n  n n
Es decir, que la probabilidad de que el intervalo
 σo σ 
 X − 1.96 , X + 1.96 o 
 n n
contenga al verdadero valor del parámetro µ es 0.95. Este intervalo se denomina intervalo de
confianza para µ de nivel de confianza 0.95.
Observaciones: 1) No es correcto decir “la probabilidad de que θ pertenezca al intervalo (a,b)

es 1 - α” porque θ no es una variable aleatoria. El intervalo es aleatorio ya que sus extremos son
funciones de la muestra y por lo tanto, debemos decir “la probabilidad de que el intervalo (a,b)
contenga al parámetro θ es 1 - α”
2) Una vez construído el intervalo a partir de una muestra dada, ya no tiene sentido hablar de
probabilidad. En todo caso, tenemos “confianza” de que el intervalo contenga a θ. La confianza
está puesta en el método de construcción de los intervalos, que nos asegura que (1 - α) 100% de
las muestras producirán intervalos que contienen a θ.
Intervalos de confianza para los parámetros de una distribución normal
n 1
Distribución t: Sean dos v.a. Z ~N(0,1) y U ~ χ n2 = Γ ,  independientes, entonces
2 2
Z
T= ~ tn
U
n
Se dice que T tiene distribución t de Student con n grados de libertad. Esta distribución
está tabulada para diferentes valores de n. Su densidad es simétrica respecto al 0 y tiene
forma de campana, pero tiene colas más pesadas que la distribución normal standard.
Cuando n tiende a infinito, la distribución de Student tiende a la distribución normal
standard.
Proposición: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µ, σ2), entonces
 σ2  X −µ
a) X ~ N  µ ,  ⇔ n ~ N (0,1)
 n  σ
175
n
(n − 1) S2 ∑ (X
i =1
i − X )2
b) ~ χ n2−1 con S 2 =
σ 2
n −1
c) X y S 2 son independientes
X −µ
d) n ~ t n −1
S
Dem: a) Ya hemos visto que cualquier combinación de v.a. normales independientes es

normal y el promedio es una combinación lineal particular.
b) y c) Están fuera del alcance de este curso.
e) Resulta de a) b) y c) pues
X −µ (n − 1) S 2
n ~ N (0,1) y ~ χ n2−1
σ σ 2
son v.a. independientes. Entonces, por definición de la distribución t de Student,
X −µ
n
σ X −µ
= n ~ t n −1
(n − 1) S 2 S
σ 2 (n − 1)
Intervalo de confianza para la media de la distribución normal con varianza

conocida: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µ, σ o2 ), con varianza σ o2
conocida, entonces
X −µ
n ~ N (0,1)
σo
 X −µ 
P − zα / 2 ≤ n ≤ zα / 2  = 1 − α
 σo 
de donde se deduce el siguiente intervalo de confianza de nivel 1 - α para µ,
176
 σo σ 
 X − zε / 2 , X + zε / 2 o  (1)
 n n
Intervalo de confianza para la media de la distribución normal con varianza

desconocida: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µ, σ 2 ), entonces
X −µ
n ~ t n −1
S
 X −µ 
P − t n −1,α / 2 ≤ n ≤ t n −1,α / 2  = 1 − α
 S 
de donde se deduce el siguiente intervalo de confianza de nivel 1 - α para µ,
 S S 
 X − t n −1,α / 2 , X + t n −1,α / 2 
 n n
Intervalo de confianza para la varianza de la distribución normal con media

conocida: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µo, σ 2 ), con media µo
conocida, entonces
2
X i − µo  X i − µo  1 1
~ N (0,1) ∀1 ≤ i ≤ n ⇒   ~ χ 12 = Γ ,  ∀1 ≤ i ≤ n
σ  σ  2 2
Como además las v.a. son independientes
2
n
 X i − µo  n 1
∑ 
i =1  σ
 ~ χ n2 = Γ , 
  2 2
¿Cómo elegimos los percentiles de la distribución χ2 que encierran un área igual a 1 - α?
177
χ n2,1−α / 2 χ n2,α / 2
Los elegimos de manera tal que quede un área igual a α/2 en cada extremo. Entonces,
 n

 ∑ ( X i − µ o )2 

P χ n ,1−α / 2 ≤
2 i =1
≤ χ n ,α / 2  = 1 − α
2
 σ 2 
 
 
Se obtiene el siguiente intervalo
 n
( X i − µ o )2 
n
∑ i ( X − µ o ) 2
∑
 i =1 2 , i =1 2 
 χ n ,α / 2 χ n ,1−α / 2 
 
 
Intervalo de confianza para la varianza de la distribución normal con media

desconocida: Sea X 1 , X 2 ,..., X n una m.a. de una distribución N(µ, σ 2 ), entonces
(n − 1) S 2
~ χ n2−1
σ 2
Por lo tanto,
 (n − 1) S 2 
P χ n2−1,1−α / 2 ≤ ≤ χ n2−1,α / 2  = 1 − α
 σ 2

178
Se obtiene el siguiente intervalo
 (n − 1) S 2 (n − 1) S 2 
 2 , 2 
 χ n −1,ε / 2 χ n −1,1−ε / 2 
Ejemplos: Sea X 1 , X 2 ,..., X 49 una m.a., X i ~ N ( µ , σ 2 ) .
a) Supongamos que el verdadero valor del desvío standard es σo = 35 y que se observa

x = 160 y construyamos un intervalo de confianza para la media de nivel 0.95.
Como las v.a. son normales y la varianza es conocida, el intervalo para µ será de la forma
 σ σ 
 X − z ε / 2 o , X + z ε / 2 o 
 n n
con zα / 2 = z 0.025 = 1.96 , σ o = 35, n = 49 y valor observado de X igual a 160. Obtenemos
 35 35 
160 − 1.96 , 160 + 1.96  = (160 − 9.8, 160 + 9.8) = (150.2, 169.8)
 49 49 
b) Supongamos ahora que la varianza es desconocida pero que el valor observado de S

es s=35. El correspondiente intervalo de confianza para µ será de la forma
 S S 
 X − t n −1,α / 2 , X + t n −1,α / 2 
 n n
con t n −1,α / 2 = t 48, 0.025 = 2.01 . Obtenemos
 35 35 
160 − 2.01 , 160 + 2.01  = (160 − 10.05, 160 + 10.05) = (149.95, 170.05)
 49 49 
Notemos que es más ancho que el anterior
c) Suponiendo como antes que observamos x = 160 y s = 35 , hallemos un intervalo de

confianza para σ2 de nivel 0.95.
Por tratarse de una muestra normal con media desconocida, el intervalo para σ2 será de
la forma
 (n − 1) S 2 (n − 1) S 2 
 , 2 
 χ2 
 n −1,ε / 2 χ n −1,1−ε / 2 
179
con χ n2−1,α / 2 = χ 48
2
, 0.025 = 69.02 y χ n −1,1−α / 2 = χ 48, 0.975 = 30.75 . Obtenemos
 48 ⋅ 35 2 48 ⋅ 35 2 
 ,  = (851.93, 1912.20)
 69.02 30.75 
y un intervalo de confianza para σ de nivel 0.95 será
 48 ⋅ 35 2 48 ⋅ 35 2 

 69.02
,
30.75
=

( )
851.93 , 1912.20 = (29.19, 43.73)
 
Esto último resulta de aplicar una función monótona creciente a cada extremo del
intervalo para σ2
Determinación del tamaño de muestra: Consideremos el intervalo de confianza para µ con

varianza conocida en el caso de una m.a. normal. La longitud del intervalo obtenido (1) es
σo
L = 2 zα / 2
n
y depende de
• nivel de confianza (α)

• varianza o desvío standard de las observaciones (σo)
• tamaño de la muestra (n)
Un modo de obtener mayor precisión, es decir un intervalo más angosto, es aumentando

el tamaño de la muestra. Si se desea una longitud menor o igual que Lo, entonces
2
σo 2z σ  2z σ 
L = 2 zα / 2 ≤ Lo ⇔ n ≥ α / 2 o ⇔ n ≥  α / 2 o 
n Lo  Lo 
Ejemplo: Supongamos que σo = 35, ¿qué tamaño de muestra se requiere como mínimo
para obtener un intervalo de nivel 0.95 de longitud menor o igual que 10?.
Por lo tanto, Lo = 10, σ o = 35 y z 0.025 = 1.96 , entonces
2
 2 ⋅ 1.96 ⋅ 35 
n≥  = 188.23 ⇒ n ≥ 189
 10 
En el caso de varianza desconocida el problema es más complejo porque el percentil t

también depende del tamaño de muestra.
180
Método general para obtener intervalos de confianza:
Sea X 1 , X 2 ,..., X n una m.a. de una distribución que depende de un parámetro θ.

Supongamos que existe una función T ( X 1 , X 2 ,..., X n , θ ) (es decir, una función de la
muestra y del parámetro) cuya distribución no depende de θ ni de ningún otro parámetro
desconocido. Entonces, existen dos valores a y b tales que
P(a ≤ T ( X 1 , X 2 ,..., X n ,θ ) ≤ b ) = 1 − α
y, a partir de esta expresión, es posible obtener un intervalo de confianza para θ.
La función T ( X 1 , X 2 ,..., X n , θ ) se denomina pivote.
Ejemplo: Sea X 1 , X 2 ,..., X n una m.a. de una distribución exponencial de parámetro λ.

Hemos demostrado que
∑X
i =1
i ~ Γ(n, λ )
 λ
Usando este resultado y que, si V ~ Γ(α , λ ) y a > 0 entonces aV ~ Γα,  , se puede
 a
demostrar que
n
 2n 1 
2λ ∑ X i ~ χ 22n = Γ , 
i =1  2 2
n
Usando como pivote la función T ( X 1 , X 2 ,..., X n , λ ) = 2λ ∑X
i =1
i , podemos obtener un
intervalo de confianza de nivel 1 - α para el parámetro λ.
 n

P χ 22n ,1−α / 2 ≤ 2λ ∑ X i ≤ χ 22n ,α / 2  = 1 − α
 i =1 
 
 
χ 2 n ,1−α / 2 χ 2 n ,α / 2
P n ≤λ ≤ n  =1−α
 
 2∑ X i 2∑ X i 
 i =1 i =1 
y el intervalo requerido es
181
 
χ χ 
 2 nn,1−α / 2 , 2nn ,α / 2 
 
 2∑ X i 2 ∑ X i 
 i =1 i =1 
Ejemplo: Sea X 1 , X 2 ,..., X n una m.a. de una distribución U(0,θ). Para obtener un intervalo
de confianza para θ , recordemos que el EMV de θ es θˆ = max ( X 1 ,..., X n ) y probemos
que la distribución de θˆ / θ no depende de θ.
Llamemos V a la v.a. max ( X 1 ,..., X n ) . Recordemos que, si X 1 , X 2 ,..., X n es una m.a. de

una distribución FX, entonces la función de distribución de V está dada por
FV (v) = (FX (v) )

n
Queremos demostrar que la distribución de V/θ. no depende de θ.
V 
FV / θ ( w) = P ≤ w  = P(V ≤ θ w) = FV (θ w) = FX i (θ w) ( )n
θ 
Como, en nuestro caso, X i ~U(0,θ),
 0 si θ w ≤ 0  0 si w ≤ 0
 θw  n
(
FV / θ ( w) = FX i (θw) )
n
=   si 0 < θ w < θ

= w n si 0 < w < 1
 θ   1 si w ≥ 1
 1 si θ w ≥ θ 
Por lo tanto, la distribución de V/θ no depende de θ. Derivando, se obtiene la densidad de

V/θ
f V / θ ( w) = n w n −1 I ( 0,1) ( w)
max ( X 1 ,..., X n )
Utilizando T ( X 1 , X 2 ,..., X n , θ ) = como pivote, obtendremos un intervalo
θ
de confianza para θ de nivel 1 - α. Buscamos a y b tales que
 max ( X 1 ,..., X n ) 
P a ≤ ≤ b = 1−α
 θ 
y, obtenemos el siguiente intervalo
182
 max ( X 1 ,..., X n ) max ( X 1 ,..., X n ) 
 , 
 b a 
¿Cómo elegimos a y b?. Observando (2), debemos hallar a y b , 0 < a < b < 1, tales que
b
b
∫nw
n −1
dw = w n = bn − an =1 − α (2)
a
a
Obviamente hay infinitas soluciones de esta ecuación, pero podríamos elegir la solución
que produce el intervalo de menor longitud esperada, es decir, buscar a y b que
minimicen E(L) sujeto a la condición (2), siendo
1 1
L = max ( X 1 ,..., X n ) − 
a b
n
Como ya hemos demostrado que E (max ( X 1 ,..., X n ) = θ , debemos minimizar
n +1
n 1 1
θ −  (3)
n +1  b a 
sujeto a la condición b n − a n = 1 − α .
Esto puede hacerse utilizando multiplicadores de Lagrange o bien, despejando de esta

última expresión a en función de b, reemplazándola en (3) y minimizando la expresión
resultante respecto de a.
El intervalo de mínima longitud esperada es
 max( X 1 ,..., X n ) max ( X 1 ,..., X n ) 

 , 
 1 n
α 
Intervalos de confianza de nivel asintótico 1 - α:
En muchos problemas no es posible encontrar intervalos de confianza de nivel exacto

1 - α, o bien son de muy difícil construcción. En otro casos disponemos de muy poca
información sobre la distribución de las variables aleatorias. En estas situaciones es
posible obtener intervalos de confianza de nivel aproximado cuando tenemos un tamaño
de muestra grande.
Definición: Sea X 1 , X 2 ,..., X n una m.a. de una distribución que depende de un parámetro
θ. Dadas dos sucesiones {a n ( X 1 , X 2 ,...., X n )} y {bn ( X 1 , X 2 ,...., X n )} tales que
lim P(a n ( X 1 , X 2 ,..., X n ) ≤ θ ≤ bn ( X 1 , X 2 ,..., X n ) ) = 1 − α

n→∞
183
la sucesión de intervalos [a n ( X 1 , X 2 ,..., X n ), bn ( X 1 , X 2 ,..., X n )] es una sucesión de
intervalos de confianza de nivel asintótico 1 - α para el parámetro θ. También se dice
que, si n es suficientemente grande, el intervalo [a n ( X 1 , X 2 ,..., X n ), bn ( X 1 , X 2 ,..., X n )]
tiene nivel aproximado 1 - α.
¿Porqué calcular intervalos de nivel asintótico?
• Porque no es posible encontrar una función pivote que no dependa del parámetro
• Porque no se conoce a distribución exacta de la función pivote
• Porque en general es más fácil encontrar la distribución asintótica que la exacta de la
función pivote
Ejemplos: 1) Sea X 1 , X 2 ,..., X n una m.a. de una distribución F con E(Xi) = µ y

2
V(Xi) = σ < ∞. Buscamos un intervalo de confianza para µ.
Sabemos que X es un estimador insesgado y consistente de µ. No conocemos su

distribución exacta porque no conocemos la de Xi, pero sabemos que
X −µ d
n → N (0,1)
σ
Si σ2 es conocido, esta función podría servir de pivote para el intervalo de nivel

aproximado, pero qué usamos si σ2 es desconocido.
Propiedad:
Yn 
→
d
Y
 ⇒ U n Yn 
→
d
aY
Un → a 
p
s p σ p
Como s 
→p
σ por ser un estimador consistente, entonces 
→1 y →1 .
σ s
Luego,
X −µ d 
n → N (0,1) X −µ d
σ  ⇒ n → N (0,1)
σ p  s
→1
s 
A partir de este resultado,
 X −µ 
P − zα / 2 ≤ n ≤ zα / 2  → 1 − α
 s 
184
y se obtiene el siguiente intervalo de nivel aproximado 1 - α
 s s 
 X − zα / 2 , X + zα / 2 
 n n
Intervalo de confianza de nivel asintótico 1 - α para el parámetro p de la

distribución Binomial:
Sea X 1 , X 2 ,..., X n una m.a. de una distribución Bi(1,p) . Entonces

n
X = ∑ X i ~ Bi (n, p) . Queremos construir un intervalo de nivel asintótico 1 - α para p.
i =1
Recordemos que, por el TCL,
X
∑X
i =1
i (a)
 p (1 − p ) 
pˆ = = ~ N  p, 
n n  n 
y, por lo tanto
 X 
 −p 
P − zα / 2 ≤ n ≤ zα / 2  ≅ 1 − α (4)
p (1 − p )
 
 n 
Hay dos formas de obtener un intervalo para p a partir de esta última expresión.
X
∑X
i =1
i
a) Como = 
→p
p por la Ley de los Grandes Números, podemos aplicar la
n n
Propiedad enunciada antes y reemplazar en el denominador del pivote p por su
estimador. Entonces
 X 
 −p 
P − zα / 2 ≤ n ≤ zα / 2  ≅ 1 − α
pˆ (1 − pˆ )
 
 n 
185
 X  X X  X 
 1 −  1 −  
X n  n X n  n 
P − z α / 2 ≤ p ≤ + zα / 2  ≅1−α
n n n n 
 
 
obteniendo un intervalo para p de nivel aproximado 1 – α.
b) Reescribimos la expresión (4) en la forma
   X 2

 X
−p    − p  
 n   n  ≤ z2  ≅1−α
P ≤ zα / 2  ≅ 1 − α ⇔ P α/2 
p(1 − p) p(1 − p)
   
 n   n 
   
Observemos que
2
X 
 − p 2
n  ≤ z2 X  p (1 − p )
α /2 ⇔  − p  ≤ zα / 2
2
p (1 − p ) n  n
n
2
X X p(1 − p )
⇔   − 2 p + p − zα / 2
2 2
≤0
n n n
2
 z2   2 X zα2 / 2   X 
⇔ p 2 1 + α / 2  − p + +  ≤0
 n
 n   n n 
Buscamos las raíces de esta ecuación de segundo grado, que llamaremos p̂1 y p̂ 2 y el
intervalo pedido será
( pˆ 1 , pˆ 2 )
186

Intervalo de Confianza

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Intervalo de Confianza

Hochgeladen von

Copyright:

Verfügbare Formate

Inferencia estadística – Intervalos de confianza

Cuando se obtiene una estimación puntual de un parámetro, es conveniente acompañar

A partir de esta expresión obtenemos

Es decir, que la probabilidad de que el intervalo

Observaciones: 1) No es correcto decir “la probabilidad de que θ pertenezca al intervalo (a,b)

Intervalos de confianza para los parámetros de una distribución normal

Dem: a) Ya hemos visto que cualquier combinación de v.a. normales independientes es

b) y c) Están fuera del alcance de este curso.

son v.a. independientes. Entonces, por definición de la distribución t de Student,

Intervalo de confianza para la media de la distribución normal con varianza

de donde se deduce el siguiente intervalo de confianza de nivel 1 - α para µ,

Intervalo de confianza para la media de la distribución normal con varianza

de donde se deduce el siguiente intervalo de confianza de nivel 1 - α para µ,

Intervalo de confianza para la varianza de la distribución normal con media

Como además las v.a. son independientes

¿Cómo elegimos los percentiles de la distribución χ2 que encierran un área igual a 1 - α?

Se obtiene el siguiente intervalo

Intervalo de confianza para la varianza de la distribución normal con media

Ejemplos: Sea X 1 , X 2 ,..., X 49 una m.a., X i ~ N ( µ , σ 2 ) .

a) Supongamos que el verdadero valor del desvío standard es σo = 35 y que se observa

con zα / 2 = z 0.025 = 1.96 , σ o = 35, n = 49 y valor observado de X igual a 160. Obtenemos

b) Supongamos ahora que la varianza es desconocida pero que el valor observado de S

con t n −1,α / 2 = t 48, 0.025 = 2.01 . Obtenemos

Notemos que es más ancho que el anterior

c) Suponiendo como antes que observamos x = 160 y s = 35 , hallemos un intervalo de

y un intervalo de confianza para σ de nivel 0.95 será

Determinación del tamaño de muestra: Consideremos el intervalo de confianza para µ con

• nivel de confianza (α)

Un modo de obtener mayor precisión, es decir un intervalo más angosto, es aumentando

Por lo tanto, Lo = 10, σ o = 35 y z 0.025 = 1.96 , entonces

En el caso de varianza desconocida el problema es más complejo porque el percentil t

Sea X 1 , X 2 ,..., X n una m.a. de una distribución que depende de un parámetro θ.

y, a partir de esta expresión, es posible obtener un intervalo de confianza para θ.

La función T ( X 1 , X 2 ,..., X n , θ ) se denomina pivote.

Ejemplo: Sea X 1 , X 2 ,..., X n una m.a. de una distribución exponencial de parámetro λ.

intervalo de confianza de nivel 1 - α para el parámetro λ.

Llamemos V a la v.a. max ( X 1 ,..., X n ) . Recordemos que, si X 1 , X 2 ,..., X n es una m.a. de

FV (v) = (FX (v) )

Queremos demostrar que la distribución de V/θ. no depende de θ.

Como, en nuestro caso, X i ~U(0,θ),

Por lo tanto, la distribución de V/θ no depende de θ. Derivando, se obtiene la densidad de

y, obtenemos el siguiente intervalo

Esto puede hacerse utilizando multiplicadores de Lagrange o bien, despejando de esta

El intervalo de mínima longitud esperada es

 max( X 1 ,..., X n ) max ( X 1 ,..., X n ) 

Intervalos de confianza de nivel asintótico 1 - α:

En muchos problemas no es posible encontrar intervalos de confianza de nivel exacto

lim P(a n ( X 1 , X 2 ,..., X n ) ≤ θ ≤ bn ( X 1 , X 2 ,..., X n ) ) = 1 − α

¿Porqué calcular intervalos de nivel asintótico?

Ejemplos: 1) Sea X 1 , X 2 ,..., X n una m.a. de una distribución F con E(Xi) = µ y

Sabemos que X es un estimador insesgado y consistente de µ. No conocemos su

Si σ2 es conocido, esta función podría servir de pivote para el intervalo de nivel

A partir de este resultado,

Intervalo de confianza de nivel asintótico 1 - α para el parámetro p de la

Sea X 1 , X 2 ,..., X n una m.a. de una distribución Bi(1,p) . Entonces

Recordemos que, por el TCL,

obteniendo un intervalo para p de nivel aproximado 1 – α.

b) Reescribimos la expresión (4) en la forma

Das könnte Ihnen auch gefallen