Sie sind auf Seite 1von 3

Inferencia Estadı́stica

PROBABILIDAD Y ESTADÍSTICA

Guı́a Práctica: Robustez de los intervalos de confianza.

Sobre la robustez de los intervalos de confianza para la media


bajo NO normalidad

Por el teorema central del limite, sabemos que la media muestral de muestras suficientemente grandes a menudo están bien aproximadas por una distribución
normal, incluso si los datos originales no se distribuyen normalmente. Por lo tanto, los intervalos de confianza en este caso son aproximados (cuanto más
cerca está la media de ser normal, más aproximados son los intervalos).
Para datos que no son normales, la distribución de la varianza muestral puede diferir sustancialmente de una distribución χ2 . Sin embargo, si el tamaño de
la muestra es grande, la distribución de la varianza muestral tiene poco efecto sobre la distribución de la t y, por lo tanto, sobre el intervalo de confianza.
Si los datos son sustancialmente no normales y el tamaño de la muestra es pequeño, el intervalo de confianza usando la distribución t puede dar resultados
malos. Cuando el supuesto de normalidad no se sostiene, una alternativa es usar bootstrap.

1. En este problema se analiza la robustez de los intervalos de confianza para la media cuando los datos no provienen de una distribución normal. Para
ello, muestre usando simulaciones que el α obtenido al utilizar intervalos de confianza para la media con varianza desconocida (bajo normalidad,
con bootstrap normal y percentı́lico) es similar al α usado para construir el intervalo de confianza, aunque la distribución de los datos se aleja de la
normal. Además realice Construya una tabla como la siguiente para diferentes distribuciones de los datos.

Distribución Parámetros n α α IC normal α IC bootstrap normal α IC percentı́lico


Poisson λ=1 10, 100
Poisson λ=5 10, 100
Binomial m = 10, p = 0.1 10, 100
Binomial m = 10, p = 0.6 10, 100
Chi cuadrado k=2 10,100
Chi cuadrado k = 10 10, 100
Uniforme a = 0, b = 5 10, 100
Inferencia Estadı́stica

Cuando no se puede asumir que σ1 = σ2 , surgen algunos problemas importantes. Por ejemplo, Sp ya no estimará a σ1 ni a σ2 y por lo tanto el desvı́o
estándar de la diferencia de medias muestrales ya no estará bien estimado. En consecuencia, al utilizar intervalos de confianza con varianzas iguales cuando
éstas no lo son, no se obtendrán buenos resultados.
Sin embargo, si n1 ≈ n2 , los intervalos permanecen válidos aún cuando σ1 6= σ2 . Cuando n1 es muy diferente a n2 , los resultados obtenidos ya no son
fiables.

2. Suponga que tiene una muestra aleatoria de tamaño n1 de una variable aleatoria distribuı́da como N (µ1 , σ1 ) y otra muestra de tamaño n2 de una
variable aleatoria distribuı́da como N (µ2 , σ2 ). Muestre lo siguiente:

• La robustez de los intervalos de confianza de diferencia de medias cuando supone varianzas iguales y sin embargo las varianzas verdaderas no lo
son y n1 = n2 . Es decir, muestre mediante simulaciones (no presente las simulaciones sino sólo un informe) que el α obtenido experimentalmente
(bajo normalidad, con bootstrap normal y percentı́lico), suponiendo varianzas iguales a pesar de ser diferentes, es similar al α usado para construir
el intervalo de confianza.
Distribución Parámetros n1 , n2 α α IC normal α IC bootstrap normal α IC percentı́lico
Normal µ1 = µ2 = 0, σ12 = 1,σ22 = 4 10, 10
Normal µ1 = µ2 = 0, σ12 = 1,σ22 =4 100, 100

• La NO robustez de los intervalos de confianza de diferencia de medias cuando supone varianzas iguales y sin embargo las varianzas verdaderas no
lo son y n1 6= n2 . E decir, muestre mediante simulaciones (no presente las simulaciones sino sólo un info me) que el α obtenido experimentalmente
(bajo normalidad, con bootstrap normal y percentı́lico)suponiendo varianzas iguales a pesar de ser dif rentes es muy diferente al α usado para
construir el intervalo de confianza. Muestre y arriesgue una hipótesis de cuándo el α obtenido es más conservador o más liberal que el α teórico.

Distribución Parámetros n α α IC normal α IC bootstrap normal α IC percentı́lico


Normal µ1 = µ2 = 0, σ12 = 1 , σ22 = 4 10, 40
Normal µ1 = µ2 = 0, σ12 = 1, σ22 = 4 40, 10
Normal µ1 = µ2 = 0, σ12 = 1,σ22 = 4 50, 100
Normal µ1 = µ2 = 0, σ12 = 1, σ22 = 4 100, 50

Importante: Para poder analizar el efecto de las varianzas, al hacer este ejercicio se deben respetar las otras hipótesis (independencia y normalidad). Es
decir se deben tomar muestras normales, independientes sólo que con diferentes varianzas pero se utilizará el intervalo de confianza para varianzas iguales.
Inferencia Estadı́stica

3. Qué sucede con el α teórico vs. el α que se obtiene experimentalmente cuando se tienen dos muestras que no son independientes pero se construyen
IC (bajo normalidad, con bootstrap normal y percentı́lico) para la diferencia de medias suponiendo que en realidad las muestras son independientes?
Utilice simulaciones para elaborar su respuesta, pero escriba solamente sus conclusiones.

Distribución Parámetros n α α IC normal α IC bootstrap normal α IC percentı́lico


Normal µ1 = 0, σ12 = 1 , X2 ∼ N (X1 , 1.5) 10
Normal µ1 = 0, σ12 = 1 , X2 ∼ N (X1 , 1.5) 100

Importante: Para poder analizar el efecto de la no independencia, se deben respetar todas las otras hipótesis (independencia y varianzas iguales o no). Es
decir se deben tomar muestras normales, dependientes y se debe usar el test de no independencia.

Sobre la NO robustez de los intervalos de confianza para la varianza


bajo NO normalidad

4. En este problema analizaremos la robustez de los intervalos de confianza para la varianza cuando los datos no provienen de una distribución normal.
Para ello, a partir de simulaciones y construyendo una tabla como en el problema anterior, muestre cómo es el α usado en la construcción de los IC
(bajo normalidad, con bootstrap normal y percentı́lico) comparado con el α obtenido a partir de ellos cuando la distribución de los datos se aleja de
la normal. Saque sus propias conclusiones.

Distribución Parámetros n α α IC normal α IC bootstrap normal α IC percentı́lico


Poisson λ=1 10, 100
Poisson λ=5 10, 100
Binomial m = 10, p = 0.1 10, 100
Binomial m = 10, p = 0.6 10, 100
Chi cuadrado k=2 10,100
Chi cuadrado k = 10 10, 100
Uniforme a = 0, b = 5 10, 100