Sie sind auf Seite 1von 5

Curso: Estadstica Inferencial (ICO 8306)

Profesores: Esteban Calvo, Pablo Hueichapan y Omar Ramos


Ayudantes: Jos T. Medina, Fabio Salinas y Daniela Vilches
ESTIMACIN POR INTERVALO
La primera parte consisti en estimar los intervalos de confianza considerando una desviacin estndar conocida, en ese
caso usbamos una estimacin de la desviacin estndar poblacional tomando como referencia datos histricos que se
tenan o algn otro valor que se pudiera tener de referencia para ese parmetro. Ahora, si lo pensamos bien, esto es
netamente para la teora, porque sera bastante raro tener la desviacin estndar de una poblacin, y no tener la media
de esta. Por eso el basarse en la desviacin estndar poblacional y considerar la media muestral es teora para poder
introducirnos en la obtencin de Intervalos de Confianza con desviacin estndar desconocida.
Estimacin por intervalos de la media poblacional con desviacin estndar desconocida
Es muy comn que el clculo de los intervalos de confianza de la media poblacional se realice sin conocer la desviacin
estndar de la poblacin, siendo esta situacin la mayora de los casos. En esta clase veremos cmo resolver este
problema utilizando la desviacin estndar muestral , utilizando tambin la misma muestra para poder obtener .
Anteriormente utilizbamos la tabla de distribucin normal estndar, para este caso utilizaremos una nueva distribucin
de probabilidad, conocida como distribucin o distribucin , en honor a su creador que firmaba bajo el
seudnimo de "Student" en sus publicaciones, Sealy Gosset. Es necesario sealar que esta distribucin
matemticamente parte de una distribucin normal, y se ha demostrado que sirve para muchos casos en que la
poblacin se desva significativamente de una poblacin normal.
Distribucin
Esta distribucin es un conjunto de distribuciones similares, donde cada distribucin est sujeta al nmero de grados de
libertad que tenga, es decir, cada distribucin depende del valor de este parmetro. Esto nos indica que cada
distribucin es distinta. Tambin debemos sealar que mientras mayor sea el grado de libertad de la distribucin, ms
nos acercamos a una distribucin normal. Caractersticas importantes de sealar; mientras mayor sea el grado de
libertad de la distribucin, menor es su varianza; la media de toda distribucin es 0.
Al igual que con la tabla de probabilidades normal estndar, el valor tambin tiene un sub ndice que denota el rea en
la cola superior de la distribucin de probabilidad . En la siguiente figura se puede ver la distribucin con la
probabilidad /2 en la cola superior (/2 ).

Curso: Estadstica Inferencial (ICO 8306)


Profesores: Esteban Calvo, Pablo Hueichapan y Omar Ramos
Ayudantes: Jos T. Medina, Fabio Salinas y Daniela Vilches
La tabla de distribucin tiene ciertas diferencias con la tabla de distribucin normal estndar. En este caso hay dos
parmetros que necesitamos conocer para obtener una probabilidad, los grados de libertad y el rea de la cola superior.
Es as como podemos ver la probabilidad de la tabla . La siguiente figura nos muestra un pequeo ejemplo
de la tabla, ya que los grados de libertad van de 1 a infinito, mientras mayor sea el grado de libertad, ms se acercar a
una probabilidad normal estndar. Para grados de libertad mayores a 100, regularmente se usa el rengln infinito de
grados de libertad, esto significa que para grados de libertad mayor a 100 el valor normal estndar es una buena
aproximacin al valor .

Obtencin de los intervalos de confianza


Si recordamos la formula anterior para la estimacin por intervalo de la media poblacional cuando la desviacin
estndar es conocida:
/2

Cuando la desviacin estndar es desconocida, se utiliza la desviacin estndar muestral () en reemplazo de sigma y se
reemplaza el valor por de la distribucin . Nuestro margen de error est dado por /2
2

La estimacin por

intervalo de la media poblacional cuando se desconoce la desviacin estndar poblacional es:


/2

Curso: Estadstica Inferencial (ICO 8306)


Profesores: Esteban Calvo, Pablo Hueichapan y Omar Ramos
Ayudantes: Jos T. Medina, Fabio Salinas y Daniela Vilches
La descripcin no se diferencia mucho de la descrita en la estimacin por intervalo de la media poblacional con
desviacin estndar conocida. Lo visto anteriormente se ve formalmente de la siguiente manera:

El margen de error est dado por: /2

Coeficiente de confianza: (1 )

Intervalo de confianza: /2

Grados de libertad: 1

El uso de los grados de libertad se debe a la utilizacin de la desviacin estndar muestral como nuestra estimacin de la
desviacin estndar poblacional. Los grados de libertad se refieren al nmero de valores independientes en el clculo de
( ), ya que en cualquier conjunto de datos ( ) = 0, por lo tanto 1 de esos valores son
independientes, y el ltimo se puede determinar conociendo los otros. Y como vimos anteriormente, la frmula de la
desviacin estndar muestral es:
( )2
=
1
Ejemplo
Chile y Brasil se han enfrentado en 71 oportunidades por partidos de campeonato, ya sean considerados oficiales por la
FIFA o no, recibiendo un total de 161 goles en contra y 61 goles a favor. Suponiendo que no podemos obtener la
desviacin estndar poblacional, pero que tenemos acceso a una muestra aleatoria de tamao n. Obtengamos la
estimacin por intervalo de confianza de la media poblacional de goles recibidos por partido al 95% de confianza.
Tomando una muestra aleatoria de tamao 10. Los resultados fueron los siguientes:

Ch 1-1 Br
Ch 0-1 Br
Ch 2-2 Br
Ch 4-1 Br
Ch 1-1 Br

Ch 1-6 Br
Ch 2-4 Br
Ch 1-1 Br
Ch 0-3 Br
Ch 1-2 Br

En promedio chile recibe 2,2 goles por partido, con una desviacin estndar muestral de 1,7 aproximadamente.
Reemplazando en nuestra formula tenemos:
2,2 2,262

1,7
10

2,2 1,2064
Esto nos dice que Chile cuando juega ante Brasil puede recibir en promedio 2,2 goles por partido con un margen de
error de 1,2064. Pudiendo estar la media entre 3,41 y 0,99 goles por partido.

Curso: Estadstica Inferencial (ICO 8306)


Profesores: Esteban Calvo, Pablo Hueichapan y Omar Ramos
Ayudantes: Jos T. Medina, Fabio Salinas y Daniela Vilches
Informacin til
Mediante este mtodo, el intervalo de confianza es exacto cuando la poblacin tiene una distribucin normal, esto nos
dice que se puede usar con cualquier tamao muestral. Si la poblacin no se distribuye normal, los intervalos de
confianza sern aproximados (esta aproximacin depender del tamao de la muestra y de la distribucin de la
poblacin, es decir de la calidad de los datos). Una muestra de tamao mayor o igual a 30 puede ser suficiente como
hemos visto a lo largo del curso, siempre considerando que no tenemos observaciones atpicas o que la distribucin sea
muy sesgada, para estos casos es bueno aumentar el tamao de nuestra muestra a 50 o ms. Con muestras pequeas se
debe trabajar solo si suponemos normalidad en la distribucin de la poblacin.
Al enfrentarse a un problema de estimacin por intervalo de la media poblacional debemos seguir el siguiente
procedimiento; primero preguntarnos si se conoce o no la desviacin estndar poblacional , si es conocida utilizamos la
formula vista en la clase anterior con la tabla de probabilidad normal estndar, si no la conocemos usamos la desviacin
estndar de la muestra para estimar , ms la tabla de distribucin .
STATA
La clase pasada ya vimos como poder utilizar STATA para obtener estimacin por intervalo de confianza de la media
poblacional, es por esto que repasaremos lo visto con el ejercicio que se us en la Solemne 1.
Utilizando el comando para elaborar intervalos de confianza inmediatos para variables distribuidas normalmente,
genere los intervalos de confianza para los siguientes datos sobre la variable: = 49 ; = 120 ; = 100. Asuma que
la muestra de donde se obtuvieron los valores est distribuida de forma normal, que se trata de una muestra grande y
que se us una tabla de distribucin normal estndar para obtener los valores. Luego repita el ejercicio cambiando el
nivel de confianza a 90. Luego interprete y explique todos los valores expresados en la tabla de intervalos de confianza
inmediatos y las diferencias que se producen al cambiar el nivel de confianza.

. cii 120 100 49

Variable |

Obs

Mean

Std. Err.

[95% Conf. Interval]

-------------+--------------------------------------------------------------|

120

100

4.473068

91.14288

108.8571

En la primera pregunta debamos simplemente utilizar el comando cii con los datos que nos entregaba el enunciado. La
nica dificultad que podan tener era que los datos no estaban en orden.
Para el siguiente punto era agregarle un nivel de confianza menor, ya que por defecto, cuando no se le asigna un nivel
de confianza al comando cii, utiliza un 95% como nivel de confianza. El resultado es el que se muestra a continuacin.

Curso: Estadstica Inferencial (ICO 8306)


Profesores: Esteban Calvo, Pablo Hueichapan y Omar Ramos
Ayudantes: Jos T. Medina, Fabio Salinas y Daniela Vilches
. cii 120 100 49, level(90)

Variable |

Obs

Mean

Std. Err.

[90% Conf. Interval]

-------------+--------------------------------------------------------------|

120

100

4.473068

92.58473

107.4153

Pregunta
Por qu cambian los resultados? Cmo se interpreta que los intervalos de confianza sean distintos?
La segunda parte del ejercicio era la siguiente.
Usando la base de datos casen2011_ie. Asuma que el total de la base de datos es una poblacin. Genere 6 muestras
aleatorias de la base de datos y genere los Intervalos de confianza al 99% de confiabilidad para todas las muestras.
Explique por qu se diferencian y compare con la media poblacional. (Utilizar la variable ytotaj para los intervalos de
confianza).

Das könnte Ihnen auch gefallen