Sie sind auf Seite 1von 26

1.

ESTIMACION PUNTUAL Y POR INTERVALO

La estimacin de un parmetro involucra el uso de los datos mustrales en


conjuncin con alguna estadstica. Existen dos formas de llevar a cabo lo anterior:
primero por la estimacin puntual (estimador), que es un estadstico muestral
que se utiliza con el fin de inferir el valor de un parmetro poblacional
desconocido. Y la segunda la estimacin por intervalo, que es la realizacin de
un estimador en base a datos provenientes de una muestra aleatoria, es un valor
especifico observado de un estimador. As, con el proceso de estimacin puntual
se pretende hallar una estimacin univaluada del parmetro poblacional de
inters, ya que mediante una muestra se estima un nico valor del mismo. Por
Ejemplo, el estadstico x es un estimador de la media poblacional, y el valor
especifico

realizacin de

que tome cuando es extrada una muestra aleatoria (es decir, la


x

es la estimacin puntual.

El proceso de estimacin puntual asigna un nico valor al parmetro poblacional


desconocido. Por lo tanto, la estimacin puntual es correcta o equivoca y,
generalmente, ocurrir este segundo caso, ya que es muy poco probable que la
estimacin obtenida a partir de una nica muestra coincida con el parmetro
poblacional. Sin embargo la estimacin por s sola no nos dice nada respecto de
cuan equivocada puede ser nuestra estimacin.
Los estadsticos y los estimadores son variables aleatorias, ya que su valor vara
de una muestra a otra. Por lo tanto, por ms que usemos el mismo estimador, la
estimacin puntual resultante variara de una muestra a otra. Sin embargo, al
conocer la distribucin de muestreo del estimador, podemos hallar un intervalo que
con cierta probabilidad contendr al parmetro. As, ya que mediante la estimacin
puntual se asigna un solo valor numrico a cada parmetro desconocido, y esto
generalmente no es el todo satisfactorio, se a la construccin de un intervalo de
confianza para el parmetro.
As, cuando se lleva a cabo una estimacin por intervalo se utilizan los datos
provenientes de una muestra aleatoria para determinar un intervalo de valores en
el cual se cree con cierta probabilidad, que estar el parmetro poblacional de
inters. Reiteramos que toda inferencia estadstica debe estar asociada a un nivel
de riesgo determinado. En las estimaciones puntuales, el error estndar suele
utilizarse como medida del riesgo, mientras que en los intervalos de confianza, el

nivel de confianza es justamente lo que mide cuan precisa es la estimacin


realizada.

2. ERROR CUADRTICO MEDIO


Sea T cualquier estimador de un parmetro desconocido . Se define el error
cuadrtico medio de T como el valor esperado del cuadrado de la diferencia entre
Ty .
Para cualquier estadstica T, se denotara el error cuadrtico medio por ECM (T);
de esta forma
ECM (T) = E (T- ) ^2.
Puede verse la razn de porque el error cuadrtico medio es una cantidad
importante para enjuiciar a los posibles estimadores de mediante el desarrollo
de la anterior ecuacin; este es,
ECM (T) = E (T^2 - 2 T +

2
= E (T^2) - 2 E (T) +

= var (T) + [E (T)] ^2 -2 E (T) + ^2


= var (T) + [ - E (T)] ^2.
El error cuadrtico medio de cualquier estimador es la suma de dos cantidades no
negativas: una es la varianza del estimador y la otra es el cuadrado del sesgo del
estimador. Estas dos cantidades se encuentran relacionadas en forma directa con
las propiedades deseables de un estimador. De manera especfica, la varianza de
un estimador debe ser lo ms pequea posible mientras que la distribucin de
muestreo debe concentrarse alrededor del valor del parmetro. Por lo tanto, el
problema visto de manera superficial parece bastante
sencillo; esto es,
seleccionar, como el mejor estimador de , la estadstica que tenga el error
cuadrtico medio ms pequeo posible de entre todos los estimadores factibles de
.

Sin embargo, en realidad el problema es mucho ms complicado. Aun si fuese


prctico determinar los errores cuadrticos medios de un numero grande de
estimadores, para la mayor parte de las densidad f(x: no existe ningn
estimador que minimice el error cuadrtico medio por todo los posibles valores de
. es decir, un estimador puede tener un error cuadrtico medio mnimo para
algunos valores de

mientras que otro estimador tendr la misma propiedad,

pero para otros valores de

3. PROPIEDADES DE LOS ESTIMADORES

Si entendemos por estimador el parmetro o expresin que permite, a partir de los


datos de la muestra, asignar al correspondiente parmetro poblacional un valor,
diremos que un estimador es un buen estimador cuando cumple las cuatro
propiedades: centrado o insesgado, eficiente, consistente y suficiente.

3.1 Estimadores insesgados


En el error cuadrtico medio de un estimador T, el termino [

- E (T)] recibe el

nombre de sesgo del estimador. El sesgo de T puede ser positivo, negativo o cero.
Puesto que el cuadrado del sesgo es un componente del error cuadrtico medio,
es razonable insistir que este sea, en valor absoluto, lo ms pequeo posible. En
otras palabras, es deseable que un estimador tenga una media igual a la del
parmetro que se est estimando. Lo anterior da origen a la siguiente definicin.
Un estadstico muestral T = u(X1 , X2 , Xn ) es un estimador insesgado del
parmetro

si su esperanza matemtica es igual al parmetro:


E (T)=

El sesgo de un estimador es la diferencia entre su esperanza y el parmetro:

Como puede observarse de la definicin anterior, si un estimador es insesgado,


entonces, su sesgo es cero. Adems, si el sesgo es cero, el ECM es igual a la
varianza.
Esta propiedad no garantiza nada respecto de la estimacin obtenida a partir de
una nica muestra. Lo que afirma es que si un estimador es insesgado, entonces,
el promedio de todas las estimaciones que se obtendran con todas las muestras
posibles de tamao n coincidira con el valor del parmetro. Sin embargo, ya
hemos mencionado que es imposible tomar las muestras posibles de un
determinado tamao.

Si
la esperanza
matemtica
de distribucin
una distribucin
de probabilidad
Si laes
esperanza
matemtica
de una
de probabilidad
cualquiera es
cualquiera
(es
decir,
es
la
media
poblacional),
entonces,
conocida, entonces:

1
n

^2 = i=1
n

Es un estimador insesgado de la misma.

) ^2

i=1

Esta proposicin tiene poca aplicacin prctica, ya que generalmente la media


poblacional no se conoce. En este caso, utilizamos la varianza muestral como
estimador.
La varianza muestral es un estimador insesgado de la varianza poblacional
de cualquier distribucin de probabilidades:

S2 =

1
n1

1-

X )2

(Es insesgado)

i=1

El siguiente estadstico es un estimador sesgado de la varianza poblacional:

3.2 Estimadores eficiente


La eficiencia de un estimador est relacionada con su estabilidad de muestra en
muestra: decimos que un estimador es ms eficiente que otro si es ms estable de
una muestra a otra. Por ejemplo, si tomamos muchas muestras, los valores (las
realizaciones) de la media muestral estarn ms concentrados que las
observaciones de la media muestral o el modo muestral. Por lo tanto, la media
muestral es un estimador ms eficiente (estable) que la mediana muestral y el
modo muestral. La estabilidad de las observaciones de una variable aleatoria est
ntimamente relacionada con su desvi estndar , y por ende la eficiencia de un
estimador estar relacionada con su erros estndar: cuanto ms chico el error
estndar, ms eficiente es el estimador.
En otras palabras cuando se extrae una nica muestra, esta podra ser sesgada, y
por lo tanto es importante tener una idea del riesgo que se podra estar
cometiendo al realizar la estimacin puntual. El error estndar del estimador es
justamente una medida para ello. Cuanto ms pequeo es el error estndar, mejor
o ms confiables ser nuestra estimacin puntual.

Si bien existen tcnicas para determinar si un estimador tiene la mnima varianza


que podr poseer cualquier otro estimador del parmetro. Analizaremos la
eficiencia en trminos relativos, como una herramienta para comparar dos
estimadores puntuales.
Sean T1 y T2 dos estimadores de

. Si Var (T ) < Var (T ), entonces T es


1
2
1

ms eficiente que T2.


La eficiencia relativa de T1 respecto T2 es Var (T1)/Var (T2).
Si los estimadores son sesgados, se suele utilizar el ECM para medir l
eficiencia relativa.

3.3 Estimador consistente


Es lgico esperar que cuanta mayor informacin muestral se posea, mejor sern
las estimaciones que se realicen. Por lo tanto, un buen estimador debera mejorar
a medida que aumenta el tamao muestral.
Un estimador T del parmetro desconocido

es consistente si

converge en probabilidad al verdadero valor del parmetro. Es decir, la


probabilidad que la diferencia entre el estimador y el parmetro sea muy
pequea tiende al 100% cuando la muestra crece:

T
P
lim

)=1

para todo

> 0.

Esta propiedad indica que al aumentar el tamao de la muestra se tiene casi la


certeza de que el valor del estimador se aproximara bastante al valor del
parmetro. Es decir que, cuando el tamao muestral aumenta, el valor de
cualquier realizacin del estimador estar muy prximo al valor del parmetro.

3.4 Estimador suficiente


Se dice que un estimador T es suficiente si utiliza toda la informacin relevante de
la muestra para estimar el parmetro de la poblacin. Es decir, un estimador T

es suficiente si todo el conocimiento que se obtiene acerca del parmetro es


mediante la especificacin real de todos los valores de la muestra.
Ejemplo. Se tiene una muestra aleatoria (X 1, X2,..., Xn) de tamao 30 tomada de
una poblacin exponencial f(x, l), donde l es un parmetro desconocido. Considere
las dos estadsticos siguientes:
T1 =

1
X 1+ X 2+ X 3 ..+X 29

T2=

1
1
=

X 1+ X 2+ X 3+ ...+ X 30 X

El estadstico T1 no es un estimador suficiente del parmetro l mientras que T2 s


lo es.
Definicin: Se dice que un estadstico T = t(X1, X2, ..., Xn) es "suficiente" para un
parmetro si la distribucin conjunta de X1, X2, ..., Xn dado T se encuentra libre
de , es decir, si se afirma T, entonces X1, X2, ..., Xn no tienen nada ms que
decir acerca de .
Formalmente esto puede expresarse en trminos de la distribucin condicional de
los valores de la muestra, dado que = T. Esta cantidad est dada por:
F(X1, x2,,Xn) =

f ( X 1, X 2,. . Xn , t)
g (t)

f ( X 1, X 2, , Xn)
g(t )

Donde la expresin final del numerador se sigue de la condicin de suficiencia.


Utilidad. Si un estimador insesgado T de un parmetro es una funcin de un
estadstico suficiente, entonces tendr la varianza ms pequea entre todos los
estimadores insesgados de . Es decir, si existe el estimador ms eficiente de ,
ste ser un estadstico suficiente.

3.5 Estimadores insesgados de varianza mnima


Para un parmetro que posee un error cuadrtico medio mnimo es difcil
determinar un estimador para todos los posibles valores del parmetro. Sin
embargo, es posible analizar cierta clase de estimadores y dentro de esta clase
intentar determinar uno que tenga un ECM mnimo.

Por ejemplo, considrese la clase de estimadores insesgados para el parmetro .


Si una estadstica T se encuentra dentro de esta clase, entonces E(T)= y
ECM(T)= Var (T). Puesto que es deseable que la varianza de un estimador sea lo
mas pequea posible, debe buscarse uno en la clase de estimadores insesgados,
si es que existe, que tenga varianza mnima para todos los valores posibles de .
Este estimador recibe el nombre de estimador insesgado de varianza mnima
uniforma (VMU) de .

La varianza de un estimador insesgado es la cantidad ms importante para


determinar que tan bueno es el estimador para estimar un parmetro .

4. TERMINOLOGIA RELACIONADA CON LOS I.C.

Nivel de significancia: Es la probabilidad de cometer un error de tipo I cuando


la hiptesis nula es verdadera como igualdad.

Para denotar el nivel de significancia se utiliza la letra alfa ( ), y los valores que se
suelen usar para son 0,05 y 0,01.
En la prctica la persona responsable de la prueba especifica el nivel de
significancia. Si el costo de cometer un error es elevado, los valores pequeos de
son preferibles y si el costo no es tan elevado se utilizan valores mayores de .
Enfocndonos en el tema de intervalos de confianza la probabilidad de
equivocarnos se llama nivel de significancia y se simboliza . Generalmente se
construyen intervalos con confianza 1- =95% (o significancia =5%).

Nivel de confianza: Es considerado la probabilidad de que el verdadero valor


del parmetro se encuentre en el intervalo construido se denomina nivel de
confianza, y se denota 1- . La eleccin del nivel de confianza depende del
investigador. los niveles de confianza mas utilizados son 95.5 y 99.7 % de
confianza.

Limite inferior y superior en los I.C: En la estimacin por intervalo es


necesario calcular estos dos puntos, entres estos hay una determinada
probabilidad de que se encuentre el verdadero valor del parmetro poblacional
que se desea estimar.

Los lmites de un intervalo de confianza son aleatorios ya que se construyen en


base a estadsticos mustrales.

5. INTERVALOS DE CONFIANZA (IC)

El calculo de intervalos de confianza para la estimacin de parmetros son


tcnicas que nos permiten hacer declaraciones sobre que valores podemos
esperar de un parmetro.
El intervalo calculado depender de:

Lo estimado en la muestra (porcentaje, media..).


El intervalo de confianza esta formado por valores ligeramente menores y
mayores que la aproximacin ofrecida por la muestra.
El tamao muestral.
Cuando ms datos hayan participado en el clculo, ms pequeo
esperamos que sea la diferencia entre el valor estimado y el valor real
desconocido.
La probabilidad (nivel de confianza) con la que el mtodo dar una
respuesta correcta.

5.1 Errores asociados al intervalo de confianza.


La construccin de un intervalo de confianza incluye tres errores.
5.1.1 Probabilidad de error
El nivel de confianza es un indicador numrico del grado de confianza con que se
realiza la estimacin. Complementaria a esa confianza existe una probabilidad de
errar. El error es una magnitud que expresa la probabilidad de equivocarse en la
estimacin. Asume valores entre 0 y 1.
5.1.2 Error mximo admisible

Es una decisin del investigador. Se puede leer de dos modos distintos segn se
estime la proporcin o la muestra poblacional. Cuando se estima la proporcin
asume valores entre 0 y 1. Sin embargo, cuando se estima la media poblacional el
error depende de la unidad de medida de la variable en estudio.
La muestra del Error mximo admisible estar condicionada por los recursos
disponibles.

5.1.3 Error tpico


Es una medida de dispersin. Mide la variacin del estadstico muestral. Dicha
variacin se explica por medio de fluctuaciones del muestreo.

5.2 Intervalos de Confianza para la Media en Poblaciones Normales con


Varianza Conocida
X Es considerado un buen estimador de la media poblacional debido a sus

propiedades y caractersticas. Como ya Se ha visto en clases anteriores


X N ( ; 2 /n) , cuando se tienen poblaciones con una distribucin N ( ; 2 ) o
cuando no se conoce el tipo de distribucin, pero

n>30

y se conoce

Como consecuencia a esto tenemos que:

P z / 2

Donde

z / 2

z 1 /2

respectivamente. Se sigue que:

son los valores que corresponden a una Normal Estndar

que tienen una probabilidad de

g( )1=+ Z

X
z
=1
/ n 1 /2

limite superior
n

P z< Z = /2

P Z < Z 1 =1 /2


limite Inferior
n

g()2=+ Z 1
2

Ahora bien dado que se tiene una Normal Estndar y que esta tiene la
caracterstica de ser simtrica; se cumple que

Z /2=Z 1
2

. Utilizando esta

relacin y reagrupando, tenemos:


Z 1

Z 1
2

1 =P(

Z 1

P( X

P( X

Z 1
X +

Z 1
2

Z 1
+
X

En conclusin el Intervalo de Confianza de un


poblacional

EJEMPLO (1):

100 (1 )

para la media

cuando se conoce la Desviacin estndar ( ) es:

estudiantes varones de la Facultad de Ciencias


Suponga
que
la estatura
Zde
los
P X Z
X+
=1
1
1
n Universidad
n Cartagena se distribuye Normalmente, y se sabe
2
Econmicas 2dela
de
que la Desviacin Estndar es de 15 cm. Determine el Intervalo de Confianza que
obtendr la media poblacional con un 99%, si se tiene una muestra de 20
estudiantes.

Varones Facultad de Ciencias


Econmicas Universidad de Cartagena
1.83
1.82
1.91
1.80
1.85
1.76

1.70

1.80

1.70

1.83

1.76

1.72

1.91

1.84

1.90

1.76

1.77

1.76

1.74

1.81

Al calcular el promedio (realizamos

para esta muestra), tenemos que

X =1.7985 1.80 . Teniendo en cuenta que

=0.01

. Finalmente, como sabemos que

1 =99 ),

1 =0.995
, y tenemos que
2

buscamos en la tabla de la Normal el valor para


Z 0.995=2.5758

(porque

n=20

=0.15 , podemos

construir el IC:

P X Z 0.995
X +Z 0.995
=0.99
n
n

0.15
0.15
1.75+ 2.5758
=0.99
20
20

P 1.802.5758

P (1.7136 1.8363 ) =0.99


De acuerdo al resultado se puede decir que con un 99% la estatura media de los
varones de la Facultad de Ciencias Econmicas de la Universidad de Cartagena
esta entre 1.71 m y 1.83 m.

5.3 Intervalos de Confianza para la Media en Poblaciones Normales con


Varianza Desconocida.
Como se vio en clases anteriores, cuando se tiene una muestra aleatoria de
tamao

de una Poblacin Normal

( N ( ; ))

con media ( )

y varianza

( 2 ) desconocidas, la distribucin de muestreo que sigue la variable en mencin


es t de student
T=

con n1 grados de libertad.

X
t n1
S
n

De acuerdo con esto, podemos determinar que,

P t

n1;
2

X
t
1 =1
n1;
S
2
n

En donde

tiene

n1 ;

una

n1 ;

probabilidad

1
2

corresponden a valores de una t de Student que


P T <t

de

;n1

P T <t 1

; n1

1
,
2

respectivamente.
Ahora bien, al igual que en la normal, la distribucin t de Student es simtrica
respecto al origen, por lo tanto, se cumple que

n1 ;

=t

n1;

1
2

. Reagrupando

la expresin anterior y con base a esto se tiene que:

1 =P

P X

1
2

1
2

n1;

n1 ;

1
2

n
t

P X

n1 ;

t
X +
t

X+

n1 ;

1
2

n1;

1
2

n1 ;

1
2

n
S

)
)

=1

Finalmente obtenemos el Intervalo de Confianza de un

para la media

cuando desconozco varianza

poblacional

P X t 1

100(1 )

;n1

S
S
+t 1
X
=1
;n1

n
n
2

EJEMPLO (2):
Una empresa desea controlar la vida til de sus lmparas. Para ello, se extrae una
muestra de 20 artefactos y se los enciende hasta que fallen. La duracin de cada
artefacto se muestra en la tabla. Si la distribucin de la duracin es normal, Cul
es el intervalo en el cual se encuentra la duracin media con un 99% de
confianza?

774 759 755 724


660 763 742 601
667 707 665 644
696 699 778 780
691 663 765 575
Como primer paso, calculamos la Media Muestral y la Desviacin Estndar con los
datos que el ejercicio brinda. Estos son:
n

14108
X =
=705.4
20
i=1

Y S=60

Ahora hallamos el cuantil de la distribucin t de Student con 19 grados de libertad


con una probabilidad de 99.5%. Estos valores provienen de nuestro tamao de
muestra n=20 y =1 , entonces,
1
=99.5
2

n1=19 Y

Buscamos en la tabla la probabilidad y tenemos que,


P ( T t 19 ;0.995 )=2.8609 2.861
, por lo tanto el Intervalo de Confianza para este
ejercicio estara dado de la siguiente manera:

P 705.42.861

60
60
705.4+ 2.861
20
20

P (667.01 743.78 )=0.99


En palabras se tiene que con un 99% de confianza se puede decir que la duracin
media de las lmparas esta entre 667.01 y 743.78 horas

5.4 Intervalos de Confianza para la Diferencia de Medias


Sean

X1 , X2 , X3, , Xn

Y 1 ,Y 2 , Y 3 , , Y m

dos muestras aleatorias de dos

distribuciones normales independientes, de tamaos

con medias

X y Y

,y

X y Y , respectivamente, entonces tenemos que la distribucin de

varianzas

Muestreo Para La Diferencia De Medias esta dada por:


Z=

Y ) ( X Y )
( X

2
X

2
Y


+
n m

N ( 0 ;1 )

Con la Distribucin de muestreo expuesta, es posible hallar el valor del cuantil


Z 1
2

, de esta forma se podr construir el correspondiente Intervalo De

Confianza. Entonces, sabemos que:


P Z 1 Z Z 1 =1

Reemplazando Z tenemos:

P Z 1

( X Y ) ( X Y )

X Y
+
n m

Z 1 =1
2

Reagrupamos la anterior expresin y nos queda que:

2X 2Y
2X 2Y

P ( X Y )Z 1
+ ( X Y ) ( X Y ) + Z 1
+
=1
n m
n m
2
2
Una vez se obtengan los datos de las muestras, se obtienen las respectivas

estimaciones para X e Y y con ellas se podr estimar el intervalo.

Finalmente, el Intervalo de Confianza de un


medias,

para la diferencia de

X Y , cuando se tienen dos poblaciones Normales independientes con

varianzas conocidas

100(1 )

P x y z 1
2

2X y 2Y

es:

2X 2Y
2X 2Y
+ X Y x y + z 1
+
=1
n m
n m
2

EJEMPLO (3):
Varones Facultad de Ciencias
Econmicas Universidad de Cartagena
1.83
1.82
1.91
1.80
1.85

Tengamos en cuenta el ejemplo de


la estatura de los varones de la
Facultad de Ciencias Econmicas
1.76
1.70
1.80
1.70
1.83
de la Universidad de Cartagena,
donde se construyo el IC con una
1.76
1.72
1.91
1.84
1.90
muestra de 20 varones. Ahora
1.76
1.77
1.76
1.74
1.81
supongamos,
que
a
esta
informacin se suma una muestra de 30 datos de mujeres de la misma facultad.
Considerando las anteriores condiciones y agregando que la distribucin de
estaturas de mujeres es Normal, con una desviacin estndar de 10 cm y son
independientes de la estatura de los varones, calcule el IC para un 99% de la
diferencia de medias.
Mujeres Facultad de Ciencias
Econmicas
Universidad de Cartagena
Varones Facultad
de Ciencias
1.71 de 1.66
1.76
1.75
Econmicas 1.64
Universidad
Cartagena
1.62
1.63
1.63
1.62
1.87
1.91
1.80
1.85
1.83
1.82
1.66
1.65
1.64
1.61
1.83
1.80
1.70
1.83
1.76
1.70
1.83
1.63
1.81
1.70
1.63
1.91
1.84
1.90
1.76
1.72
1.59
1.53
1.81
1.77
1.83
1.76
1.74
1.81
1.76
1.77
1.66
1.68
1.78
1.58
1.76

P v mz

0.995

El
intervalo
quedara de la
siguiente forma:

]
2

v m

+ v m v m+
z 0.995 v + m =0.99
n m
n m

Para calcular los valores, primero debemos saber que en una Normal Estndar
z 0.995=2.5747
. Luego con la informacin dad tenemos:
v =1.80 m=1.70

2
2
2v 2m
0.15 0.10
+ =
+
=0.038188
n m
20
30

Reemplazando y efectuando las operaciones respectivas nos queda:


P [ 1.801.702.57580.038188 v m 1.801.70+2.57580.038188 ] =0.99
P [ 0.0042 v m 0.2009 ]=0.99
En conclusin, observando la muestra, al ser el lmite inferior del intervalo,
superior a cero, podemos decir que con un 99% de confianza que la estatura
media de los varones es superior a la estatura media de las mujeres.
En el segundo caso, en que las varianzas de las dos poblaciones son
desconocidas pero son iguales (o se suponga una igualdad entre ellas), entonces,
se usara la distribucin t de Student. Para estimar la varianza comn, como se
haba dicho en clases anteriores, se usa el siguiente estadstico:

( n1 ) s2x + ( m1 ) s2y
S =
n+m2
2
p

{ X 1 , X 2 ; ; X n } y {Y 1, Y 2 ; ; Y n }

Sean

n ym ,

respectivamente,

independientes con medias

provenientes
X y Y

dos muestras aleatorias de tamaos


de

dos

poblaciones

Normales

, y varianzas desconocidas pero iguales.

Entonces:
Y ) ( X Y )
( X
Sp

1 1
+
n m

t n+m 2

En conclusin el IC para la diferencia de medias cuando desconozco varianza, y se


asume que estas son iguales, es:

P x y t

1
n+ m2:
2

EJEMPLO (4):

S p

1 1
1 1
+ X Y x y +t
+ =1
1 S p
n+ m2:
n m
n m
2

Supongamos el ejemplo anterior, pero ahora digamos que se desconocen las


varianzas poblacionales, pero que estas son iguales. Para construir el intervalo de
t
=2.6822
confianza, primero buscamos el valor de 30 +202 ;0.995
. Luego estimamos
la varianza comn
2
p

S =

Sp:

( n v 1 ) S 2v +(nm1)S 2m
n v + nm2

( 201 ) 0.0642 +(301)0.092

20+ 302
0.006464
S p =0.0804
Reemplazando en la expresin dada para este Intervalo De Confianza, tenemos
que:
0.99=P( 1.801.702.68220.0804 v m 1.801.70+ 2.68220.0804)
P(0.1131 v m 0.3182)
En este caso, al incluir valores negativos el intervalo, no se puede asegurar que la
estatura media de los valores sea mayor a la estatura media de las mujeres. Por lo
tanto, la afirmacin del ejemplo anterior estaba basada exclusivamente en los
supuestos respecto de las varianzas poblacionales.

5.5 Intervalos de Confianza para la Proporcin cuando se muestra una


distribucin Binomial
En una distribucin binomial cuando n es lo suficientemente grande, esta
distribucin se aproxima a una Normal. Usando esta propiedad, hemos visto que
cuando el tamao de muestra es grande, la Distribucin De Muestreo De
Proporcin puede aproximarse a una Normal Estndar:

Z=

p
p
N (0 ; 1)
p(1 p)/ n

Por lo tanto, valindose de la simetra de la Distribucin Normal, podremos


escribir:

P Z 1
2

p p
Z 1 =1
p(1p)/n
2

Reagrupando la expresin nos queda que:


1 =P(Z 1 p(1 p)/n p p Z 1 p (1 p)/n)
2

P(p Z 1 p(1p)/n p p + Z 1 p(1 p)/n)


2

P( p Z 1 p(1p)/n p p + Z 1 p(1p)/n)
2

El Intervalo de Confianza de un

100 (1 )

para la Proporcin poblacional p, cuando

el tamao de la muestra es lo suficientemente grande, es:

P p x Z 1

EJEMPLO
(5):
2

p x ( 1 p x )
p (1 p x )
p p x +Z 1 x
=1
n
n
2

Suponga que en una encuesta tomada a 500 personas, en la ciudad de


Cartagena, 300 respondieron que apoyan a Juan Manuel Santos, lo que significa
z 0.975=1.96
que la proporcin muestral es de un 60%. Entonces, sabiendo que
,
el intervalo de 95% de confianza para la proporcin poblacional seria:

0.95=P 0.601.96

0.700.30
0.700.30
p 0.66+ 1.96
500
500

P ( 0.5571 p 0.6429 )
Siendo el lmite inferior del intervalo mayor a 0.50, el resultado de esta encuesta
permite afirmar con un 95% de confianza que el candidato Juan Manuel Santos
ganara las elecciones.

5.6 Intervalos de Confianza para la Diferencia de Proporciones

{ A1 ; A 2 ; ; A n } y { B1 ; B2 ; ; B m } dos muestras aleatorias de tamaos

Sean

n y m , respectivamente, provenientes de dos poblaciones Bernoulli, con

pA y pB

parmetros

. Sean X e Y la cantidad de xitos en cada una de ellas (es

X = A i y Y = B i ). Entonces, aproximadamente, tenemos que:


i=1
i=1

decir,

( Xn Ym )( p p )
A

p A (1p A ) p B (1p B )
+
n
m

N (0 ; 1)

Con esta distribucin de muestreo es inmediata la construccin del intervalo de


confianza.
El Intervalo de Confianza de un

100 (1 )

para la Diferencia De Proporciones

es:

x y
x y
z 1 s p A p B + z 1 s =1
n m
n m
2
2

Donde para el clculo de la Desviacin estndar se reemplaza la proporcin de


cada poblacin por sus respectivas medidas muestrales (

x
y
p A = y p B =
n
m

),

EJEMPLO (6):
Tengamos en cuenta el ejemplo anterior y ahora supongamos que en la ciudad de
Bogot se encuestan a 300 personas, y resulta que 150 estn a favor de Juan
Manuel Santos. Cul es el IC al 95% para la diferencia entre las proporciones de
ambas ciudades?
Primero, recordemos que en el ejemplo anterior se obtuvo que 300 personas
estaban a favor de Juan Manuel Santos una muestra de 500: x=300 y n=500 (

x
=0.6
). A su vez, con los datos aqu presentados, tenemos que y = 150 y
n
y
=0.5
m=300 ( m
). Con esta informacin, podemos calcular la desviacin
estndar:
s=

x (nx) y (m y)
+
3
3
n
m

300200 150150
+
0.03624
5003
3003

Finalmente sabiendo que

z 0.975=1.96

, podemos construir el intervalo:

0.95=P [ 0.60.51.960.03624 p1 p 2 0.6+0.5+1.960.03624 ]


P [ 0.0290 p1 p2 0.1710 ]
Por lo tanto, en base a las muestras, con un 95% de confianza podemos afirmar
que la diferencia entre la proporcin de personas favorables al candidato Juan
Manuel Santos en las ciudades de Cartagena y Bogot, esta entre el 2.90% y el
17.10%. Esto evidencia el mayor apoyo en la ciudad de Cartagena.

5.7 Intervalo de confianza para la varianza


Para estimar un intervalo de confianza para la varianza, nos ayudaremos de la
siguiente propiedad de la distribucin

2
n1

=
i=1

( x i X )

(n1) ^S
2

X 2n1

Consideremos dos cuantiles de esta distribucin que


probabilidad 1 en la ``zona central'' de la distribucin:

nos

dejen

una

Figura: Cuantiles
2
X n1 .

P X n1 < x

la

distribucin

2
n1 ;

de

1
2

]= 2
[

P X2

P X n1 > x

2
n1 ;

1
2

n1,

X 2n1 X 2

n 1,

1
2

]=1

Entonces un intervalo de confianza al nivel

1 para la varianza de una

distribucin gaussiana (cuyos parmetros desconocemos) lo obtenemos teniendo


en cuenta que existe una probabilidad 1 de que:
1
X

2
n1 ;

X n1 X

2
n1 ;1

(n1) S^
X 2 1
2
n1;

2
2

X2

n1;

^2
(n1) S^ 2
2 (n1) S
2
2
X
X
1

n1;

n 1 ;

Por tanto el intervalo que buscamos es:

(n1) S^ (n1) S^
2
, 2
X
X
1

n1 ;

n 1 ;

EJEMPLO (7):
En un ejemplo anterior se estudiaba la altura de los individuos de una ciudad,
obtenindose en una muestra de tamao 25 los siguientes valores:
x =170 cm
S=10 cm

Calcular un intervalo de confianza con

=0.05 para la varianza

de la altura

de los individuos de la ciudad.


Solucin:
Para estimar un intervalo de confianza para

(varianza poblacional) el

estadstico que nos resulta til es:


2
( n1) S^
X=
X 2n1
2

Entonces el intervalo de confianza que buscamos lo obtenemos mediante (cf.


figura 8.8)
Figura: Percentiles

del

2,5%

del

97,5%para la distribucin

n1,
2

X X

2
1
n1,
2

X 224 ;0.025 =12.4

X 24 .

2410.206 2
X 224; 0.075=39' 4
2

[ 63.45 ; 201.60 ]
Por tanto, para el valor poblacional de la desviacin tpica tenemos que
7.96 14.19 9 con una confianza del 95%, que por supuesto contiene a las
^
estimaciones puntuales S=10 y S=10.206 calculado sobre la muestra.
5.8 Intervalos de Confianza para el Cociente de Varianza
En clases anteriores, hemos visto que cuando se muestrean dos poblaciones
normales con medias desconocidas, se verifica que:
s 2x
2x
s2y

F (n1,m1)

y
Al igual que en los anteriores casos, una vez conocida la distribucin de muestreo,
la construccin del intervalo es directa. En este caso, por no ser simtrica la
distribucin tenemos que:

sx

P F

( n1 ;m1) ;

sy

( n1 ;m1) ;

1
2

=1

Si se reagrupa la expresin anterior y se realizan las estimaciones


2
2
correspondientes de los estadsticos S x y S y , obtenemos el IC para el
cociente de varianzas.
Si

se toman

dos muestras aleatorias,

{ X 1 ; X 2 ; ; X n } y {Y 1 ; Y 2 ; ; Y m }

, de

dos

poblaciones normales con medias desconocidas, entonces el intervalo de confianza de un

100 (1 )

es:

S2x
S 2y F

1
( n1 ;m1 ) ;
2

2x
S2x

2y S2y F

=1

( n1; m1) ;
2

EJEMPLO (8):
En el ejemplo (2), se analizo la duracin de las lmparas producidas por una
determinada empresa. Ahora supngase que la empresa esta analizando la
posibilidad de adquirir una nueva maquina, y le interesa especialmente que la
duracin de los productos se mas estable (es decir, que la varianza de la duracin
sea menor). Para decidir respecto de la compra, se toma una muestra de la
produccin de la nueva maquina. Las duraciones de las lamparitas se observan en
la tabla, siendo la varianza muestral calculada con estas observaciones:
S 2y =1871.

A su vez, recordamos de los ejemplos anteriores que con la muestra

de la produccin actual se obtuvo una varianza de

S x =3600

681

688

655

771

670

674

635

657

694

619

662

782

751

650

684

700

720

757

614

678

679

706

705

682

663

Para realizar la comparacin de la variabilidad de los dos mtodos de produccin


se decide construir el intervalo para el cociente de varianzas con un 98% de
confianza. Para determinar los lmites, ya tenemos calculadas las varianzas
muestrales, y nos resta determinar los valores de la variable F con 19 y 24 grados
de libertad (ya que la primera muestra era de 20 y la segunda de tamao 25).
Entonces, buscamos los cuantiles que acumulan 99% y 1%, de manera que en el
F( 19;24 ) ;0.99=2.762 y F (19,24 );0.01 =0.342
centro quede el 98% deseado:
Finalmente, utilizando la formula expuesta calculamos el intervalo:
0.98=P

2
3600
3600
2x
18712.762 y 18710.342
2

P 0.697

x
2y

5.629

Para asegurar que la nueva maquina es menos variable que la actual, el intervalo
debera encontrarse totalmente a la derecha de numero uno (el limite inferior
debera ser mayor a 1), ya que ello implicara que la varianza actual es mayor que
la nueva:
2

1< LI <

1< 2x 2y < 2X
2
y
y

Como el intervalo calculado con un 98% incluye al uno, no se puede asegurar que la
varianza del procedimiento actual sea mayor a la varianza de la nueva maquina.

Das könnte Ihnen auch gefallen