Sie sind auf Seite 1von 40

Tema 1.

Inferencia estadstica para una poblacion


Contenidos

Inferencia estadstica

Estimadores puntuales

Estimaci on de la media y la varianza de una poblaci on

Estimacion de la media de la poblacion mediante intervalos de


conanza

Intervalos de conanza para la media de una poblaci on normal con


varianza conocida

Intervalos de conanza para la media en muestras grandes

Intervalos de conanza para la proporci on en una poblaci on

Intervalos de conanza para la media de una poblaci on normal con


varianza desconocida

Estimacion de la varianza de la poblacion mediante intervalos de


conanza

Intervalos de conanza para la varianza de una poblaci on normal


Tema 1. Inferencia estadstica para una poblacion
Objetivos de aprendizaje
Al nal de este tema debieras ser capaz de:

Estimar parametros de la poblacion desconocidos a partir de datos


muestrales

Construir intervalos de conanza para los parametros de la poblacion


desconocidos a partir de datos muestrales:

En el caso de una distribuci on normal: intervalos de conanza para la


media y la varianza de la poblaci on

En muestras grandes: intervalos de conanza para la media de la


poblaci on y la proporci on

Interpretar el signicado de un intervalo de conanza

Entender el efecto del tama no muestral, el nivel de conanza, etc


sobre la longitud del intervalo de conanza

Calcular un tama no muestral necesario para controlar la longitud de


un intervalo de conanza
Tema 1. Inferencia estadstica para una poblacion
Referencias

Newbold, P. Estadstica para Administracion y Economa

Captulos 7 y 8 (8.1-8.6)

Ross, S. Introduccion a la Estadstica

Captulo 8
Inferencia Estadstica: palabras clave (i)

Poblacion: el conjunto de toda la informacion numerica relativa a


una cantidad de interes.

Identicaremos el concepto de poblaci on con el de una variable


aleatoria X.

La ley o distribucion de la poblaci on es la distribuci on de X, F


X
.

Muestra: un subconjunto observado (por ejemplo, de tama no n) de


valores de la poblacion.

Representada como una colecci on de n variables aleatorias


X
1
, X
2
, . . . , X
n
, tpicamente
iid (independientes e identicamente distribuidas) .

Parametro: una constante que caracteriza a X o F


X
.
Inferencia Estadstica: palabras clave (ii)

Inferencia estadstica: el proceso mediante el que se llega a


conclusiones sobre una poblacion a partir de las medidas o las
observaciones realizadas sobre una muestra de individuos de la
poblacion.

Estadstico: una variable aleatoria denida como una funcion de una


muestra aleatoria, Y = f (X
1
, X
2
, . . . , X
n
)

Estimador de un parametro: una variable aleatoria, por ejemplo T,


funcion de una muestra aleatoria, T = T(X
1
, X
2
, . . . , X
n
), que se
emplea para aproximar (estimar) el valor de un parametro de la
poblacion desconocido.

Estimacion: una realizacion concreta del estimador, por ejemplo T,


correspondiente a una muestra observada, x
1
, x
2
, . . . , x
n
, y que
proporciona una aproximacion al valor del parametro de interes.
Inferencia estadstica: ejemplo
Queremos conocer Tenemos n copias Tenemos n

X
= E[X] de X valores observados de
X
1
, X
2
, . . . , X
n
X
1
, X
2
, . . . , X
n
F x
1
, x
2
, . . . , x
n
X F Muestra Muestra observada

Estimador de
X
(variable aleatoria) Estimacion de
X
(un n umero)

X
= E[X]

X x
Valor esperado de X Media muestral Media muestral
Estimadores puntuales: introducci on

Un estimador puntual de un parametro de una poblacion es una


funcion, por ejemplo T, de la informacion muestral
X
n
= (X
1
, . . . , X
n
) que toma un valor numerico.

Ejemplos de parametros de poblaciones, estimadores y estimaciones:


Parametro Estimador: Estimacion:
poblaci on T(X
n
) notacion notacion
Media pobl.
X
media muestral
X
1
+...+X
n
n

X =
X
x
Prop. pobl. p
X
prop. muestral p
X
p
x
Var. pobl.
2
X
var. muestral
P
i
X
2
i
n(

X)
2
n

2
X

2
x
Var. pobl.
2
X
quasi var. muestral
P
i
X
2
i
n(

X)
2
n1
=
n
n1

2
X
s
2
X
s
2
x
. . . . . . . . . . . .
En general,
X
. . .

x
Estimadores puntuales: propiedades (i)
Que caractersticas querramos que tuviese un estimador?

Ausencia de sesgo. Esta propiedad se da cuando un estimador tiene


sesgo igual a cero. Que es el sesgo? El sesgo es la diferencia entre
el valor esperado del estimador y el valor del parametro de interes.
Sesgo[

X
] = E[

X
]
X
Poblacion Estimador Estimador insesgado
parametro T(X
n
) Sesgo Insesgado? de mnima varianza?
Media pobl.
X
X E[

X]
X
= 0 S S, si X normal
Prop. pobl. p
X
p
X
E[ p
X
] p
X
= 0 S S
Var. pobl.
2
X

2
X
E[
2
X
]
2
X
= 0 No No
Var. pobl.
2
X
s
2
X
E[s
2
X
]
2
X
= 0 S S, si X normal
En general,
X

X
E[

X
]
X
A menudo Rara vez
Estimadores puntuales: propiedades (ii)

Eciencia. Se mide por la varianza del estimador. Un estimador con


menos varianza es mas eciente.

La eciencia relativa de dos estimadores insesgados


X,1
y

X,2
para
un parametro
X
se dene como
Eciencia relativa(

X,1
,

X,2
) =
Var[

X,1
]
Var[

X,2
]
Nota:

En algunos casos se emplea la denici on inversa.

En todo caso, un estimador con menor varianza es mas eciente.


Estimadores puntuales: propiedades (iii)

Un criterio mas general para seleccionar estimadores (incluyendo


estimadores insesgados y sesgados) es el error cuadratico medio,
denido como
ECM[

X
] = E[(

X

X
)
2
] = Var[

X
] + (Sesgo[

X
])
2
Nota:

El error cuadratico medio de un estimador insesgado es igual a su


varianza.

Un estimador con menor ECM es mejor.

El estimador insesgado de mnima varianza tiene la menor


varianza/ECM entre todos los estimadores.

Como encontrar una buena denicion para un estimador T?

En algunos casos se conoce un estimador optimo: estimador


insesgado de mnima varianza

Si no es as, existen distintos metodos de construcci on de


estimadores que proporcionan resultados razonables, por ejemplo:

Estimacion maximo verosmil

Metodo de momentos
Estimacion puntual: ejemplo
Ejemplo: 7.1 (Newbold) Las ratios precio-benecio para una muestra
aleatoria de diez acciones negociadas en la bolsa de NY en un da
concreto fueron
10 16 5 10 12 8 4 6 5 4
Emplee un procedimiento de estimacion insesgado para obtener
estimaciones puntuales para los siguientes parametros de la poblacion:
media, varianza, proporcion de valores que exceden 8.5.
x =
80
10
= 8
s
2
x
=
782 10(8)
2
10 1
= 15,78
p
x
=
1 + 1 + 0 + 1 + 1 + 0 + 0 + 0 + 0 + 0
10
= 0,4
Estimacion puntual: ejemplo
Ejemplo: Sea
X
=
2
n(n+1)
(X
1
+ 2X
2
+. . . + nX
n
) un estimador de la media de
la poblaci on basado en una MAS X
n
. Compare este estimador con la media
muestral,

X.
Sabemos que

X es un estimador insesgado de
X
, con varianza

2
X
n
.

X
tambien es insesgado:
E[
X
] = E
"
2
n(n + 1)
(X
1
+ 2X
2
+ . . . + nX
n
)
#
=
2
n(n + 1)
(E[X
1
] + 2E[X
2
] + . . . + nE[X
n
])
=
id
2
n(n + 1)
(
X
+ 2
X
+ . . . + n
X
)
=
2
X
n(n + 1)
n(n+1)/2
z }| {
(1 + 2 + . . . + n) =
X
Sesgo[
X
] = 0
Y su varianza/ECM es:
V[
X
] = V
"
2
n(n + 1)
(X
1
+ 2X
2
+ . . . + nX
n
)
#
=
indep.

2
n(n + 1)
!
2
(V[X
1
] + 2
2
V[X
2
] + . . . + n
2
V[X
n
])
=
id
4
n
2
(n + 1)
2

2
X
n(n+1)(2n+1)/6
z }| {
(1
2
+ 2
2
+ . . . + n
2
)
=
2(2n + 1)
3n(n + 1)

2
X
ECM[
X
] = V[
X
] + 0
2
=
2(2n + 1)
3n(n + 1)

2
X
Eciencia relativa(

X,
X
) =

2
X
/n
2(2n+1)
3n(n+1)

2
X
=
3(n + 1)
2(2n + 1)
Puede verse que para n 2 este cociente es menor que 1, y por tanto

X es un
estimador mas eciente para
X
.
De estimaciones puntuales a estimaci on por intervalos de
conanza

Hasta ahora hemos considerado la estimacion puntual de un


parametro desconocido de una poblacion que, partiendo de una
MAS de n observaciones de X, proporciona una aproximacion
razonable para ese parametro desconocido.

Una estimacion puntual no tiene en cuenta la variabilidad del


proceso de estimacion, debida entre otras causas a:

El tama no muestral - una muestra mayor debiera proporcionar una


informacion mas precisa sobre el parametro de la poblaci on.

Variabilidad en la poblaci on - una muestra de una poblaci on con


menos varianza debiera proporcionar estimaciones mas precisas

Que se conozcan otros parametros de la poblaci on.

etc
Estas limitaciones pueden tratarse mediante el uso de estimaciones por
intervalos de conanza, esto es, un metodo que proporciona un intervalo
de valores al que es probable que pertenezca el valor del parametro.
Estimadores por intervalos de conanza e intervalos de
conanza
Sea X
n
= (X
1
, X
2
, . . . , X
n
) una MAS de una poblacion X con funcion de
distribucion F
X
que depende de un parametro desconocido .
Un estimador por intervalos de conanza de con un nivel de conanza
(1 ) = 100(1 ) % es un intervalo (T
1
(X
n
), T
2
(X
n
)) que satisface
P ( (T
1
(X
n
), T
2
(X
n
)) = 1
Interpretacion: tenemos una probabilidad (1 ) de que el parametro
desconocido de la poblacion pertenecera a (T
1
(X
n
), T
2
(X
n
)).
Un intervalo de conanza para con un nivel de conanza 1 es el
valor observado del estimador por intervalos de conanza,
(T
1
(x
n
), T
2
(x
n
))
Interpretacion: podemos tener una conanza de (1 ) de que el valor
del parametro desconocido de la poblacion estara en (T
1
(x
n
), T
2
(x
n
)).
Niveles de conanza habituales
0.01 0.05 0.10
100(1 ) % 99 % 95 % 90 %
Obteniendo un estimador por intervalos de conanza:
procedimiento
1. Se busca una cantidad (aleatoria) relacionada con el parametro
desconocido y con la muestra X
n
, C(X
n
, ), cuya distribucion sea
conocida y no dependa del valor del parametro - esta cantidad se
conoce como la cantidad pivotal o el pivote para
2. Se pueden usar los cuantiles 1 /2 y /2 de esa distribucion, y la
denicion del estimador por intervalos de conanza, para plantear la
ecuacion
P(
doble desigualdad

1 /2 cuantil<C(X
n
, )</2 cuantil) = 1 .
3. Para obtener los extremos del estimador por intervalo de conanza,
T
1
(X
n
) y T
2
(X
n
), se resuelve la doble desigualdad en .
4. El intervalo de conanza al 100(1 ) % para es (T
1
(x
n
), T
2
(x
n
)).
Intervalo de conanza para la media de la poblacion,
poblacion normal con varianza conocida
1. Sea X
n
una MAS de tama no n obtenida de X. Bajo los supuestos:

X sigue una distribuci on normal con parametros


X
y
2
X


2
X
es conocida (muy poco realista)
2. La cantidad pivotal para
X
es:

X
X
/

n
N(0, 1)
Nota: la desviacion tpica de

X,
X
/

n, (o de cualquier otro
estadstico) se conoce como su error estandar
Intervalo de conanza para la media de la poblacion,
poblacion normal con varianza conocida
3. Si z
1/2
y z
/2
son los cuantiles
superiores (1 /2) y (/2) de
la distribucion N(0, 1), tenemos
P(z
1/2
< Z < z
/2
) = 1
Densidad normal estandar

Si Z N(0, 1) entonces
E[Z] = 0, V[Z] = 1
1

2
G G
z
1

2
= z

2
z

2
4. Se tiene que P(
z
/2

z
1/2
<
Z

X
X

X
/

n
< z
/2
) = 1
Intervalo de conanza para la media de la poblacion,
poblacion normal con varianza conocida
5. Resolvemos la doble desigualdad para
X
:
z
/2
<

X
X

X
/

n
< z
/2
z
/2

n
<

X
X
< z
/2

n
z
/2

n


X <
X
<

X + z
/2

n
z
/2

n
+

X >
X
>

X z
/2

n
para obtener el estimador por intervalos de conanza
(
T
1
(X
n
)
z }| {

X z
/2

n
,
T
2
(X
n
)
z }| {

X + z
/2

n
)
6. El intervalo de conanza es:
IC
1
(
X
) =

x z
/2

n
, x z
/2

x z
/2

Ejemplo: calculo de un intervalo de conanza para


X
Ejemplo: 8.2 (Newbold) Un proceso industrial produce bolsas de azucar
renado. Los pesos de las bolsas siguen una distribuci on normal con desviaci on
tpica igual a 12 g. Una muestra aleatoria de venticinco bolsas tiene un peso
promedio de 198 g. Encuentre un intervalo de conanza al 95 % para el peso
promedio en la poblacion de las bolsas de azucar fabricadas con este proceso.
Poblaci on:
X = peso de una bolsa (en g)
X N(
X
,
2
X
= 12
2
)
'
MAS: n = 25
Muestra: x = 198
Area=
0.025
G
z
0.025
= 1.96
Objetivo: IC
0,95
(
X
) =

x z
/2

X
= 12
n = 25 x = 198
1 = 0,95 /2 = 0,025
z
/2
= z
0,025
= 1,96
IC
0,95
(
X
) =

198 1,96
12

25

= (198 4,7)
= (193,3, 202,7)
Interpretaci on: Podemos tener una
conanza del 95 % de que
X
esta en (193,3, 202,7)
Interpretaci on frecuentista del IC: nivel de conanza
En este ejemplo simulado se han generado 150 muestras de tama no n = 50, de
una distribuci on X N(
X
= 5,
2
X
= 1
2
) y se construyeron 150 IC
1
(
X
)
con = 0,1 y otros 150 intervalos con = 0,01.

X
esta en aprox. 150(0,9) = 135 interv.
(pero no en 150(0,1) = 15)
(1 ) = 0,9, n = 50
6.0 5.5 5.0 4.5 4.0
0
5
0
1
0
0
1
5
0
Intervalo de confianza
I
n
d
i
c
e
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|

X
esta en aprox. 150(0,99) = 148,5 interv.
(pero no en 150(0,01) = 1,5)
(1 ) = 0,99, n = 50
6.0 5.5 5.0 4.5 4.0
0
5
0
1
0
0
1
5
0
Intervalo de confianza
I
n
d
i
c
e
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
La longitud del intervalo, L = x +
z
/2

x
z
/2

= 2
z
/2

n
, aumenta
al aumentar el nivel de conanza (a igualdad de otros valores). Por que?
Interpretaci on frecuentista del IC: tama no muestral
Construimos ahora 150 muestras de tama no n = 50 y otras 150 de tama no
n = 200, de una distribuci on X N(
X
= 5,
2
X
= 1
2
) .

X
en aprox. 150(0,9) = 135 interv.
(pero no en 150(0,1) = 15)
(1 ) = 0,9, n = 50
6.0 5.5 5.0 4.5 4.0
0
5
0
1
0
0
1
5
0
Intervalo de confianza
I
n
d
i
c
e
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|

X
en aprox. 150(0,9) = 135 interv.
(pero no en 150(0,1) = 15)
(1 ) = 0,9, n = 200
6.0 5.5 5.0 4.5 4.0
0
5
0
1
0
0
1
5
0
Intervalo de confianza
I
n
d
i
c
e
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
La longitud de los intervalos decrece cuando el tama no muestral aumenta
(suponiendo que los demas valores no cambien). Por que?
Pregunta: Cual es el efecto del valor de sobre la longitud?
Ejemplo: estimacion del tama no muestral
Ejemplo: 8.14 (Newbold) La longitud de las barras de acero fabricadas en un
proceso industrial siguen una distribuci on normal con desviaci on tpica 1.8 mm.
El encargado del proceso desea obtener un intervalo de conanza al 99 % para
dicha longitud, con un tama no menor o igual a 0.5 mm a cada lado de la media
muestral. Que tama no muestral sera necesario para tener esta propiedad?
Poblaci on:
X = longitud de la barra (en mm)
X N(
X
,
2
X
= 1,8
2
)
'
MAS: n =?
IC
0,99
(
X
):
longitud
z }| {
2
z
/2

n
2(0,5) = 1
Area=
0.005
G
z
0.005
= 2.575
Objetivo: n tal que longitud IC 1
2
z
/2

n
1

n 2z
/2

n 2
2
z
2
/2

2
n (2
2
)(2,575
2
)(1,8
2
)
= 85,93
Para satisfacer la petici on del
encargado se necesitara una
muestra de tama no al menos
igual a 86 observaciones.
Intervalo de conanza para la media de la poblacion en
muestras grandes
1. Sea X
n
una MAS de tama no n de X. Bajo las hipotesis:

X sigue una distribuci on (no necesariamente normal) con parametros

X
y
2
X

el tama no muestral n es grande (n 30)


2. La cantidad pivotal para
X
basada en el Teorema Central del
Lmite es

X
X

X
/

n

approx.
N(0, 1)
Intervalo de conanza para la media de la poblacion en
muestras grandes
3. Por tanto, si z
1/2
y z
/2
son
los cuantiles superiores (1 /2)
y (/2) de N(0, 1), tenemos
P(z
1/2
< Z < z
/2
) = 1
Densidad normal estandar

2
G G
z
1

2
= z

2
z

2
4. Imponemos la condicion P(
z
/2

z
1/2
<
Z

X
X

X
/

n
< z
/2
) = 1
Intervalo de conanza para la media de la poblacion en
muestras grandes
5. Resolvemos la doble desigualdad para
X
:
z
/2
<

X
X

X
/

n
< z
/2
para obtener el estimador por intervalos de conanza
(
T
1
(X
n
)

X z
/2

X

n
,
T
2
(X
n
)

X +z
/2

X

n
)
6. El intervalo de conanza es:
IC
1
(
X
) = ( x z
/2

x

n
, x +z
/2

x

n
)
Intervalo de conanza para la proporci on en la poblacion
en muestras grandes
Aplicaci on de ICs para la media en muestras grandes
Sea X
n
, n 30, una MAS de una distr. Bernoulli con parametro p
X
(
X
= E[X] = p
X
y
X
=

p
X
(1 p
X
)). La proporci on muestral p
X
es
un caso especial de media muestral con observaciones cero-uno, p
X
=

X.
Por tanto, del TCL,
p
X
p
X

p(1 p)/n

X
/

approx.
N(0, 1)

Este resultado sigue siendo


valido si la desviacion tpica de la
poblaci on se estima (no se conoce)
p
X
p
X
p
p(1 p)/

n
| {z }

X
/

approx.
N(0, 1)
En muestras grandes, el intervalo de conanza para p
X
es:
IC
1
(p
X
) =

p
x
z
/2

p
x
(1 p
x
)
n
, p
x
+z
/2

p
x
(1 p
x
)
n

Ejemplo: calculo de un intervalo de conanza para p


X
Ejemplo: 8.6 (Newbold) A una muestra aleatoria de 344 ejecutivos de compras se les realiz o la
pregunta Cual es la poltica de su empresa en relaci on con los regalos que su personal de
compras pueda recibir de sus proveedores? 83 de estos ejecutivos respondieron que cada
empleado poda tomar su propia decisi on. Calcule un intervalo de conanza al 90 % para la
proporcion en la poblacion de los ejecutivos que dan libertad sobre estos regalos a sus empleados.
Poblacion:
X = 1 si un ejecutivo permite tomar
decisiones a su personal y 0 en otro caso
X Bernoulli(p
X
)
'
MAS: n = 344 grande
Muestra: p
x
=
83
344
= 0,241
Area=
0.05
G
z
0.05
= 1.645
Objetivo: IC
0,9
(p
X
) =

p
x
z
/2
r
p
x
(1 p
x
)
n
!
p
x
= 0,241 n = 344
1 = 0,9 /2 = 0,05
z
/2
= z
0,05
= 1,645
IC
0,9
(p
X
) =
0
@
0,241 1,645
s
0,241(1 0,241)
344
1
A
= (0,241 0,038)
= (0,203, 0,279)
Interpretaci on: Podemos tener una conanza
del 90 % de que la proporcion de ejecutivos
que permiten tomar sus propias decisiones a
sus empleados, p
X
, esta en (0,203, 0,279)
Intervalo de conanza para la media de la poblacion:
poblacion normal con varianza desconocida
1. Sea X
n
una MAS de tama no n de X. Bajo las hipotesis:

X sigue una distribuci on normal con parametros


X
y
2
X


2
X
es desconocida (muy realista)
2. La cantidad pivotal para
X
es

X
X
s
X
/

n
t
n1
Intervalo de conanza para la media de la poblacion:
poblacion normal con varianza desconocida
3. Si t
n1;1/2
y t
n1;/2
son los cuantiles
superiores (1 /2) y (/2) de una
distribuci on t de Student con n 1 grados
de libertad (gl), tenemos
P(t
n1;1/2
<
t
n1
z}|{
T < t
n1;/2
) = 1
Densidad t de Student

Recuerda: si T t
n
, E[T] = 0, V[T] =
n
n2
1

2
G G
t
n1 ; 1

2
= t
n1 ;

2
t
n1 ;

2
4. Imponemos la condicion
P(
t
n1;/2

t
n1;1/2
<
T t
n1

X
X
s
X
/

n
< t
n1;/2
) = 1
Intervalo de conanza para la media de la poblacion:
poblacion normal con varianza desconocida
5. Resolvemos la doble desigualdad para
X
:
t
n1;/2
<

X
X
s
X
/

n
< t
n1;/2
y obtenemos el estimador por intervalos de conanza
(
T
1
(X
n
)

X t
n1;/2
s
X

n
,
T
2
(X
n
)

X +t
n1;/2
s
X

n
)
6. El intervalo de conanza es:
IC
1
() = ( x t
n1;/2
s
x

n
, x t
n1;/2
s
x

n
)
Ejemplo: calcular un intervalo de conanza para
X
Ejemplo: 8.4 (Newbold) Se ha medido el consumo de combustible en una
muestra aleatoria de seis coches del mismo modelo, obteniendo en mpg: 18.6,
18.4, 19.2, 20.8, 19.4, 20.5. Calcule un intervalo de conanza al 90 % para el
consumo medio, suponiendo que la poblaci on sigue una distribuci on normal.
Poblaci on: X = mpg de un coche
de este modeloX N(
X
,
2
X
)

2
X
desconocida
'
MAS: n = 6 peque na
Muestra: x =
116,9
6
= 19,4833
s
2
x
=
2282,41 6(19,4833)
2
6 1
= 0,96
Area=
0.05
G
t
5 ; 0.05
= 2.015
Objetivo: IC
0,9
(
X
) =

x t
n1;/2
s
x

s
x
=
p
0,96 = 0,98
n = 6 x = 19,48
1 = 0,9 /2 = 0,05
t
n1;/2
= t
5;0,05
= 2,015
IC
0,9
(
X
) =

19,48 2,105
0,98

= (19,48 0,81)
= (18,67, 20,29)
Interpretaci on: Tenemos una
conanza del 90 % de que el
consumo promedio de este modelo,

X
, estara entre 18.67 y 20.29 mpg
Ejemplo: calcular un intervalo de conanza para
X
Ejemplo: 8.4 (cont.) en Excel: Ir al men u: Datos, submen u: Analisis de
Datos, escoger la funcion: Estadstica Descriptiva.
Columna A datos en amarillo (media muestral, semilongitud t
n1;/2
s
x

n
,
extremo inferior (celda: D3-D16), extremo superior (celda: D3+D16)).
Datos
Media muestral
Semilongitud IC
Distribuciones t de Student y
2
(chi-cuadrado)

Sabemos que T t
n
si T =
Z

2
n
/n
, donde Z N(0, 1) y
2
n
sigue una
distribuci on chi-cuadrado con gl = n, y ambas son independientes.

Tambien,
2
n
es la distribuci on de la suma de los cuadrados de n variables
aleatorias N(0, 1) independientes.

Por ejemplo, la cuasi varianza muestral reescalada sigue una distribuci on


chi cuadrado con n 1 grados de libertad.
(n 1)s
2
X

2
X
=
P
n
i =1
(X
i


X)
2

2
X
=
n
X
i =1

X
i


X

2

2
n1
Por que n 1 y no n?
Si conociesemos el valor de
X
, el
n umero de grados de libertad sera
n, porque tendramos n variables
aleatorias iid
X
i

X
Si tenemos que estimar
X
mediante

X, los gl son n 1, porque solo


tenemos n 1 variables aleatorias iid
X
i

X
(si se conocen los valores de
n 1 de ellas, se puede deducir
facilmente el valor de la restante)
Decimos que empleamos un grado de libertad en el calculo de
X
Distribuciones t de Student y
2
(chi-cuadrado)
Densidades de t y N(0, 1)

4 2 0 2 4
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
N(0,1)
gl=10
gl=5
gl=3
Densidades de
2

0 10 20 30 40
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
gl=20
gl=15
gl=10
gl=5
Intervalo de conanza para la varianza de la poblacion,
poblacion normal
1. Sea X
n
una MAS de tama no n de X. Bajo las hipotesis:

X sigue una distribuci on normal con varianza


2
X
2. La cantidad pivotal para
2
X
es
(n 1)s
2
X

2
X

2
n1
Intervalo de conanza para la varianza de la poblacion,
poblacion normal
3. Por tanto, si
2
n1;1/2
y
2
n1;/2
son
los cuantiles superiores (1 /2) y
(/2) de una distribuci on chi-cuadrado
con n 1 grados de libertad, tenemos
P(
2
n1;1/2
<
2
n1
<
2
n1;/2
) = 1
Densidad chi-cuadrado

Recuerda: E[
2
n
] = n, V[
2
n
] = 2n
1

2
G G

n1 ; 1

2
2

n1 ;

2
2
4. Imponemos la condici on P(
2
n1;1/2
<

2
n1
z }| {
(n 1)s
2
X

2
<
2
n1;/2
) = 1
Intervalo de conanza para la varianza de la poblacion,
poblacion normal
5. Resolvemos la doble desigualdad para
2
X
:

2
n1;1/2
<
(n1)s
2
X

2
X
<
2
n1;/2
1

2
n1;1/2
>

2
X
(n1)s
2
X
>
1

2
n1;/2
(n 1)s
2
X

2
n1;1/2
>
2
X
>
(n 1)s
2
X

2
n1;/2
y obtenemos el estimador por intervalos de conanza

(n 1)s
2
X

2
n1;/2
,
(n 1)s
2
X

2
n1;1/2

6. El intervalo de conanza es:


IC
1
(
2
X
) =

(n 1)s
2
x

2
n1;/2
,
(n 1)s
2
x

2
n1;1/2

Ejemplo: calcular un intervalo de conanza para


2
X
y
X
Ejemplo: 8.8 (Newbold) Una muestra aleatoria de quince pastillas para el dolor
de cabeza tiene una cuasi desviaci on tpica de 0.8 % en la concentraci on del
ingrediente activo. Calcule un IC al 90 % para la varianza de la poblaci on para
estas pastillas. Obtenga tambien un IC para la desviaci on tpica de la poblaci on.
Poblaci on:
X = concentraci on del
ingrediente activo en una pastilla
(in %)X N(
X
,
2
X
)
'
MAS: n = 15
Muestra: s
x
= 0,8
Area=
0.05
Area=
0.05
G G

14 ; 0.95
2
=6.57

14 ; 0.05
2
=23.68
Objetivo: IC
0,9
(
2
X
) =
0
@
(n1)s
2
x

2
n1;/2
,
(n1)s
2
x

2
n1;1/2
1
A
s
2
x
= 0,8
2
= 0,64 n = 15
1 = 0,9 /2 = 0,05

2
n1;1/2
=
2
14;0,95
= 6,57

2
n1;/2
=
2
14;0,05
= 23,68
IC
0,9
(
2
X
) =

14(0,64)
23,68
,
14(0,64)
6,57

= (0,378, 1,364)
IC
0,9
(
X
) = (
p
0,378,
p
1,364)
= (0,61, 1,17)
Para obtener IC(
X
) aplicamos

a los
extremos de IC(
2
X
)
F ormulas para intervalos de conanza
Resumen para una poblacion

Sea X
n
una muestra aleatoria simple de una poblaci on X con media
X
y
varianza
2
X
Parametro Hipotesis Cantidad pivotal (1 ) Intervalo Conf.
Datos normales
Varianza conocida

X
X

X
/

n
N(0, 1)
X

x z
/2

n
, x + z
/2

Media
Datos no normales
Muestra grande

X
X

X
/

n

approx.
N(0, 1)
X

x z
/2

x

n
, x + z
/2

x

Datos Bernoulli
Muestra grande
p
X
p
X
q
p
X
(1 p
X
)/n

approx.
N(0, 1) p
X

p
x
z
/2
r
p
x
(1 p
x
)
n
#
Datos normales
Varianza descono-
cida

X
X
s
X
/

n
t
n1

X

x t
n1,/2
s
x

n
, x + t
n1,/2
s
x

Varianza
Datos normales
(n1)s
2
X

2
X

2
n1

2
X

0
@
(n1)s
2
x

2
n1;/2
,
(n1)s
2
x

2
n1;1/2
1
A
Desv. tpica
Datos normales
(n1)s
2
X

2
X

2
n1

X

0
@
v
u
u
t
(n1)s
2
x

2
n1;/2
,
v
u
u
t
(n1)s
2
x

2
n1;1/2
1
A
Intervalos de conanza para la media de la poblacion:
Que usar cuando?
X distribucion con media
X
y desviacion tpica
X

X normal

conocida

basada en z
(exacta)

desconocida

basada en t
(exacta)

X normal

n peque na

metodos mas
alla de Est II

n grande

basada en z
(aprox. TCL)

Das könnte Ihnen auch gefallen