Beruflich Dokumente
Kultur Dokumente
2
M. Angeles Fdez. Sotelo
Nos interesa saber qu valores puede tomar y con qu probabilidades, esto es, su
distribucin.
Ejemplo 2: Queremos conocer la proporcin de individuos con cierta caracterstica en
una poblacin. El experimento consiste en extraer uno al azar y as la distribucin de
Bernoulli que indica la presencia de la caracterstica tiene como parmetro la
proporcin desconocida.
Suponemos que la distribucin de X, an siendo desconocida, sigue un modelo como
los del tema anterior. En el caso del calor desprendido en la reaccin del Ejemplo 1,
podra ser normal, y en el caso de la proporcin del Ejemplo 2, es claramente de
Bernoulli.
As, el problema se reduce a averiguar los parmetros caractersticos.
Vamos a estudiar los distintos enfoques citados dentro de la inferencia paramtrica.
Hacemos notar que los resultados que obtendremos son vlidos para el caso de
poblaciones infinitas o muy grandes. En caso contrario hay que hacer algunas
modificaciones, debido al cambio de valor de los errores muestrales.
ESTIMACIN PUNTUAL DE UNA MEDIA Y DE UNA PROPORCIN
Supongamos un experimento aleatorio susceptible de repeticin en unas condiciones
similares (por ejemplo, supongamos que seleccionamos personas en una comunidad).
A cada resultado del experimento le asociamos el valor de una variable de inters, X
(por ejemplo, la estatura). Supongamos que conocemos el tipo de la variable (por
ejemplo, es normal) y nos interesa el valor de un parmetro (por ejemplo, la media).
Para obtener informacin vamos a observar repetidamente la variable objeto de
estudio. Estadsticamente, eso quiere decir que vamos a considerar una muestra
aleatoria de tamao n, un conjunto de n variables:
X1 , X 2 ,..., X n
independientes y con la misma distribucin que la variable en estudio. Un valor
concreto de las n variables que constituyen la muestra aleatoria es lo que recibe el
nombre de realizacin muestral o simplemente muestra. (La idea es que vamos a
tomar una muestra de n estaturas, pero los valores de esa muestra dependen de las
personas concretas que consideremos, por tanto realmente partimos de n variables y
despus consideraremos un valor concreto de cada una de esas variables).
3
M. Angeles Fdez. Sotelo
Insesgado (centrado): el valor esperado del estimador (su centro) coincide con
lo que queremos estimar.
Eficiente: es el de mnima varianza entre los insesgados.
Consistente: al aumentar el tamao muestral el estimador se acerca
indefinidamente al parmetro que queremos estimar.
Formalmente,
Llamamos sesgo de un estimador para un parmetro poblacional a
Sesgo ( )=E ( )-
y diremos que el estimador es insesgado si su sesgo vale cero.
Definimos el error cuadrtico medio de un estimador
poblacional como
E ( - )2 = (Sesgo ( ))2 +Var ( )
para un parmetro
X i
i 1
n 1
muestral
s2
X i
i 1
, se tiene
n 2
s
n 1
1
0.25
4
0, 2
2, 2
3, 2
5, 2
0, 3
2 ,3
3, 3
5, 3
0, 5
2 ,5
3, 5
5, 5
La proporcin muestral es, en este caso, una variable discreta, que se distribuye de la
siguiente forma:
5
M. Angeles Fdez. Sotelo
xi
pi
xi pi
xi2 pi
9/16
1/2
6/16
6/32
6/64
1/16
1/16
4/64
Dado que el estadstico es una variable, si elegimos una muestra distinta obtendremos
una estimacin distinta. Por eso es importante elegir un estadstico con buenas
propiedades, y un tamao adecuado para la muestra.
ESTIMACIN DE UNA PROPORCIN (O PARMETRO p DE UNA BINOMIAL)
Consideremos un experimento aleatorio, E, que admite dos posibles resultados:
A y Ac siendo p p( A)
Si X es la variable aleatoria nmero de veces que ocurre A en una prueba de este
experimento, sabemos que X es una variable aleatoria binomial de parmetros 1 y p.
Si p es desconocido, vamos a considerar
X1 , X 2 ,..., X n ,
n variables aleatorias
6
M. Angeles Fdez. Sotelo
As pues, el estadstico
p
p
p (1 p)
p N p,
verifica que
limV ( p ) 0 .
n
Ejemplo
El fabricante de un determinado tipo de lmparas desea averiguar la proporcin de
lmparas defectuosas que produce. Para ello selecciona y prueba 200 unidades y
descubre un total de 80 unidades defectuosas.
Una estimacin de la proporcin de lmparas defectuosas es
p = 80/200=0.4
ESTIMACIN DE LA MEDIA DE UNA VARIABLE NORMAL
Consideramos una poblacin en la que la variable de inters, X, sigue una distribucin
N ( , 2 ) .
Si
X1 , X 2 ,..., X n
X X 2 ... X n
1
n
2
, se tiene que N ,
.
n
7
M. Angeles Fdez. Sotelo
2
N ,
n
Si n es grande,
sin necesidad de
media de poblaciones normales, siguen siendo vlidas para poblaciones que no sean
normales, si las muestras son grandes.
Ejemplo
En una poblacin de 10000 individuos se sabe que la estatura sigue una distribucin
aproximadamente normal, y estamos interesados en estimar la estatura media. Para
ello se elige una muestra de 50 individuos elegidos al azar, se miden sus estaturas y se
calcula la media de esos 50 valores; se obtiene como media 162 cm.
Este valor,
L1 y L2
0 1, si
8
M. Angeles Fdez. Sotelo
p z 2
z 2
p (1 p )
, p z 2
n
es tal que, si ZN(0,1),
p (1 p )
P(Z z 2 ) 2
p (1 p )
p (1 p )
z
,
p
2
2
n
n
Sustituyendo
el intervalo
(0.311,0.489).
z
,
z
2
2
n
n
t
,
t
n1; 2
n1; 2
n
n
9
M. Angeles Fdez. Sotelo
siendo
tn1; 2
libertad, se tiene
P(t tn1; 2 ) 2
es la cuasidesviacin tpica
X
i 1
n 1
z
,
n
n
z
,
z
2
2
.
n
n
200
30 .
199
Adems
30
45 4.17 ,
199
t
,
t
n1; 2
n1; 2
, suponiendo que la
n
n
variable es normal.
10
M. Angeles Fdez. Sotelo
En este caso,
45 2.093
30
45 4.17 45 14.405 , es decir (30.595,59.405).
19
Observemos que es mucho ms amplio que en el caso anterior, lo cual nos confirma
que la precisin de la estimacin es mayor al aumentar el tamao de la muestra.
p1 p 2 z 2
siendo
p1 (1 p1 ) p 2 (1 p 2 )
n1
n2
p1 (1 p1 ) p 2 (1 p 2 )
, p1 p 2 z 2
n1
n2
Ejemplo
Se quiere estimar la diferencia de proporciones de estudiantes de dos titulaciones que
encuentran trabajo cuando terminan sus estudios. Observados 200 individuos de cada
titulacin, con la primera se colocaron el 85% mientras quede la segunda se colocaron
el 80%. Determinar un intervalo de confianza al 95% para la diferencia de
proporciones.
Los valores para sustituir en la expresin del intervalo son
z 2 =1.96,
n1=n2=200
con
lo
cual
se
obtiene
el
p1 =0.85, p 2 =0.80,
intervalo
de
lmites
0.850.15 0.800.2
N ( 1 , 12 ) y N ( 2 , 22 )
respectivamente.
11
M. Angeles Fdez. Sotelo
X1 , X 2 ,..., X n1
situaciones:
Las dos varianzas son conocidas. En este caso, el intervalo ser
12 22
12 22
, 1 2 z 2
1 2 z 2
n
n
n
n
1
2
1
2
Las varianzas son desconocidas pero podemos suponer que son iguales. Se
obtiene el intervalo cuyos lmites son
1 2
tn1n2 2;
n1 n2 2
n1 n2
12 22
12 22
, 1 2 z 2
1 2 z 2
n
n
n
n
1
2
1
2
pero si las muestras son pequeas, este intervalo no resulta adecuado y debe
sustituirse z 2 por t f ; 2 en donde f viene dado por la llamada aproximacin
de Welch, que no estudiaremos.
Ejemplo
Se quiere comparar la eficiencia de dos lneas de produccin de una empresa, para lo
cual se observa el nmero de piezas fabricadas en cinco das por cada una de ellas. En
la primera han sido 50, 48, 53, 60 y 37 mientras que en la segunda 40, 51, 62, 55 y 64.
Vamos a construir un intervalo de confianza al nivel 95% para la diferencia de medias
suponiendo que las variables son normales y las varianzas son iguales (en realidad, a
partir de los datos podramos deducir que esta suposicin efectivamente es admisible,
pero no vamos a estudiar la tcnica correspondiente).
12
M. Angeles Fdez. Sotelo
Sabemos
que
1 2
n1 n2 2
n1 n2
datos
deducimos
1 =49.6, 2 =54.4, 12 =8.382, 22 =9.612,
t8;0.025 =2.306, n1=n2=5 y, haciendo las operaciones, resulta
De
los
tn1n2 2;
en
4.80 2.3069.02
este
caso
el
intervalo
viene
dado
por
2
4.80 13.16 , es decir, el intervalo es
5
(-17.96, 8.36)
13
M. Angeles Fdez. Sotelo