Sie sind auf Seite 1von 13

Tema 6: INFERENCIA ESTADSTICA:

Estimacin puntual e intervalos de confianza


Introduccin
En temas anteriores hemos estudiado la Estadstica Descriptiva que se dedica al
anlisis y tratamiento de datos.
A partir de ellos resume, ordena y extrae los aspectos ms relevantes de la informacin
que contienen. Sin embargo, los objetivos de la Estadstica pretenden adems extraer
conclusiones para la poblacin de la que fueron extrados.
A esta ltima tarea la llamamos Inferencia Estadstica.
Obtendremos las muestras de forma aleatoria y por tanto necesitaremos la Teora de
la Probabilidad vista anteriormente para valorar nuestras afirmaciones. Hemos visto
algunos modelos de variables discretas y continuas para una poblacin y sus
caractersticas ms importantes, como la media y varianza poblacionales y otros
parmetros. En este tema vamos a construir estimadores de los parmetros de inters
a partir de una muestra y adems vamos a estudiar qu propiedades deben tener los
estimadores para obtener buenas estimaciones.

Comenzamos recordando algunos conceptos bsicos para este tema ya introducidos


anteriormente:
La Inferencia Estadstica es una tcnica matemtica basada en el Clculo de
Probabilidades que tiene por objeto incrementar el conocimiento acerca de
una poblacin a partir de la informacin facilitada por muestras de la misma.

Poblacin es un conjunto finito o infinito de individuos sobre los que interesa


estudiar una caracterstica. Por ejemplo deseamos conocer el gasto de los
turistas que pernoctan, en Galicia durante un cierto mes, en hoteles de dos,
tres o cuatro estrellas. O queremos conocer la intencin de voto de los
electores en las siguientes elecciones.

Tema 6: Estimacin puntual e intervalos de confianza

Cuando se recoge informacin de la caracterstica de inters en todos y cada uno de


los elementos de la poblacin se dice que se est realizando un censo u observacin
exhaustiva.
Al resultado de medir la caracterstica de inters sobre un subconjunto de la poblacin
se le denomina muestra. Con esto la informacin ser manejable y evitaremos el coste
que conlleva, en algunos casos, trabajar con toda la poblacin.
El tamao muestral es el nmero de elementos que componen la muestra.
Cabe hablar de una primera distincin, al hablar de Inferencia, segn la naturaleza del
problema que se plantee:

1) Inferencia paramtrica: cuando conocemos de qu tipo es la variable de


inters y queremos averiguar el parmetro o parmetros de los que depende.
Por ejemplo, la variable de inters puede ser la estatura de una poblacin, se
sabe que es Normal y nos interesan los parmetros y 2, es decir, la media y
la varianza de la estatura. A su vez, dentro de la inferencia paramtrica,
vamos a distinguir distintos enfoques:
a) Estimacin puntual: como valor del parmetro desconocido vamos a dar
un nmero.
b) Intervalos de confianza: daremos un intervalo que contiene al parmetro
con un cierto "nivel de confianza".
c) Test (o contraste) de hiptesis: tenemos una hiptesis sobre el valor del
parmetro desconocido y se trata de aceptar o rechazar esa hiptesis
utilizando la informacin que nos proporciona la muestra.

2) Inferencia no paramtrica: cuando no conocemos de qu tipo es la variable de


inters. Tambin se pueden plantear las tareas de estimacin, intervalos de
confianza y contrastes de hiptesis, aunque las tcnicas estadsticas son
diferentes.
Consideramos un experimento aleatorio sobre el cual medimos una cierta variable
aleatoria, que denotaremos por X. El objetivo es estudiar la variable aleatoria X, cuya
funcin de distribucin F es en mayor o menor grado desconocida.
Ejemplo 1: Provocamos una reaccin qumica y medimos el calor que se desprende: X.

2
M. Angeles Fdez. Sotelo

Tema 6: Estimacin puntual e intervalos de confianza

Nos interesa saber qu valores puede tomar y con qu probabilidades, esto es, su
distribucin.
Ejemplo 2: Queremos conocer la proporcin de individuos con cierta caracterstica en
una poblacin. El experimento consiste en extraer uno al azar y as la distribucin de
Bernoulli que indica la presencia de la caracterstica tiene como parmetro la
proporcin desconocida.
Suponemos que la distribucin de X, an siendo desconocida, sigue un modelo como
los del tema anterior. En el caso del calor desprendido en la reaccin del Ejemplo 1,
podra ser normal, y en el caso de la proporcin del Ejemplo 2, es claramente de
Bernoulli.
As, el problema se reduce a averiguar los parmetros caractersticos.
Vamos a estudiar los distintos enfoques citados dentro de la inferencia paramtrica.
Hacemos notar que los resultados que obtendremos son vlidos para el caso de
poblaciones infinitas o muy grandes. En caso contrario hay que hacer algunas
modificaciones, debido al cambio de valor de los errores muestrales.
ESTIMACIN PUNTUAL DE UNA MEDIA Y DE UNA PROPORCIN
Supongamos un experimento aleatorio susceptible de repeticin en unas condiciones
similares (por ejemplo, supongamos que seleccionamos personas en una comunidad).
A cada resultado del experimento le asociamos el valor de una variable de inters, X
(por ejemplo, la estatura). Supongamos que conocemos el tipo de la variable (por
ejemplo, es normal) y nos interesa el valor de un parmetro (por ejemplo, la media).
Para obtener informacin vamos a observar repetidamente la variable objeto de
estudio. Estadsticamente, eso quiere decir que vamos a considerar una muestra
aleatoria de tamao n, un conjunto de n variables:

X1 , X 2 ,..., X n
independientes y con la misma distribucin que la variable en estudio. Un valor
concreto de las n variables que constituyen la muestra aleatoria es lo que recibe el
nombre de realizacin muestral o simplemente muestra. (La idea es que vamos a
tomar una muestra de n estaturas, pero los valores de esa muestra dependen de las
personas concretas que consideremos, por tanto realmente partimos de n variables y
despus consideraremos un valor concreto de cada una de esas variables).
3
M. Angeles Fdez. Sotelo

Tema 6: Estimacin puntual e intervalos de confianza

Un estadstico es una funcin de la muestra aleatoria. Es tambin una variable


aleatoria y por tanto tendr una cierta funcin de distribucin que se denomina
distribucin del estadstico en el muestreo.
Un ejemplo de estadstico es la "media muestral" (suma de las n variables dividido por
n). Al valor del estadstico para una muestra concreta se le denomina estimacin (por
ejemplo, la media de una muestra de n estaturas).
Cuando en una variable de una poblacin desconocemos un parmetro y como valor
de ese parmetro tomamos una estimacin, diremos que estamos ante un problema
de estimacin puntual.
Cuando un estadstico se utiliza en un problema de estimacin puntual se le
denomina estimador.
Indudablemente el problema est en elegir un "buen" estimador, es decir, una funcin
de la muestra con "buenas propiedades":

Insesgado (centrado): el valor esperado del estimador (su centro) coincide con
lo que queremos estimar.
Eficiente: es el de mnima varianza entre los insesgados.
Consistente: al aumentar el tamao muestral el estimador se acerca
indefinidamente al parmetro que queremos estimar.

Formalmente,
Llamamos sesgo de un estimador para un parmetro poblacional a
Sesgo ( )=E ( )-
y diremos que el estimador es insesgado si su sesgo vale cero.
Definimos el error cuadrtico medio de un estimador
poblacional como
E ( - )2 = (Sesgo ( ))2 +Var ( )

para un parmetro

y diremos que dicho estimador es consistente si lim E( - )2 = 0 , cuando n tiende a .


Es intuitivo y se puede demostrar matemticamente que, en general, un buen
estimador de un parmetro poblacional (media, proporcin, etc.) va a ser el
correspondiente parmetro muestral (media de la muestra, proporcin muestral, etc.),
aunque en algn caso deba modificarse ligeramente. Por ejemplo, para estimar la
varianza de una poblacin la varianza muestral no es un estimador insesgado y
podemos
sustituirlo
por
la
cuasivarianza
muestral,
definida
como
4
M. Angeles Fdez. Sotelo

Tema 6: Estimacin puntual e intervalos de confianza

X i

i 1

(es decir, dividimos por n-1 en vez de hacerlo por n).

n 1

Observemos que, al ser la varianza

muestral

s2

X i
i 1

, se tiene

n 2
s
n 1

Ejemplo de Estimacin Puntual

Supongamos que nuestra poblacin es un conjunto de 4 nmeros:


{0, 2, 3, 5}
y que deseamos conocer la proporcin, p, de cincos en la poblacin. Obviamente la
respuesta es:

1
0.25
4

Pero vamos a utilizar argumentos propios de inferencia estadstica para obtener


aproximadamente el valor de p. (Ntese que el problema que estamos tratando
presenta caractersticas anlogas, por ejemplo, al de conocer la proporcin de
votantes de un partido poltico antes de unas elecciones, proporcin de piezas que
fallan en una instalacin,).
Para resolver el problema, en lugar de trabajar con toda la poblacin, vamos a
considerar una muestra (con reemplazamiento) de tamao 2 y vamos a considerar
como estimador la proporcin de cincos en la muestra, es decir, la proporcin
muestral. Esta proporcin muestral es, en principio, una variable aleatoria, porque
depende de la muestra.
Posibles muestras (de tamao 2):
0, 0
2, 0
3, 0
5, 0

0, 2
2, 2
3, 2
5, 2

0, 3
2 ,3
3, 3
5, 3

0, 5
2 ,5
3, 5
5, 5

La proporcin muestral es, en este caso, una variable discreta, que se distribuye de la
siguiente forma:

5
M. Angeles Fdez. Sotelo

Tema 6: Estimacin puntual e intervalos de confianza

xi

pi

xi pi

xi2 pi

9/16

1/2

6/16

6/32

6/64

1/16

1/16

4/64

La media de esta variable es 0.25 (precisamente el verdadero valor de p) y su


varianza es 3/32.
Las posibles estimaciones son 0, 1/2 y 1.
Notemos que ninguna estimacin coincide con el verdadero valor de p.
Tomando muestras de tamao 3, las estimaciones que se pueden conseguir son: 0,
1/3, 2/3 y 1.
En la prctica, en un problema de estimacin puntual:
1) Fijaremos el tamao de la muestra, de acuerdo con ciertos criterios.
2) Obtendremos una muestra de tamao n, por medio de algn mtodo de
muestreo.
3) Calcularemos el valor del estadstico para nuestra muestra. Ese valor, que es
una estimacin, nos da un valor aproximado para el parmetro desconocido.

Dado que el estadstico es una variable, si elegimos una muestra distinta obtendremos
una estimacin distinta. Por eso es importante elegir un estadstico con buenas
propiedades, y un tamao adecuado para la muestra.
ESTIMACIN DE UNA PROPORCIN (O PARMETRO p DE UNA BINOMIAL)
Consideremos un experimento aleatorio, E, que admite dos posibles resultados:
A y Ac siendo p p( A)
Si X es la variable aleatoria nmero de veces que ocurre A en una prueba de este
experimento, sabemos que X es una variable aleatoria binomial de parmetros 1 y p.
Si p es desconocido, vamos a considerar

X1 , X 2 ,..., X n ,

n variables aleatorias

independientes con la misma distribucin que X, es decir, vamos a considerar n


pruebas del experimento E y definimos el siguiente estadstico al que se denomina
proporcin muestral:

6
M. Angeles Fdez. Sotelo

Tema 6: Estimacin puntual e intervalos de confianza

nmero de veces que ocurre A en n pruebas


n

Como todo estadstico,


grande:

As pues, el estadstico

p
p

es una variable aleatoria. Se puede probar que para n

p (1 p)
p N p,

tiene las siguientes propiedades:

tiene distribucin Normal.


es una variable, ahora bien, aunque puede tomar diferentes valores se

verifica que

E p p . Como hemos dicho, un estadstico cuya esperanza es

el verdadero valor del parmetro se dice que es insesgado.


La varianza del estadstico es importante. De poco sirve que su esperanza
coincida con el parmetro desconocido si presenta mucha varianza. En nuestro
caso

limV ( p ) 0 .
n

Ejemplo
El fabricante de un determinado tipo de lmparas desea averiguar la proporcin de
lmparas defectuosas que produce. Para ello selecciona y prueba 200 unidades y
descubre un total de 80 unidades defectuosas.
Una estimacin de la proporcin de lmparas defectuosas es
p = 80/200=0.4
ESTIMACIN DE LA MEDIA DE UNA VARIABLE NORMAL
Consideramos una poblacin en la que la variable de inters, X, sigue una distribucin

N ( , 2 ) .

Si

X1 , X 2 ,..., X n

es una muestra aleatoria, vamos a definir el

siguiente estadstico, al que denominamos media muestral:

X X 2 ... X n
1
n

2
, se tiene que N ,
.
n

Por tanto, vemos que este estadstico tambin es insesgado.

7
M. Angeles Fdez. Sotelo

Tema 6: Estimacin puntual e intervalos de confianza

2
N ,
n

Si n es grande,

exigir que X sea

N ( , 2 ) . Por ello, las tcnicas que veremos a continuacin para la

sigue siendo aproximadamente

sin necesidad de

media de poblaciones normales, siguen siendo vlidas para poblaciones que no sean
normales, si las muestras son grandes.
Ejemplo
En una poblacin de 10000 individuos se sabe que la estatura sigue una distribucin
aproximadamente normal, y estamos interesados en estimar la estatura media. Para
ello se elige una muestra de 50 individuos elegidos al azar, se miden sus estaturas y se
calcula la media de esos 50 valores; se obtiene como media 162 cm.
Este valor,

=162, constituye una estimacin de la media de la poblacin.

OBTENCIN DE INTERVALOS DE CONFIANZA


La estimacin puntual tiene el inconveniente de que no tenemos una medida de la
seguridad con la que el estadstico se aproxima al verdadero parmetro. Para poder
dar respuesta a esta cuestin construimos intervalos de confianza, que permiten
precisar la incertidumbre existente en la estimacin.
Un intervalo de confianza es aqul cuyos extremos son funciones de una
muestra aleatoria (y por tanto variables aleatorias) y que contienen al
parmetro con una cierta probabilidad que se denomina nivel de confianza.
Sea el parmetro desconocido y
que el intervalo

L1 y L2

los extremos del intervalo. Se dice

L1 , L2 tiene un nivel de confianza 1 ,

0 1, si

dicho intervalo contiene al parmetro con probabilidad 1 .

El nivel de confianza se suele expresar en tanto por cien, as un intervalo de confianza


del 95 por cien es un intervalo de extremos aleatorios que contiene al parmetro con
una probabilidad de 0.95.
INTERVALO DE CONFIANZA PARA UNA PROPORCIN
Si p es la proporcin de individuos que en una poblacin verifican una cierta

propiedad, un intervalo de confianza de nivel 1 para dicha proporcin ser, para


valores grandes de n:

8
M. Angeles Fdez. Sotelo

Tema 6: Estimacin puntual e intervalos de confianza

p z 2

Donde, como sabemos,

z 2

p (1 p )
, p z 2
n
es tal que, si ZN(0,1),

p (1 p )

P(Z z 2 ) 2

denota la proporcin muestral.


Notemos que a mayor valor de n, menor longitud del intervalo de confianza y que a
mayor nivel de confianza mayor longitud del intervalo.
Ejemplo
Con los datos: El fabricante de un determinado tipo de lmparas desea averiguar la
proporcin de lmparas defectuosas que produce. Para ello selecciona y prueba 200
unidades y descubre un total de 80 unidades defectuosas. Obtener un intervalo de
confianza del 99 por cien para la proporcin de lmparas defectuosas.
El intervalo es:

p (1 p )
p (1 p )

z
,
p

2
2
n
n

p 0.4 , z 2 2.575 y n=200 se obtiene

Sustituyendo

el intervalo

(0.311,0.489).

INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA VARIABLE NORMAL


Consideramos ahora una poblacin en la que la variable de inters, X, sigue una
distribucin

N ( , 2 ) . Vamos a estudiar el intervalo de confianza para la media,

de nivel 1 en distintas situaciones:

Cuando la varianza de la poblacin es conocida, el intervalo es:

z
,

z
2
2

n
n

Cuando la varianza de la poblacin no es conocida, el intervalo adecuado es:

t
,

t
n1; 2
n1; 2

n
n

9
M. Angeles Fdez. Sotelo

Tema 6: Estimacin puntual e intervalos de confianza

siendo

tn1; 2

tal que si t es una distribucin t de Student con n-1 grados de

libertad, se tiene

P(t tn1; 2 ) 2

es la cuasidesviacin tpica

muestral, estimacin de la desviacin tpica, que viene dada por


n

X
i 1

n 1

Cuando la varianza de la poblacin no es conocida, y el tamao de la muestra


es grande (n mayor que 30), debido a la aproximacin de la distribucin t a la
normal, el intervalo anterior puede sustituirse por

z
,

n
n

Vemos que es el mismo intervalo del caso de varianza conocida sustituyendo la


varianza por su estimacin.
Ejemplo
La administracin de una empresa desea saber el tiempo que los trabajadores
emplean en desplazarse al trabajo. Para ello observa una muestra de 200 trabajadores,
que dan un tiempo medio de 45 minutos y una desviacin tpica de 30 minutos.
Vamos a calcular un intervalo de confianza del nivel 95% para el tiempo medio.
Se trata de un caso de varianza desconocida y tamao muestral grande por lo que el
intervalo ser

z
,

z
2
2

.
n
n

Teniendo en cuenta la relacin

entre la varianza y la cuasivarianza, tenemos que

z 2 1.96 . Por tanto,

200
30 .
199

el intervalo tendr los lmites 45 1.96

Adems

30
45 4.17 ,
199

con lo cual se obtiene (40.83, 49.17).

Si la muestra fuese de solo 20 trabajadores y la media y desviacin tpica fuesen las


mismas, el intervalo sera

t
,

t
n1; 2
n1; 2

, suponiendo que la
n
n

variable es normal.

10
M. Angeles Fdez. Sotelo

Tema 6: Estimacin puntual e intervalos de confianza

En este caso,

45 2.093

tn1; 2 t19;0.025 2.093

y los lmites del intervalo son

30
45 4.17 45 14.405 , es decir (30.595,59.405).
19

Observemos que es mucho ms amplio que en el caso anterior, lo cual nos confirma
que la precisin de la estimacin es mayor al aumentar el tamao de la muestra.

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES


Consideramos dos poblaciones independientes y en cada una de ellas estudiamos la
proporcin de un suceso A. Estamos interesados en comparar las dos proporciones
(que denotaremos p1 y p2), para lo cual construiremos un intervalo de confianza para la
diferencia p1-p2. Haremos n1 pruebas en la primera poblacin y n2 en la segunda.
Se obtiene el siguiente intervalo de confianza, para valores de n1 y n2 suficientemente
grandes:

p1 p 2 z 2

siendo

p1 (1 p1 ) p 2 (1 p 2 )

n1
n2

p1 (1 p1 ) p 2 (1 p 2 )

, p1 p 2 z 2
n1
n2

p1 y p 2 las proporciones muestrales.

Ejemplo
Se quiere estimar la diferencia de proporciones de estudiantes de dos titulaciones que
encuentran trabajo cuando terminan sus estudios. Observados 200 individuos de cada
titulacin, con la primera se colocaron el 85% mientras quede la segunda se colocaron
el 80%. Determinar un intervalo de confianza al 95% para la diferencia de
proporciones.
Los valores para sustituir en la expresin del intervalo son

z 2 =1.96,

n1=n2=200

0.85 0.80 1.96

con

lo

cual

se

obtiene

el

p1 =0.85, p 2 =0.80,

intervalo

de

lmites

0.850.15 0.800.2

, que resulta ser (-0.0243, 0.1243).


200
200

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE POBLACIONES


NORMALES INDEPENDIENTES
Consideramos ahora dos poblaciones en donde las variables de inters sern X e Y,
independientes y con distribuciones
Con el objeto de poder comparar

N ( 1 , 12 ) y N ( 2 , 22 )

respectivamente.

las dos medias, construiremos un intervalo de

11
M. Angeles Fdez. Sotelo

Tema 6: Estimacin puntual e intervalos de confianza

confianza para la diferencia 1-2. Tomaremos dos muestras,

Y1 , Y2 ,..., Yn2 . Al igual que en el caso de una poblacin,

X1 , X 2 ,..., X n1

debemos distinguir varias

situaciones:
Las dos varianzas son conocidas. En este caso, el intervalo ser

12 22
12 22

, 1 2 z 2

1 2 z 2

n
n
n
n
1
2
1
2

Las varianzas son desconocidas pero podemos suponer que son iguales. Se
obtiene el intervalo cuyos lmites son

1 2

tn1n2 2;

(n1 1)12 (n2 1) 22 1 1


n1 n2 2
n1 n2

Las varianzas son desconocidas y no podemos suponer que son iguales.


Cuando los tamaos muestrales son suficientemente grandes, podemos utilizar
el mismo intervalo que en el caso de varianzas conocidas sustituyndolas por
sus estimaciones (cuasivarianzas), es decir, obtendremos el intervalo

12 22
12 22

, 1 2 z 2

1 2 z 2

n
n
n
n
1
2
1
2

pero si las muestras son pequeas, este intervalo no resulta adecuado y debe
sustituirse z 2 por t f ; 2 en donde f viene dado por la llamada aproximacin
de Welch, que no estudiaremos.
Ejemplo
Se quiere comparar la eficiencia de dos lneas de produccin de una empresa, para lo
cual se observa el nmero de piezas fabricadas en cinco das por cada una de ellas. En
la primera han sido 50, 48, 53, 60 y 37 mientras que en la segunda 40, 51, 62, 55 y 64.
Vamos a construir un intervalo de confianza al nivel 95% para la diferencia de medias
suponiendo que las variables son normales y las varianzas son iguales (en realidad, a
partir de los datos podramos deducir que esta suposicin efectivamente es admisible,
pero no vamos a estudiar la tcnica correspondiente).

12
M. Angeles Fdez. Sotelo

Tema 6: Estimacin puntual e intervalos de confianza

Sabemos

que

1 2

(n1 1)12 (n2 1) 22 1 1


tn1n2 2; 2


n1 n2 2
n1 n2
datos
deducimos
1 =49.6, 2 =54.4, 12 =8.382, 22 =9.612,
t8;0.025 =2.306, n1=n2=5 y, haciendo las operaciones, resulta

De

los

tn1n2 2;

en

4.80 2.3069.02

este

caso

el

intervalo

viene

dado

por

2
4.80 13.16 , es decir, el intervalo es
5

(-17.96, 8.36)

13
M. Angeles Fdez. Sotelo

Das könnte Ihnen auch gefallen