Sie sind auf Seite 1von 11

UNMSM – FISI – NOTAS DE CLASE – TEMA: INFERENCIA ESTADÍSTICA

UNIDAD 3: INFERENCIA ESTADÍSTICA PARAMÉTRICA

ESTIMACIÓN DE PARAMETROS

La estimación estadística es un procedimiento mediante el cual se llega a obtener y analizar


estimadores de parámetros poblacionales desconocidos.
Un estimador es una regla o método para estimar un parámetro poblacional. Por ejemplo, se dice
que la media muestral X es un estimador de la media poblacional  porque la media muestral
proporciona un método para estimar la media de la población. Un estimador proporciona alguna
información respecto al parámetro.
Una estimación es un valor particular del estimador obtenido de observaciones de la muestra.

Para una población de mediciones de X, muchas veces es necesario estimar el parámetro  ; es


decir, mediante una muestra aleatoria X1, X2, ..., Xn debemos “aproximarnos” al verdadero valor de  .

La estimación puede hacerse mediante un único valor (estimación puntual) o mediante un


conjunto de valores (estimación por intervalo).

Por ejemplo, supongamos que los puntajes de ingreso de este año a la Escuela de Ing. de
Sistemas siguen una distribución normal con media  desconocida y con varianza  2 conocida.
Deseamos estimar la media  . Para ello, utilizamos como “estimador” la media muestral. Si elegimos
una muestra aleatoria de 30 ingresantes y observamos sus puntajes, el valor observado de la media
muestral será una “estimación puntual” de  . Si se prefiere acompañar la estimación puntual con
alguna medida de la dispersión de la misma, se estará haciendo una “estimación por intervalo”. En este
ejemplo, un “intervalo de confianza” para  se consigue sumando y restando al estimador puntual X el
producto del error de la media por un cierto factor, que en muchos casos es 1.96.
Los “mejores” estimadores puntuales para la media poblacional, la varianza poblacional y la
proporción poblacional son, respectivamente, la media muestral, la varianza muestral y la proporción
muestral, porque gozan de ciertas propiedades.

PROPIEDADES DE UN BUEN ESTIMADOR PUNTUAL


Un buen estimador puntual ˆ , de un parámetro  , debe ser: insesgado, consistente, eficiente.

ESTIMADOR INSESGADO
Se dice que ˆ es un estimador insesgado del parámetro  si E( ˆ ) = 
Significado :

 Si calculamos el valor de ˆ para cada muestra y repetimos el experimento un gran número de veces,
el promedio de todas estas estimaciones será igual a . Por tanto, los estimadores insesgados
proporcionan resultados perfectos en promedio.

PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Página 1


UNMSM – FISI – NOTAS DE CLASE – TEMA: INFERENCIA ESTADÍSTICA

 Si E ( ˆ )   , entonces el estimador será sesgado.


El sesgo se mide por :
Sesgo ( ˆ ) = E ( ˆ ) - 

EJEMPLO: Las estadísticas X , S 2 y p son estimadores insesgados de los correspondientes

parámetros ,  2 y  .

ESTIMADOR CONSISTENTE
Se dice que ˆ es un estimador consistente del parámetro  si

lim E(ˆ)  
i)
n

lim Var (ˆ)  0


ii)
n

Significado :

Si al incrementar el tamaño de la muestra se produce a la vez un menor sesgo y la varianza tiende a cero,
entonces se tendrá un estimador consistente.

EJEMPLO: Las estadísticas X , S 2 y p son estimadores consistentes de los respectivos parámetros

,  2 y  .

ESTIMADOR EFICIENTE
Sean ˆ1 y ˆ2 dos estimadores insesgados del mismo parámetro  . Se dice que el estimador ˆ1 es más
eficiente que ˆ2 si y solo si
Var ( ˆ1 ) < Var ( ˆ2 )

ERROR ESTANDAR DE UN ESTIMADOR

Se llama error estándar del estimador a la desviación estándar del estimador. Una manera de
medir la precisión de un estimador es utilizando su error estándar. El error estándar es inversamente
proporcional a la precisión del estimador; a menor error estándar, mayor será la precisión del estimador.

EJEMPLO:

PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Página 2


UNMSM – FISI – NOTAS DE CLASE – TEMA: INFERENCIA ESTADÍSTICA


El error estándar de la media muestral basada en una muestra de tamaño n es .
n
El error estándar de la proporción muestral es p(1  p) / n .
Estas fórmulas son válidas cuando las muestras se toman de poblaciones infinitas o cuando se toman con
reemplazo de poblaciones finitas.

ESTIMACIÓN DE PARÁMETROS MEDIANTE INTERVALOS DE CONFIANZA

Es una forma de hacer inferencia, que consiste en dar una conjunto de valores dentro de los
cuales estará el verdadero valor del parámetro, con una probabilidad prefijada igual a (1-  ), conocida
como “nivel de confianza”.
Generalmente, un intervalo de confianza se obtiene sumando y restando al estimador puntual del
parámetro, el producto del error estándar del estimador por un cierto factor.
Para obtener el intervalo de confianza para un parámetro, se toma en cuenta la distribución
muestral del estimador correspondiente al parámetro.

PROCEDIMIENTO PARA CONSTRUIR UN INTERVALO DE CONFIANZA

10 Se toma una muestra aleatoria X = X 1 , X 2 ,..., X n de tamaño n de la población X cuya función de


densidad es f ( x; ) , donde  es desconocido.
20 Se define la función pivote Q = q(X;  ) que generalmente depende del estimador y del parámetro y
cuya distribución muestral se conoce.
30 Plantear una proposición probabilística como la siguiente

P( q1  Q  q 2 ) 1

donde ( 1 ) generalmente toma los valores 0.90, 0.95, 0.99 y q1 y q2 son los cuantiles de la distribución
muestral del estimador.
40 Despejar  de la proposición anterior hasta obtener

P(q1 (X)    q2 (X))  1  

y entonces el intervalo [q1(X), q2 (X)] será el intervalo que cubre a  con un nivel de confianza igual a
1 .

Interpretación del nivel de confianza 1 :


El nivel de confianza es la probabilidad de que el parámetro que se estima se encuentre en el intervalo
de confianza.
El valor 1 indica la proporción esperada de las veces que el intervalo contendrá al parámetro cuando
el muestreo se repite un determinado número de ocasiones. Si se realiza el muestreo en k oportunidades,
es de esperar que el ( 1 )100% de los k intervalos de confianza que se formen contengan al parámetro.

PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Página 3


UNMSM – FISI – NOTAS DE CLASE – TEMA: INFERENCIA ESTADÍSTICA

Sea por ejemplo 1 = 0.95. Significa que, si en un muestreo repetido se calculara con cada muestra
un intervalo de confianza para  , entonces en el 95% de las muestras los intervalos construidos
incluirían a  .
A continuación, se muestra un procedimiento para construir intervalos de confianza para algunos
parámetros de interés.

INTERVALO DE CONFIANZA PARA ESTIMAR LA MEDIA  DE UNA POBLACIÓN


NORMAL

CASO 1: La varianza poblacional  2 es conocida.

Siguiendo el procedimiento señalado anteriormente, obtendremos un intervalo de confianza para la


media  si tomamos como función pivote a la variable aleatoria
x
 n
la cual tiene distribución normal estándar.

Usando la distribución normal hacemos el siguiente enunciado probabilístico:

x
P( -z < < z ) = 1 .
 n

y despejando  se obtiene:
𝜎 𝜎
P(𝑥̅ -z( ) <  < 𝑥̅ +z( ) ) = 1 .
√𝑛 √𝑛

Lo cual indica que, el intervalo de confianza para estimar la media poblacional es el siguiente

 
[X- z , X z ]
n n

el cual cubre a  con una confianza de ( 1 )100%.

Ejemplo 1:

Una máquina de empaquetar bolsas de café está regulada para embalar bolsas cuyos pesos se distribuyen
normalmente con media 500 gr. y desviación estándar 10 gr. Supongamos que la máquina está
desregulada y deseamos conocer el nuevo promedio  . Una muestra aleatoria de 25 bolsas arroja una
media igual a 485 gr. Hallar un intervalo de confianza de 95% para  .

Solución:
X: pesos de las bolsas de café, en gramos. X ∼ N(500, σ = 10). Se desea saber si el valor de la media μ
se mantiene en 500 o ha cambiado, ya que la máquina de llenar se ha desregulado.
PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Página 4
UNMSM – FISI – NOTAS DE CLASE – TEMA: INFERENCIA ESTADÍSTICA

Datos: n = 25, X = 485,  = 10, 1 = 0.95, z /2 = 1.96. Como se conoce la varianza poblacional, se
usará el intervalo del caso 1. Reemplazando los datos se obtiene el siguiente I.C. para  con un nivel
de confianza de 95%:
[481.08 , 488.92]

Se estima que, en promedio, los pesos de las bolsas de café fluctúan entre 481.08 gr. y 488.92 gr. En
conclusión, la máquina está llenando bolsas de café con un contenido menor de 500 gr., debe ser
revisada.

CASO 2: La varianza poblacional  2 es desconocida.

En este caso, la función pivote es


x
s n
la cual tiene distribución t con n-1 grados de libertad.

Usando esta distribución, procedemos como en el caso anterior, planteando una proposición
probabilística y despejando  .
Luego, el intervalo para estimar  a un nivel de confianza de 1 es
s s
[X - t , X t ]
n n
Ejemplo 2:
Una máquina produce varillas de metal utilizadas en el sistema de suspensión de un automóvil. Se toma
una muestra aleatoria de 15 varillas y se mide su diámetro, en cms. Los datos obtenidos son: 8.24 8.21
8.23 8.25 8.26 8.23 8.20 8.26 8.19 8.23 8.20 8. 28 8.25 8.24 8.24
Suponiendo que los diámetros de las varillas siguen una ley normal, construir un intervalo de confianza
del 95% para el diámetro promedio por varilla.

Solución: Sea X: el diámetro de las varillas de metal, en cms. X∼N(μ, σ2), con σ2 desconocida.
Con los datos se obtiene: n=15, X = 8.234 y S 2 = (0.0244)2. Siendo la varianza poblacional
desconocida, usaremos la distribución t para construir el I.C. Para 1 = 0.95 y por la simetría de la
distribución t, el cuantil que deja a su izquierda un área igual a 0.975 es t  / 2 = 2.145. Reemplazando los
datos en el último intervalo se obtiene el siguiente intervalo que cubre a  con una confianza igual a
95%: [8.22 , 8.247].

Ejemplo 3:
Se desea conocer la permanencia media de pacientes en cierto hospital, con el fin de poner en práctica
un proyecto de ampliación del local. Con datos referentes a días de permanencia, de una muestra de 600
pacientes se obtuvieron los siguientes resultados: X = 12.3 días y S = 8 días.
Hallar un intervalo de confianza del 95% para la permanencia media.
Solución:

PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Página 5


UNMSM – FISI – NOTAS DE CLASE – TEMA: INFERENCIA ESTADÍSTICA

X: días de permanencia en cierto hospital. No se conoce la distribución de X. Podría suponerse que X


tiene distribución normal, con media y varianza desconocidas. Se desea estimar la media μ. Como no se
conoce la varianza poblacional, deberíamos usar la distribución t para obtener la estimación de μ
mediante el I.C. Pero, siendo la muestra grande, n=600, por el TCL se sabe que X tiene distribución
normal con media y varianza desconocidas. La varianza se estima con la varianza muestral S2. Luego,
s s
usaremos el intervalo del caso 1: [ X - z , X z ].
n n
Por la simetría de la curva normal, para 1 = 0.95 se tiene z /2 =1.96
Reemplazando datos se obtiene que, el tiempo promedio de permanencia de los pacientes en el hospital
varía en el intervalo (11.66, 12.94), expresado en días, con una seguridad de 95%.

Observaciones:

1. La longitud del intervalo de confianza para  es L = 2 z / 2 .
n
Como el tamaño de la muestra aparece en el denominador, entonces, muestras grandes darán intervalos
de confianza de longitud más cortos, por lo tanto más precisos. Si se conociera la longitud del intervalo,
entonces el tamaño de la muestra será igual a
 2 z / 2  
2

n 
 L 
Por ejemplo, suponga que el número de onzas de cerveza que una máquina vierte en una botella es una
variable aleatoria distribuida normalmente con media  desconocida y desviación estándar conocida
igual a 0.5 onzas. ¿De qué tamaño debe ser n para que la longitud del intervalo de 90% de confianza sea
de media onza?
Reemplazando los datos en la relación anterior se tiene:
2
 2 x1645
. x 0.5
n  = 11
 0.5 
Si la longitud del intervalo fuese un cuarto de onza, entonces sería n = 44.

2. Si se desea estimar la media poblacional  mediante la media muestral X , con un error de


estimación no mayor a E, y con probabilidad igual a ( 1 ), bastará tomar una muestra de tamaño n de

tal modo que z / 2  E. De aquí se deduce que el tamaño de muestra a usar debe ser tal que
n
z 
2

n    /2 
 E 

Así, si en el ejemplo 1 visto arriba, el máximo error permitido se reduce a la mitad, cuál será el tamaño
de muestra requerido?

Siendo z / 2 = (1.96 x 10)/5 = 3.92, la mitad del error es 1.96. Reemplazando este valor en la fórmula
n
de n se obtiene n  100.

PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Página 6


UNMSM – FISI – NOTAS DE CLASE – TEMA: INFERENCIA ESTADÍSTICA

3. Cuando la población es finita de tamaño N, con varianza conocida σ2, y el muestreo se hace sin
reemplazo (o también, cuando el tamaño de la muestra supera el 5% de la población), entonces el
intervalo de confianza para estimar la media  de una distribución normal, al nivel 1 , está dado por:

  N n  N n
 X  z / 2 , X - z  /2 
 n N 1 n N 1 

Si la varianza es desconocida y la muestra es pequeña, el intervalo es:

 s N n s N n
 X  t / 2 , X - t  /2 
 n N 1 n N 1 

Y, para muestras grandes es:

 s N n s N n
 X  z / 2 , X - z  /2 
 n N 1 n N 1 
Ejercicio 1:
Un fabricante de fibras sintéticas desea estimar la tensión de ruptura media de una fibra. Diseña un
experimento en el que se observan las tensiones de ruptura, en libras, de 16 hilos del proceso
seleccionados aleatoriamente. Las tensiones son: 20.8 20.6 21.0 20.9 19.9 20.2 19.8 19.6 20.9 21.1
20.4 20.6 19.7 19.6 20.3 20.7. Supóngase que la tensión de ruptura de una fibra se encuentra
modelada por una distribución normal, con  =0.45 libras
Construir un intervalo de confianza estimado del 98% para el valor real de la tensión de ruptura
promedio de la fibra.
Construir otro intervalo de confianza suponiendo que no se conoce  . Compare los dos intervalos.

Ejercicio 2:
Tres estudiantes desean construir intervalos de confianza para la media de una población normal con
varianza conocida igual a 9 y con coeficiente de confianza de 90%. Cada uno de ellos dispone de la
información siguiente:
ESTUDIANTE TAMAÑO DE MUESTRA VALOR OBSERVADO
a 3 6 5 4
b 6 10 0 4 2 9 5
c 9 8 3 5 7 9 6 2 10 4
a) ¿Qué intervalo construiría cada estudiante?. Compare la precisión de los intervalos y haga algún
comentario.
b) ¿Qué tamaño de muestra se necesitaría si deseamos un intervalo de 90% de confianza y una precisión
de 0.4?

INTERVALO DE CONFIANZA PARA ESTIMAR LA VARIANZA  2 DE UNA POBLACIÓN


NORMAL

PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Página 7


UNMSM – FISI – NOTAS DE CLASE – TEMA: INFERENCIA ESTADÍSTICA

Siguiendo el método anterior, después de obtener una muestra aleatoria de tamaño n de la población
normal con varianza desconocida, se usa como función pivote la variable aleatoria
(n-1) S 2 /  2

la cual tiene distribución chi cuadrado con n-1 grados de libertad.


Tomando en cuenta tal distribución se hace el siguiente enunciado probabilístico

(n  1)S 2
P(   / 2 
2
 12 / 2 )  1  
 2

y despejando  2 dentro del paréntesis se obtiene lo siguiente:

(n  1) S 2 (n  1) S 2
P(  
2
) 1
12 / 2 2 / 2
de modo que, el I. C. que cubre a  2 , con un nivel de confianza igual a ( 1 )100% está dado por:

 (n  1) S 2 (n - 1)S2 
 , 
  1 / 2  /2 
2 2

Ejemplo:
Se realizaron 15 mediciones del largo de una barra. Los resultados fueron: 42.7, 43.48, 43.63, 42.78,
43.18, 42.756, 42.76, 42.87, 42.95, 43.39, 43.01, 43.06, 41.60, 43.20, 43.10.
Suponiendo que la variable aleatoria X que representa a las mediciones es normal, hallar el intervalo de
estimación para las varianzas de las medidas, al nivel de confianza del 95%.
Solución:
El tamaño de la muestra es 15. Los valores de la media y varianza muestrales son, respectivamente, X =
42.95 y S 2 = 0.2284. Para el nivel 1 = 0.95, los cuantiles correspondientes de la distribución chi
cuadrado con 14 grados de libertad son  20.025 =5.63 y  20.975 = 26.1
Reemplazando todos estos valores en el intervalo para la varianza se tiene que:
[0.1224 , 0.5679] cubren a  2 con una confianza de 95%.

INTERVALO DE CONFIANZA PARA ESTIMAR LA PROPORCIÓN POBLACIONAL π DE


UNA POBLACIÓN DE BERNOULLI

Se aborda una población de Bernoulli, donde existe una proporción π de elementos que tienen cierto
atributo. Se toma una muestra aleatoria de tamaño n de esta población y en ella se calcula la proporción
p de elementos que tienen el atributo. Por el Teorema del Límite Central, se sabe que, cuando el tamaño
de la muestra es suficientemente grande (n≥30), la distribución de p se aproxima a la de una normal,
con media π y varianza π(1- π)/n .
Interesa estimar la proporción poblacional π. Seguiremos el procedimiento de la cantidad pivotal, para
hallar el intervalo de confianza.

PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Página 8


UNMSM – FISI – NOTAS DE CLASE – TEMA: INFERENCIA ESTADÍSTICA

p 
En este caso, la función pivote que se usa es la variable aleatoria Z =
 (1   )
n
la cual tiene distribución normal estándar.
Usando esta distribución y siguiendo el procedimiento de la función pivote, se plantea el siguiente
enunciado probabilístico:

𝑝−𝜋
𝑃 (−𝑧 ≤ ≤ 𝑧) = 1 − 𝛼
√𝜋(1 − 𝜋)/𝑛

Esta expresión se puede escribir del modo siguiente:

𝑃(𝑝 − 𝑧√𝜋(1 − 𝜋)/𝑛 ≤ 𝜋 ≤ 𝑝 + 𝑧√𝜋(1 − 𝜋)/𝑛) = 1 − 𝛼

El valor de π que aparece en el error estándar se estima con la proporción muestral.


Luego, el intervalo que cubre a π con una confianza de 1 está dado por

 p(1  p) p(1  p) 
 p  z / 2 , p  z/2 
 n n 
Ejemplo:
Con motivo de las elecciones presidenciales, en una encuesta de opinión pública, de un total de 400
persona entrevistadas, 320 mostraron su preferencia por determinado candidato.
a) Construir un intervalo de confianza del 95% para estimar la proporción del total de personas que están
a favor de dicho candidato.
b) Con un nivel de confianza de 99%, cambia el máximo error de estimación de a)?
Solución:
a) La proporción muestral es igual a p = 320/400 = 0.80. Para 1 = 0.95 el valor de z /2 es 1.96.
Luego, reemplazando estos valores en el intervalo antes formulado se obtiene el siguiente intervalo que
cubre a π con una confianza de 95%:

0.8  0.0392
Nótese que el valor 0.0392 es el máximo error de estimación. Entonces decimos que, el 80% del
electorado estará a favor del candidato, con un error de estimación de 3.92% y con una confianza de
95%.
b) Si fuese 1 = 0.99, entonces el máximo error permitido sería
z /2 p = 2.58 x 0.02 = 0.0516. Vemos que el error de estimación se vuelve más grande y por tanto el
intervalo es menos preciso.

Del mismo modo, siguiendo el método antes descrito, se puede construir intervalos de confianza para los
parámetros que son combinaciones de los parámetros ya vistos, como son la diferencia de medias y la

PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Página 9


UNMSM – FISI – NOTAS DE CLASE – TEMA: INFERENCIA ESTADÍSTICA

razón de varianzas en poblaciones normales y la diferencia de proporciones en poblaciones de Bernoulli.


En todos estos casos se deberá tomar en cuenta la distribución muestral del estimador correspondiente
al parámetro en cuestión. El intervalo que se obtenga en cada caso será el resultado de seguir el método
de la cantidad pivotal, con un nivel de confianza de ( 1 )100% .

INTERVALO DE CONFIANZA PARA ESTIMAR LA DIFERENCIA DE PROPORCIONES


1-2 DE DOS POBLACIONES DE BERNOULLI INDEPENDIENTES

p1 1  p1  p 2 1  p 2 
p1  p 2   Z1α/2 
n1 n2

Analizando los signos de los límites de este intervalo podemos concluir que:
• Si el intervalo es (- , +), entonces 1 = 2.
• Si el intervalo es (- , -), entonces 1 < 2.
• Si el intervalo es (+, +), entonces 1 > 2.

INTERVALO DE CONFIANZA PARA ESTIMAR LA RAZÓN DE VARIANZAS σ12 σ 22


DE DOS POBLACIONES NORMALES INDEPENDIENTES

Se quiere estimar el cociente de varianzas de dos poblaciones Normales.

Un intervalo de confianza para σ12 σ 22 al (1-α)100% está dado por:

S12 S12
Fn 2 1,n1 1;α/2 2 ; Fn 2 1,n1 1;1α/2 2
S2 S2
• Interpretación:
Si el intervalo anterior contiene al uno, entonces se puede considerar que las varianzas son
iguales, con el nivel de confianza dado.
En cambio, si el intervalo no contiene al uno, se puede considerar que las varianzas son
diferentes.

INTERVALO DE CONFIANZA PARA ESTIMAR LA DIFERENCIA DE MEDIAS µ1 - µ2 DE


DOS POBLACIONES NORMALES INDEPENDIENTES

Se quiere estimar la diferencia de medias de dos poblaciones Normales independientes.


• Caso I: Varianzas poblacionales conocidas
Un intervalo de confianza para µ1 - µ2 al (1-α)100% está dado por:

σ12 σ 22
X1  X 2   z1α/2 
n1 n2
PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Página 10
UNMSM – FISI – NOTAS DE CLASE – TEMA: INFERENCIA ESTADÍSTICA

• Caso II: Varianzas poblacionales desconocidas pero iguales:


Un intervalo de confianza para µ1 - µ2 al (1-α)100% está dado por:

 1 1 
X1  X2   t n  n 2  2;1 α/2 
S2p   
 1
n n 2 
1

• Caso III: Varianzas poblacionales desconocidas pero diferentes:


Un intervalo de confianza para µ1 - µ2 al (1-α)100% está dado por:

S12 S22
X1  X 2   t V;1α/2 
n1 n 2

Interpretación:
Para los tres casos de estimación de la diferencia de medias, la interpretación se hace a partir de
los signos de los límites del intervalo:
Si el intervalo es (- , -), entonces µ1< µ2.
Si el intervalo es (- , +), entonces µ1= µ2.
Si el intervalo es (+ , +), entonces µ1> µ2.

PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Página 11

Das könnte Ihnen auch gefallen