Beruflich Dokumente
Kultur Dokumente
ESTIMACIÓN DE PARAMETROS
Por ejemplo, supongamos que los puntajes de ingreso de este año a la Escuela de Ing. de
Sistemas siguen una distribución normal con media desconocida y con varianza 2 conocida.
Deseamos estimar la media . Para ello, utilizamos como “estimador” la media muestral. Si elegimos
una muestra aleatoria de 30 ingresantes y observamos sus puntajes, el valor observado de la media
muestral será una “estimación puntual” de . Si se prefiere acompañar la estimación puntual con
alguna medida de la dispersión de la misma, se estará haciendo una “estimación por intervalo”. En este
ejemplo, un “intervalo de confianza” para se consigue sumando y restando al estimador puntual X el
producto del error de la media por un cierto factor, que en muchos casos es 1.96.
Los “mejores” estimadores puntuales para la media poblacional, la varianza poblacional y la
proporción poblacional son, respectivamente, la media muestral, la varianza muestral y la proporción
muestral, porque gozan de ciertas propiedades.
ESTIMADOR INSESGADO
Se dice que ˆ es un estimador insesgado del parámetro si E( ˆ ) =
Significado :
Si calculamos el valor de ˆ para cada muestra y repetimos el experimento un gran número de veces,
el promedio de todas estas estimaciones será igual a . Por tanto, los estimadores insesgados
proporcionan resultados perfectos en promedio.
parámetros , 2 y .
ESTIMADOR CONSISTENTE
Se dice que ˆ es un estimador consistente del parámetro si
lim E(ˆ)
i)
n
Significado :
Si al incrementar el tamaño de la muestra se produce a la vez un menor sesgo y la varianza tiende a cero,
entonces se tendrá un estimador consistente.
, 2 y .
ESTIMADOR EFICIENTE
Sean ˆ1 y ˆ2 dos estimadores insesgados del mismo parámetro . Se dice que el estimador ˆ1 es más
eficiente que ˆ2 si y solo si
Var ( ˆ1 ) < Var ( ˆ2 )
Se llama error estándar del estimador a la desviación estándar del estimador. Una manera de
medir la precisión de un estimador es utilizando su error estándar. El error estándar es inversamente
proporcional a la precisión del estimador; a menor error estándar, mayor será la precisión del estimador.
EJEMPLO:
El error estándar de la media muestral basada en una muestra de tamaño n es .
n
El error estándar de la proporción muestral es p(1 p) / n .
Estas fórmulas son válidas cuando las muestras se toman de poblaciones infinitas o cuando se toman con
reemplazo de poblaciones finitas.
Es una forma de hacer inferencia, que consiste en dar una conjunto de valores dentro de los
cuales estará el verdadero valor del parámetro, con una probabilidad prefijada igual a (1- ), conocida
como “nivel de confianza”.
Generalmente, un intervalo de confianza se obtiene sumando y restando al estimador puntual del
parámetro, el producto del error estándar del estimador por un cierto factor.
Para obtener el intervalo de confianza para un parámetro, se toma en cuenta la distribución
muestral del estimador correspondiente al parámetro.
P( q1 Q q 2 ) 1
donde ( 1 ) generalmente toma los valores 0.90, 0.95, 0.99 y q1 y q2 son los cuantiles de la distribución
muestral del estimador.
40 Despejar de la proposición anterior hasta obtener
y entonces el intervalo [q1(X), q2 (X)] será el intervalo que cubre a con un nivel de confianza igual a
1 .
Sea por ejemplo 1 = 0.95. Significa que, si en un muestreo repetido se calculara con cada muestra
un intervalo de confianza para , entonces en el 95% de las muestras los intervalos construidos
incluirían a .
A continuación, se muestra un procedimiento para construir intervalos de confianza para algunos
parámetros de interés.
x
P( -z < < z ) = 1 .
n
y despejando se obtiene:
𝜎 𝜎
P(𝑥̅ -z( ) < < 𝑥̅ +z( ) ) = 1 .
√𝑛 √𝑛
Lo cual indica que, el intervalo de confianza para estimar la media poblacional es el siguiente
[X- z , X z ]
n n
Ejemplo 1:
Una máquina de empaquetar bolsas de café está regulada para embalar bolsas cuyos pesos se distribuyen
normalmente con media 500 gr. y desviación estándar 10 gr. Supongamos que la máquina está
desregulada y deseamos conocer el nuevo promedio . Una muestra aleatoria de 25 bolsas arroja una
media igual a 485 gr. Hallar un intervalo de confianza de 95% para .
Solución:
X: pesos de las bolsas de café, en gramos. X ∼ N(500, σ = 10). Se desea saber si el valor de la media μ
se mantiene en 500 o ha cambiado, ya que la máquina de llenar se ha desregulado.
PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Página 4
UNMSM – FISI – NOTAS DE CLASE – TEMA: INFERENCIA ESTADÍSTICA
Datos: n = 25, X = 485, = 10, 1 = 0.95, z /2 = 1.96. Como se conoce la varianza poblacional, se
usará el intervalo del caso 1. Reemplazando los datos se obtiene el siguiente I.C. para con un nivel
de confianza de 95%:
[481.08 , 488.92]
Se estima que, en promedio, los pesos de las bolsas de café fluctúan entre 481.08 gr. y 488.92 gr. En
conclusión, la máquina está llenando bolsas de café con un contenido menor de 500 gr., debe ser
revisada.
Usando esta distribución, procedemos como en el caso anterior, planteando una proposición
probabilística y despejando .
Luego, el intervalo para estimar a un nivel de confianza de 1 es
s s
[X - t , X t ]
n n
Ejemplo 2:
Una máquina produce varillas de metal utilizadas en el sistema de suspensión de un automóvil. Se toma
una muestra aleatoria de 15 varillas y se mide su diámetro, en cms. Los datos obtenidos son: 8.24 8.21
8.23 8.25 8.26 8.23 8.20 8.26 8.19 8.23 8.20 8. 28 8.25 8.24 8.24
Suponiendo que los diámetros de las varillas siguen una ley normal, construir un intervalo de confianza
del 95% para el diámetro promedio por varilla.
Solución: Sea X: el diámetro de las varillas de metal, en cms. X∼N(μ, σ2), con σ2 desconocida.
Con los datos se obtiene: n=15, X = 8.234 y S 2 = (0.0244)2. Siendo la varianza poblacional
desconocida, usaremos la distribución t para construir el I.C. Para 1 = 0.95 y por la simetría de la
distribución t, el cuantil que deja a su izquierda un área igual a 0.975 es t / 2 = 2.145. Reemplazando los
datos en el último intervalo se obtiene el siguiente intervalo que cubre a con una confianza igual a
95%: [8.22 , 8.247].
Ejemplo 3:
Se desea conocer la permanencia media de pacientes en cierto hospital, con el fin de poner en práctica
un proyecto de ampliación del local. Con datos referentes a días de permanencia, de una muestra de 600
pacientes se obtuvieron los siguientes resultados: X = 12.3 días y S = 8 días.
Hallar un intervalo de confianza del 95% para la permanencia media.
Solución:
Observaciones:
1. La longitud del intervalo de confianza para es L = 2 z / 2 .
n
Como el tamaño de la muestra aparece en el denominador, entonces, muestras grandes darán intervalos
de confianza de longitud más cortos, por lo tanto más precisos. Si se conociera la longitud del intervalo,
entonces el tamaño de la muestra será igual a
2 z / 2
2
n
L
Por ejemplo, suponga que el número de onzas de cerveza que una máquina vierte en una botella es una
variable aleatoria distribuida normalmente con media desconocida y desviación estándar conocida
igual a 0.5 onzas. ¿De qué tamaño debe ser n para que la longitud del intervalo de 90% de confianza sea
de media onza?
Reemplazando los datos en la relación anterior se tiene:
2
2 x1645
. x 0.5
n = 11
0.5
Si la longitud del intervalo fuese un cuarto de onza, entonces sería n = 44.
n /2
E
Así, si en el ejemplo 1 visto arriba, el máximo error permitido se reduce a la mitad, cuál será el tamaño
de muestra requerido?
Siendo z / 2 = (1.96 x 10)/5 = 3.92, la mitad del error es 1.96. Reemplazando este valor en la fórmula
n
de n se obtiene n 100.
3. Cuando la población es finita de tamaño N, con varianza conocida σ2, y el muestreo se hace sin
reemplazo (o también, cuando el tamaño de la muestra supera el 5% de la población), entonces el
intervalo de confianza para estimar la media de una distribución normal, al nivel 1 , está dado por:
N n N n
X z / 2 , X - z /2
n N 1 n N 1
s N n s N n
X t / 2 , X - t /2
n N 1 n N 1
s N n s N n
X z / 2 , X - z /2
n N 1 n N 1
Ejercicio 1:
Un fabricante de fibras sintéticas desea estimar la tensión de ruptura media de una fibra. Diseña un
experimento en el que se observan las tensiones de ruptura, en libras, de 16 hilos del proceso
seleccionados aleatoriamente. Las tensiones son: 20.8 20.6 21.0 20.9 19.9 20.2 19.8 19.6 20.9 21.1
20.4 20.6 19.7 19.6 20.3 20.7. Supóngase que la tensión de ruptura de una fibra se encuentra
modelada por una distribución normal, con =0.45 libras
Construir un intervalo de confianza estimado del 98% para el valor real de la tensión de ruptura
promedio de la fibra.
Construir otro intervalo de confianza suponiendo que no se conoce . Compare los dos intervalos.
Ejercicio 2:
Tres estudiantes desean construir intervalos de confianza para la media de una población normal con
varianza conocida igual a 9 y con coeficiente de confianza de 90%. Cada uno de ellos dispone de la
información siguiente:
ESTUDIANTE TAMAÑO DE MUESTRA VALOR OBSERVADO
a 3 6 5 4
b 6 10 0 4 2 9 5
c 9 8 3 5 7 9 6 2 10 4
a) ¿Qué intervalo construiría cada estudiante?. Compare la precisión de los intervalos y haga algún
comentario.
b) ¿Qué tamaño de muestra se necesitaría si deseamos un intervalo de 90% de confianza y una precisión
de 0.4?
Siguiendo el método anterior, después de obtener una muestra aleatoria de tamaño n de la población
normal con varianza desconocida, se usa como función pivote la variable aleatoria
(n-1) S 2 / 2
(n 1)S 2
P( / 2
2
12 / 2 ) 1
2
(n 1) S 2 (n 1) S 2
P(
2
) 1
12 / 2 2 / 2
de modo que, el I. C. que cubre a 2 , con un nivel de confianza igual a ( 1 )100% está dado por:
(n 1) S 2 (n - 1)S2
,
1 / 2 /2
2 2
Ejemplo:
Se realizaron 15 mediciones del largo de una barra. Los resultados fueron: 42.7, 43.48, 43.63, 42.78,
43.18, 42.756, 42.76, 42.87, 42.95, 43.39, 43.01, 43.06, 41.60, 43.20, 43.10.
Suponiendo que la variable aleatoria X que representa a las mediciones es normal, hallar el intervalo de
estimación para las varianzas de las medidas, al nivel de confianza del 95%.
Solución:
El tamaño de la muestra es 15. Los valores de la media y varianza muestrales son, respectivamente, X =
42.95 y S 2 = 0.2284. Para el nivel 1 = 0.95, los cuantiles correspondientes de la distribución chi
cuadrado con 14 grados de libertad son 20.025 =5.63 y 20.975 = 26.1
Reemplazando todos estos valores en el intervalo para la varianza se tiene que:
[0.1224 , 0.5679] cubren a 2 con una confianza de 95%.
Se aborda una población de Bernoulli, donde existe una proporción π de elementos que tienen cierto
atributo. Se toma una muestra aleatoria de tamaño n de esta población y en ella se calcula la proporción
p de elementos que tienen el atributo. Por el Teorema del Límite Central, se sabe que, cuando el tamaño
de la muestra es suficientemente grande (n≥30), la distribución de p se aproxima a la de una normal,
con media π y varianza π(1- π)/n .
Interesa estimar la proporción poblacional π. Seguiremos el procedimiento de la cantidad pivotal, para
hallar el intervalo de confianza.
p
En este caso, la función pivote que se usa es la variable aleatoria Z =
(1 )
n
la cual tiene distribución normal estándar.
Usando esta distribución y siguiendo el procedimiento de la función pivote, se plantea el siguiente
enunciado probabilístico:
𝑝−𝜋
𝑃 (−𝑧 ≤ ≤ 𝑧) = 1 − 𝛼
√𝜋(1 − 𝜋)/𝑛
p(1 p) p(1 p)
p z / 2 , p z/2
n n
Ejemplo:
Con motivo de las elecciones presidenciales, en una encuesta de opinión pública, de un total de 400
persona entrevistadas, 320 mostraron su preferencia por determinado candidato.
a) Construir un intervalo de confianza del 95% para estimar la proporción del total de personas que están
a favor de dicho candidato.
b) Con un nivel de confianza de 99%, cambia el máximo error de estimación de a)?
Solución:
a) La proporción muestral es igual a p = 320/400 = 0.80. Para 1 = 0.95 el valor de z /2 es 1.96.
Luego, reemplazando estos valores en el intervalo antes formulado se obtiene el siguiente intervalo que
cubre a π con una confianza de 95%:
0.8 0.0392
Nótese que el valor 0.0392 es el máximo error de estimación. Entonces decimos que, el 80% del
electorado estará a favor del candidato, con un error de estimación de 3.92% y con una confianza de
95%.
b) Si fuese 1 = 0.99, entonces el máximo error permitido sería
z /2 p = 2.58 x 0.02 = 0.0516. Vemos que el error de estimación se vuelve más grande y por tanto el
intervalo es menos preciso.
Del mismo modo, siguiendo el método antes descrito, se puede construir intervalos de confianza para los
parámetros que son combinaciones de los parámetros ya vistos, como son la diferencia de medias y la
p1 1 p1 p 2 1 p 2
p1 p 2 Z1α/2
n1 n2
Analizando los signos de los límites de este intervalo podemos concluir que:
• Si el intervalo es (- , +), entonces 1 = 2.
• Si el intervalo es (- , -), entonces 1 < 2.
• Si el intervalo es (+, +), entonces 1 > 2.
S12 S12
Fn 2 1,n1 1;α/2 2 ; Fn 2 1,n1 1;1α/2 2
S2 S2
• Interpretación:
Si el intervalo anterior contiene al uno, entonces se puede considerar que las varianzas son
iguales, con el nivel de confianza dado.
En cambio, si el intervalo no contiene al uno, se puede considerar que las varianzas son
diferentes.
σ12 σ 22
X1 X 2 z1α/2
n1 n2
PROFESORA: LIC. JUSTA CARIDAD HUAROTO SUMARI Página 10
UNMSM – FISI – NOTAS DE CLASE – TEMA: INFERENCIA ESTADÍSTICA
1 1
X1 X2 t n n 2 2;1 α/2
S2p
1
n n 2
1
S12 S22
X1 X 2 t V;1α/2
n1 n 2
Interpretación:
Para los tres casos de estimación de la diferencia de medias, la interpretación se hace a partir de
los signos de los límites del intervalo:
Si el intervalo es (- , -), entonces µ1< µ2.
Si el intervalo es (- , +), entonces µ1= µ2.
Si el intervalo es (+ , +), entonces µ1> µ2.