Beruflich Dokumente
Kultur Dokumente
estimador y se simboliza θ .
Por ejemplo, dada una muestra aleatoria simple de tamaño n = 3, se definen los
siguientes estadísticos:
f(X1, X2, X3) = X1 + 3X2 – 5X3
3
(Xi X )2
i 1
f(X1, X2, X3) =
2
Como se puede observar, el primer estadístico es función de las variables de la
muestra pero no da información sobre ningún parámetro; mientras que el segundo es
el estadístico variancia muestral, que se utiliza para dar información sobre la variancia
poblacional, es decir que es un estimador de la variancia poblacional.
1
2
Tabla 9 Estimadores de los parámetros µ, σ y π, y estimaciones puntuales
Π
π fr π fo
En la Sección 6-1 se vio que todo estimador (estadístico) es una variable aleatoria y
tiene una determinada distribución de probabilidades. Entonces, dar una estimación
puntual, es decir, dar al parámetro un único valor (el mismo valor obtenido para el
estadístico en la muestra) no suele ser satisfactorio, ya que no da idea de la precisión
de la estimación ni del riesgo de que la esta sea errónea.
La estimación por intervalo se va a presentar con más detalle para el caso de la media
de una población normal, con la desviación estándar conocida. Para ese intervalo se
comentará su interpretación y se analizará la relación entre los distintos elementos que
lo componen. Estos conceptos son válidos también para el resto de los intervalos de
confianza que se presentan en este material
2
6-2-1 Estimación por intervalo para la media de una población normal (µ),
cuando σ es conocido
Se cuenta con una variable aleatoria X ~N(µ,σ), donde σ es conocido. Para estimar a
µ, se va a tomar una muestra de n elementos. El estimador más adecuado es la media
muestral μ X
Dado que X es una variable aleatoria con distribución normal y σ se conoce, X
también se distribuye normalmente, por ser combinación lineal de variables normales.
E
de donde puede despejarse que z0,975 1, 96 (3)
σ/ n
La cota superior para el error de estimación, E, para una probabilidad del 95 % queda
E 1, 96x σ / n (4)
3
En la última expresión (7), el promedio poblacional no se ha convertido en una
variable, sigue siendo una constante de la población. Lo aleatorio son los
extremos del intervalo, que dependen de la variable aleatoria media muestral. Es
posible que el intervalo cubra o no al parámetro
El intervalo obtenido es un intervalo aleatorio de probabilidad 0,95 para la media
poblacional, suponiendo conocido σ y representa a los infinitos intervalos que pueden
obtenerse a partir de infinitas muestras aleatorias del mismo tamaño n, extraidas de
una población N(µ,σ). El valor 0,95 puede interpretarse de la siguiente manera: si se
toma una gran cantidad de muestras, todas del mismo tamaño n, y para cada una se
construye un intervalo, aproximadamente el 95 % de los intervalos cubrirán al valor del
parámetro y el 5 % restante, no. En la Figura 8 se presenta un conjunto de intervalos
construidos para la media poblacional. Algunos cubren el verdadero valor y otros no.
Probabilidad vs. Confianza: (adaptado del libro “Estadística para ingenieros”, de W. Navidi)
El término probabilidad se refiere a eventos aleatorios que pueden dar diferentes
resultados de repetición a repetición. Una vez tomada la muestra, los extremos del
intervalo ya no son variables aleatorias sino números, y como tales, son fijos, al igual
que el valor del parámetro. Por lo tanto, el término probabilidad se utiliza para el
intervalo aleatorio y el término confianza, para el intervalo ya calculado con los datos
de la muestra.
4
Fig.8. (tomada del libro “Introducción a la Estadística” de Wonnacott y Wonnacott)
Intervalos de confianza para el parámetro µ, construidos a partir de muestras del mismo tamaño.
Muestras diferentes dan valores diferentes de la media muestral, y, por lo tanto, intervalos diferentes. El
proceso es análogo a arrojar herraduras para acertar en el blanco:
Algunos intervalos cubren al parámetro y otros, no.
En las figuras, la media es conocida. En la realidad, NO se conoce; de modo que nunca se conoce con
seguridad si el intervalo obtenido lo cubre o no. Sólo se tiene confianza de que esto suceda.
Hasta aquí se trabajó con una probabilidad de 0,95 para el intervalo aleatorio, lo cual
significa un nivel de confianza del 95 % para el intervalo de confianza. El valor 1,96 es el
percentil 0,975 de la distribución normal estándar, es decir, el valor que acumula una
probabilidad de 0,975 en dicha distribución. Si se desea fijar otro valor para el nivel de
confianza, cambiará el valor del percentil. En general, se define un nivel de confianza (1 –
α) y la probabilidad restante, α, se divide en partes iguales a ambos lados de la distribución
muestral, como se observa en la Figura 9. El percentil correspondiente es el percentil (1 –
α/2). Por ejemplo, si se busca un nivel de confianza del 99 %, el percentil correspondiente
es Z0,995 = 2,575; mientras que si interesa una confianza del 98 %, el percentil
5
Pα/2 P1-α/2
Fig. 9. Percentiles utilizados en la construcción de los intervalos
E z(1 α / 2 )x σ/ n (4)
De (4) se observa que el máximo error de estimación (E), el nivel de confianza (1-
α) y el tamaño de la muestra (n), están estrechamente vinculados entre sí. Un
aumento o disminución en cualquiera de ellos afectará, sin dudas, a los
restantes. Esto se representa en la Figura 10.
6
Fig.10. (Tomada del libro “Estadística Elemental. Lo esencial” 11ª.ed., de R. Johnson y P. Kuby).
El máximo error de estimación (E), el nivel de confianza (1-α) y el tamaño de la muestra (n), están
estrechamente vinculados entre sí.
Un aumento o disminución en cualquiera de ellos afecta a los restantes.
Solución
Población física: ∞ operaciones de acabado metálico
Variable aleatoria: X: % de desperdicio
X ~ N(µ, σ = 0,3 %)
Parámetro de interés: µ: porcentaje de desperdicio promedio de las operaciones de acabado
metálico que realiza la empresa.
7
La media muestral observada es X = 5,07 % Ese valor se utiliza para estimar
puntualmente al parámetro. Pero la estimación puntual no da información sobre la
precisión de la estimación ni sobre el riesgo de obtener inferencias erróneas.
Conviene dar una estimación por intervalo de confianza que se apoya en la distribución
muestral del estadístico
I.C. 95%, µ: (5, 07 1, 96x 0, 08 μ 5, 07 1, 96x 0, 08) → I.C. 95%, µ: (4,91 ; 5,23)
Este intervalo cubre al porcentaje de desperdicio promedio poblacional con una confianza del
95 %.
A partir del intervalo, también pueden responderse preguntas sobre el valor del
parámetro y tomar decisiones. Suponga, por ejemplo que si el % promedio de
desperdicio de la operación supera 5,3 %, se requiere hacer ajustes en el proceso
para que dicho desperdicio disminuya. Con un nivel de confianza del 95 %, los
posibles valores para µ son menores que 5,30. De ahí que pueda considerarse
(corriendo un riesgo del 5 %) que es razonable pensar que µ < 5,30 % y por lo tanto no
hace falta hacer ajustes en el proceso.
8
6-2-2 Estimación por intervalo para la media de una población normal (µ),
cuando σ es desconocido
I.A(1-α)%, µ: (X t S/ n
( n 1 ),( 1 α / 2 )
μ X tn ( 1 ),(1 α / 2 )
S / n) (9)
Solución
Población física: ∞ piezas metálicas
Variable aleatoria: X: longitud (en mm) X ~ N(µ, σ)
Parámetro de interés: µ: longitud promedio de las infinitas piezas
9
X ~ N(µ, σ) , pero no se conoce la desviación estándar poblacional.
Se define un nivel de confianza del 99 %. Entonces, (1-α) = 0,99 y t(9, 0,995) = 3,2498. La media
muestral es X = 13,04 mm y el desvío estándar muestral es s = 1,009 mm
2
6-2-3 Estimación por intervalo para la variancia de una población normal (σ )
2
Esta estimación se basa en la distribución Х presentada brevemente en la primera
parte de este material. Si la normalidad es razonable, entonces, los intervalos aleatorio
y de confianza tienen las siguientes expresiones:
(n 1)S2 (n 1)S2
I.A.(1-α, σ2): ( ; )
χ 2 α/ 2 χ 21 α/ 2
(14)
(n 1)s2 (n 1)s2
I.C.(1-α, σ2): ( ; 2 )
χ 2 α/ 2 χ 1 α/ 2
(15)
2
Observación: para el caso del intervalo de la variancia, los valores de la distribución Х no son
los percentiles, sino los que tienen a su derecha la probabilidad indicada.
Solución
Población física: ∞ piezas metálicas
Variable aleatoria: X: longitud (en mm) X ~ N(µ, σ)
2
Parámetro de interés: σ : variancia de las longitudes de las piezas.
10
X ~ N(µ, σ)
2
Se define un nivel de confianza del 99 %. Entonces, (1-α) = 0,99 y los valores de la tabla Х
2 2
son: Х (9, 0,995) = 1,7349 y Х (9, 0,005) = 23,5893
El desvío estándar muestral observado es s = 1,009 mm
2 2
I.C. 99%, σ2: ( 9x 1, 009 ; 9x1, 009 )
23, 5893 1, 7349
2
I.C. 99%, σ : (0,388 ; 5,281)
Este intervalo cubre al valor de la variancia de las longitudes con una confianza del 99 %
fr (1 fr )
I.A.(1-α, π): fr z (1 α / 2 ) (16)
n
fo (1 fo )
I.C.(1-α, π): fo z (1 α / 2 ) (17)
n
Ejemplo 9: Una empresa garantiza los elementos que produce y reemplaza a sus
clientes los elementos que no cumplen las especificaciones. Históricamente sólo el 4
% de los elementos no cumplía las especificaciones; pero, en el último tiempo, los
reclamos de los compradores aumentaron y los ingenieros a cargo del proceso
sospechan que este porcentaje aumentó. Se seleccionó una muestra aleatoria de n =
150 elementos producidos y se observó que 9 no cumplían las especificaciones.
11
Solución:
Población física: ∞ elementos que produce la empresa
Variable aleatoria: X: 1 si el elemento no cumple las especificaciones
X: 0 si las cumple
X ~ Be(π)
Parámetro de interés: π: proporción de elementos que no cumplen las especificaciones
Con una confianza del 90 % se puede decir que el intervalo obtenido cubre a la proporción
poblacional de elementos que no cumplen las especificaciones.
Dado el planteo del problema, interesa saber si dicha proporción es mayor que 0,04. Como en
el intervalo hay valores menores y mayores que 0,04 no se puede afirmar nada en relación a
un posible aumento de dicha proporción. Se debe reducir la amplitud del intervalo, aumentando
el tamaño muestral.
I.C.(90%, π): (0,03; 0,09) I.C.(95%, π): (0,022 0,098) I.C.(99%, π): (0,01; 0,11)
Para pensar:
¿Puedo obtener un intervalo con un nivel de confianza muy alto y que a la vez
sea muy preciso?
12
PROBLEMAS PROPUESTOS
Stem-and-Leaf Display:
N = 100
Leaf Unit = 1,0
2 7 66
4 7 99
9 8 00011
24 8 222222333333333
41 8 44444444455555555
(28) 8 6666666666666677777777777777
31 8 888888888899999999999
10 9 00000001
2 9 2
1 9 4
13
a) Analice la información y comente sus conclusiones
10490 - 16620 - 17300 - 15480 - 12970 - 17260 - 13400 - 13900 13260 - 14370 - 11700 -
15470 - 17840 - 14070 - 14760 - 13630
a) ¿Puede afirmar que se cumple lo pretendido por los productores de los paneles de
madera de pino? Justifique exhaustivamente su respuesta
b) ¿Cuánto vale el error de la estimación obtenida? ¿Con qué alternativas cuenta para
reducirlo?
7200 - 6100 - 7300 - 7300 - 8000 - 7400 - 7300 - 7300 - 8000 - 6700
14
Suponga que las 10 observaciones obtenidas se pueden considerar una muestra
aleatoria de una población con distribución normal y que se conoce que la desviación
estándar de la resistencia al estallamiento para ese tipo de soldaduras (σ) es 500
unidades.
10- En una industria automotriz, los ingenieros a cargo de uno de los procesos de
ensamblado están investigando el tiempo (en segundos) que demanda dicho proceso.
Si el tiempo promedio supera los 93 segundos, máximo valor admitido por la empresa,
se implementará un programa de capacitación para todos los operarios que trabajan
en el sector ensamblado. Para decidir si es necesario implementar el programa de
capacitación se toma una muestra aleatoria de 20 tiempos. Los resultados obtenidos
son los siguientes:
93 - 90 - 97 - 90 - 93 - 91 - 96 - 94 - 91 - 91 - 88 - 93 - 95 - 91 - 89 - 92 - 87- 88 - 90 - 86
15
a) ¿Puede afirmar que la proporción de autopartes que fallan es superior a 0,025?
Justifique claramente su respuesta, utilizando un nivel de confianza del 90 %
12- Una maderera minorista inspecciona los embarques que le llegan de sus
proveedores. Para los embarques de una madera de calidad selecta el supervisor
selecciona una muestra aleatoria de 144 hojas de un embarque que tiene decenas de
miles de hojas. En dicha muestra, 18 hojas no pueden venderse como de primera
calidad. Si el embarque tiene más del 15 % de hojas de segunda calidad, no es
rentable para la empresa minorista.
a) En base a los datos de la muestra, ¿qué puede concluir Ud. sobre la rentabilidad
del embarque? Justifique su respuesta.
16