Beruflich Dokumente
Kultur Dokumente
Versión 1.2
Marzo de 2017
ANALISIS ESTADISTICO PARA LA INGENIERIA
Tabla de contenidos
PROBLEMA 1
Cierta empresa realizó un estudio para poder aplicar un producto que consiste en una pasta
flexible cementicia, para reparar defectos en los muros de concreto. El fabricante advierte
que se debe aplicar cuando la temperatura se encuentre entre 5°C y 30°C ; y la humedad
relativa del aire debe ser menor a 81%. De los ensayos realizados con la pasta, en diferentes
días, se tomó una muestra y se obtuvieron los siguientes resultados sobre la temperatura y 3
la humedad:
a) Según la información proporcionada. ¿Se puede afirmar que existe una menor
dispersión en la temperatura, en los ensayos en que la humedad relativa es inferior
al 40% que en los ensayos con humedad relativa de por lo menos 40%?
b) ¿En qué porcentaje de los ensayos en que se aplicó el producto, no estaban las
condiciones que indica el fabricante?
c) A consecuencia del cambio climático, se espera que la humedad relativa del aire
aumente en un 4%. Usando propiedades. ¿Cuál será la nueva humedad relativa
promedio y su desviación típica?
SOLUCIÓN 1-A
Datos
Sea:
X: Temperatura, cuando la humedad relativa es inferior al 40%, en °C.
Es conveniente realizar una tabla que contenga los parámetros específicos que se van a
analizar, como se expone a continuación.
Es por esto, que para realizar un análisis comparativo en cuanto a la dispersión entre ambas
distribuciones asociadas a la variable Temperatura, se estudiará el coeficiente de variación,
el cual se obtiene a partir de la ecuación (1.1)
𝑠(𝑥)
𝐶. 𝑉(𝑥) = (1.1)
𝑥
Así, los coeficientes de variación estarán dados de la siguiente forma:
𝑠(𝑥) 5,547
→ 𝐶. 𝑉(𝑥) = = = 0,261 → 26,1% 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑
𝑥 21,248
𝑠(𝑦) 6,433
→ 𝐶. 𝑉(𝑦) = = = 0,466 → 46,6% 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑
𝑦 13,800
Conclusión
A partir del análisis del coeficiente de variación, es posible afirmar que existe una menor
dispersión en la temperatura, en los ensayos en que la humedad relativa es inferior al 40%,
que en los ensayos con humedad relativa de por lo menos 40%. Esto se justifica, debido a
que 𝐶. 𝑉(𝑥) < 𝐶. 𝑉(𝑦)
SOLUCIÓN 1-B
𝑛∙𝑘
𝑎𝑖 ∙ ( 100 − 𝑁𝑖−1 )
𝑃𝑘 = 𝑋𝑖−1 + (1.2)
𝑛𝑖
Dónde:
✓ 𝑃𝑘 : 𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑘
✓ 𝑋𝑖−1 : 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑒𝑛 𝑞𝑢𝑒 𝑠𝑒 𝑒𝑠𝑡á 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑛𝑑𝑜.
✓ 𝑎𝑖 : 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑒𝑛 𝑞𝑢𝑒 𝑠𝑒 𝑒𝑠𝑡á 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑛𝑑𝑜.
✓ 𝑛: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎.
5
✓ 𝑘: 𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑐𝑜𝑛𝑡𝑒𝑛𝑖𝑑𝑜𝑠 𝑑𝑒𝑠𝑑𝑒 𝑒𝑙 𝑐𝑜𝑚𝑖𝑒𝑛𝑧𝑜 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 ℎ𝑎𝑠𝑡𝑎
𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑑𝑜 (𝑃𝑘 )
✓ 𝑁𝑖−1 : 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝐴𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑠𝑜𝑐𝑖𝑎𝑑𝑎 𝑎𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎𝑙 𝑞𝑢𝑒 𝑠𝑒 𝑒𝑠𝑡á
𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑛𝑑𝑜.
✓ 𝑛𝑖 : 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝐴𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑎𝑠𝑜𝑐𝑖𝑎𝑑𝑎 𝑎𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑒𝑛 𝑞𝑢𝑒 𝑠𝑒 𝑡𝑟𝑎𝑏𝑎𝑗𝑎.
Temperatura 𝒏𝒊 𝑵𝒊
3 - 8,4 9 9
8,4 – 13,8 13 22
13,8 – 19,2 23 45
19,2 – 24,6 24 69
24,6 – 30,0 21 90 = n
Tabla 3. Temperatura expresada en intervalos, con sus respectivas frecuencias absolutas y acumuladas.
90 ∙ 𝑘
5,4 ∙ ( 100 − 0)
→ 𝑃𝑘 = 3 + → 𝑘 = 3,7%
9
Conclusión
En un 3,7% de los productos, no estaban las condiciones que indica el fabricante.
SOLUCIÓN 1-C
Sea
H: Humedad relativa del aire, expresada en porcentaje.
𝐻`: Nueva humedad posterior al cambio climático.
En general, siendo “X” una variable cualquiera, y “a” y “b” constantes, se tienen las
siguientes propiedades del promedio y la desviación estándar. 6
Promedio
Desviación Estándar
Para efectos del ejercicio, es necesario definir matemáticamente la variable 𝐻`, lo cual se
expone a continuación.
4
𝐻` = 𝐻 + ∙ 𝐻 = 1,04 ⋅ 𝐻
100
Así, es posible relacionar la expresión 𝐻` = 1,04 ⋅ 𝐻 con la generalidad expuesta
anteriormente. Esto, asociando la variable “X” con “H”, y por otro lado las constantes “a” y
“b” con los valores 1,04 y 0 respectivamente.
Conclusión
La nueva humedad relativa promedio dada por el cambio climático y su desviación típica,
están dados por 39,694% y 14,127 respectivamente.
PROBLEMA 2
La información siguiente corresponde a longitudes en milímetros de 36 piezas fabricadas
en un proceso:
Longitud Stem-and-Leaf Plot
n mínimo máximo ∑x ∑ x2
36 31,0 32,8 1152,6 36907,06
Tabla 4. Datos asociados a longitudes de piezas fabricadas en un proceso.
SOLUCIÓN
Según lo requerido en el enunciado es necesario obtener el promedio y la desviación
estándar de las 36 piezas fabricadas en el proceso. A continuación, se expone el cálculo de
dichos parámetros.
Promedio
∑ 𝑥 1152,6
𝑥= = = 32,017 [𝑚𝑚]
𝑛 36
Desviación Estándar Muestral
Con el fin de encontrar una ecuación más práctica, considerando la forma en que se
entregan los datos en el presente problema, se reducirá la fórmula de la varianza de la
siguiente forma.
𝑘 𝑘 𝑘
(𝑥𝑖 − 𝑥)2 1 1 2
𝑉(𝑥) = ∑ = ∙ ∑(𝑥𝑖 − 𝑥)2 = ∙ ∑(𝑥𝑖 2 − 2 ⋅ 𝑥𝑖 ⋅ 𝑥 + 𝑥 )
𝑛−1 𝑛−1 𝑛−1
𝑖=1 𝑖=1 𝑖=1
𝑘 𝑘 𝑘
1 2
→ 𝑉(𝑥) = ( ∑ 𝑥𝑖 2 − 2 ∑ 𝑥𝑖 ⋅ 𝑥 + ∑ 𝑥 )
𝑛−1 8
𝑖=1 𝑖=1 𝑖=1
𝑘 𝑘
1 2
→ 𝑉(𝑥) = ( ∑ 𝑥𝑖 2 − 2 ⋅ 𝑥 ∑ 𝑥𝑖 + 𝑥 ⋅ 𝑛)
𝑛−1
𝑖=1 𝑖=1
𝑘 𝑘
1 𝑛 2
→ 𝑉(𝑥) = ( ∑ 𝑥𝑖 2 − 2 ⋅ 𝑥 ∑ 𝑥𝑖 ⋅ + 𝑥 ⋅ 𝑛)
𝑛−1 𝑛
𝑖=1 𝑖=1
𝑘
1 2
→ 𝑉(𝑥) = ( ∑ 𝑥𝑖 2 − 2 ⋅ 𝑥 ⋅ 𝑛 ∙ 𝑥 + 𝑥 ⋅ 𝑛)
𝑛−1
𝑖=1
𝑘
1 2 2
→ 𝑉(𝑥) = ( ∑ 𝑥𝑖 2 − 2 ⋅ 𝑥 ⋅ 𝑛 ∙ +𝑥 ⋅ 𝑛)
𝑛−1
𝑖=1
2
∑𝑘𝑖=1 𝑥𝑖 2 − 𝑛 ∙ 𝑥
→ 𝑉(𝑥) = (1.4)
𝑛−1
Así, reemplazando los valores dados en la ecuación (1.4) se obtiene la varianza muestral.
36907,06 − 36 ∙ 32,0162
→ 𝑉(𝑥) = = 0,1767
36 − 1
Luego, se sabe que la desviación estándar se relaciona con la varianza, de la forma expuesta
en la ecuación (1.5)
Conclusión
A partir del gráfico de tallo y hoja, es posible afirmar que existen 2 piezas con longitud 9
inferior a 31,6 [mm] de un total de 36 piezas estudiadas.
PROBLEMA 3
Se realiza un estudio para evaluar el diámetro (X), expresado en milímetros, de cierto
producto utilizado en el ensamblaje de ciertas piezas, requeridas en construcciones
antisísmicas.
Se obtuvo la siguiente información en una muestra de 200 productos, provenientes de cada
una de tres máquinas: A , B Y C
Máquinas
Diámetro 10
A(%) B(%)
4,95 – 7,25 5,0 7,5
7,25 – 9,55 26,0 13,0
9,55 – 11,85 37,5 17,0
11,85 – 14,15 12,5 34,0
14,15 – 16,45 10,0 15,0
16,45 – 18,75 9,0 13,5
Total 100 100
Tabla 5. Representación del diámetro expresado en milímetros de cierto producto, en las máquinas A y B.
Máquina C
200
∑ 𝑥𝑖 = 2798,90
𝑖=1
200
∑ 𝑥𝑖2 = 40891,3
𝑖=1
a) Se cree que la distribución del diámetro de los productos fabricados por la máquina
C es más homogénea que en los productos fabricados por la máquina A. Analice la
aseveración utilizando medidas estadísticas adecuadas.
c) Suponga que por error se ingresa un producto con diámetro de 16,4 milímetros
cuando su valor correcto es de 6,4 milímetros en la máquina C. Determine cuál sería
el valor correcto de la desviación estándar del diámetro del producto de la máquina
C, justificando su respuesta.
SOLUCIÓN 3 - A
Sea:
𝑋𝑖 : Diámetro de cierto producto en milímetros, provenientes de la máquina "𝑖" ,con 𝑖 =
𝑎, 𝑏, 𝑐
Observación
Para el caso de la desviación típica, se reemplazará en las ecuaciones (1.4) y (1.5), ya
expuestas en problemas anteriores.
∑ 𝑥𝑖 2798,90
→ 𝑥𝑐 = = = 13,995 [𝑚𝑚]
𝑛 200
s(𝑥𝑐 ) 2,942
→ 𝐶. 𝑉(𝑥𝑐 ) = ∙ 100% = ∙ 100% = 21,02%
𝑥𝑐 13,995
Por otro lado, para calcular el coeficiente de variación de los productos provenientes de la
máquina A, se calculará el promedio y la desviación estándar directo de la calculadora, a
partir de la siguiente tabla.
Máquina A
𝒙𝒊 𝑛𝑖
6,1 10
8,4 52
10,7 75
13 25
15,3 20
17,6 18
Tabla 7. Representación de marcas de clase y distribución de frecuencias de productos provenientes de máquina A.
→ 𝑥𝐴 = 11,2405 [𝑚𝑚]
→ 𝑆(𝑥𝐴 ) = 3,0413[𝑚𝑚]
3,0413
→ 𝐶. 𝑉(𝑥𝐴 ) = ∙ 100% = 27,056%
11,2405
Conclusión
A partir del análisis de coeficientes de variación, se observa que 𝐶. 𝑉(𝑥𝐴 ) > 𝐶. 𝑉(𝑥𝐶 ). Según 12
lo anteriormente expuesto, es posible afirmar que los diámetros de ciertos productos
provenientes de la máquina C son más homogéneos que la distribución de diámetros de
productos provenientes de la máquina A.
SOLUCIÓN 3 – B
Sea:
En general, se sabe que al realizar un análisis comparativo entre dos o más distribuciones
de cierta variable, se cumple la siguiente relación:
→ 𝑥𝐵 = 12,4595
→ 𝑠(𝑥𝐵 ) = 3,26067
3,26067
→ % 𝑑𝑒 𝑉𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑎𝑛𝑡𝑒𝑠 𝑑𝑒𝑙 𝑎𝑗𝑢𝑠𝑡𝑒 = ∙ 100% = 26,17%
12,4595
𝑋`𝐵 = 𝑥𝐵 − 1,5
Así, aplicando propiedades del promedio y la desviación típica, se obtienen los siguientes
valores de dichos parámetros.
Conclusión
A partir del análisis del porcentaje de variabilidad, es posible afirmar que la distribución de
diámetros de productos provenientes de la máquina B posterior al ajuste realizado es más
heterogénea que la de los productos provenientes de la máquina B antes del ajuste.
SOLUCIÓN 3 – C
Sea:
𝑋𝑐´ : Diámetro modificado, en milímetros, de productos provenientes de la máquina C.
Conclusión
Según las expresiones expuestas anteriormente, el valor correcto de la desviación
estándar del diámetro del producto proveniente de la máquina C corresponde a
2,985[mm]
PROBLEMA 4
Se ha realizado un estudio en una empresa dedicada al área de las telecomunicaciones,
conductividad y redes, para ello se evaluaron entre otras variables, tipo de redes (Y) y el
costo de los productos, en miles de pesos (X); medidas en una muestra de 100 productos
de esta empresa, las cuales se muestran en la siguiente tabla:
Si el costo del producto es inferior a 180 mil pesos, se obtiene una utilidad diaria de
$5000, si fluctúa entre 180 mil pesos y 400 mil pesos, la utilidad aumenta en un 15%
y si el costo es superior a 400 mil pesos, la utilidad inicial sólo en un 10%.
Determine la utilidad promedio por producto.
c) Para comparar los costos de los primeros productos, para redes de empresas, se
solicita otro estudio de una muestra de 28 productos del año anterior.
Informe de costos de productos de redes para empresas
Tallo Hoja Frecuencia
2 699 3
3 011155568 9
4 003567889 9
5 244459 6
6 1 1
Compare la dispersión del costo entre los dos estudios realizados e indique cual se
comporta en forma más homogénea.
SOLUCIÓN 4 - A
Sea:
𝑋: Costo de los productos utilizados en una empresa de Telecomunicaciones, en miles de
pesos.
Observación 15
Es necesario notar que el estudio solicitado, se aplica exclusivamente a redes para edificios.
Es por esto que se realiza la siguiente tabla para facilitar dicho análisis.
Cálculo de Mediana
Variables Discretas
𝑥𝑛+1 , 𝑠𝑖 𝑛 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟
2
𝑀𝑒(𝑥) = { 𝑥𝑛 + 𝑥𝑛+1 (1.6)
2 2
, 𝑠𝑖 𝑛 𝑒𝑠 𝑝𝑎𝑟
2
Variables Contínuas
𝑎𝑖 𝑛
𝑀𝑒(𝑥) = 𝑥𝑖−1 + ∙ ( − 𝑁𝑖−1 ) (1.7)
𝑛𝑖 2
Es importante denotar que las variables contenidas en la ecuación (1.7) coinciden con la de
cálculo de percentiles, expuesta en la ecuación (1.2). Esto se explica ya que la mediana de
una distribución de variable representa el dato ubicado en el centro de ésta, por lo que su
valor es equivalente al del percentil 50.
Así, calculamos la mediana del costo, a partir de la ecuación (1.7) debido a que esta variable
estudiada es de tipo contínua.
100 40
→ 𝑀𝑒(𝑥) = 𝑃50 = 300 + ∙ ( − 15)
12 2 16
Polígono de Frecuencias
SOLUCIÓN 4 – B
Sea:
Así, es necesario saber la cantidad de casas que se encuentran en cada intervalo de “X”. Es
por esto, que a continuación se calculará el porcentaje de datos concentrados hasta los
$180.000 en costo, con ayuda de la fórmula de percentiles, expuesta en la ecuación (1.2)
32 ∙ 𝑘
( 100 − 0)
→ 180 = 100 + 100 ∙
15
→ 𝑘 = 37,5%
Así, la utilidad promedio queda dada a partir de la ecuación (1.9), donde “X” corresponde a
una variable cuantitativa cualquiera.
𝑥̅ = ∑ 𝑥𝑖 ∙ ℎ𝑖 (1.9)
̅ = ∑ 𝑢𝑖 ∙ ℎ𝑖
→𝑈
= 5461
Conclusión
La utilidad promedio obtenida por las ventas de redes para casas en la empresa de
Telecomunicaciones, corresponde a 5461 pesos.
18
SOLUCIÓN 4 – C
Con el fin de facilitar el análisis comparativo, para el presente inciso se considerarán las
siguientes variables:
𝑠(𝑥1 ) 68,525
→ 𝐶. 𝑉(𝑋1 ) = = = 0,190 → 19% 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑
𝑥1
̅̅̅ 360,714
𝑠(𝑥2 ) 101,715
→ 𝐶. 𝑉(𝑋2 ) = = = 0,241 → 24,1% 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑
𝑥2
̅̅̅ 421,429
Observación
Los valores expuestos anteriormente pueden ser obtenidos directamente con la calculadora,
o bien “manualmente” a partir de las fórmulas de varianza (1.4) y promedio.
Conclusión
A partir del análisis de coeficiente de variación, es posible afirmar a partir de la evidencia
estadística que se dispone, que la variable asociada a la distribución de costos del presente
año es más homogénea que la asociada a los costos del año anterior.
19
Unidad 2 - Probabilidades
PROBLEMA 1
El porcentaje de reclamos en una empresa de correos es de 15%, se realiza un seguimiento
de estos reclamos ya que esta cifra se considera excesiva. Se toma una muestra de 25
despachos. ¿Cuál es la probabilidad de que al menos dos de ellos tengan reclamos?
SOLUCIÓN
20
En los ejercicios de probabilidades, SIEMPRE antes de realizar cualquier cálculo, se
recomienda definir claramente los sucesos que se estudian, y expresar matemáticamente
tanto las probabilidades que se piden como las que se estipulan en el enunciado.
Definición de Sucesos
Sea:
R: Existe un reclamo en un despacho realizado en una empresa de correos.
Definición de Probabilidades
→ 𝑃(𝑅) = 0,15
Se pide la probabilidad de que al menos dos de ellos tengan reclamos, lo que quiere decir
que tengan reclamos 2,3,4, 5, … o 25 despachos. Es por esto que se decide analizar el
complemento de lo que se requiere, vale decir que de un total de 25 despachos, ninguno
presente reclamos o uno presente reclamos, lo que escrito en términos “informales” estará
dado por:
Es necesario conocer 𝑃(𝑅 𝐶 ), para lo que se utilizará la ecuación (2.1), en la que “A”
corresponde a un suceso cualquiera.
→ 0,907
Conclusión
La probabilidad de que, en una muestra de 25 despachos, al menos dos presenten reclamos
es de un 90,7%
PROBLEMA 2
El MOP quiere inscribir 4 nuevas carreteras, para lo cual llamará a 4 licitaciones. Por las
condiciones impuestas solo podrían adjudicárselas las empresas Alfa y Beta. Estas empresas
por decisión de sus respectivos directorios, llegaron al acuerdo siguiente: si una de ellas se
adjudica dos de las carreteras en forma consecutiva, la otra no seguirá participando. Por
antecedentes que se manejan, Alfa tiene una probabilidad constante de ganar en cualquiera
de estas licitaciones de 0,6 y Beta de 0,4. ¿Cuál es la probabilidad de que Beta “no siga
participando”?
22
SOLUCIÓN
Definición de Sucesos
Definición de Probabilidades
→ 𝑃(𝐴) = 0,6
→ 𝑃(𝐵) = 0,4
A
A
B
A
A
B B
B
A
A
B
Ilustración 4. Representación de que la empresa “𝛽” no siga participando, habiendo ocurrido A en la primera licitación.
A
A
B B
B
Ilustración 5. Representación de que la empresa “𝛽” no siga participando, habiendo ocurrido B en la primera licitación.
→ 𝑃(𝐴 ∩ 𝐴) ∪ 𝑃(𝐵 ∩ 𝐴 ∩ 𝐴)
Al ser A y B sucesos independientes, la expresión que se requiere calcular queda dada como
se muestra a continuación.
→ 𝑃(𝐴 ∩ 𝐴) ∪ 𝑃(𝐵 ∩ 𝐴 ∩ 𝐴)
Conclusión
La probabilidad de que la empresa “Beta” no siga participando es de un 50,4%
24
PROBLEMA 3
En una planta industrial adquieren reguladores de voltaje de tres diferentes fabricantes B1,
B2 y B3; el 50% de los reguladores se compran a B1, el 34% se compran a B2 y el resto a B3.
El porcentaje de reguladores que resultan defectuosos, de los fabricados por B1 es 6%, de
los fabricados por B2 es 10% y de los reguladores adquiridos a B3 el 92% resultan buenos.
SOLUCIÓN
Definición de Sucesos
Definición de Probabilidades
→ 𝑃(𝐵1 ) = 0,5
→ 𝑃(𝐵2 ) = 0,34
→ 𝑃(𝐷/𝐵1 ) = 0,06
→ 𝑃(𝐷/𝐵2 ) = 0,1
→ 𝑃(𝐷𝐶 ) = ?
→ 𝑃(𝐵1 /𝐷𝐶 ) = ?
→ 𝑃(𝐵2 /𝐷𝐶 ) = ?
→ 𝑃(𝐵3 /𝐷𝐶 ) = ?
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴⁄𝐵 ) = (2.2)
𝑃(𝐵)
26
𝑃(𝐷 ∩ 𝐵1 )
→ 𝑃(𝐷/𝐵1 ) = → 𝑃(𝐷 ∩ 𝐵1 ) = 0,5 ∙ 0,06 = 0,03
𝑃(𝐵1 )
𝑃(𝐷 ∩ 𝐵2 )
→ 𝑃(𝐷/𝐵2 ) = → 𝑃(𝐷 ∩ 𝐵2 ) = 0,34 ∙ 0,1 = 0,034
𝑃(𝐵2 )
𝐶
𝑃(𝐷𝐶 ∩ 𝐵3 ) 𝑃(𝐵3 ) − 𝑃(𝐷 ∩ 𝐵3 )
→ 𝑃(𝐷 /𝐵3 ) = 0,92 → = = 0,92
𝑃(𝐵3 ) 𝑃(𝐵3 )
27
𝐶)
𝑃(𝐵2 ∩ 𝐷𝐶 ) 𝑃(𝐵2 ) − 𝑃(𝐵2 ∩ 𝐷) 0,34 − 0,034
→ 𝑃(𝐵2 /𝐷 = = = = 0,3315
𝑃(𝐷𝐶 ) 𝑃(𝐷𝐶 ) 0,9232
Conclusión
El regulador extraído al azar que resultó no defectuoso es más probable que provenga de
los fabricados por 𝐵1, con una probabilidad correspondiente a un 53,9%
PROBLEMA 4
Una empresa dedicada a transportar carga pesada dentro de una mina posee tres camiones
para el trabajo diario. Si el 40% de las veces se utiliza el camión A, el 25% utiliza el camión
C, el 15% de las veces se utiliza el camión A y C, el 48% se utiliza el camión B cuando se ha
utilizado el camión C, el 30% de los días no se utiliza ninguno de los 3 camiones. Además, el
25% de las veces se utiliza el camión B y no el A. Se elige al azar un día de trabajo, determine
la probabilidad que, en ese día, la empresa sólo utilice uno de los tres camiones. Utilice
propiedades de las probabilidades. 28
SOLUCIÓN
Definición de Sucesos
A: Se utiliza el camión A.
B: Se utiliza el camión B.
C: Se utiliza el camión C.
Definición de Probabilidades
→ 𝑃(𝐴) = 0,4
→ 𝑃(𝐶) = 0,25
→ 𝑃(𝐵) = 0,35
→ 𝑃(𝐴 ∩ 𝐶) = 0,15
→ 𝑃(𝐵/𝐶) = 0,48
→ 𝑃(𝐵 ∩ 𝐴𝐶 ) = 0,25
→ 𝑃(𝐴𝐶 ∩ 𝐵 𝐶 ∩ 𝐶 𝐶 ) = 0,3
𝐵 𝑃(𝐵 ∩ 𝐶)
→ 𝑃 ( ) = 0,48 → = 0,48 → 𝑃(𝐵 ∩ 𝐶) = 0,48 ∙ 0,25 = 0,12
𝐶 𝑃(𝐶)
= 0,22
= 0,2
= 0,05
= 0,47
Conclusión
La probabilidad de que en el día de trabajo elegido al azar, la empresa sólo utilice uno de 31
los tres camiones es de un 47%.
PROBLEMA 5
En un estudio realizado, por una compañía de seguros, sobre las causas mecánicas que
provocan accidentes de tránsito, se encontró que las más frecuentes son por frenos,
dirección y neumáticos. El estudio mostró que el 48% de los accidentes se deben a causa de
los frenos, el 30% a causa de los neumáticos, el 10% a causa de la dirección, el 9% a frenos
y neumáticos, el 4% a neumáticos y dirección, el 51% a frenos o dirección. La probabilidad
que haya presentado todas las causas mencionadas es de 0,01. Además, se detectó que de
todos los automóviles involucrados en accidentes un 25% no tenía contratado un seguro y
que de ellos un 10% sufrió un accidente grave, en cambio de los que tenían seguro un 18% 32
sufrió un accidente grave.
SOLUCIÓN 5-A
Definición de Sucesos
Definición de Probabilidades
→ 𝑃(𝐹) = 0,48
→ 𝑃(𝑁) = 0,3
→ 𝑃(𝐷) = 0,1
→ 𝑃(𝐹 ∩ 𝑁) = 0,09
33
→ 𝑃(𝑁 ∩ 𝐷) = 0,04
→ 𝑃(𝐹 ∪ 𝐷) = 0,51
→ 𝑃(𝐹 ∩ 𝐷 ∩ 𝑁) = 0,01
→ 𝑃 (𝐴⁄ 𝑆 𝐶 ) = 0,1
→ 𝑃( 𝑆 𝐶 ) = 0,25
→ 𝑃(𝐴⁄𝑆) = 0,18
→ 𝑃(𝐴) = ?
Así, las probabilidades asociadas a los automóviles que sufren accidentes, quedan dadas
como se muestra a continuación.
𝑃(𝐴 ∩ 𝑆)
→ 𝑃(𝐴⁄𝑆) = 0,18 → = 0,18
𝑃(𝑆)
𝐴 𝑃(𝐴 ∩ 𝑆 𝐶 )
→ 𝑃 ( ⁄ 𝑆 𝐶 ) = 0,1 → = 0,1
𝑃( 𝑆 𝐶 )
𝑃(𝐴) − 𝑃(𝐴 ∩ 𝑆)
→ = 0,1
1 − 𝑃(𝑆)
→ 𝑃(𝐴) = 0,16
Observación
La descomposición de probabilidades condicionadas, se ha realizado a partir del Teorema
de Bayes y las Leyes de Morgan. Estas propiedades han sido representadas en las ecuaciones
(2.2) y (2.3)
Conclusión
La probabilidad que el automóvil sufra accidente grave corresponde a un 16%.
SOLUCIÓN 5-B
→ 𝑃(𝐹 ∪ 𝐷 ∪ 𝑁⁄𝐴) = ?
Primero que todo, se procederá a descomponer la probabilidad 𝑃(𝐹 ∩ 𝐷), a partir de los
datos estipulados en el enunciado.
𝑃((𝐹 ∪ 𝐷 ∪ 𝑁) ∩ 𝐴)
→ 𝑃(𝐹 ∪ 𝐷 ∪ 𝑁⁄𝐴) =
𝑃(𝐴)
Reemplazando, se obtiene:
= 0,69
Conclusión
La probabilidad de que sólo se asocie una causa de las estudiadas en este problema a un
automóvil que sufre un accidente, es de un 69%.
SOLUCIÓN 5-C
→ 𝑃(𝑆) = 0,75
Sea:
Probabilidad Requerida:
𝑃(𝑋 ≥ 3) = ?
15
= 1 − [𝑃(𝑆 𝐶 )15 + 15 ∙ 𝑃(𝑆) ∙ 𝑃(𝑆 𝐶 )14 + ( ) ∙ 𝑃(𝑆)2 ∙ 𝑃(𝑆 𝐶 )13 ]
2
15 (0,25)2 (1
= 1 − [(1 − 0,25)15 + 15 ∙ (0,25) ∙ (1 − 0,25)14 + ( )∙ ∙ − 0,25)13 ]
2
= 0,7639
Conclusión
La probabilidad que por lo menos 3 de los 15 automóviles elegidos de forma aleatoria
tengan un contrato de seguro corresponde a un 76,39%
PROBLEMA 6
En un estudio encargado por la gerencia de ciertos servicentros de Santiago, parte de él se
enfocó a clientes con vehículos del último año (A), vehículos que usan Diesel (D) y clientes
que pagan el combustible con tarjeta de crédito (T), obteniéndose la siguiente información:
P(A)=0,17 P(A∩D)=0,06
P(D)= 0,10 P(A∩ T)=0,08
P(T)= 0,36 P(Dc∩ T)=0,33
37
Además, el 52% de los vehículos no tienen ninguna de las tres características anteriores.
Si un cliente elegido al azar no paga con tarjeta de crédito. ¿Cuál es la probabilidad que su
vehículo sea del último año y no use Diesel? Utilice propiedades de las probabilidades.
SOLUCIÓN
Definición de Sucesos
Definición de Probabilidades
P(A)=0,17 P(A∩D)=0,06
P(D)= 0,10 P(A∩ T)=0,08
P(T)= 0,36 P(Dc∩ T)=0,33
→ 𝑃(𝐴𝐶 ∩ 𝐷𝐶 ∩ 𝑇 𝐶 ) = 0,52
= 0,02
𝐶 𝑃((𝐴 ∩ 𝐷𝐶 ) ∩ 𝑇 𝐶 )
→ 𝑃 (𝐴 ∩ 𝐷 ⁄ 𝑇𝐶) = 𝑃( 𝑇 𝐶 )
𝑃(𝐴 ∩ 𝐷𝐶 ∩ 𝑇 𝐶 ) 39
=
1 − 𝑃(𝑇)
𝑃(𝐴 ∩ (𝐷 ∪ 𝑇)𝐶 )
=
1 − 𝑃(𝑇)
𝑃(𝐴 ∩ [1 − 𝐷 ∪ 𝑇])
=
1 − 𝑃(𝑇)
= 0,0781
Conclusión
La probabilidad de que el vehículo elegido al azar sea de último año y no use Diesel, dado
que el cliente no paga con tarjeta de crédito es de un 7,81%.
PROBLEMA 1
Una empresa que fabrica reproductores de DVD ha detectado que el número de aparatos
defectuoso (X) por partida, se puede considerar una variable aleatoria con la siguiente
función de cuantía:
𝑿 𝟎 𝟏 𝟐 𝟑 𝟒 𝟓
𝑷(𝒙) 0 0,66 0,15 0,12 0,05 0,02 40
Tabla 9. Distribución de probabilidades respecto al número de reproductores de DVD defectuosos.
SOLUCIÓN
Primero que todo, es importante denotar que "𝑋" es una variable aleatoria discreta. Esto,
debido a que no existen valores intermedios entre un valor que toma la variable y otro; por
ejemplo, entre 𝑋 = 0 "𝑎𝑝𝑎𝑟𝑎𝑡𝑜𝑠" Y 𝑋 = 1 (𝑎𝑝𝑎𝑟𝑎𝑡𝑜), no existen aparatos intermedios.
Se sabe, que en general la esperanza de una variable aleatoria discreta, se define como se
muestra en la ecuación (3.1), donde "𝑋" es una variable discreta cualquiera.
= 1,62
Conclusión
El número esperado de aparatos defectuosos por partida, corresponde a 1,62 “aparatos”
PROBLEMA 2
El tiempo que un adolescente hace funcionar su MP4, en cierto periodo, se considera una
variable aleatoria con función de densidad, en cientos de horas:
𝑥 𝑠𝑖 0 < 𝑥 < 1
𝑓(𝑥) = {2 − 𝑥 𝑠𝑖 1 ≤ 𝑥 < 2
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
SOLUCIÓN 2-A
Sea:
Para resolver este problema, es necesario identificar que “X” corresponde a una variable
aleatoria contínua. Para este tipo de variables, en general es válido utilizar la ecuación (3.2)
para el cálculo de probabilidades, donde “X” es una variable aleatoria continua cualquiera
y; “a” y “b” representan valores constantes.
𝑏
𝑃(𝑎 ≤ 𝑥 ≤ 𝑏) = ∫ 𝑓(𝑥) ∙ 𝑑𝑥 (3.2)
𝑎
1,5
∫0,6 𝑓(𝑥) ∙ 𝑑𝑥
= 0,6
1 − ∫0 𝑓(𝑥) ∙ 𝑑𝑥
1 1,5
∫0,6 𝑥 ∙ 𝑑𝑥 + ∫1 (2 − 𝑥) ∙ 𝑑𝑥 0,695
= 0,6 =
1 − ∫0 𝑥 ∙ 𝑑𝑥 0,82
= 0,848
Conclusión 42
De los adolescentes que hacen funcionar su MP4 más de 60 horas, un 84,8% lo hace
funcionar menos de 150 horas.
SOLUCIÓN 2-B
1 2
= ∫ 𝑥 ∙ 𝑥 ∙ 𝑑𝑥 + ∫ 𝑥 ∙ (2 − 𝑥) ∙ 𝑑𝑥
0 0
1 2
= ∫ 𝑥 2 ∙ 𝑑𝑥 + ∫ (2 ∙ 𝑥 − 𝑥 2 ) ∙ 𝑑𝑥
0 0
=1
Conclusión
El tiempo esperado, que un adolescente hace funcionar su MP4 corresponde a cien horas.
SOLUCIÓN 2-C
Primero que todo, se representará como 𝑃60 el punto mínimo en del 40% de los
adolescentes que más usan el dispositivo. Es decir, podría asociarse a que el valor 𝑃60
representa el percentil 60 de la distribución de la variable “X”. Es importante denotar, que
es éste valor 𝑃60 la incógnita que se requiere calcular, quedando esto representado de la
siguiente forma, en vista de los datos que se tienen: 43
Observación
Se nota que el valor 𝑃60 pertenece a la segunda parte de la función de densidad, esto se
puede explicar, debido a que anteriormente se ha determinado que el tiempo esperado
corresponde a 1 “cientos de horas”, lo que recae en la mitad de la distribución de
probabilidad. Lo anterior, queda demostrado analizando la integral de la primera parte de
la función de densidad, lo cual se expone a continuación:
1 1
→ ∫ 𝑓(𝑥) ∙ 𝑑𝑥 = ∫ 𝑥 ∙ 𝑑𝑥 = 0,5
0 0
Así, sabiendo que 𝑃60 pertenece a la segunda parte de la función de densidad, es válido
realizar el siguiente desarrollo:
𝑃60
→∫ 𝑓(𝑥) ∙ 𝑑𝑥 = 0,6
0
2
→ 1 − ∫ 𝑓(𝑥) ∙ 𝑑𝑥 = 0,6
𝑃60
2
→ 0,4 = ∫ (2 − 𝑥) ∙ 𝑑𝑥
𝑃60
𝑥2 2
→ 0,4 = [2 ∙ 𝑥 − ] |
2 𝑃60
22 𝑃60 2
→ 0,4 = [4 − − 2 ∙ 𝑃60 + ]
2 2
Despejando, se obtiene la siguiente ecuación cuadrática:
𝑃60 2
→ − 2 ∙ 𝑃60 + 1,6 = 0
2
Resolviendo la ecuación, se obtienen como soluciones:
→ 𝑃601 = 2,894 44
→ 𝑃602 = 1,106
Es posible notar, que 𝑃601 no pertenece al recorrido de la variable “X”, es por esto que el
valor válido corresponde a:
→ 𝑃60 = 1,106
Conclusión
El mínimo tiempo que hace funcionar su MP4, el 40% de los adolescentes que más lo usan
corresponde a 110,6 horas.
PROBLEMA 3
La demanda diaria de “pan especial” en una panadería es una variable aleatoria (X), en
cientos de Kilogramos, con función de densidad:
0,25 𝑠𝑖 2 < 𝑥 ≤ 6
𝑓(𝑥) = {
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
45
Si la panadería recibe una utilidad diaria, en (um); según la demanda de pan, que consiste
en que si la demanda se encuentra: entre 200 y menos de 300 kilos, la utilidad es de 30
(um); entre 300 y menos de 550 Kg, la utilidad es de 35 (um) y más de 550 Kg, la utilidad es
37 (um) ¿Cuál es la utilidad esperada?
SOLUCIÓN
Cálculo de Probabilidades
Es importante notar que “X” corresponde a una variable aleatoria contínua, por lo que el
cálculo de probabilidades necesarias se realiza en base a la ecuación (3.2), la cual ha sido
expuesta en problemas anteriores.
3
→ P(2 ≤ x ≤ 3) = ∫ 0,25 ∙ 𝑑𝑥 = 0,25
2
5,5
→ P(3 ≤ x ≤ 5,5) = ∫ 0,25 ∙ 𝑑𝑥 = 0,625
3
6
→ P(5,5 ≤ x ≤ 6) = ∫ 0,25 ∙ 𝑑𝑥 = 0,125
5,5
U 𝑷(𝑼)
30 0,25
35 0,625
37 0,125
Tabla 10. Distribución de probabilidad de utilidad obtenida, en unidades monetarias.
Así, es posible determinar la utilidad esperada, a partir de la ecuación (3.1), la cual ha sido
expuesta en problemas anteriores.
→ 𝐸(𝑈) = ∑ 𝑃(𝑈𝑖 ) ∙ 𝑈𝑖 46
= 34
Conclusión
La utilidad esperada corresponde a 34 unidades monetarias.
PROBLEMA 4
Una industria que elabora cierto dispositivo, compra el componente principal de su
producto a dos proveedores A y B. Los tiempos de vida útil (en miles de horas) de los
componentes tienen las siguientes funciones de densidad:
𝑥
;0 ≤ 𝑥 < 1
2
1 1
𝑓𝑋 (𝑥) = ;1 ≤ 𝑥 < 2 𝑓𝑌 (𝑦) = { ; 0 ≤ 𝑦 < 2,8
2 𝑘 47
3−𝑥 0 ; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
; 2≤𝑥<3
{ 2
SOLUCIÓN 4-A
Sea:
Esperanza de “X”
3
→ 𝐸(𝑋) = ∫ 𝑓(𝑥) ∙ 𝑥 ∙ 𝑑𝑥
0
1 2 3
𝑥2 𝑥 3−𝑥
=∫ ∙ 𝑑𝑥 + ∫ ∙ 𝑑𝑥 + ∫ ( ) ∙ 𝑥 ∙ 𝑑𝑥
0 2 1 2 2 2
1 2,8
→ ∙ [𝑦] | = 1
𝑘 0
→ 𝑘 = 2,8
2,8
1
=∫ ∙ 𝑦 ∙ 𝑑𝑦
0 2,8
Conclusión
Se ha logrado determinar que 𝐸(𝑌) < 𝐸(𝑋). En base a lo expuesto anteriormente, es
posible afirmar que el proveedor A presenta una mayor duración esperada que el proveedor
B.
SOLUCIÓN 4-B
3 3−𝑥
∫2,2( 2 ) ∙ 𝑑𝑥 0,16
= 0,5 𝑥 =
1 − ∫0 2 ∙ 𝑑𝑥 0,938
= 0,171
Conclusión
La probabilidad que la vida útil del componente principal del dispositivo estudiado sea
superior a 2200 horas, dado que ha durado más de 500 horas, corresponde a un 17,1%
PROBLEMA 5
El tiempo de llegado, adelantado o retrasado, medido en minutos, de un tren de alta
velocidad entre la ciudad A y B, es una variable aleatoria con la siguiente función de
densidad:
0 𝑠𝑖 𝑥 < −1
2
𝑥 −1 50
(𝑥 + 1) + ( ) 𝑠𝑖 − 1 ≤ 𝑥 < 0
2
𝐹𝑥 (𝑋) =
𝑥2 + 1
(𝑥 + 1) − ( ) 𝑠𝑖 0 ≤ 𝑥 < 1
2
{ 1 𝑠𝑖 𝑥 ≥ 1
SOLUCIÓN
Sea:
Observación
Es muy importante notar que la función presentada en el enunciado, corresponde a una
función de distribución de probabilidad acumulada.
Previo a realizar cálculos y análisis, se llevarán los valores de estudio, a las unidades en que
se encuentra definida la variable.
reemplazar, será la probabilidad de que la variable tome valores desde el límite inferior del
recorrido de la variable hasta el valor que se está evaluando.
= 0,899 − 0,281
= 0,618
51
Conclusión
La probabilidad que el tren llegue entre 33 segundos de adelanto y 15 segundos de retraso,
corresponde a un 61,8%
PROBLEMA 1
El tiempo que una persona emplea en desarrollar cierta tarea, en minutos, es una variable
aleatoria (X) con función de densidad:
1
𝑓(𝑥) = { 10 ; 𝑠𝑖 30 ≤ 𝑥 ≤ 40
0; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 52
d) Si se eligen al azar y en forma independiente 20 personas. ¿Cuál es la probabilidad
que 12 de ellas se demoren más del tiempo esperado en desarrollar la tarea?
e) Si se eligen personas hasta encontrar una que se haya demorado menos de 35
minutos en desarrollar la tarea. ¿Cuál es la probabilidad que se hayan elegido por
lo menos 4 personas?
SOLUCIÓN 1-A
Sea:
Es posible notar que se da el número de muestra, con lo que se hace factible calcular la
probabilidad de que ocurra un éxito a partir de la función de densidad. Los parámetros
expuestos anteriormente, son suficientes para conformar un modelo binomial.
Dónde:
Observación
Es posible observar, que el espacio muestral del resultado del experimento de Bernoulli,
está dado por “p + q”. A partir de esto, se puede afirmar que dicha probabilidad “p + q” da
como resultado 1.
Para determinar el valor de “p”, debe determinarse en forma previa el valor numérico del 53
tiempo esperado en desarrollar la tarea, lo que queda expuesto a continuación:
40 40
1
→ 𝐸(𝑋) = ∫ 𝑓(𝑥) ∙ 𝑥 ∙ 𝑑𝑥 = ∫ ∙ 𝑥 ∙ 𝑑𝑥 = 35
30 30 10
Con la probabilidad obtenida anteriormente, es posible definir una variable aleatoria que
siga una distribución binomial.
Sea:
Y= Número de personas que demoran más del tiempo esperado en desarrollar cierta tarea,
en una muestra aleatoria de 20 personas.
20
( ) ∙ 0,5𝑦 ∙ 0,520−𝑦 , 𝑦 = 0,1, … ,20
𝑝(𝑦) = { 𝑦
0, 𝑒. 𝑜. 𝑐
→ 𝑃(𝑌 = 12) = ?
20
→ 𝑃(𝑌 = 12) = ( ) ∙ 0,512 ∙ (1 − 0,5)20−12
12
= 0,12
Conclusión
Si se eligen al azar y en forma independiente 20 personas. La probabilidad que 12 de ellas
tarden más del tiempo esperado en realizar la tarea es de un 12%
SOLUCIÓN 1-B
Es posible notar a partir del enunciado, que se eligen personas hasta encontrar una que se
haya demorado menos de 35 minutos. Con esto, se puede definir una variable que siga un
modelo de distribución geométrica. Esta distribución, al igual que la binomial se encuentra
relacionada con el experimento de Bernoulli. Específicamente, dicha relación se da en las 54
siguientes aseveraciones:
Sea:
T: Número de personas que se eligen hasta encontrar una que se demore menos de 35
minutos.
𝑇~𝐺𝑒𝑜(𝑝 =? )
Observación
Se nota que la probabilidad de éxito de Bernoulli "𝑝" corresponde a que se encuentre una
persona que tarde menos de 35 minutos en desarrollar la tarea. Además, es posible
observar que, a diferencia del modelo binomial, la distribución geométrica depende sólo
del parámetro “p”, independiente del tamaño de muestra aleatoria.
𝑃(𝑇 ≥ 4) = ?
Dónde:
= 0,125
Conclusión
La probabilidad de que se hayan elegido a lo menos 4 personas, dado que se eligen personas
hasta encontrar una que haya tardado menos de 35 minutos en desarrollar la tarea
corresponde a un 12,5%.
PROBLEMA 2
Una cajera de supermercado demora en promedio 100 segundos en atender a un cliente.
Si se establecen válidos los supuestos de Poisson:
SOLUCIÓN 2-A 56
Sea:
𝑋~𝑃𝑜𝑖(𝜆` =? )
𝜆𝑥 ∙ 𝑒 −𝜆
𝑝(𝑥) = , 𝑠𝑖 𝑥 = 0,1,2,3, … , 𝜆 (4.3)
𝑥!
Dónde
A partir del enunciado, es posible identificar que la cajera atiende en promedio a un cliente
en 100 segundos. Con esto se puede afirmar que 𝜆 corresponde al tiempo promedio que la
cajera tarda en atender a un cliente, cuando se estudian 100 segundos. Sin embargo, en la
pregunta se pide analizar la variable X para 2 minutos, es decir 120 segundos. Al cambiar la
unidad de estudio, cambia el parámetro 𝜆, es por esto que dicho parámetro se puede
despejar con una “regla de tres simple”, tal como se muestra a continuación:
𝜆 → 𝑈𝑛𝑖𝑑𝑎𝑑
1 → 100 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠
𝜆` → 120 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠
→ 𝜆` = 1,2
→ 𝑋~𝑃𝑜𝑖(𝜆` = 1,2)
𝑃(𝑋 > 1) = ?
Así, a partir de la función de cuantía dada para la distribución de Poisson y las propiedades
básicas asociadas al cálculo de probabilidades, es posible desarrollar la probabilidad
anteriormente expuesta.
= 0,3374
Conclusión
La probabilidad que la cajera atienda a más de un cliente en dos minutos corresponde a un
33,74%.
SOLUCIÓN 2-B
Es posible definir una variable aleatoria, que siga una distribución binomial. Esto ya que se
identifica un tamaño de muestra aleatoria (n) correspondiente a 5 periodos de dos minutos
y que la probabilidad de que en un período de dos minutos, la cajera atienda a un cliente
corresponde a la probabilidad de éxito (p), la cual es posible obtenerla bajo los supuestos
de Poisson.
Sea:
𝑊~𝐵𝑖𝑛(𝑛 = 5, 𝑝 =? )
1,21 ∙ 𝑒 −1,2
→ 𝑝 = 𝑃(𝑋 = 1) = = 0,3614
1!
Así, se tienen los parámetros necesarios para definir la distribución y la función de cuantía
para W. La última, es posible obtenerla a partir de la ecuación (4.1)
𝑊~𝐵𝑖𝑛(𝑛 = 5 , 𝑝 = 0,3614)
5 𝑤 5−𝑤
𝑝(𝑤) = {(𝑤 ) ∙ 𝑝 ∙ 𝑞 , 𝑤 = 0,1,2,3,4,5
0, 𝑒. 𝑜. 𝑐
→ 𝑃(𝑊 = 1) = ?
5
→ 𝑃(𝑊 = 1) = ( ) ∙ 0,36141 ∙ [1 − 0,3614]5−1
1
= 0,3005
Conclusión
La probabilidad que en sólo uno de los períodos la cajera atienda a un cliente, en una
muestra aleatoria de 5 periodos diferentes observados, de dos minutos cada uno,
corresponde a un 30,05%.
PROBLEMA 3
En una planta industrial adquieren cierto tipo de producto. En un envío de 20 productos,
dos tienen defectos de pintura y tres tienen defectos en el etiquetado. Determine la
probabilidad de que resulten al menos dos productos con defectos en el etiquetado entre
cuatro productos elegidos al azar para una revisión. Defina variable aleatoria y distribución
de probabilidad. Justifique su respuesta.
SOLUCIÓN 59
A partir de los datos estipulados en el enunciado, es posible notar que los datos situación
sigue un modelo de distribución hipergeométrica.
Por otro lado, en general se tiene la siguiente función de cuantía para la distribución de
probabilidad Hipergeométrica:
(𝑁𝑥1 ) ∙ (𝑁−𝑁
𝑛−𝑥
1
)
𝑁 ; 𝑥 = 1,2,3, … . 𝑛 ≤ 𝑁1
𝑃(𝑥) = { ( ) (4.4)
𝑛
0, 𝑒. 𝑜. 𝑐
Dónde:
𝑁: 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
Sea:
𝑋~𝐻𝑖𝑝(𝑛 = 4; 𝑁1 = 3; 𝑁 = 20)
(𝑥3) ∙ (4−𝑥
17
)
; 𝑥 = 1,2,3
𝑃(𝑋 = 12) = { (20
4
)
0, 𝑒. 𝑜. 𝑐
→ 𝑃(𝑋 ≥ 2) = ?
= 0,8772
Conclusión
La probabilidad de que resulten al menos dos productos con defectos en el etiquetado entre
cuatro productos elegidos al azar para una revisión, corresponde a 87,72%
PROBLEMA 4
Una empresa de pavimentación tiene contrato con una municipalidad para el
mantenimiento de sus calles. Estas calles dan un promedio de 2 defectos por milla, después
de ser utilizadas durante un año. Si se consideran que los defectos se ajustan a una
distribución de Poisson.
SOLUCIÓN 4-A
Sea:
𝑋~𝑃𝑜𝑖(𝜆 = 2)
2𝑥 ∙ 𝑒 −10
𝑝(𝑥) = , 𝑠𝑖 𝑥 = 0,1,2
𝑥!
→ 𝑃(𝑋 = 1) =?
21 ∙ 𝑒 −2
→ 𝑃(𝑋 = 1) = = 0,2707
1!
Conclusión
La probabilidad que se presente un defecto en cualquier milla, después de soportar trafico
un año, corresponde a un 27,07%
SOLUCIÓN 4-B
Observación
Es importante denotar, que la variable “X” se define para una milla. Por lo que para realizar
un estudio basado en 5 millas, se debe definir una nueva variable aleatoria, la cual se
distribuya con un respectivo 𝜆` asociado a las 5 millas.
Sea:
El parámetro λ`, es posible determinarlo a partir de una “regla de tres simple”, como se
expone a continuación:
5∙2
→ λ` = → λ` = 10
1
Así, es posible definir la distribución de probabilidad de “Y”, y su función de cuantía, a partir
de la ecuación (4.3)
𝑌~𝑃𝑜𝑖(𝜆` = 10)
10𝑦 ∙ 𝑒 −10
𝑝(𝑦) = , 𝑠𝑖 𝑦 = 0,1,2,3, … ,10
𝑦!
→ 𝑃(𝑌 ≥ 2) = ?
Conclusión
La probabilidad que se presenten por lo menos 2 defectos en 5 millas es de un 99,95%
PROBLEMA 1
La resistencia de un cable eléctrico de alta tensión se considera una variable aleatoria con
distribución normal con una media de 36 (ohmios) y una varianza de 0,64 (ohmios)2. Un
cable se considera defectuoso si su resistencia es inferior a 35 (ohmios)
63
f) De los cables que tienen una resistencia superior a 34 (ohmios) ¿Qué proporción
de cables se consideran defectuosos?
g) Se eligen al azar y en forma independiente 10 cables, ¿Cuál es la probabilidad que
más de 2 cables resulten defectuosos?
SOLUCIÓN 1-A
Sea:
35 − 36 34 − 36
𝑃 (𝑧 < 0,8 ) − 𝑃 (𝑧 < 0,8 )
=
34 − 36
1 − 𝑃 (𝑧 ≤ 0,8 )
0,1056 − 0,00672
=
0,00672
= 0,1
Conclusión 64
La proporción de cables que se consideran defectuosos, de los que tienen una resistencia
superior a 34 ohmios, corresponde a 0,1.
SOLUCIÓN 1-B
Sea:
→ 𝑃(𝑌 > 2) = ?
= 0,0814
Conclusión
La probabilidad que más de 2 cables resulten defectuosos, en una muestra elegida aleatoria
de 10 cables, corresponde a un 8,14%.
PROBLEMA 2
Al curar el concreto se hace vulnerable a vibraciones de choque, que pueden causar
agrietamiento o daños ocultos en el material. Como parte de un estudio de fenómenos de
vibración, el artículo “Shock Vibration Test of concrete” (ACI Materials J. 2002) informó que
la rapidez máxima de una partícula en (mm/s) que viaja por un espécimen que es sometido
a un proceso de curado se distribuye normal con media 529,29 (mm/s) y desviación
estándar 154,36.
SOLUCIÓN 2-A
Sea:
X: Rapidez máxima de una partícula que viaja por un espécimen que es sometido a un
proceso de curado, en [mm/s]
Sea:
𝑌~𝐵𝑖𝑛(𝑛 = 12; 𝑝 = ? )
→ 𝑝 = 𝑃(400 ≤ 𝑥 ≤ 600)
= 0,6772 − 0,2033
= 0,4739
66
𝑌~𝐵𝑖𝑛(𝑛 = 12; 𝑝 = 0,4739)
12 12
= 1 − [( ) 0,47390 ∙ (1 − 0,4739)12−0 + ( ) 0,47391 ∙ (1 − 0,4739)12−1 ]
0 1
= 0,99469
Conclusión
La probabilidad que al menos en dos de los 12 especímenes tomados en forma aleatoria, la
velocidad máxima con que viaja una partícula fluctúe entre 400 (mm/s) y 600 (mm/s) es de
un 99,47%
SOLUCIÓN 2-B
Sea:
𝑇~𝑃𝑜𝑖(𝜆 = ? )
1,3 ∙ 5
→𝜆= = 6,5
1
𝑇~𝑃𝑜𝑖(𝜆 = 6,5)
𝑒 −6,5 ∙ 6,5𝑡
𝑝(𝑡) = , 𝑠𝑖 𝑡 = 0,1,2, … ,6
𝑡!
= 0,95696
Conclusión
La probabilidad que en cinco palmetas de concreto de 2 m2 se encuentren a lo menos tres
grietas es de un 95,67%
PROBLEMA 3
La duración en minutos, de un proceso textil tiene un comportamiento Normal, con una
desviación típica de 26.3 (minutos). Además, se sabe que el 60% de los procesos duran por
lo menos 40 minutos.
De los procesos que han tenido una duración de a lo más 62 minutos. ¿Qué porcentaje, de
ellos, duró más de 48 minutos?
68
SOLUCIÓN
Sea
X: Duración de un proceso textil, en minutos.
𝑋~𝑁(𝜇 =? ; 𝜎 2 = 26,32 )
40 − 𝜇
→ 𝑃 (𝑍 ≤ ) = 0,4
26,3
40 − 𝜇
→ = −0,26
26,3
→ 𝜇 = 46,575 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
62 − 46,575 48 − 46,575 69
𝑃 (𝑍 < ) − 𝑃 (𝑍 < )
26,3 26,3
=
62 − 46,575
𝑃 (𝑍 < )
26,3
0,7224 − 0,5199
=
0,7224
= 0, ,2803
Conclusión
El porcentaje de procesos que duró más de 48 minutos, de los que han tenido una duración
de a lo más 62 minutos, corresponde a un 28,03%.
PROBLEMA 4
“Avance del tiempo en flujo de tránsito”, es el tiempo transcurrido entre el tiempo que un
automóvil termina de pasar por un punto fijo y el instante en que el siguiente automóvil
comienza a pasar por ese punto. La variable aleatoria X: “avance en el tiempo en el flujo de
tránsito, entre dos automóviles consecutivos elegidos al azar en un período de flujo intenso,
en segundos”, se distribuye exponencial con media 6,67 segundos. ¿Cuál es el menor
tiempo del 40% de los casos en que hay mayor avance de tiempo, en el flujo del tránsito?
SOLUCIÓN 4 70
Sea:
𝑋~𝐸𝑥𝑝(𝜆 = ? )
1
𝜆= (1)
𝐸(𝑋)
Dónde
1
→𝜆= = 0,15
6,67
𝑋~𝐸𝑥𝑝(𝜆 = 0,15)
→ 𝑃(𝑋 ≥ 𝑥0 ) = 0,4
→ 1 − 𝑒 −0,15∙𝑥0 = 0,6
→ 𝑒 −0,15∙𝑥0 = 0,4
→ −0,15 ∙ 𝑥0 = ln(0,4)
→ 𝑥0 = 6,11 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠
Conclusión
El menor tiempo del 40% de los casos en que hay mayor avance de tiempo, en el flujo del
tránsito, corresponde a 6,11 segundos.
PROBLEMA 5
Una empresa dedicada a la fabricación de pinturas tiene su planta en una localidad rural
cerca de la ciudad, por esta razón los pedidos grandes son cargados en camiones el día
anterior a su despacho y estos se guardan en una bodega que se encuentra en la misma
ciudad.
SOLUCIÓN 5-A
Sea:
𝑥~𝑈(40; 60)
60
1
𝑃(𝑋 > 45) = ∫ ∙ 𝑑𝑥 = 0,75
45 20
Sea:
𝑦~𝐵𝑖𝑛(𝑛 = 4; 𝑝 = 0,75
→ 𝑃(𝑌 ≥ 1) = ?
→ 𝑃(𝑌 ≥ 1) = 1 − 𝑃(𝑌 = 0)
72
4
= 1 − ( ) 0,750 ∙ 0,254−0
0
= 0,9961
Conclusión
La probabilidad que al menos uno de cuatro camiones que salen de la planta hacia la bodega
elegidos de distintos despachos, demoren más de 45 minutos es de un 99,61%
SOLUCIÓN 5-B
Sea:
T: Tiempo que emplea un camión en desplazarse desde la bodega a su lugar de destino, en
horas.
𝑇~𝑁(𝜇 = 2; 𝜎 2 = 0,252 )
Sea:
T`: Tiempo que emplea un camión en desplazarse desde su lugar de destino a la bodega, en
horas.
T` = 0,9 ∙ T
= 𝐹(0,89) − 𝐹(−1,33)
Conclusión
El porcentaje de los camiones que tardan en volver a la bodega entre 1,5 horas y 2 horas es
de un 72,15%.
SOLUCIÓN 5-C
Sea:
W: Número de tinetas con pintura elastomérica, de las tres seleccionadas. 73
𝑊~𝐻𝑖𝑝(𝑁 = 15, 𝑁1 = 5, 𝑛 = 3)
𝑃(𝑊 = 1) = ?
5 10
( )∙( )
𝑃(𝑊 = 1) = 1 2 = 0,4945
15
( )
3
Conclusión
La probabilidad que sólo una de las tres tinetas elegidas al azar contenga pintura
elastomérica es de un 49,45%
PROBLEMA 1
A. En los fines de semana en que hay dos especialistas disponibles ¿Cuál es el número
esperado de llamadas de emergencia recibidas?
B. ¿Cuál es la probabilidad que en un fin de semana el número de llamadas solicitando
atención de emergencia sobrepase el número de especialistas disponibles?
C. Determine el porcentaje de variabilidad del número de llamadas que solicitan
atención de emergencia los fines de semana.
D. Determine 𝐶𝑜𝑣(𝑥, 𝑦)
E. Determine el coeficiente de Pearson asociado a la dependencia entre las variables
“x” e “y”.
SOLUCIÓN – A
Se tienen:
X = Número de especialistas disponibles en un fin de semana.
Y = Número de llamadas recibidas solicitando atención de emergencia en un fin de semana.
𝑦
Primero que todo, es necesario obtener la función de densidad 𝑓( ⁄𝑥 = 2), la cual
se presenta a continuación.
𝒀 𝒚
𝑷( ⁄𝒙 = 𝟐)
𝟎 0,04⁄
0,42 = 0,0952
𝟏 0,23⁄
0,42 = 0,548
𝟐 0,12⁄
0,42 = 0,286
𝟑 0,02⁄
0,42 = 0,0476
𝟒 0,01⁄
0,42 = 0,0238
Observación
Para obtener el valor de probabilidad asociada a cuando la variable "𝑦" toma el valor "0",
se debe realizar el cociente entre la intercepción de 𝑥 = 2 e 𝑦 = 0; dividido por la
probabilidad total asociada a 𝑥 = 2, la cual se obtiene realizando la sumatoria de las
probabilidades, cuando la variable "𝑥" toma dicho valor.
= 1,358
Conclusión
En un fin de semana en que hay dos especialistas, el número esperado de llamadas de
emergencia recibidas es de 1,358.
SOLUCIÓN – B
𝑃(𝑦 > 𝑥) =?
𝒙 𝒚
𝟏 2
𝟏 3
𝟏 4
𝟐 3
𝟐 4
𝟑 4
Conclusión
La probabilidad de que el número de llamadas de emergencia supere al número de
especialistas disponibles en un fin de semana es de un 12%.
76
SOLUCIÓN – C
𝒚 𝑷(𝒚)
𝟎 0,2
𝟏 0,45
𝟐 0,25
𝟑 0,07
𝟒 0,03
Luego, se puede trabajar la función marginal, como una función de densidad discreta
cualquiera, por lo que el cálculo de la esperanza queda dado de la siguiente forma.
→ 𝐸(𝑦) = 1,28
→ 𝜎𝑦2 = 0,9216
→ 𝜎𝑦 = 0,96
0,96
→ 𝐶. 𝑉(𝑦) = = 0,75
1,28
Observación
En la presente solución del problema planteado, se plantea un camino a seguir para
resolverlo, lo que no significa que sea el único. Por ejemplo, los valores correspondientes a
la esperanza y la desviación estándar, se pueden determinar además a partir de la 77
calculadora ingresando la función marginal presentada al principio de este ítem.
Conclusión
El porcentaje de variabilidad asociado al número de llamadas de emergencia en un
fin de semana es de un 75%.
SOLUCIÓN – D
𝒙 𝒚 𝑷(𝒙𝒊 , 𝒚𝒊 )[𝑭𝑹𝑬𝑸]
𝟏 𝟎 0,15
𝟏 𝟏 0,1
𝟏 𝟐 0,05
𝟏 𝟑 0,02
𝟏 𝟒 0
𝟐 𝟎 0,04
𝟐 𝟏 0,23
𝟐 𝟐 0,12
𝟐 𝟑 0,02 78
𝟐 𝟒 0,01
𝟑 𝟎 0,01
𝟑 𝟏 0,12
𝟑 𝟐 0,08
𝟑 𝟑 0,03
𝟑 𝟒 0,02
→ ∑ 𝑥 ∙ 𝑦 ∙ 𝑝(𝑥𝑖 , 𝑦𝑖 ) = 2,75
→ 𝐸(𝑥) = 1,94
→ 𝐸(𝑦) = 1,28
Observación
∑ 𝑥∙𝑦∙𝑝(𝑥𝑖 ,𝑦𝑖 )
Es importante denotar que la 𝐸(𝑥 ∙ 𝑦) es equivalente a , donde N corresponde
𝑁
a la frecuencia total acumulada. Así, al estar trabajando con probabilidades, es posible
identificar que 𝑁 = 1, lo que indica que en los casos en que se trabaje con probabilidades,
se cumplirá la siguiente expresión:
→ 𝐶𝑜𝑣(𝑥, 𝑦) = 0,2668
SOLUCIÓN – E
→ 𝜌(𝑥, 𝑦) = 𝑟 = 0,366
𝐶𝑜𝑣(𝑥, 𝑦)
𝜌(𝑥, 𝑦) = (6.3)
𝜎𝑥 ∙ 𝜎𝑦
0,2668
→ 𝜌(𝑥, 𝑦) =
0,759 ∙ 0,96
→ 𝜌(𝑥, 𝑦) = 0,366
Conclusión
El coeficiente de correlación asociado a las variables "𝑥" e "𝑦" corresponde a 0,366. Esto,
representa que la relación lineal entre dichas variables es baja, lo que indica que existe poca
dependencia entre ambas variables.
PROBLEMA 2
2
𝑓(𝑥, 𝑦) = {5 (2𝑥 + 3𝑦) 𝑠𝑖 0 ≤ 𝑥 ≤ 1 ; 0 ≤ 𝑦 ≤ 1
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Determine la probabilidad que una viga, elegida al azar, cumpla con menos del 70% 80
de lo exigido en el control II, si en el control I cumplió con el 90% de lo exigido.
SOLUCIÓN
Sean:
X = Proporción de vigas, sometidas a una prueba, que cumplen con la exigencia inicial I.
Y = Proporción de vigas, sometidas a una prueba, que cumplen con la exigencia inicial II.
𝑦 < 0,7
𝑃( ⁄𝑥 = 0,) = ?
9
Conclusión 81
La probabilidad que una viga, elegida al azar, cumpla con menos del 70% de lo exigido en el
control II, dado que en el control I cumplió con el 90% de lo exigido, es de un 60,5%.
PROBLEMA 3
En una empresa dedicada a la fabricación de cables para alta tensión afirman que la
producción de cables diaria, en miles de metros, en el turno de la mañana (X) y la
producción de cables diaria, en miles de metros, en el turno de la tarde (Y), se pueden
considerar variables aleatorias con función de densidad conjunta:
2𝑥 + 𝑦
𝑓(𝑥, 𝑦) = { 1,12 𝑠𝑖 0 ≤ 𝑥 ≤ 1 ; 0 ≤ 𝑦 ≤ 0,8
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 82
a) Calcular P(Y>0,6/X=0,7)
b) Si se seleccionan 8 días en forma independiente. ¿Cuál es la probabilidad que en
menos de 3 días se haya obtenido una producción inferior a 0,5 miles de metros de
cables, en el turno de la mañana?
SOLUCIÓN 3– A
Sean:
X = Producción de cables diaria en el turno de la mañana, en miles de metros.
Y = Producción de cables diaria en el turno de la tarde, en miles de metros.
𝑦 > 0,6⁄
→ 𝑃( 𝑥 = 0,7) =?
0,8
2𝑥 + 𝑦 1
→ 𝑓𝑥 (𝑥) = ∫ 𝑑𝑦 = ∗ (10𝑥 + 2)
0 1,12 7
2 ∗ 0,7 + 𝑦
𝑦 𝑓(0,7 ; 𝑦) 1,12 1,4 + 𝑦
𝑓 ( ⁄𝑥 = 0,7) = = =
𝑓𝑥 (0,7) 1,285 1,439
SOLUCIÓN 3 – B
Sea:
W = Número de días que hayan tenido una producción inferior a 0,5 miles de metros de 83
cable, en el turno de la mañana, en una muestra aleatoria de 8 días.
𝑤~𝐵𝑖𝑛(𝑛 = 8, 𝑝 =? )
0,5 0,8
2𝑥 + 𝑦
→𝑝=∫ ∫ 𝑑𝑦𝑑𝑥 = 0,3214
𝑥=0 𝑦=0 1,12
𝑤~𝐵𝑖𝑛(𝑛 = 8, 𝑝 = 0,3214)
8 𝑤 8−𝑤
𝑃(𝑤) = {(𝑤 ) 0,3214 ∗ 0,6788 𝑠𝑖 𝑤 = 0,1, … . ,8
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Finalmente, es posible plantear y resolver la probabilidad objetivo, como se muestra a
continuación.
8 8 8
= ( ) 0,32140 ∗ 0,67888 + ( ) 0,32141 ∗ 0,67887 + ( ) 0,32142 ∗ 0,67886
0 1 2
→ 𝑃(𝑤 < 3) = 0,4987
Conclusión
La probabilidad de que en 8 días seleccionados al azar y en forma independiente, se
obtenga una producción inferior a 0,5 miles de metros de cables, en menos de tres días en
el turno de la mañana es de un 49,87%.
PROBLEMA 4
3(𝑥 2 + 𝑦 2 )
𝑓(𝑥, 𝑦) = { 380000 𝑠𝑖 20 ≤ 𝑥 ≤ 30 ; 20 ≤ 𝑦 ≤ 30
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
¿Cuál es la probabilidad de que la presión del neumático derecho exceda a la presión del
neumático izquierdo en al menos dos (𝐼𝑏⁄𝑝𝑢𝑙𝑔2 )?
SOLUCIÓN
Sea:
X = Presión de aire para neumático izquierdo, en [Ib/pulg 2 ]
Y = Presión de aire para neumático derecho, en [Ib/pulg 2 ]
𝑃(𝑦 ≥ 2 + 𝑥) = ?
En estos casos, es necesario realizar un análisis gráfico, con el fin de definir de buena forma
los límites de integración.
Observación
Para definir los límites de integración, es necesario dejarlos en función de una sola variable,
lo que nos permite desarrollar eficientemente la integración, es por esto que se realiza el
análisis gráfico.
85
30 28
3
∫ ∫ (𝑥 2 + 𝑦 2 )𝑑𝑥𝑑𝑦
𝑦=22 𝑥=𝑦−2 380000
30 (28)3 (𝑦 − 2)3
3 2
= ∫ ( + 28𝑦 − − (𝑦 − 2) ∙ 𝑦 2 ) 𝑑𝑦
380000 𝑦=22 3 3
→ P(y ≥ 2 + x) = 0,3176
Conclusión
PROBLEMA 5
En el proceso de fabricación de cierto artículo, se consideran las variables aleatorias:
X = costo de materia prima utilizada, Y = costo en mano de obra, ambas en miles de $, con
función de densidad conjunta:
2𝑥 2 𝑦
𝑓(𝑥, 𝑦) = { 105 𝑠𝑖 1 < 𝑥 < 4 ; 2 < 𝑦 < 3
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
SOLUCIÓN
Se tiene:
X = Costo de materia prima utilizada, en miles de pesos.
Y = Costo en mano de obra, en miles de pesos.
A partir de las variables, notamos que existen dos tipos de costos asociados a la fabricación
de un artículo, por lo que se deben obtener ambos costos esperados para resolver con éxito
el problema. Para esto, inicialmente se recomienda determinar las funciones marginales de
cada variable.
3
2𝑥 2 𝑦 2𝑥 2 𝑥2
→ 𝑓𝑥 (𝑥) = ∫ 𝑑𝑦 = ∗ (32 − 22 ) =
2 105 105 ∗ 2 21
4
2𝑥 2 𝑦 2𝑦 43 13 126𝑦 2
→ 𝑓𝑦 (𝑦) = ∫ 𝑑𝑥 = ∗( − )= = 𝑦
1 105 105 3 3 315 5
Así, a partir de las funciones expuestas anteriormente, es posible obtener los costos
esperados.
4 4
𝑥2
→ 𝐸(𝑥) = ∫ 𝑥 ∗ 𝑓𝑥 (𝑥)𝑑𝑥 = ∫ 𝑥 ∗ 𝑑𝑥 = 3,0357
1 1 21
3 3
2
→ 𝐸(𝑦) = ∫ 𝑦 ∗ 𝑓𝑦 (𝑦)𝑑𝑦 = ∫ 𝑦 ∗ 𝑦 𝑑𝑦 = 2,535
2 2 5
Conclusión
El costo total esperado por artículo fabricado corresponde a 5,57 miles de pesos.
PROBLEMA 1
El número de accidentes que ocurren en una empresa, en un mes, se considera una variable
aleatoria con distribución de Poisson. Calcular la probabilidad de que en un mes se registre
un accidente, si al tomar una muestra aleatoria de 10 meses se obtuvo:
1 0 3 1 2 0 1 2 3 1
Tabla 11. Número de Accidentes ocurridos en 10 meses elegidos de forma aleatoria.
87
SOLUCIÓN
Sea:
X: Número de accidentes que ocurren en una empresa, en un mes.
𝑋~𝑃𝑜𝑖(𝜆)
→ 𝑃(𝑋 = 1) = ?
𝑒 −𝜆 ∙ 𝜆1
→ 𝑃(𝑋 = 1) =
1!
Como podemos notar, es necesario obtener el parámetro "𝜆" para resolver la probabilidad
requerida. Es por esto, que a continuación se procederá a realizar la estimación puntual de
este parámetro poblacional, ya que este valor es desconocido.
Estimación Puntual
𝑛
𝑒 −𝜆 ∙ 𝜆𝑥𝑖
→ 𝐿(𝑥, 𝜆) = ∏( )
𝑥𝑖 !
𝑖=1
𝑛
𝑒 −𝜆 ∙ 𝜆𝑥𝑖
→ ln(𝐿(𝑥, 𝜆)) = ln(∏( ))
𝑥𝑖 !
𝑖=1
𝑛
𝑒 −𝜆 ∙ 𝜆𝑥𝑖
→ ln(𝐿(𝑥, 𝜆)) = ∑(ln( ))
𝑥𝑖 !
𝑖=1
𝑛
𝜕 𝑥𝑖
→ ln(𝐿(𝑥, 𝜆)) = ∑(− ln(𝑒 ) + )
𝜕𝜆 𝜆
𝑖=1
𝑛
𝜕 1
→ ln(𝐿(𝑥, 𝜆)) = −𝑛 + ∙ ∑ 𝑥𝑖
𝜕𝜆 𝜆
𝑖=1
∑𝑛𝑖=1 𝑥𝑖
→ 𝜆̂ = = 𝑥̅
𝑛
Habiendo realizado la estimación máximo verosímil del parámetro, es posible asociar a la
muestra dada en el enunciado la relación obtenida, calculando así 𝜆̂.
1+0+3+1+⋯+1
𝜆̂ = 𝑥̅ = = 1,4 𝑚𝑒𝑠𝑒𝑠.
10
Así, la probabilidad requerida quedaría dada por:
𝑒 −1,4 ∙ 1,41
→ 𝑃(𝑋 = 1) =
1!
→ 𝑃(𝑋 = 1) = 0,345
Conclusión 89
La probabilidad que en un mes se registre un accidente corresponde a un 34,5%.
PROBLEMA 2
La amplitud de una señal de radar refundida desde la superficie del mar es una variable
aleatoria con la siguiente función de densidad, con α desconocido:
2 −α x2
𝑓(𝑥, α ) = {2α 𝑥𝑒 𝑥>0 ; α >0
0 𝑥≤0
SOLUCIÓN
Sea:
X: Amplitud de una señal de radar refundida desde la superficie del mar.
Estimación Puntual
i. Función de Verosimilitud
𝑛
2
→ 𝐿(𝑥) = ∏( 2α 2 𝑥𝑖 𝑒 −α 𝑥𝑖 )
𝑖=1
𝑛
2
→ ln(𝐿(𝑥)) = ln(∏( 2α 2 𝑥𝑖 𝑒 −α 𝑥𝑖 ))
𝑖=1
𝑛
2
→ ln(𝐿(𝑥)) = ∑(ln(2α 2 𝑥𝑖 𝑒 −α 𝑥𝑖 ))
𝑖=1
𝑛
𝜕 1
→ ln(𝐿(𝑥)) = ∑(2 ∙ ∙ 2 − 𝑥𝑖 2 )
𝜕𝛼 2𝛼
𝑖=1
𝑛
𝜕 2∙𝑛
→ ln(𝐿(𝑥)) = − ∑ 𝑥𝑖 2
𝜕𝛼 𝛼
𝑖=1
𝑛
𝜕 2∙𝑛
→ ln(𝐿(𝑥)) = 0 → − ∑ 𝑥𝑖 2 = 0
𝜕𝛼 𝛼̂
𝑖=1
𝑛
2∙𝑛
→ = ∑ 𝑥𝑖 2
𝛼̂
𝑖=1
2∙𝑛
→ 𝛼̂ =
∑𝑛𝑖=1 𝑥𝑖 2
2 ∙ 10
→ 𝐸. 𝑀. 𝑉(𝛼) = = 9,72 ∙ 10−3
102 + 152 + ⋯ + 172
→ 𝐸. 𝑀. 𝑉(𝛼 + 1) = 1,00972
Conclusión
La estimación máximo verosímil del parámetro (α+1) corresponde a 1,00972.
PROBLEMA 3
El tiempo de germinación de una planta, en días, se distribuye según una variable aleatoria
X, cuya función de densidad, con parámetro α desconocido es:
SOLUCIÓN
Sea:
X: Tiempo de germinación de una planta, en días.
Estimación Puntual
i. Función de Verosimilitud
𝑛
𝑛
𝜕 1
→ ln(𝐿(𝑥, 𝛼)) = ∑( − (x𝑖 − 20))
𝜕𝛼 𝛼
𝑖=1
𝑛
𝜕 𝑛
→ ln(𝐿(𝑥, 𝛼)) = − ∑ 𝑥𝑖 + 20𝑛
𝜕𝛼 𝛼
𝑖=1
𝑛
𝜕 𝑛
→ ln(𝐿(𝑥, 𝛼)) = 0 → − ∑ 𝑥𝑖 + 20𝑛 = 0
𝜕𝛼 𝛼̂
𝑖=1
𝑛
𝑛
→ = ∑ 𝑥𝑖 − 20𝑛
𝛼̂
𝑖=1
𝑛 1
→ 𝛼̂ = =
∑𝑛𝑖=1 𝑥𝑖− 20𝑛 𝑥̅ − 20
100
→ 𝐸. 𝑀. 𝑉(𝛼) = = 0,5
2200 − 20 ∙ 100
Conclusión
1
El estimador máximo verosímil de α está dado por 𝑥̅ −20 y su estimación máxima verosímil
corresponde a 0,5.
PROBLEMA 4
Sea (X1,X2,…X10) una m.a.t (10) de X ~ N(; 2). Sean ̂1 y ̂ 2 dos estimadores de , tal que:
𝑋1 + 𝑋10
̂1 =
𝜃
2
𝑋1 + 2𝑋5 + 𝑋10
̂2 =
𝜃
4
94
Analice insesgamiento de ̂1 y ̂ 2 e indique cual de los estimadores es mejor. Justifique su
respuesta.
SOLUCIÓN
Análisis de Insesgamiento
Se sabe por definición que en general para que un estimador "𝛼̂" , se clasifique como
insesgado para cierto parámetro "𝛼", se debe cumplir la relación expuesta en la ecuación
(7.1)
𝐸(𝛼
̂) = 𝛼 (7.1)
Así, es necesario en primera instancia analizar insesgamiento con el fin de identificar cual
de los 2 estimadores expuestos es mejor. Es válido decir que evidentemente un estimador
insesgado respecto a su respectivo parámetro poblacional, será mejor que un estimador no
insesgado para el mismo.
𝑋1 + 𝑋10
̂1 ) = 𝐸(
→ 𝐸(𝜃 )
2
𝑋1 𝑋10
̂1 ) = 𝐸(
→ 𝐸(𝜃 + )
2 2
1 1
̂1 ) =
→ 𝐸(𝜃 ∙ 𝐸(𝑋1 ) + ∙ 𝐸(𝑋10 )
2 2
1 1
̂1 ) =
→ 𝐸(𝜃 ∙𝜇+ ∙𝜇
2 2
̂1 ) = 𝜇
→ 𝐸(𝜃
𝑋1 + 2𝑋5 + 𝑋10
̂2 ) = 𝐸(
→ 𝐸(𝜃 )
4 95
1
̂2 ) =
→ 𝐸(𝜃 ∙ 𝐸(𝑋1 + 2𝑋5 + 𝑋10 )
4
1
̂2 ) =
→ 𝐸(𝜃 ∙ [𝐸(𝑋1) + 2𝐸(𝑋5 ) + 𝐸(𝑋10 )]
4
1
̂2 ) =
→ 𝐸(𝜃 ∙ [𝜇 + 2𝜇 + 𝜇]
4
4𝜇
̂2 ) =
→ 𝐸(𝜃
4
̂2 ) = 𝜇
→ 𝐸(𝜃
En el enunciado se pide determinar cual de los dos estimadores es mejor, con respecto a
sus respectivos parámetros. Se ha determinado que ambos son estimadores insesgados,
por lo que con la información que se dispone no es posible definir cual de los dos es mejor.
Es por esto, que se realizará un análisis de varianza mínima. Es importante notar, que a
menor varianza, existirá menor variabilidad entre la estimación y su valor poblacional, por
lo que el estimador estudiado será mejor que el que presente más discontinuidad.
Para realizar este análisis, se aplicarán propiedades de la varianza, las cuales ya han sido
estudiadas anteriormente. Estás propiedades se aplicarán bajo el supuesto de que la
variable normal estudiada es independiente.
𝑋1 + 𝑋10
̂1 ) = 𝑉(
→ 𝑉(𝜃 )
2
𝑋1 𝑋10
̂1 ) = 𝑉(
→ 𝑉(𝜃 + )
2 2
1 1
̂1 ) =
→ 𝑉(𝜃 ∙ 𝑉(𝑋1 ) + ∙ 𝑉(𝑋10 )
4 2
1 2 1 2
̂1 ) =
→ 𝑉(𝜃 ∙𝜎 + ∙𝜎
4 4
̂1 ) = 0,5 ∙ 𝜎 2
→ 𝑉(𝜃
96
̂1 es estimador
Al ser 0,5 ∙ 𝜎 2 inferior al parámetro poblacional 𝜎 2 , es posible afirmar que 𝜃
insesgado para 𝜃1 de varianza mínima.
̂2 , tal como se
Análogamente, se realiza el análisis de varianza mínima para el estimador 𝜃
expone a continuación:
𝑋1 + 2𝑋5 + 𝑋10
̂2 ) = 𝑉(
→ 𝑉(𝜃 )
4
1
̂2 ) =
→ 𝑉(𝜃 ∙ 𝑉(𝑋1 + 2𝑋5 + 𝑋10 )
16
1
̂2 ) =
→ 𝑉(𝜃 ∙ [𝑉(𝑋1) + 4𝑉(𝑋5 ) + 𝑉(𝑋10 )]
16
1
̂2 ) =
→ 𝑉(𝜃 ∙ [𝜎 2 + 4𝜎 2 + 𝜎 2 ]
16
6𝜎 2
̂2 ) =
→ 𝑉(𝜃
16
̂2 ) = 0,375 ∙ 𝜎 2
→ 𝑉(𝜃
̂2 es un
Al ser 0,375 ∙ 𝜎 2 inferior al parámetro poblacional 𝜎 2 , es posible afirmar que 𝜃
estimador insesgado para 𝜃2 de varianza mínima.
Conclusión
Se ha determinado que tanto 𝜃 ̂1 como 𝜃
̂2 son estimadores insesgados para sus respectivos
parámetros poblacionales. Además, a partir de un análisis de varianza mínima, se ha
identificado que el mejor estimador insesgado para su parámetro corresponde a 𝜃 ̂2 , pues
𝑉(𝜃̂2 ) < 𝑉(𝜃
̂1 )
PROBLEMA 5
Para una variable aleatoria “Y” se sabe que E(Y)=θ/3; y V(Y)= θ/6. Se proponen los siguientes
estimadores para el parámetro θ desconocido, a partir de una muestra aleatoria de tamaño
4:
3 3
θ̂1 = (𝑌1 + 𝑌2 + 𝑌3 + 𝑌4 ) θ̂2 = (𝑌1 + 𝑌2 + 𝑌3 − 𝑌4 )
4 2
Determine:
97
a) Cuál de estos estimadores es insesgado.
b) Cuál estimador presenta menor varianza.
SOLUCIÓN 5-A
Análisis de Insesgamiento
3
̂1 ) = 𝐸( (𝑌1 + 𝑌2 + 𝑌3 + 𝑌4 ))
→ 𝐸(𝜃
4
3
̂1 ) = 𝐸(𝑌1 + 𝑌2 + 𝑌3 + 𝑌4 )
→ 𝐸(𝜃
4
3
̂1 ) =
→ 𝐸(𝜃 ∙ [𝐸(𝑌1 ) + 𝐸(𝑌2 ) + 𝐸(𝑌3 ) + 𝐸(𝑌4 )]
4
3
̂1 ) =
→ 𝐸(𝜃 ∙ [𝜇 + 𝜇 + 𝜇 + 𝜇]
4
3
̂1 ) =
→ 𝐸(𝜃 ∙ [4𝜇] = 3 ∙ 𝜇
4
𝜃
̂1 ) = 3 ∙
→ 𝐸(𝜃 =𝜃
3
̂1 𝑒𝑠 𝑖𝑛𝑠𝑒𝑠𝑔𝑎𝑑𝑜 𝑝𝑎𝑟𝑎 𝜃
→𝜃
3
̂2 ) = 𝐸( (𝑌1 + 𝑌2 + 𝑌3 − 𝑌4 ))
→ 𝐸(𝜃
2
3
̂2 ) =
→ 𝐸(𝜃 ∙ 𝐸(𝑌1 + 𝑌2 + 𝑌3 − 𝑌4 )
2
3
̂2 ) =
→ 𝐸(𝜃 ∙ [𝐸(𝑌1 ) + 𝐸(𝑌2 ) + 𝐸(𝑌3 ) − 𝐸(𝑌4 )]
2
98
3
̂2 ) =
→ 𝐸(𝜃 ∙ [𝜇 + 𝜇 + 𝜇 − 𝜇]
2
3 ∙ 2𝜇
̂2 ) =
→ 𝐸(𝜃 = 3𝜇
2
𝜃
̂2 ) = 3 ∙
→ 𝐸(𝜃 =𝜃
3
̂2 𝑒𝑠 𝑖𝑛𝑠𝑒𝑠𝑔𝑎𝑑𝑜 𝑝𝑎𝑟𝑎 𝜃
→𝜃
Conclusión
̂1 como 𝜃
Se ha determinado que tanto 𝜃 ̂2 son estimadores insesgados para 𝜃
SOLUCIÓN 5-B
Para realizar este análisis, se aplicarán propiedades de la varianza, las cuales ya han sido
estudiadas anteriormente. Estás propiedades se aplicarán bajo el supuesto de que la
variable normal estudiada es independiente.
3
̂1 ) = 𝑉( (𝑌1 + 𝑌2 + 𝑌3 + 𝑌4 )
→ 𝑉(𝜃
4
9
̂1 ) =
→ 𝑉(𝜃 𝑉(𝑌1 + 𝑌2 + 𝑌3 + 𝑌4 )
16
9
̂1 ) =
→ 𝑉(𝜃 ∙ [𝑉(𝑌1 ) + 𝑉(𝑌2 ) + 𝑉(𝑌3 ) + 𝑉(𝑌4 )]
16
9
̂1 ) =
→ 𝑉(𝜃 ∙ [𝜎 2 + 𝜎 2 + 𝜎 2 + 𝜎 2 ]
16 99
9 9 𝜃
̂1 ) =
→ 𝑉(𝜃 ∙ 4𝜎 2 = ∙4∙
16 16 6
3
̂1 ) =
→ 𝑉(𝜃 ∙𝜃
8
̂2 , tal como se
Análogamente, se realiza el análisis de varianza mínima para el estimador 𝜃
expone a continuación:
3
̂2 ) = 𝑉( (𝑌1 + 𝑌2 + 𝑌3 − 𝑌4 )
→ 𝑉(𝜃
2
9
̂2 ) =
→ 𝑉(𝜃 ∙ 𝑉(𝑌1 + 𝑌2 + 𝑌3 − 𝑌4 )
4
9
̂2 ) =
→ 𝑉(𝜃 ∙ [𝑉(𝑌1 ) + 𝑉(𝑌2 ) + 𝑉(𝑌3 ) + 𝑉(𝑌4 )]
4
9
̂2 ) =
→ 𝑉(𝜃 ∙ [𝜎 2 + 𝜎 2 + 𝜎 2 + 𝜎 2 ]
4
36𝜎 2 36𝜃
̂2 ) =
→ 𝑉(𝜃 =
4 4∙6
3
̂2 ) =
→ 𝑉(𝜃 ∙𝜃
2
Conclusión
̂1 ) < 𝑉(𝜃
Realizando el análisis de varianza mínima, se logra identificar que 𝑉(𝜃 ̂2 ). Con esto,
es posible afirmar que 𝜃̂2 es mejor estimador insesgado para 𝜃 que 𝜃 ̂1 .
PROBLEMA 6
Sea X1, X2, X3,……Xn una muestra aleatoria de tamaño n de X que representa número de
brocas para taladro de corte que se revisan hasta encontrar “r” defectuosas, cuya función
de cuantía está dada por:
𝑥−1 𝑟 𝑥−𝑟
𝑃(𝑋 = 𝑥) = { 𝑟 − 1) 𝑝 (1 − 𝑝)
( 𝑠𝑖 𝑥 = 𝑟, 𝑟 + 1, 𝑟 + 2, …
100
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
En que:
𝑟
𝐸(𝑋) =
𝑝
𝑟(1 − 𝑝)
𝑉(𝑋) =
𝑝2
SOLUCIÓN 6-A
Sea:
X: Número de brocas para taladros de corte que se revisan hasta encontrar “r” defectuosas.
Estimación Puntual
i. Función de Verosimilitud
𝑛
𝑥𝑖 − 1 𝑟
→ 𝐿(𝑥, 𝑝) = ∏( ( ) 𝑝 (1 − 𝑝)𝑥𝑖 −𝑟 )
𝑟−1
𝑖=1
𝑛
𝑥𝑖 − 1 𝑟
→ ln(𝐿(𝑥, 𝑝)) = ln(∏( ( ) 𝑝 (1 − 𝑝)𝑥𝑖 −𝑟 ))
𝑟−1
𝑖=1
𝑛
𝑥𝑖 − 1 𝑟
→ ln(𝐿(𝑥, 𝑝)) = ∑(( ) 𝑝 (1 − 𝑝)𝑥𝑖 −𝑟 ))
𝑟−1
𝑖=1
𝑛
𝑥𝑖 − 1
→ ln(𝐿(𝑥, 𝑝)) = ∑ (ln( ( )) + 𝑟 ∙ ln(𝑝) + (𝑥𝑖 − 𝑟) ∙ ln(1 − 𝑝))
𝑟−1
𝑖=1
𝑛 𝑛
𝑥𝑖 − 1
→ ln(𝐿(𝑥, 𝑝)) = ∑ ln (( )) + 𝑟 ∙ 𝑛 ∙ ln(𝑝) + ln(1 − 𝑝) ∙ ∑( 𝑥𝑖 − 𝑟)
𝑟−1 101
𝑖=1 𝑖=1
𝑛
𝜕 𝑟∙𝑛 1
→ ln(𝐿(𝑥, 𝑝)) = − ∑(𝑥𝑖 − 𝑟) ∙
𝜕𝑝 𝑝 (1 − 𝑝)
𝑖=1
𝑛
𝑟∙𝑛 1
→ = ∙ ∑(𝑥𝑖 − 𝑟)
𝑝̂ (1 − 𝑝̂ )
𝑖=1
→ (1 − 𝑝̂ ) ∙ 𝑟 ∙ 𝑛 = ∑(𝑥𝑖 − 𝑟) ∙ 𝑝̂
𝑖=1
→ 𝑟 ∙ 𝑛 − 𝑟 ∙ 𝑛 ∙ 𝑝̂ = 𝑝̂ ∑(𝑥𝑖 ) − 𝑟 ∙ 𝑛 ∙ 𝑝̂
𝑖=1
𝑟∙𝑛
→ 𝑝̂ =
∑𝑛𝑖=1(𝑥𝑖 )
𝑟
→ 𝑝̂ =
𝑥̅
Conclusión
𝑟
El estimador máximo verosímil de p, corresponde a
𝑥̅
SOLUCIÓN 6-B
Por probar:
1
𝐸(𝑝∗ ) =
𝑝
1
→ 𝐸(𝑝∗ ) = ∙ 𝐸(𝑋̅)
𝑟
1 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
= ∙ 𝐸[ ]
𝑟 𝑛
1
= ∙ 𝐸[𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 ]
𝑟∙𝑛
1
= ∙ [𝐸(𝑋1 ) + 𝐸(𝑋2 ) + ⋯ 𝐸(𝑋𝑛 )]
𝑟∙𝑛
1
= ∙ 𝑛 ∙ 𝐸(𝑋)
𝑟∙𝑛
𝑟
→ 𝐸(𝑋) =
𝑝
1 𝑟
→ 𝐸(𝑝∗ ) = ∙𝑛∙
𝑟∙𝑛 𝑝
1
=
𝑝
Conclusión
A partir de la expresión expuesta anteriormente, queda verificado que 𝑝∗ es insesgado
para 𝑝.
103
PROBLEMA 1
Se realiza un estudio para analizar el comportamiento de cierto río, en relación a sus
desbordes que han ocurrido en los últimos años. Se sabe que la descarga de agua debido a
los desbordes tiene un comportamiento normal con una desviación típica de 200 [𝑝𝑖𝑒𝑠 3⁄𝑠]
Estime con un 95% de confianza la descarga promedio de los desbordes del río.
SOLUCIÓN
Sea:
X: Descargas de agua debido a los desbordes de cierto río, en [𝑝𝑖𝑒𝑠 3⁄𝑠]
Así, es posible denotar que lo que se requiere es estimar la media poblacional asociada a la
variable de interés, para lo cual existe la siguiente fórmula para realizar la estimación por
intervalo.
Caso 1
“Estimación por intervalo de la Media [𝜇], con la varianza poblacional [𝜎 2 ] conocida”
𝜎 𝜎
𝑃 (𝑥 − 𝑧1−𝛼 ∙ ≤ 𝜇 ≤ 𝑥 + 𝑧1−𝛼 ∙ )= 1−𝛼 (8.1)
2 √𝑛 2 √𝑛
Datos
A partir del enunciado, es posible identificar los siguientes datos:
𝑛 = 11
𝛼 = 0,05
Observación
Es importante mencionar, que en este caso se debe buscar en la tabla el valor de adentro de
𝛼
la misma, ya que el dato que se tiene “1 − 2 = 0,975”, corresponde a una probabilidad, no
al recorrido de la variable tipificada [Z] 105
200 200
→ 𝑃 (5090 − 1,96 ∙ ≤ 𝜇 ≤ 5090 + 1,96 ∙ ) = 0,95
√11 √11
→ 𝜇 ∈ [4971,808 ; 5208,192]
Conclusión
Con una confianza del 95%, es posible afirmar que la descarga promedio de los desbordes
del río, fluctúa entre 4971,808 [𝑝𝑖𝑒𝑠 3⁄𝑠] y 5208,192 [𝑝𝑖𝑒𝑠 3⁄𝑠]
PROBLEMA 2
El concreto que se está utilizando en una nueva obra de construcción de estacionamientos,
se le ha aplicado un nuevo método de curado. Se realizaron ensayos en muestras de
concreto midiendo su resistencia en [𝐼𝑏 ∙ 𝑝𝑙𝑔2 ], los resultados se presentan en la siguiente
tabla:
Resistencia ni
2000-2700 1
2700-2900 2
106
2900-3100 5
3100-3300 8
3300-3500 9
3500-3700 7
Tabla 12.Resistencia asociada a ensayos de muestras de concreto, en 𝐼𝑏 ∙ 𝑝𝑙𝑔2
a. Estime con una confianza del 95% la resistencia del promedio del concreto.
b. Se puede afirmar que la varianza de la resistencia del concreto es de
(265[𝐼𝑏 ∙ 𝑝𝑙𝑔2 ])2. Utilice 𝛼 = 0,05
c. Si se define el error de estimación como la mitad de la amplitud de un intervalo.
Encuentre y compare el error de estimación de un intervalo para la resistencia
promedio con una confianza del 95% y 90%
d. Estime con un 90% de confianza la proporción de ensayos que mostraron una
resistencia en el concreto inferior a 3100 ([𝐼𝑏 ∙ 𝑝𝑙𝑔2 ])
SOLUCIÓN 2 - A
Sea:
X: Resistencia asociada al concreto, en [𝐼𝑏 ∙ 𝑝𝑙𝑔2 ]
𝑋~𝑁(𝜇 = ? ; 𝜎 2 = ? )
Caso 2
“Estimación por intervalo de la Media [𝜇], con la varianza poblacional [𝜎 2 ] desconocida”
𝑠(𝑥) 𝑠(𝑥)
𝑃 (𝑥 − 𝑡(𝑛−1 , 𝛼
1− )
∙ ≤ 𝜇 ≤ 𝑥 + 𝑡(𝑛−1 , 𝛼
1− )
∙ )= 1−𝛼 (8.2)
2 √𝑛 2 √𝑛
Datos
A partir de la tabla expuesta en el enunciado, es posible obtener los siguientes datos:
𝑛 = 32
107
𝑥 = 3260,938 [𝐼𝑏 ∙ 𝑝𝑙𝑔2 ]
𝛼 = 0,05
→ 𝑡(𝑛−1 , 𝛼
1− )
= 𝑡(31 , 0,975) = 2,0395
2
289,809 289,809
→ 𝑃 (3260,938 − 2,0395 ∙ ≤ 𝜇 ≤ 3260,938 + 2,0395 ∙ ) = 0,95
√32 √32
→ 𝜇 ∈ [3155,513 ; 3364,487]
Conclusión
Con un 95% de confianza, es posible denotar que la resistencia media al concreto fluctúa
entre 3155,513 [𝐼𝑏 ∙ 𝑝𝑙𝑔2 ] y 3364,487 [𝐼𝑏 ∙ 𝑝𝑙𝑔2 ]
SOLUCION 2 - B
Caso 3
“Estimación por intervalo de la varianza poblacional [𝜎 2 ]”
(𝑛 − 1) ∙ [𝑠(𝑥)]2 2
(𝑛 − 1) ∙ [𝑠(𝑥)]2
𝑃( ≤ 𝜎 ≤ )= 1−𝛼 (8.3) 108
𝑥2 𝛼 𝑥2 𝛼
(𝑛−1,1− 2 ) (𝑛−1, 2 )
Datos
A partir de la tabla expuesta en el enunciado, es posible obtener los siguientes datos:
𝑛 = 32
𝛼 = 0,05
2 2
→ 𝑥(𝑛−1, 𝛼 = 𝑥(31,0,025) = 17,539
)
2
→ 𝜎 2 ∈ [ 53982,148 ; 148450,1369 ]
Conclusión
Se tiene que 2652 = 70225 [𝐼𝑏 ∙ 𝑝𝑙𝑔2 ]2 pertenece al intervalo confidencial, calculado con
un 95% de confianza. A partir de lo anterior, es posible afirmar que el valor planteado en el
enunciado está dentro del rango de estimación de la varianza. No obstante, no se tiene la
información suficiente, para estimar que la varianza se asocia puntualmente a dicho valor
enunciado.
SOLUCION 2 - C
→ 𝜇 ∈ [3155,513 ; 3364,487]
3364,487 − 3155,513
→𝐸=
2
→ 𝐸 = 104,487
289,809 289,809
→ 𝑃 (3260,938 − 𝑡31,;0,95 ∙ ≤ 𝜇 ≤ 3260,938 + 𝑡31,;0,95 ∙ ) = 0,9
√32 √32
→ 𝑡31,;0,95 = 1,6955
289,809 289,809
→ 𝑃 (3260,938 − 1,6955 ∙ ≤ 𝜇 ≤ 3260,938 + 1,6955 ∙ ) = 0,9
√32 √32
→ 𝜇 ∈ [3174,074 ; 3347,801]
110
3347,801 − 3174,074
→𝐸=
2
→ 𝐸 = 86,863
Observación
Es importante entender “a priori”, vale decir antes de realizar los cálculos, que al aumentar
el nivel de confianza, entonces la amplitud de un intervalo de estimación tiende a aumentar,
debido a que se debe tener más confianza en que el parámetro poblacional si pertenezca al
intervalo de estimación. Así, al ser más grande la amplitud a medida que se aumenta la
confianza, el error de estimación también debe tender a aumentar.
Conclusión
El error de estimación de la media, asociado a un 95% de confianza es más elevado que el
correspondiente al de un 90%, lo cual es consistente de acuerdo a lo esperado.
SOLUCION 2- D
En este caso, se pide estimar por intervalos la proporción, para lo que utilizaremos la
expresión representada en la ecuación (8.5)
𝑝̂ ∙ 𝑞̂ 𝑝̂ ∙ 𝑞̂
𝑃 (𝑝̂ − 𝑧1−𝛼 ∙ √ ≤ 𝑝 ≤ 𝑝̂ + 𝑧1−𝛼 ∙ √ )= 1−𝛼 (8.5)
2 𝑛 2 𝑛
Luego, es necesario determinar los valores asociados a los estimadores 𝑝̂ y 𝑞̂, para lo que
debemos recordar que el valor de “p” se asocia a la probabilidad de éxito de un experimento
de Bernoulli y “q” a la probabilidad de fracaso del mismo experimento, En este caso, a partir
de la tabla expuesta en el enunciado, es posible obtener el valor de los estimadores,
considerando un caso exitoso que “los ensayos presenten una resistencia en el concreto
inferior a 3100 [𝐼𝑏 ∙ 𝑝𝑙𝑔2 ]”.
8
→ 𝑝̂ = = 0,25
32
111
24
→ 𝑞̂ = = 0,75
32
Por otro lado, es necesario conocer el valor de "𝑧1−𝛼 ”, para lo que se utilizará la tabla de la
2
distribución normal, obteniendo:
1,64 + 1,65
→ 𝑧1−0,9 = 𝑧0,95 = = 1,645
2 2
→ 𝑝 ∈ [0,124 ; 0,376]
Conclusión
Con un 90% de confianza, es posible afirmar que la proporción de ensayos que mostraron
una resistencia en el concreto inferior a 3100 [𝐼𝑏 ∙ 𝑝𝑙𝑔2 ], fluctúa entre 0,124 y 0,376.
PROBLEMA 3
Si la distribución del espesor (X) del recubrimiento de cierta pintura de baja viscosidad
expresada en milímetros, se distribuye Normal con media y varianza 2
a) Estime con 98% de confianza el espesor medio del recubrimiento, en base a la
siguiente muestra aleatoria de espesores observadas:
0,83 0,88 0,88 1,04 1,09 1,12 1,29 1,31
1,48 1,49 1,59 1,62 1,65 1,71 1,76 1,83
112
b) ¿Qué tamaño de muestra es adecuado para estimar la proporción de recubrimientos
con un espesor entre 1,0 y 1,5 milímetros, con 90% de confianza y un error de
estimación de 0,035? (suponga que los datos del inciso A corresponden a una
muestra piloto)
SOLUCIÓN 3 - A
Sea:
𝑋: Espesor del recubrimiento de cierta pintura de baja viscosidad, en milímetros.
𝑋~𝑁(𝜇 = ? ; 𝜎 2 = ? )
Datos
A partir del enunciado, es posible recopilar los siguientes datos relevantes:
𝑛 = 16
1 − 𝛼 = 0,98 → 𝛼 = 0,02
𝑥 = 1,348
𝑠(𝑥) = 0,3385
Es importante identificar que se está pidiendo estimar por intervalo la media del espesor,
desconociendo la varianza poblacional. Así, notamos que estamos en presencia del “Caso
2”, por lo que reemplazaremos los datos anteriores en la ecuación (8.2), tal como se
muestra a continuación:
0,3385 0,3385
→ 𝑃 (1,348 − 𝑡15,;0,99 ∙ ≤ 𝜇 ≤ 1,348 + 𝑡15,;0,99 ∙ ) = 0,98
√16 √16
→ 𝑡15,;0,99 = 2,6025
0,3385 0,3385
→ 𝑃 (1,348 − 2,6025 ∙ ≤ 𝜇 ≤ 1,348 + 2,6025 ∙ ) = 0,98
√16 √16
→ 𝜇 ∈ [1,1278 ; 1,568]
Conclusión
Con un 98% de confianza, es posible afirmar que el espesor medio del recubrimiento de 113
cierta pintura, fluctúa entre 1,1278 [mm] y 1,568 [mm]
SOLUCIÓN 3 – B
Primero que todo es necesario obtener los valores de 𝑝̂ 𝑦 𝑞̂, considerando como “éxito” que
el espesor fluctúe entre 1 y 1,5 milímetros. Esto se realizará a partir de los datos expuestos
en la tabla de la parte A del ejercicio.
7
→ 𝑝̂ = = 0,4375
16
9
→ 𝑞̂ = = 0,5625
16
Además, con respecto al nivel de significación, se tiene que:
→ 1 − 𝛼 = 0,9 → 𝛼 = 0,1
Luego, a partir de la ecuación que representa el error de estimación en este caso, es posible
despejar el valor del número de muestra asociado a un error de 0,035. Para esto, se utilizará
la ecuación (8.6), que representa el cálculo del error de estimación por intervalo de la
proporción.
𝑝̂ ∙ 𝑞̂
𝐸 = 𝑧1−𝛼 ∙ √ (8.6)
2 𝑛
0,4325 ∙ 0,5675
→ 0,035 = 𝑧0,95 ∙ √
𝑛
0,4325 ∙ 0,5675
→ 0,035 = 1,645 ∙ √
𝑛
Observación
Es importante denotar que al realizar el cálculo del número de muestras asociado a cierto
error de estimación, en caso de que se obtengan valores decimales, siempre se aproximará
al entero sucesor, con el fin de ser conservador. 114
Conclusión
Con un 90% de confianza, es posible afirmar que el número de muestras apropiado para
que el error asociado a la estimación de recubrimientos con espesor comprendido entre 1
y 1,5 milímetros corresponda a 0,035; se asocia a 544 muestras.
PROBLEMA 4
Un ingeniero recolectó información acerca del tiempo de trabajo, en horas, requerido por
una máquina (A) para fabricar silenciadores para automóvil. Al tomar una muestra de 30
silenciadores fabricados por la máquina A, se obtuvo:
Máquina A
Tiempo N° de silenciadores
0,48-1,18 4
1,18-1,88 8 115
1,88-2,58 9
2,58-3,28 6
3,28-3,98 3
SOLUCIÓN
Sea:
𝑋: Tiempo de trabajo requerido por una máquina A, en horas.
“A priori”, es importante identificar que estamos en presencia del “caso 4”, el cual
corresponde a la estimación de la proporción, donde dicho parámetro en este caso se asocia
a un “éxito” correspondiente a que el tiempo de fabricación de la máquina fluctúe entre
1,18 y 2,6 horas.
Así, para utilizar la ecuación (8.5), es necesario conocer los valores de los estimadores 𝑝̂ y
𝑞̂. Para esto se utilizará la tabla expuesta en el enunciado, donde se observa que el valor
2,6 no se encuentra puntualmente como límite de intervalo, por lo que será necesario
realizar un cálculo de percentiles.
30𝑘
( − 21)
→ 2,6 = 2,58 + 0,7 ∙ 100
6
→ 𝑘 = 70,571%
70,571
→ ∙ 30 = 21,1714
100
17,1714
→ 𝑝̂ = = 0,5724
30
→ 𝑞̂ = 0,4276 116
→ 1 − 𝛼 = 0,9 → 𝛼 = 0,1
→ 𝑝 ∈ [0,424 ; 0,721]
Conclusión
Con un 90% de confianza, es posible afirmar que la proporción de silenciadores que
presentan un tiempo de fabricación comprendido entre 1,18 horas y 2,6 horas; fluctúa entre
0,424 y 0,721.
PROBLEMA 5
Se está estudiando la duración de ciertos procesos productivos y se toma una muestra
aleatoria, de tamaño 10. Se define como “Proceso Corto” cuando su duración es menor que
5 minutos, los datos obtenidos, en minutos, fueron:
SOLUCIÓN 5 - A
Sea:
X = Duración de cierto proceso productivo, en minutos.
5
→ 𝑝̂ = = 0,5
10
→ 𝑞̂ = 0,5
→ 1 − 𝛼 = 0,98 → 𝛼 = 0,02
→ 𝑝 ∈ [0,132 ; 0,868]
Conclusión
Con un 98% de confianza, es posible afirmar que la proporción de “Procesos Cortos”, se
encuentra comprendida entre 0,132 y 0,868. 118
SOLUCION 5 - B
Primero que todo determinaremos a partir de la ecuación (8.6), el error probable asociado
a la estimación realizada sin la modificación.
0,5 ∙ 0,5
→ 𝐸 = 2,33 ∙ √ = 0,3684
10
10
̂ = 0,5 −
→ 𝑝` ∙ 0,5 = 0,45
100
̂ = 0,55
→ 𝑞`
→ 1 − 𝛼 = 0,95 → 𝛼 = 0,05
0,45 ∙ 0,55
→ 0,3684 = 𝑧0,975 ∙ √
𝑛
0,45 ∙ 0,55
→ 0,3684 = 1,96 ∙ √
𝑛
→ 𝑛 = 7,0056 ≈ 8 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠
Conclusión
Con un 95% de confianza, es posible afirmar que el número de muestras asociado a un error
de estimación de “Procesos Cortos” igual a 0,3684; corresponde a 8 muestras.
SOLUCION 5 - C
Primero, notamos que estamos en presencia del caso 3, ya que se requiere estimar la
varianza, por lo que utilizaremos la ecuación (8.3) para realizar la estimación.
→ 1 − 𝛼 = 0,99 → 𝛼 = 0,01
Por otro lado, es necesario conocer el valor de la desviación estándar muestral, la cual es
posible obtenerla a partir de la tabla expuesta en el enunciado.
→ 𝑠(𝑥) = 2,3489
(10 − 1) ∙ [2,3489]2 2
(10 − 1) ∙ [2,3489]2
→ 𝑃( 2 ≤ 𝜎 ≤ 2 ) = 0,99
𝑥(9,0,995) 𝑥(9, 0,005)
→ 𝜎 2 ∈ [2,105 ; 28,620]
Conclusión
Con un 99% de confianza, es posible afirmar que la varianza poblacional de los datos
asociados a la duración en minutos de cierto proceso productivo, fluctúa entre 2,105 y
28,620 [min2]
PROBLEMA 1.
SOLUCIÓN
Sea:
X= Tensión de ruptura de un hilo utilizado en la fabricación de material de tapicería, en
psi.
𝑋~𝑁(𝜇, 𝜎 2 = 4)
Datos
m.a.t (9)
𝛼 = 0,05
Dócima
𝐻0 : 𝜇 ≥ 100
𝐻1 : 𝜇 < 100
Estadística
𝑥̅ − 𝜇0
𝑇= 𝜎 (9.1)
⁄ 𝑛
√
A partir de la tabla 1, se puede obtener el valor del promedio de la muestra “𝑥̅ ” .Es posible
determinarla ingresando los valores de la tabla a la calculadora con frecuencia 1 , o bien por
la fórmula del promedio estudiada en estadística descriptiva.
𝑥̅ = 97 [𝑝𝑠𝑖]
97 − 100
𝑇= = −4,5
2⁄
√9
Región Crítica
121
Al no ser una igualdad, se considera sólo la región crítica según la desigualdad de la hipótesis
alternativa [H1]
Conclusión
Es posible observar que el estadístico de prueba “T” pertenece a la región crítica. A partir
de esto es posible rechazar la hipótesis nula. Según lo expuesto anteriormente, se puede
concluir con un nivel de confianza del 95%, que la tensión de ruptura de un hilo utilizado en
la fabricación de material no cumple con el requerimiento de que sea al menos de 100 [psi].
PROBLEMA 2.
En una embotelladora de refresco, el proceso de llenado realizado por una máquina está
fuera de control cuando la desviación estándar de la cantidad de refresco vertida supera
0,02 [u.m]. Para controlar la variabilidad se tomó una muestra aleatoria de 28 botellas
llenadas por la máquina y se obtuvo una desviación estándar s=0,027 [u.m]. ¿Qué se puede
concluir con un 90% de confianza?
SOLUCIÓN
Sea: 122
X= Cantidad de refresco vertida, en [u.m]
𝑋~𝑁(𝜇, 𝜎 2 )
Datos
m.a.t (28)
𝛼 = 0,10
𝑠(𝑥) = 0,027 [𝑢. 𝑚]
Dócima
𝐻0 : 𝜎 2 ≤ 0,022
𝐻1 : 𝜎2 > 0,022
Estadística
(𝑛 − 1) ∗ 𝑠 2
𝑇= (9.3)
𝜎02
(28 − 1) ∗ (0,027)2
𝑇= = 49,208
0,0202
Región Crítica
Al no ser una igualdad, se considera sólo la región crítica según la desigualdad de la hipótesis
alternativa [H1]
2
𝑅𝐶: 𝑇 > 𝑋(𝑛−1;1−𝛼) (9.4)
Conclusión
Es posible observar que el estadístico de prueba “T” pertenece a la región crítica. A partir
de esto es posible rechazar la hipótesis nula [H0]. Según lo expuesto anteriormente, se
puede concluir con un nivel de confianza del 90%, que si la desviación estándar de la
cantidad de refresco vertida supera 0,02 [u.m], entonces la máquina esta fuera de control.
PROBLEMA 3
Una empresa dedicada a la fabricación de vidrio quiere incluir lunas entre los productos que
fabrican, piensan comercializarlas en la industria de automóvil. Las especificaciones de
estos productos siguen una resistencia media al impacto de 8 [kg/cm2]. Para ello ha
realizado pruebas de fabricación obteniendo los siguientes resultados de resistencia al
impacto:
7,2 4,3 8,7 9,0 6,7 10,2 5,4 7,2 8,3 124
Con un nivel de significación de 1%. ¿Se puede afirmar que las lunas fabricadas cumplen
con la especificación requerida?
SOLUCIÓN
Sea:
X= Resistencia al impacto de lunas producidas por una empresa dedicada a la fabricación
𝑘𝑔
de vidrios, en [ ⁄𝑐𝑚2 ]
𝑋~𝑁(𝜇, 𝜎 2 )
Datos
m.a.t (9)
𝛼 = 0,01
Dócima
𝐻0 : µ = 8
𝐻1 : µ ≠ 8
Estadística
𝑥̅ − µ0
𝑇= 𝑠 (9.5)
⁄ 𝑛
√
Los valores de la desviación estándar muestral (s) y del promedio (𝑥̅ ), se pueden determinar
a partir de la tabla 2. Estos valores, se pueden obtener ingresando los valores de las
muestras a la calculadora con frecuencia 1, o bien por la fórmula de varianza muestral y del
promedio respectivamente, las cuales fueron estudiadas en estadística descriptiva.
𝑥̅ = 7,444
𝑠(𝑥) = 1,839
125
7,444 − 8
𝑇= = −0,907
1,839
⁄
√9
Región Crítica
𝑅𝐶: 𝑇 < −𝑡(8 ; 0,995) ˅ 𝑇 > 𝑡(8 ;0,995) → 𝑇 < −3,3554 ˅ 𝑇 > 3,3554
Conclusión
Es posible observar que el estadístico de prueba “T” no pertenece a la región crítica. A partir
de esto, se puede afirmar que no existe información suficiente para rechazar la hipótesis
nula [H0]. Según lo expuesto anteriormente, se puede concluir con un nivel de confianza del
99%, que la resistencia media al impacto de las lunas corresponde a 8 [kg/cm2], con esto se
puede afirmar que dichos productos si cumplen con las especificaciones requeridas para su
comercialización.
PROBLEMA 4
El tiempo de acceso al disco duro (X) en un cierto modelo de computador es una variable
aleatoria con media 15 [ms]. Se ha propuesto una modificación técnica con objeto de
disminuir este tiempo de acceso. Se prueba el nuevo sistema en 10 computadores
obteniéndose:
SOLUCIÓN
Sean:
X= Tiempo de acceso al disco duro en un cierto modelo de computador, sin realizar
modificación, en milisegundos.
𝑥~𝑁(µ = 15, 𝜎 2 )
𝑦~𝑁(µ, 𝜎 2 )
Datos
m.a.t (10)
𝛼 = 0,05
Dócima
𝐻0 : µ ≥ 15
𝐻1 : µ < 15
Estadística
𝑦̅ − µ0
𝑇= 𝑠 (9.7)
⁄ 𝑛
√
El valor del promedio y la desviación estándar muestral, es posible obtenerlos según las
fórmulas de estadística descriptiva.
127
∑𝑦
𝑦̅ = = 13,1
𝑛
∑ 𝑦 2 − 𝑛 ∗ 𝑦̅ 2 1801 − 10 ∗ 13,12
𝑉(𝑦) = = = 9,433
𝑛−1 10 − 1
13,1 − 15
𝑇= = −1,956
3,071
⁄
√10
Región Crítica
Se sabe que los formularios están hechos para igualdades. En el planteamiento de la dócima
es posible notar que se está en presencia de una desigualdad. Así se considera en la región
crítica sólo la parte de ella en donde la desigualdad coincide con la de la hipótesis alternativa
[H1]
Conclusión
128
Es posible observar que el estadístico de prueba “T” pertenece a la región crítica. A partir
de esto, se puede rechazar la hipótesis nula [H0]. Según lo expuesto anteriormente, es
posible concluir con un nivel de confianza del 95%, que el tiempo de acceso al disco duro
disminuye al realizar la modificación técnica, esto en comparación con el tiempo empleado
originalmente.
PROBLEMA 5
Una empresa se plantea la posibilidad de establecer un servicio complementario de
información a sus clientes. Éste será rentable únicamente si más del 40% de los clientes
están interesados. Para poder tomar una decisión se realizó un sondeo con una muestra
aleatoria de 100 clientes, de los cuales 45 están de acuerdo.
Sea:
X= Número de clientes interesados en establecer un servicio complementario de
información.
𝑥~𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝑝)
Datos
m.a.t (100)
𝛼 = 0,04
Dócima
𝐻0 : 𝑝 ≤ 0,4
𝐻1 : 𝑝 > 0,4
Estadística
𝑝̂ − 𝑝0
𝑇= (9.9)
√𝑝0 𝑞0⁄𝑛
45
𝑝̂ = = 0,45
100
0,45 − 0,4
𝑇= = 1,021
√0,4 ∗ 0,6⁄ 130
100
Región Crítica
En este caso, es importante recordar que los formularios están hechos para igualdades. En
el planteamiento de la dócima es posible notar que se está en presencia de una desigualdad.
Así se considera en la región crítica sólo la parte de ella en donde la desigualdad coincide
con la de la hipótesis alternativa [H1]
Conclusión
PROBLEMA 1
Se revisó la dureza del agua de dos muestras obtenidas a partir de brocas de salida
separadas de una planta de energía. Los resultados codificados (partes por millón) se
presentan a continuación:
1 9 504 29101
2 14 868 54201
Tabla 15.Datos en base a la dureza del agua provenientes de los lugares 1 y 2.
Pruebe la hipótesis “la varianza de la dureza del agua proveniente del lugar 1 es igual que
la del lugar 2” (𝜎12 = 𝜎22 ). Utilice un nivel de significación 0,05.
SOLUCIÓN
Sea:
Y= Dureza del agua, en partes por millón.
𝑌~𝑁(𝜇, 𝜎 2 )
Datos
𝑛1 = 9
𝑛2 = 14
𝛼 = 0,05
2 muestras aleatorias independientes
Dócima
𝐻0 : 𝜎12 = 𝜎22 → 𝜎12 − 𝜎22 = 0
𝐻1 : 𝜎21 ≠ 𝜎22 → 𝜎21 − 𝜎22 ≠ 0
Estadística
𝑠12
𝑇= (10.1)
𝑠22
10,4702
𝑇= = 3,701
5,4422
Región Crítica
1
𝐹(8,13; 0,025) = = 0,2403
𝐹(13,8,0,975)
Conclusión
Es posible observar que el estadístico de prueba “T” pertenece a la región crítica. A partir
de esto es posible rechazar la hipótesis nula. Según lo expuesto anteriormente, se puede
concluir con un nivel de significación 0,05, que la hipótesis “la varianza de la dureza del agua
proveniente del lugar 1 es igual que la del lugar 2” es incierta. 133
PROBLEMA 2
Se midió la resistencia a la tensión en dos tipos de varillas (10 [mm] y 12 [mm] de diámetro).
Los resultados de 50 mediciones, para cada tamaño son:
SOLUCIÓN
Sea:
Y= Resistencia a la tensión, en [N/mm2]
𝑌~𝑁(𝜇, 𝜎 2 )
Datos
𝑛1 = 50
𝑛2 = 50
𝛼 = 0,05
2 muestras aleatorias independientes
Dócima
𝐻0 : 𝜇1 + 8 = 𝜇2 → 𝜇1 − 𝜇2 = − 8
𝐻1 : 𝜇1 + 8 ≠ 𝜇2 → 𝜇1 − 𝜇2 ≠ − 8
Según el enunciado dado, no se sabe si las varianzas poblacionales son iguales o distintas,
es por esto que es necesario analizar homocedasticidad. Este análisis se realiza según la
siguiente prueba de hipótesis:
Dócima previa
Estadística previa
𝑠12 135
𝑇= (10.3)
𝑠22
𝑠(𝑦1 ) = √𝑉(𝑦1 ) = 24
𝑠(𝑦2 ) = √𝑉(𝑦2 ) = 20
242
𝑇= = 1,44
202
𝑅𝐶: 𝑇 < 𝐹(49,49; 0,025) ˅ 𝑇 > 𝐹(49,49; 0,975) → 𝑇 < 0,568 ˅ 𝑇 > 1,762
Conclusión previa
Con un 95% de confianza, se puede afirmar que no existe información suficiente para
rechazar la hipótesis nula. A partir de esto es factible inferir que las varianzas poblacionales
son iguales. 136
Ahora se sabe que ambas varianzas poblacionales son iguales y desconocidas, a partir de
esto es posible realizar el test de hipótesis.
Estadística
𝑦̅1 − 𝑦̅2 − 𝜇0
𝑇= (10.5)
𝑠𝑝 √1⁄𝑛1 + 1⁄𝑛2
Con
(𝑛1 − 1)𝑠12 + (𝑛2 − 1)𝑠22
𝑠𝑝 = √ (10.6)
𝑛1 + 𝑛2 − 2
𝑠𝑝 = 22,091
545 − 555 + 8
𝑇= = −0,453
22,091√1⁄50 + 1⁄50
Región Crítica
Con
𝑛𝑝 = 𝑛1 + 𝑛2 − 2 → 𝑛𝑝 = 98
Conclusión
Es posible observar que el estadístico de prueba “T” no pertenece a la región crítica. A partir
de esto es posible “aceptar” la hipótesis nula [H0]. Según lo expuesto anteriormente, se 137
puede concluir con un nivel de confianza del 95%, que las mediciones de resistencia a la
tensión de varillas de 12 [mm] de diámetro, son en promedio 8 unidades mayores que las
correspondientes a las varillas de 10 [mm] de diámetro.
PROBLEMA 3
Los datos que se muestran a continuación son los grados de dureza de Brinell obtenidos
para muestras de dos aleaciones de magnesio:
Aleación 1 64,8 63,7 63,6 64,8 65,8 63,7 65,1 64,9 63,7 65,5
Aleación 2 69,4 61,9 69,9 70,1 71,1 73,5 63,3 68,2 69,7 66,8
Tabla 17.Grados de dureza de Brinell para muestras de dos aleaciones de Magnesio.
138
Los datos muestrales, ¿Apoyan la hipótesis 𝜇1 < 𝜇2 ? Utilice 𝛼 = 0,05
SOLUCIÓN
Sea:
X= Grados de dureza de Brinell
𝑋~𝑁(𝜇, 𝜎 2 )
Datos
𝑛1 = 10
𝑛2 = 10
𝛼 = 0,05
2 muestras aleatorias independientes
Dócima
𝐻0 : 𝜇1 ≥ 𝜇2 → 𝜇1 − 𝜇2 ≥ 0
𝐻1 : 𝜇1 < 𝜇2 → 𝜇1 − 𝜇2 < 0
Al igual que en problema anterior, no se sabe si las varianzas poblacionales son iguales o
distintas, es por esto que es necesario analizar homocedasticidad. Este análisis se realiza
según la siguiente prueba de hipótesis:
Dócima previa
Estadística previa
𝑠12
𝑇= (10.8)
𝑠22
𝑠(𝑥1 ) = 0,822
𝑠(𝑥2 ) = 3,527
139
Así, reemplazando en la ecuación (10.8), es posible determinar el estadístico de prueba “T”.
0,8222
𝑇= = 0,0543
3,5272
𝑅𝐶: 𝑇 < 𝐹(9,9; 0,025) ˅ 𝑇 > 𝐹(9,9; 0,975) → 𝑇 < 0,2484 ˅ 𝑇 > 4,0260
Conclusión previa
Con un 95% de confianza, es posible rechazar la hipótesis nula. A partir de esto se es factible
inferir que las varianzas poblacionales son distintas.
Ahora se sabe que ambas varianzas poblacionales son distintas y desconocidas, a partir de
esto es posible resolver el problema de Behrens-Fisher.
Estadística
𝑥̅1 − 𝑥̅2
𝑇= (10.10)
2 2
√𝑠1 ⁄𝑛 + 𝑠2⁄𝑛
1 2
64,56 − 68,39
𝑇= = −3,344
2 2
√0,822 ⁄ + 3,527 ⁄
10 10
Región Crítica
140
𝑅𝐶: 𝑇 < −𝑡(𝑣;1−𝛼) (10.11)
2
Con
𝑠2 𝑠2
( 1 ⁄𝑛1 + 2⁄𝑛2 )2
𝑣= 2 → 𝑣 = 9,9748 ≈ 9
𝑠 𝑠2
( 1 ⁄𝑛1 )2⁄ ( 2⁄𝑛2 )2⁄
(𝑛1 − 1) + (𝑛2 − 1)
Conclusión
Es posible observar que el estadístico de prueba “T” pertenece a la región crítica. A partir
de esto es posible rechazar la hipótesis nula [H0]. Según lo expuesto anteriormente, se
puede concluir con un nivel de confianza del 95%, que los datos muestrales obtenidos
apoyan la hipótesis 𝜇1 < 𝜇2
PROBLEMA 4
Problema 01 02 03 04 05 06 07 08 09 10
Equipo 1 12 15 14 21 19 12 25 18 17 20 141
Equipo 2 25 26 21 23 31 19 35 28 27 26
Tabla 18. Tiempos de solución de probemas de los equipos 1 y 2.
Pruebe con 𝛼 = 0,10, que el tiempo medio para solucionar problemas es el mismo en
ambos equipos.
SOLUCIÓN
Sea:
X= Tiempos de solución que tarda un equipo en resolver problemas diferentes, en minutos.
𝑥~𝑁(µ, 𝜎 2 )
Datos
𝑛 = 10
𝛼 = 0,10
2 muestras aleatorias pareadas
Observación
Es posible identificar que son muestras pareadas, debido a que se realizan distintas
observaciones al mismo individuo. Para efectos del problema, se tienen distintos equipos
que resuelven los mismos tipos de problemas estipulados.
Dócima
𝐻0 : 𝜇1 = 𝜇2 → 𝜇1 − 𝜇2 = 0
𝐻1 : 𝜇1 ≠ 𝜇2 → 𝜇1 − 𝜇2 ≠ 0
Estadística
𝑥
̅̅̅1 − ̅̅̅
𝑥2
𝑇= 𝑠 (10.12)
𝑑
⁄
√𝑛
Para el cálculo del parámetro 𝑠𝑑 es recomendable realizar las diferencias entre los tiempos
del equipo 1 y 2 para cada problema. Posteriormente se plantea ingresar dichos valores a
la calculadora con frecuencia 1. Finalmente es posible obtener la desviación típica muestral
utilizando la misma metodología aprendida en “estadística descriptiva” 142
17,3 − 26,1
𝑇= = −8,451
3,293
⁄
√10
Región Crítica
Conclusión
Es posible observar que el estadístico de prueba “T” pertenece a la región crítica. A partir
de esto, se puede rechazar la hipótesis nula [H0]. Según lo expuesto anteriormente, es
posible concluir con un nivel de confianza del 90%, que el tiempo medio para solucionar
problemas no es el mismo en ambos equipos.
PROBLEMA 5
El Ministerio del Trabajo desea saber si un plan de seguridad en el trabajo es efectivo en la
reducción del número de accidentes laborales y, por tanto, en la pérdida de horas de trabajo
debido a accidentes. Para ello, hace un seguimiento en 12 fábricas (seleccionadas
aleatoriamente) observando las horas de trabajo semanales pérdidas a causa de accidentes.
Para ello, hace un seguimiento en 12 fábricas (seleccionadas aleatoriamente) observando
las horas de trabajo semanales perdidas a causa de accidentes, antes y después de
implantar el plan de seguridad. Los datos son los de la tabla siguiente:
143
Fábrica 1 2 3 4 5 6 7 8 9 10 11 12
Antes (1) 55 63 90 47 75 90 73 92 110 33 44 74
Después (2) 52 60 85 49 65 87 67 85 95 35 47 70
Tabla 19.Horas pérdidas de trabajo debido a accidentes, antes y después de implementar plan de seguridad.
SOLUCIÓN
Sea:
X= Tiempo perdido de trabajo semanalmente debido a accidentes, en horas.
𝑋~𝑁(µ, 𝜎 2 )
Datos
𝑛 = 12
𝛼 = 0,05
2 muestras aleatorias pareadas
Observación
Es posible identificar que son muestras pareadas, debido a que se realizan distintas
observaciones al mismo individuo. En esta ocasión particular, se tienen estudios antes y
después de implementar el plan de seguridad, aplicados dentro de las mismas fábricas.
Dócima
𝐻0 : 𝜇1 ≤ 𝜇2 → 𝜇1 − 𝜇2 ≤ 0
𝐻1 : 𝜇1 > 𝜇2 → 𝜇1 − 𝜇2 > 0
Estadística
𝑥
̅̅̅1 − ̅̅̅
𝑥2 144
𝑇= 𝑠 (10.14)
𝑑
⁄
√𝑛
70,500 − 66,417
𝑇= = 2,732
5,178
⁄
√12
Región Crítica
Conclusión
PROBLEMA 6
Dos pegamentos, I y II, pueden utilizarse para fabricar vigas laminadas. De 80 vigas
fabricadas por el pegamento I, 8 fallaron en una prueba de resistencia, mientras que 16 de
las 80 vigas hechas con el pegamento II fallaron en la misma prueba. ¿Se puede concluir con
un nivel de significación de 0,05 que el pegamento I es mejor que el II?
SOLUCIÓN
Sea: 145
X= Número de vigas fabricadas que fallan en una prueba de resistencia, en una muestra de
tamaño 80.
𝑥~𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝑝)
Datos
m.a.t (80)
𝛼 = 0,05
Dócima
𝐻0 : 𝑝1 ≥ 𝑝2 → 𝑝1 − 𝑝2 ≥ 0
𝐻1 : 𝑝1 < 𝑝2 → 𝑝1 − 𝑝2 < 0
Estadística
𝑝̂1 − 𝑝̂ 2
𝑇= (10.16)
𝑝̂ ∗ 𝑞̂ 𝑝̂ ∗ 𝑞̂
√ 1 1+ 2 2
𝑛1 𝑛2
El valor del estimador 𝑝̂1 es posible determinarlo a partir de la muestra aleatoria, donde 8
vigas fallan.
8
𝑝̂1 = = 0,1
80
16
𝑝̂2 = = 0,2
80
Así, reemplazando en la ecuación (10.16), es posible determinar el estadístico de prueba
“T”.
146
0,1 − 0,2
𝑇= = −1,789
√0,1 ∗ 0,9 + 0,2 ∗ 0,8
80 80
Región Crítica
Conclusión
Es posible observar que el estadístico de prueba “T” pertenece a la región crítica. A partir
de esto, es posible rechazar la hipótesis nula [H0]. Según lo expuesto anteriormente, se
puede concluir con un nivel de confianza del 95%, que el pegamento I es “mejor” que el II.
Lo anterior, en base a un estudio realizado en muestras de vigas a las que se les midió la
resistencia a la tracción.
PROBLEMA 7
De acuerdo con los datos del Departamento de Evaluación, Medición y Registro Educacional
DEMRE, se efectúa un estudio de los puntajes obtenidos en la PSU de Matemática, de los
alumnos que la han rendido por segunda vez, a fin de analizar si se produce una mejoría de
más de 50 puntos en los puntajes promedios. Para tales efectos, se selecciona una muestra
aleatoria de doce alumnos que han rendido dicha prueba en forma consecutiva en los dos
últimos años y los resultados obtenidos fueron los siguientes:
Alumno 1 2 3 4 5 6 7 8 9 10 11 12
147
PSU 2012 450 650 600 550 520 590 440 400 540 380 650 450
PSU 2013 507 697 662 623 592 667 478 458 611 429 703 493
Suponiendo validos los supuestos necesarios, ¿Qué concluiría usted, con nivel de
significación del 10%?
SOLUCIÓN
Sea:
X= Puntajes de PSU obtenidos por alumnos en el área de Matemáticas.
𝑥~𝑁(µ, 𝜎 2 )
Datos
𝑛 = 12
𝛼 = 0,1
2 muestras aleatorias pareadas
Observación
Es posible identificar que son muestras pareadas, debido a que se realizan distintas
observaciones al mismo individuo. Para efectos de este problema en particular, se tienen
pruebas de selección universitarias de distintos años rendidas por los mismos alumnos.
Dócima
𝐻0 : 𝜇1 + 50 ≥ 𝜇2 → 𝜇1 − 𝜇2 ≥ −50
𝐻1 : 𝜇1 + 50 < 𝜇2 → 𝜇1 − 𝜇2 < −50
Estadística
𝑥1 − 𝑥
̅̅̅ ̅̅̅2 − µ0
𝑇= 𝑠𝑑 (10.18)
⁄
√𝑛
148
518,333 − 576,667 + 50
𝑇= = −2,245
12,858
⁄
√12
Región Crítica
Conclusión
Es posible observar que el estadístico de prueba “T” pertenece a la región crítica. A partir
de esto, se puede rechazar la hipótesis nula [H0]. A partir de lo descrito anteriormente, es
posible inferir con un nivel de confianza del 90%, que el rendimiento de los alumnos que
dan la PSU de Matemáticas por segunda vez consecutiva, aumenta en promedio más de 50
puntos en el año 2013. Lo anterior, comparando dichos puntajes con los del año 2012.
PROBLEMA 8
Un ingeniero recolectó información acerca del tiempo de trabajo, en horas, requerido por
dos máquinas (A y B) para fabricar silenciadores para automóvil. Al tomar una muestra de
30 silenciadores fabricados por la máquina A, se obtuvo:
Tabla 20.Datos obtenidos de los tiempos empleados por la máquina B en fabricar un silenciador.
Máquina A
Tiempo Número de Silenciadores
O,48-1,18 4
1,18-1,88 8
1,88-2,58 9
2,58-3,28 6
3,28-3,98 3
Tabla 21. Frecuencia absoluta según tiempo de fabricación de silenciadores.
El ingeniero cree que el tiempo promedio empleado por la máquina A en fabricar los
silenciadores es menor que el tiempo promedio empleado por la máquina B. ¿Con un nivel
de significación del 5%, estaría usted de acuerdo?
SOLUCIÓN
Sean:
X= Tiempo que emplea la máquina B en fabricar un silenciador, en horas.
𝑋~𝑁𝑜𝑟𝑚𝑎𝑙(µ𝑥 ; 𝜎𝑥2 )
Datos
𝑛1 = 20
𝑛2 = 30
𝛼 = 0,05
2 muestras aleatorias independientes
Dócima
𝐻0 : 𝜇𝑥 ≤ 𝜇𝑦 → 𝜇𝑥 − 𝜇𝑦 ≤ 0
𝐻1 : 𝜇𝑥 > 𝜇𝑦 → 𝜇𝑥 − 𝜇𝑦 > 0
Según el enunciado dado, no se sabe si las varianzas poblacionales son iguales o distintas,
es por esto que es necesario analizar homocedasticidad. Este análisis se realiza según la
siguiente prueba de hipótesis:
Dócima previa
Estadística previa
𝑠𝑥2
𝑇 = 2 (10.20)
𝑠𝑦
Por otro lado, a partir de la tabla 7, es posible obtener la desviación estándar 151
correspondiente a los datos de la máquina A.
0,660
𝑇= = 0,942
0,701
𝑅𝐶: 𝑇 < 𝐹(19,29; 0,025) ˅ 𝑇 > 𝐹(19,29; 0,975) → 𝑇 < 0,418 ˅ 𝑇 > 2,2131
Conclusión previa
Con un 95% de confianza, se puede afirmar que no existe información suficiente para
rechazar la hipótesis nula. A partir de esto es factible inferir que las varianzas poblacionales
son iguales.
Ahora se sabe que ambas varianzas poblacionales son iguales y desconocidas, a partir de
esto es posible realizar el test de hipótesis.
Estadística
𝑥−𝑦
𝑇= (10.22)
𝑠𝑝 √1⁄𝑛1 + 1⁄𝑛2
152
Con
(𝑛1 − 1)𝑠𝑥2 + (𝑛2 − 1)𝑠𝑦2
𝑠𝑝 = √ (10.23)
𝑛1 + 𝑛2 − 2
𝑠𝑝 = 0,828
2,540 − 2,137
𝑇= = 1,686
0,828√1⁄20 + 1⁄30
Región Crítica
Con
𝑛𝑝 = 𝑛1 + 𝑛2 − 2 → 𝑛𝑝 = 48
Conclusión
Es posible observar que el estadístico de prueba “T” pertenece a la región crítica. A partir
de esto, es factible rechazar la hipótesis nula [H0]. Así, con un 95% de confianza, se decide
apoyar lo que plantea el ingeniero.
PROBLEMA 9
Muchos autores afirman que las mujeres fumadoras tienen un mayor nivel de neurosis que
las no fumadoras. La siguiente información presenta los puntajes (Y) obtenidos por grupos
de mujeres (seleccionadas aleatoriamente) de edad entre 35 y 50 años fumadoras y no
fumadoras en una prueba diseñada para medir el nivel de neurosis.
Fumadoras (1) 24 36 18 34 28 18 25 32 36 37
No fumadoras (2) 13 16 17 19 27 22 28 20 13 18
Tabla 22.Resultados de puntajes obtenidos por mujeres fumadoras y no fumadoras.
153
¿Se puede inferir con 𝛼 = 0,05, que la diferencia media de puntaje es por más de 3 puntos?
SOLUCIÓN
Sea:
Y= Puntajes obtenidos por grupo de mujeres de edad entre 35 y 50 años, en una prueba
que mide el nivel de neurosis.
𝑌~𝑁𝑜𝑟𝑚𝑎𝑙(µ𝑦 ; 𝜎𝑦2 )
Datos
𝑛1 = 10
𝑛2 = 10
𝛼 = 0,05
2 muestras aleatorias independientes
Dócima
𝐻0 : 𝜇1 ≤ 𝜇2 + 3 → 𝜇1 − 𝜇2 ≤ 3
𝐻1 : 𝜇1 > 𝜇2 + 3 → 𝜇1 − 𝜇2 > 3
No se sabe si las varianzas poblacionales son iguales o distintas, es por esto que es necesario
analizar homocedasticidad. Este análisis se realiza según la siguiente prueba de hipótesis:
Dócima previa
Estadística previa
𝑠12 154
𝑇= (10.25)
𝑠22
7,3002
𝑇= = 1,998
5,1652
𝑅𝐶: 𝑇 < 𝐹(9,9; 0,025) ˅ 𝑇 > 𝐹(9,9; 0,975) → 𝑇 < 0,2484 ˅ 𝑇 > 4,0260
Conclusión previa
Con un 95% de confianza, es posible plantear que no existe información suficiente para
rechazar la hipótesis nula. Con esto, para efectos de este estudio, es factible inferir que las
varianzas poblacionales son iguales.
Estadística
𝑦1 − 𝑦2 − µ0
𝑇= (10.27)
𝑠𝑝 √1⁄𝑛1 + 1⁄𝑛2
Con
(𝑛1 − 1)𝑠𝑥2 + (𝑛2 − 1)𝑠𝑦2 155
𝑠𝑝 = √ (10.28)
𝑛1 + 𝑛2 − 2
𝑠𝑝 = 6,323
28,800 − 19,300 − 3
𝑇= = 2,299
6,323√1⁄10 + 1⁄10
Región Crítica
Con
𝑛𝑝 = 𝑛1 + 𝑛2 − 2 → 𝑛𝑝 = 18
Conclusión
Es posible observar que el estadístico de prueba “T” pertenece a la región crítica. A partir
de esto, es factible rechazar la hipótesis nula [H0]. Así, con un 95% y asumiendo que la
hipótesis previa planteada por “muchos autores” es cierta; es posible afirmar que la
diferencia media de puntajes entre fumadoras y no fumadoras corresponde a más de 3
puntos.
PROBLEMA 10
Se anuncia que una nueva dieta reducirá en dos semanas el peso de una persona en más de
2,5 [kg]. El “peso” de 7 personas antes y después de someterse a dicha dieta es:
Sean:
𝑋1= “Peso” de ciertas personas antes de someterse a la dieta estipulada, en kg.
𝑋1 ~𝑁(µ, 𝜎 2 )
𝑋2 ~𝑁(µ, 𝜎 2 )
Datos
𝑛=7
𝛼 = 0,025
2 muestras aleatorias pareadas
Observación
Es posible identificar que son muestras pareadas, debido a que se realizan distintos estudios
referentes al “peso”, realizados sobre los mismos individuos antes y después de someterse
a cierta dieta.
Dócima
𝐻0 : 𝜇1 ≤ 𝜇2 + 2,5 → 𝜇1 − 𝜇2 ≤ 2,5
𝐻1 : 𝜇1 > 𝜇2 + 2,5 → 𝜇1 − 𝜇2 > 2,5
Estadística
𝑥1 − 𝑥
̅̅̅ ̅̅̅2 − µ0
𝑇= 𝑠𝑑 (10.30)
⁄
√𝑛
157
62,186 − 58,214 − 2,5
𝑇= = 1,227
3,174
⁄
√7
Región Crítica
Conclusión
Es posible observar que el estadístico de prueba “T” no pertenece a la región crítica. A partir
de esto, se puede denotar que no existe información suficiente para rechazar la hipótesis
nula [H0]. Según lo expuesto anteriormente, es concluyente inferir con un nivel de confianza
del 97,5%, que la información proporcionada no permite afirmar con certeza que la nueva
dieta reducirá el peso de una persona en más de 2,5 [kg]
PROBLEMA 1
Una racha de lluvias es un período de días consecutivos de lluvia donde el día
inmediatamente anterior a la racha es seco y el día inmediatamente posterior también es
seco. Es importante el estudio de las rachas de lluvia para la planificación vial, estudios de
la calidad de aire, entre otros. La tabla siguiente presenta la distribución de las rachas, según
Nº de días con lluvia hasta que llega el último día de lluvia en la racha. 158
X N° de Rachas
1 194
2 101
3 66
4 30
5 y más 26
Total 417
Tabla 24. Número de Rachas según números de días con lluvia hasta que llega el último día de lluvia.
SOLUCIÓN 1-A
Datos
m. a. t (n)
Función de Verosimilitud
𝑛
𝜕 𝑙𝑛𝐿(𝑥, 𝑝) 𝑛 1
= − (∑𝑥𝑖 − 𝑛)
𝜕𝑝 𝑝 1−𝑝
𝑛 1
− (∑𝑥𝑖 − 𝑛) = 0
𝑝̂ 1 − 𝑝̂
1
𝑛 − 𝑝 · ∑𝑥𝑖 = 0 → 𝑝̂ =
𝑥
SOLUCIÓN 1-B
Datos
α = 0,05
Dócima
𝐻0 : 𝑋 ~𝐺𝑒𝑜 (𝑝 = 0,45)
𝐻1 : 𝑋 ≁ 𝐺𝑒𝑜 (𝑝 = 0,45)
Estadística
Para realizar el ejercicio de forma ordenada y óptima, se recomienda realizar tabla resumen
con los siguientes parámetros a considerar:
𝑿 𝑶𝒊 𝒑(𝒙) 𝒆𝒊
1 194 0,45 187,6500
2 101 0,2475 103,2075
3 66 0,1361 56,7537
4 30 0,0749 31,2333 160
5 y más 26 0,0915 38,1555
Tabla 25. Tabla Estadística de Bondad de Ajuste.
Dónde:
𝑂𝑖 = Frecuencia Observada. En este caso equivale al número de rachas para cada valor de la
variable.
𝑝(𝑥)= Probabilidad. Esta se calcula con la ecuación (11.1), que corresponde al modelo de
distribución geométrica.
𝑒𝑖 = 𝑛 · 𝑝(𝑥) (11.2)
Es importante mencionar que para efectos de este curso, se estipulará un valor mínimo de
𝑒𝑖 igual a 5. Es decir, el test de hipótesis se llevará a cabo solo cuando se cumpla 𝑒𝑖 ≥ 5 para
cada valor de la variable (en discretas) o para cada intervalo (en contínuas). En caso de que
lo anterior no se cumpla, se deberá proceder a reagrupar los intervalos o valores de la
variable.
Por otro lado, es importante SIEMPRE VERIFICAR que dentro de la tabla estadística se
encuentre considerado todo el recorrido de la variable. Para efectos de este ejercicio, es
posible observar en la tabla que esto se cumple, debido a que 𝑅𝑒𝑐(𝑋) = 1 , 2 ,3, …
Por último, es posible denotar que en el cálculo de probabilidades [p(x)], el último valor de
la variable o intervalo de clase NO se calcula. Es decir, se ajusta con el fin de que la suma
total de probabilidades sea exactamente 1.
Estadístico de Prueba
Una vez realizada la tabla estadística, se procede a calcular el estadístico de prueba Chi
2
Cuadrado Observado (𝑥𝑜𝑏𝑠 ). Este se obtiene a partir de la ecuación (11.3)
2
∑(𝑂𝑖 − 𝑒𝑖 )2
𝑥𝑜𝑏𝑠 = (11.3)
𝑒𝑖
Así, se obtiene:
2
𝑥𝑜𝑏𝑠 = 5,6897 161
Punto Crítico
Dónde:
𝑣 =𝑘−𝑟−1
𝑘 = 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣á𝑙𝑜𝑠 𝑟𝑒𝑎𝑔𝑟𝑢𝑝𝑎𝑑𝑜𝑠
𝑟 = 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟𝑒𝑠 𝑢𝑡𝑖𝑙𝑖𝑧𝑎𝑑𝑜𝑠
Región Crítica
2
𝑅𝐶: 𝑥𝑜𝑏𝑠 > 9,4877
Conclusión
Como Chi-cuadrada de tabla es mayor que Chi-cuadrada calculada, no hay evidencia
muestral para rechazar 𝐻0 con 5% de significancia. Con esto, es posible afirmar que los datos
de la muestra provienen de una Distribución de Probabilidad Geométrica.
PROBLEMA 2
El encargado del control de calidad en el proceso de fabricación de cierto tipo de arandelas,
manifiesta que el diámetro interno de una arandela, en pulgadas, tiene un comportamiento
Normal, con media 0,289 pulgadas y desviación típica de 0,003 pulgadas. En una muestra
aleatoria de 120 arandelas, se obtuvo:
¿Los datos de la muestra dan evidencia suficiente para concluir que el diámetro interno de
las arandelas tiene el comportamiento manifestado por el encargado del control de calidad?
(Utilice α=0,025)
SOLUCIÓN
Sea:
X=Diámetro interno de una arandela, en pulgadas
𝑋~𝑁(𝜇 , 𝜎 2 )
Datos
𝑛 = 120
𝛼 = 0,025
Dócima
𝐻0 : 𝑋 ~𝑁 (𝜇 = 0,289 , 𝜎 2 = (0,003)2
2
𝐻1 : 𝑋 ≁ 𝑁 (𝜇 = 0,289 , 𝜎2 = (0,003)
Estadística
X 𝑶𝒊 𝒑(𝒙) 𝒆𝒊
𝑴𝒆𝒏𝒐𝒔 𝒅𝒆 𝟎, 𝟐𝟖𝟒 8 0,0485 5,820
0,284 - 0,288 32 0,3232 38,784
0,288 – 0,292 54 0,4706 56,472
0,292 – 0,296 22 0,1488 17,856
0,296 y más 4 8,9·10−3 1,068
Tabla 27. Tabla Estadística de Bondad de Ajuste.
Al momento de verificar el recorrido de “X”, que en este caso corresponde a 𝑅𝑒𝑐(𝑥) = {𝐼𝑅 }
según el modelo de distribución normal, es posible denotar que los valores muestrales de
la tabla solo están dados hasta 0,296; por lo que ha sido necesario agregar un último
intervalo de clase como se muestra en la tabla (4)
X 𝑶𝒊 𝒑(𝒙) 𝒆𝒊
Menos de 𝟎, 𝟐𝟖𝟒 8 0,0485 5,82
0,284 - 0,288 32 0,3232 38,784
0,288 – 0,292 54 0,4706 56,472
0,292 y más 26 0,1577 18,924
Tabla 28. Tabla Estadística de Bondad de Ajuste, con intervalos de clase reagrupados.
Estadístico de Prueba
Punto Crítico
A diferencia del problema anterior, fue necesario reagrupar los intervalos de clase, por lo
que se deben utilizar un valor de 𝑘 = 4 en el análisis de "𝑣".
𝑣 =𝑘−𝑟−1= 4−0−1= 3
Región Crítica
2
𝑅𝐶: 𝑥𝑜𝑏𝑠 > 9,348
164
Conclusión
Como Chi-cuadrada de tabla es mayor que Chi-cuadrada calculada, no hay evidencia
muestral para rechazar 𝐻0 con 5% de significancia. Con esto, es posible afirmar que el
diámetro de una arandela tiene un comportamiento normal con los valores muestrales
dados.
PROBLEMA 3
El número de autos de lujo que vende diariamente cierta automotora (X), se modela
mediante la siguiente función:
2𝑥
𝑝(𝑥) = {6 ∗ 𝑥! , 𝑠𝑖 𝑥 = 1; 2; 3; 4
0 , 𝑒. 𝑜. 𝑐
Para analizar si este modelo ha cambiado, debido a la fuerte baja del dólar, se observan las 165
ventas realizadas durante 90 días tomados en forma aleatoria. Se obtuvo:
Con un nivel de significación del 5%. ¿Concluiría usted que el modelo ha cambiado?
SOLUCIÓN
Sea:
X=Número de autos de lujo que se venden diariamente.
Datos
𝑛 = 90
𝛼 = 0,05
Dócima
𝐻0 : 𝑋 ~𝑝(𝑥)
𝐻1 : 𝑋 𝑛𝑜 𝑡𝑖𝑒𝑛𝑒 𝑒𝑙 𝑚𝑜𝑑𝑒𝑙𝑜 𝑝𝑙𝑎𝑛𝑡𝑒𝑎𝑑𝑜
Estadística
X 𝑶𝒊 𝒑(𝒙) 𝒆𝒊
1 25 0,33 30
2 34 0,33 30
3 33 0,22 20
4 9 0,11 10
Tabla 7. Tabla Estadística de Bondad de Ajuste.
2𝑥
𝑝(𝑥) = , 𝑠𝑖 𝑥 = 1; 2; 3; 4 (11.7)
6 ∗ 𝑥!
Estadístico de Prueba
Punto Crítico
Con ayuda de la tabla Chi-Cuadrado es posible determinar el valor del punto crítico, el cuál
está dado por:
2 2
𝑥(1−𝛼, 𝑣) = 𝑥(0,95 ,3) = 7,815
𝑣 =𝑘−𝑟−1= 4−0−1= 3
Región Crítica
2
𝑅𝐶: 𝑥𝑜𝑏𝑠 > 7,815
Conclusión
De acuerdo a la evidencia presentada, con un 5% de significación, es posible afirmar que el
número de autos de lujo que se venden diariamente, se ajusta al modelo propuesto.
PROBLEMA 4
𝟏𝟎𝟎
∑ 𝑿𝒊 = 𝟏𝟑𝟖𝟔
𝒊=𝟏
𝟏𝟎𝟎
∑ 𝑿𝟐𝒊 = 𝟐𝟎𝟎𝟖𝟒
𝒊=𝟏
Tabla 9.
SOLUCIÓN 4-A
Sea:
X=Resistencia de un conductor eléctrico, en ohmios.
Datos
𝑛 = 100
𝛼 = 0,05
Dócima
𝐻0 : 𝑋 ~𝑁 (𝜇 , 𝜎 2 = 7,84)
𝐻1 : 𝑋 ≁ 𝑁 (𝜇 , 𝜎2 = 7,84)
Estadística
Como en este caso el parámetro "𝜇"es desconocido, se debe estimar. Se sabe que el mejor
estimador es la media muestral, según esto se obtiene:
1386
𝜇̂ = = 13,86
100
X 𝑶𝒊 𝒑(𝒙) 𝒆𝒊
Menos de 10 11 0,0838 8,38
168
10-12 18 0,1708 17,08
12-14 24 0,2653 26,53
14-16 21 0,2565 25,65
16-18 16 0,1542 15,42
Desde 18 10 0,0694 6,94
Tabla 10. Tabla Estadística de Bondad de Ajuste.
12 − 13,86 10 − 13,86
𝑝2 (𝑥) = 𝐹(12) − 𝐹(10) = 𝐹 (𝑍 = ) − 𝐹 (𝑍 = )
2,8 2,8
= 0,2546 − 0,0838 = 0,1708
Estadístico de Prueba
Punto Crítico
Con ayuda de la tabla Chi-Cuadrado es posible determinar el valor del punto crítico, el cual
169
está dado por:
2 2
𝑥(1−𝛼, 𝑣) = 𝑥(0,95 ,4) = 9,488
𝑣 =𝑘−𝑟−1= 6−1−1= 4
Recordar que en este caso se estimó el valor del parámetro “µ”, por lo que el valor de "𝑟"
que corresponde al número de estimadores utilizados, se debe considerar como 1, en el
análisis de "𝑣".
Región Crítica
2
𝑅𝐶: 𝑥𝑜𝑏𝑠 > 9,488
Conclusión
Basándose en la información proporcionada, con un 95% de confianza, es posible afirmar
que la resistencia se distribuye en forma normal.
SOLUCIÓN 4-B
Datos
m.a.t (100)
Sea:
W: Número de conductores con resistencia superior a 13 ohmios, en la muestra de tamaño
100.
𝑛·𝑘
( 100 − 𝑁𝑖−1 )
𝑃𝐾 = 𝑋𝑖−1 + 𝑎𝑖 · (11.11)
𝑛𝑖
100 · 𝑘
( 100 − 29)
13 = 12 + 2 · → 𝑘 = 41%
24
Así, el valor del estimador de proporción estará dado por:
𝑝̂ · 𝑞̂ 𝑝̂ · 𝑞̂
𝑃 (𝑝̂ − 𝑧(1−𝛼) · √ < 𝑝 < 𝑝̂ + 𝑧(1−𝛼) · √ )=1−𝛼 (11.12)
2 𝑛 2 𝑛
𝑃 ∈ [0,4936 ; 0,6864]
171
PROBLEMA 1
Un ingeniero está investigando el efecto de la temperatura de operación de proceso en el
rendimiento del producto. El estudio da como resultado los siguientes datos:
Temperatura, ℃ 100 110 120 130 140 150 160 170 180 190
Rendimiento, % 45 51 54 61 66 70 74 78 85 89
Tabla 30. Datos asociados a la temperatura de operación de cierto proceso y rendimiento del producto procesado. 172
SOLUCIÓN 1-A
Sean:
X: Temperatura de operación de proceso de cierto producto, en ℃.
𝑌𝑖 = 𝛽0 + 𝛽1 ∙ 𝑥𝑖 + 𝑢𝑖 , ∀𝑖 = 1,2, … , 𝑛 (12.1)
Conclusión
El valor -2,7394 no tiene sentido práctico y el valor 0,4830 indica que si la temperatura de
operación del proceso aumenta en 1℃, el rendimiento promedio del producto aumenta en
0,483%. Además, para que logremos visualizar de mejor forma el ajuste realizado, se
expone el siguiente gráfico en el cual se han dispuesto los puntos asociados a las variables
de interés, para luego obtener la línea de tendencia con sus respectivos parámetros.
Ajuste Lineal
173
100
90
y = 0,483x - 2,7394
80 R² = 0,9963
70
Rendimiento , en %
60
50
40
30
20
10
0
0 50 100 150 200
Temperatura de Operación, en ºC
SOLUCIÓN 1-B
En este caso, se planteará un test de hipótesis que pruebe si existe relación lineal entre las
variables estudiadas.
Dócima
𝐻0 : ⍴ = 0
𝐻1 : ⍴ ≠ 0
Estadística
El estadístico de prueba a utilizar en este caso, se presenta en la ecuación (12.2), donde "𝑟"
es el coeficiente de correlación, "𝑟 2 " el coeficiente de determinación y "𝑛" el número de
muestra. El valor asociado al coeficiente de correlación, es posible determinarlo
directamente de la calculadora, ingresando los parámetros estipulados en el enunciado.
𝑟 ∙ √𝑛 − 2
𝑇= (12.2)
√1 − 𝑟 2
174
0,9981√8
𝑇= → 𝑇 = 46,169
√1 − 0,99812
Región Crítica
En este tipo de dócima, la región de rechazo está dada según la ecuación (12.3).
𝑅𝐶: 𝑇 < −𝑡(8 ; 0,975) ˅ 𝑇 > 𝑡(8 ;0,975) → 𝑇 < −2,3060 ˅ 𝑇 > 2,3060
Conclusión
Con un 95% de confianza, es posible observar que el valor asociado al estadístico de prueba
(T) pertenece a la región de rechazo, por lo que se rechaza la hipótesis nula. Con esto, es
posible inferir que el modelo lineal es significativo, por lo que sí existe asociación lineal
entre las variables en estudio.
SOLUCIÓN 1-C
175
SOLUCIÓN 1-D
En este caso, se planteará un test de hipótesis que pruebe lo que se plantea en el enunciado,
el cual está dado como se expone a continuación.
Dócima
𝐻0 : 𝛽1 ≥ 0,5
𝐻1 : 𝛽1 < 0,5
Observación
Lo anteriormente expuesto, es posible interpretarlo de la siguiente forma:
Estadística
En este tipo de dócimas, el valor del estadístico de prueba según el formulario oficial, está
dado según la ecuación (12.4).
𝛽1
𝑇= (12.4)
𝑠𝛽1
Dónde:
𝑠𝑦𝑥
𝑠𝛽1 = (12.5)
√∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1 2
𝑠𝑦𝑥 = √ (𝑠 − 𝑏12 𝑠𝑥2 ) (12.6)
𝑛−2 𝑦
Reemplazando, se obtiene:
176
9
𝑠𝑦𝑥 = √ (14,65192 − 0,48302 ∙ 30,27652 ) = 0,9503
8
0,9503
𝑠𝛽1 = = 0,0105
√218500 − 10 ∙ 1452
0,483 − 0,5
𝑇= → 𝑇 = −1,6191
0,0105
Observación
Se sabe que los formularios se plantean, en base a una dócima igualada a cero, por lo que
en este caso fue necesario restar el valor 0,5 que corresponde al valor porcentual del
rendimiento del producto, el cual se pide probar en el enunciado.
Región Crítica
Conclusión
Con un 95% de confianza, es posible observar que el valor asociado al estadístico de prueba
[T] no pertenece a la región de rechazo, por lo que no existe información suficiente para
rechazar la hipótesis nula. A partir de esto, es posible inferir que al aumentar la temperatura
en 1ºC, el rendimiento del producto no aumenta en menos de un 0,5%, por lo que no se
acepta la información planteada.
SOLUCIÓN 1-E
1 (𝑥 − 𝑥̅ )2
𝐼𝐶 (𝑌) = 𝑏0 + 𝑏1 𝑥 ∓ 𝑡(𝑛−2;1−𝛼) ∙ 𝑠𝑦𝑥 ∙ √1 + + (12.7)
2 𝑛 ∑(𝑥𝑖 − 𝑥̅ )2
1 (150 − 145)2
𝐼𝐶(𝑌/𝑥 = 150) = −2,7394 + 0,483 ∙ 150 ∓ 𝑡(8;0,975) ∙ 0,9503√1 + +
10 8250
Conclusión
Con un 95% de confianza, es posible afirmar que cuando la temperatura de operación es de
150ºC, el rendimiento del producto fluctúa entre un 67,41% y un 72,01%.
SOLUCIÓN 1-F
Conclusión
Con un 98% de confianza, cuando la temperatura de operación del proceso aumenta en 10
ºC, el rendimiento del producto fluctúa entre un 45,26% y un 51,34%.
SOLUCIÓN 1-G
1 𝑥̅ 2
𝑠𝑏0 = 𝑠𝑦𝑥 ∙ √ + (12.10)
𝑛 ∑(𝑥𝑖 − 𝑥)2
1 1452
𝑠𝑏0 = 0,9503 ∙ √ + → 𝑠𝑏0 = 1,5465
10 10 ∙ 28,72282
Conclusión
Con un 95% de confianza, es posible inferir que el valor del intercepto fluctúa entre -6,3056
y 0,8268. Como el cero pertenece al intervalo confidencial, podríamos afirmar con 95% de
confianza que en el modelo no debiera incluirse el intercepto. El modelo más adecuado
sería 𝑦𝑖 = 𝛽 𝑥𝑖 + 𝑢𝑖 .
PROBLEMA 2
Para determinar si existe una relación lineal entre el consumo de electricidad (Kw-hora) y
el número de habitaciones en una vivienda se recogieron datos para un mismo mes de una
muestra de viviendas, obteniendo los siguientes datos:
∑12 12 12 2 12 2 12
𝑖=1 𝑥𝑖 = 105; ∑𝑖=1 𝑦𝑖 = 80; ∑𝑖=1 𝑥𝑖 = 1067; ∑𝑖=1 𝑦𝑖 = 570; ∑𝑖=1 𝑥𝑖 ⋅ 𝑦𝑖 = 758
a) Estime la ecuación de regresión muestral por medio del método de los mínimos
cuadrados e interprete los valores obtenidos de los coeficientes en el contexto del
problema. 179
b) Estime con 95% de confianza el consumo de electricidad esperado en una vivienda
con 8 habitaciones.
c) ¿Podría afirmar que por cada habitación adicional en una vivienda, el consumo de
electricidad aumenta en más de 350 w-hora? Use α = 0,05
SOLUCIÓN
Sean:
X=Número de habitaciones en la vivienda
SOLUCIÓN 2-A
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝑢𝑖
∑𝑛𝑖=1 𝑦𝑖 ∑𝑛𝑖=1 𝑥𝑖
̂0 =
𝑏0 = 𝛽 − 𝑏1 ∙ (12.12)
𝑛 𝑛
Reemplazando en las ecuaciones (12.11) y (12.12), se obtienen los parámetros de la
regresión, como se muestra a continuación.
12 ∙ 758 − 105 ∙ 80
𝑏1 = = 0,3912
12 ⋅ 1067 − (105)2
80 105
𝑏0 = − 0,3912 ∙ = 3,2434
12 12
𝑦𝑖 = 3,2434 + 0,3912𝑥𝑖
Conclusión
El valor del intercepto en este caso no tendría sentido práctico y la pendiente indica que
por cada habitación adicional en la vivienda el consumo de electricidad aumenta en 0,391
Kw-hora. 180
SOLUCIÓN 2-B
1 (𝑥 − 𝑥̅ )2
𝐼𝐶 (µ) = 𝛽0 + 𝛽1 𝑥 ∓ 𝑡(𝑛−2;1−𝛼) ∙ 𝑠𝑦𝑥 ∙ √ + (12.13)
2 𝑛 ∑(𝑥𝑖 − 𝑥)2
𝑛−1 2
𝑠𝑦𝑥 = √ (𝑠𝑦 − 𝑏12 𝑠𝑥2 ) (12.14)
𝑛−2
11
𝑠𝑦𝑥 = √ (3,333 − 0,39122 ∙ 13,4773) = 1,1822
10
1 (8 − 8,75)2
𝐼𝐶 (µ/(𝑥 = 8)) = 3,2434 + 0,3912𝑥 ∓ 𝑡(10;0,975) ∙ 1,1822 ∙ √ +
12 148,25
1 (8 − 8,75)2
𝐼𝐶 (µ/(𝑥 = 8)) = 3,2434 + 0,3912𝑥 ∓ 2,2281 ∙ 1,1822 ∙ √ +
12 148,25
Conclusión
Con un 95% de confianza, es posible inferir que el consumo de electricidad esperado en una
vivienda que contiene 8 habitaciones, fluctúa entre 6,1437 [kw/h] y 6,6027 [kw/h]
SOLUCIÓN 2-C
En este caso, se planteará un test de hipótesis que pruebe lo que se plantea en el enunciado,
el cual está dado como se expone a continuación.
Dócima
𝐻0 : 𝛽1 ≤ 0,35
181
𝐻1 : 𝛽1 > 0,35
Observación
Lo anteriormente expuesto, es posible interpretarlo de la siguiente forma:
Estadística
En este tipo de dócimas, el valor del estadístico de prueba según el formulario oficial, está
dado según la ecuación (12.15).
𝛽1
𝑇= (12.15)
𝑠𝛽1
Dónde:
𝑠𝑦𝑥
𝑠𝛽1 = (12.16)
√∑(𝑥𝑖 − 𝑥̅ )2
Reemplazando, se obtiene:
1,1822
𝑠𝛽1 = = 0,0971
√1067 − 12 ∙ 8,752
0,3912 − 0,35
𝑇= → 𝑇 = 0,4243
0,0971
Observación
Se sabe que los formularios se plantean, en base a una dócima igualada a cero, por lo que
en este caso fue necesario restar el valor 0,35 que corresponde al consumo en [kw/hr], el
cual se pide probar en el enunciado.
Región Crítica
Conclusión
Con un 95% de confianza, es posible observar que el valor asociado al estadístico de prueba
[T] no pertenece a la región de rechazo, por lo que no existe información suficiente para 182
rechazar la hipótesis nula. A partir de esto, no podríamos afirmar que por cada habitación
adicional en una vivienda, el consumo de electricidad aumenta en más de 350 [w/h]
X ni
28 5 183
39 3
57 8
Tabla 31. Distribución de datos de variable “X”.
MODE
SHIFT 1 (SCL) =
(CLR)
28 = M+(DT)
39 = M+(DT)
57 = M+(DT)
(en freq 1)
REPLAY(↓) REPLAY(↓) =
5
184
(en freq 2)
REPLAY(↓) REPLAY(↓) =
3
(en freq 3)
REPLAY(↓) REPLAY(↓) =
8
v. Cálculo de promedio
SHIFT 2 1
SHIFT 2 3
Y ni
5 4
10 12
15 7
Tabla 32. Distribución de datos de variable Y. 185
1
MODE 3 (STAT)
(1-VAR)
Y FREQ
5 4
10 12
15 7
Tabla 33. Tabla mostrada en pantalla de calculadora CASIO fx-570ES plus.
Observación
En caso de que no aparezca la columna “FREQ”, se debe seguir la secuencia de pasos que
se expone a continuación.
MODE
SHIFT ↓ 4 (STAT) 1 (ON)
(SET UP)
𝑠(𝑦) = 3,472