Apuntes Ejercicios Resueltos Analisis Estadistico para La Ingenieria 1.2 PDF

Apuntes de Ejercicios Resueltos
Análisis Estadístico para la Ingeniería
Preparado por Camilo Ignacio Bustamante Santander
Departamento de Ingeniería en Minas
Universidad de Santiago de Chile
Versión 1.2
Marzo de 2017
ANALISIS ESTADISTICO PARA LA INGENIERIA
Tabla de contenidos
Unidad 1: Estadística Descriptiva ........................................................................................................ 3

Unidad 2: Probabilidades .................................................................................................................. 20
Unidad 3: Variable Aleatoria Unidimensional................................................................................... 40
Unidad 4: Modelos de Distribución Discretos .................................................................................. 52
Unidad 5: Modelos de Distribución Contínuos ................................................................................. 63
2
Unidad 6: Variable Aleatoria Bidimensional ..................................................................................... 74
Unidad 7: Estimación Puntual ........................................................................................................... 87
Unidad 8: Intervalos de Confianza .................................................................................................. 104
Unidad 9: Prueba de Hipótesis en una Población ........................................................................... 120
Unidad 10: Dócimas Bilaterales ...................................................................................................... 131
Unidad 11: Bondad de Ajuste ......................................................................................................... 158
Unidad 12: Regresión Lineal ........................................................................................................... 172
Anexo 1: Uso de Calculadora para Cálculos Estadísticos Básicos ................................................... 183
ANALISIS ESTADISTICO PARA LA INGENIERIA | Departamento Ingeniería en Minas

Unidad 1 - Estadí stica Descriptiva
PROBLEMA 1
Cierta empresa realizó un estudio para poder aplicar un producto que consiste en una pasta
flexible cementicia, para reparar defectos en los muros de concreto. El fabricante advierte
que se debe aplicar cuando la temperatura se encuentre entre 5°C y 30°C ; y la humedad
relativa del aire debe ser menor a 81%. De los ensayos realizados con la pasta, en diferentes
días, se tomó una muestra y se obtuvieron los siguientes resultados sobre la temperatura y 3
la humedad:
Temperatura (°C) Humedad Relativa del aire (%)

10 – 30 30 - 40 40 - 60 60 - 70
3,0 - 8,4 0 1 3 5
8,4 - 13,4 1 4 7 1
13,4 - 19,2 3 10 8 2
19,2 - 24,6 5 15 4 0
24,6 - 30,0 12 7 2 0
Tabla 1. Resultados asociados a condiciones de Temperatura y Humedad Relativa del Aire en el momento en que se
realiza el muestreo.
a) Según la información proporcionada. ¿Se puede afirmar que existe una menor
dispersión en la temperatura, en los ensayos en que la humedad relativa es inferior
al 40% que en los ensayos con humedad relativa de por lo menos 40%?
b) ¿En qué porcentaje de los ensayos en que se aplicó el producto, no estaban las
condiciones que indica el fabricante?
c) A consecuencia del cambio climático, se espera que la humedad relativa del aire
aumente en un 4%. Usando propiedades. ¿Cuál será la nueva humedad relativa
promedio y su desviación típica?
SOLUCIÓN 1-A
Datos
Sea:
X: Temperatura, cuando la humedad relativa es inferior al 40%, en °C.
Y: Temperatura, cuando la humedad relativa es mayor o igual al 40%, en °C.
Es conveniente realizar una tabla que contenga los parámetros específicos que se van a
analizar, como se expone a continuación.

Marca de Clase [𝑿𝒊 ] < 40 ≥ 40

5,7 1 8
11,1 5 8
16,5 13 10
21,9 20 4
27,3 19 2
Tabla 2. Tabla resumen asociada a la distribución de frecuencias según la variable temperatura.
Por otro lado, se tiene la siguiente generalidad:

4
𝐴 𝑀𝑒𝑛𝑜𝑟 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑉𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 → 𝑀𝑒𝑛𝑜𝑟 𝐷𝑖𝑠𝑝𝑒𝑟𝑠𝑖ó𝑛 → 𝑀𝑎𝑦𝑜𝑟 𝐻𝑜𝑚𝑜𝑔𝑒𝑛𝑒𝑖𝑑𝑎𝑑
Es por esto, que para realizar un análisis comparativo en cuanto a la dispersión entre ambas
distribuciones asociadas a la variable Temperatura, se estudiará el coeficiente de variación,
el cual se obtiene a partir de la ecuación (1.1)
𝑠(𝑥)
𝐶. 𝑉(𝑥) = (1.1)
𝑥
Así, los coeficientes de variación estarán dados de la siguiente forma:
𝑠(𝑥) 5,547
→ 𝐶. 𝑉(𝑥) = = = 0,261 → 26,1% 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑
𝑥 21,248
𝑠(𝑦) 6,433
→ 𝐶. 𝑉(𝑦) = = = 0,466 → 46,6% 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑
𝑦 13,800
Conclusión
A partir del análisis del coeficiente de variación, es posible afirmar que existe una menor
dispersión en la temperatura, en los ensayos en que la humedad relativa es inferior al 40%,
que en los ensayos con humedad relativa de por lo menos 40%. Esto se justifica, debido a
que 𝐶. 𝑉(𝑥) < 𝐶. 𝑉(𝑦)
SOLUCIÓN 1-B
En el enunciado se estipulan ciertas condiciones indicadas por el fabricante para que el

producto se pueda aplicar de buena forma, las cuales se exponen a continuación.
i. Humedad Relativa inferior al 81%.

ii. Temperatura debe fluctuar entre 5°C y 30°C.
Es necesario saber el porcentaje de datos contenidos hasta el 5% de la distribución, para

esto se trabajará con la fórmula de cálculo de percentiles, representada en la ecuación (1.2)

𝑛∙𝑘
𝑎𝑖 ∙ ( 100 − 𝑁𝑖−1 )
𝑃𝑘 = 𝑋𝑖−1 + (1.2)
𝑛𝑖
Dónde:
✓ 𝑃𝑘 : 𝑃𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑘
✓ 𝑋𝑖−1 : 𝐿í𝑚𝑖𝑡𝑒 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑒𝑛 𝑞𝑢𝑒 𝑠𝑒 𝑒𝑠𝑡á 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑛𝑑𝑜.
✓ 𝑎𝑖 : 𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 𝑑𝑒𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑒𝑛 𝑞𝑢𝑒 𝑠𝑒 𝑒𝑠𝑡á 𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑛𝑑𝑜.
✓ 𝑛: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎.
5
✓ 𝑘: 𝑃𝑜𝑟𝑐𝑒𝑛𝑡𝑎𝑗𝑒 𝑑𝑒 𝑑𝑎𝑡𝑜𝑠 𝑐𝑜𝑛𝑡𝑒𝑛𝑖𝑑𝑜𝑠 𝑑𝑒𝑠𝑑𝑒 𝑒𝑙 𝑐𝑜𝑚𝑖𝑒𝑛𝑧𝑜 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 ℎ𝑎𝑠𝑡𝑎
𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒𝑙 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑒𝑠𝑡𝑢𝑑𝑖𝑎𝑑𝑜 (𝑃𝑘 )
✓ 𝑁𝑖−1 : 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝐴𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑎 𝑎𝑠𝑜𝑐𝑖𝑎𝑑𝑎 𝑎𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑎𝑛𝑡𝑒𝑟𝑖𝑜𝑟 𝑎𝑙 𝑞𝑢𝑒 𝑠𝑒 𝑒𝑠𝑡á
𝑡𝑟𝑎𝑏𝑎𝑗𝑎𝑛𝑑𝑜.
✓ 𝑛𝑖 : 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝐴𝑏𝑠𝑜𝑙𝑢𝑡𝑎 𝑎𝑠𝑜𝑐𝑖𝑎𝑑𝑎 𝑎𝑙 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑒𝑛 𝑞𝑢𝑒 𝑠𝑒 𝑡𝑟𝑎𝑏𝑎𝑗𝑎.
A continuación, se presenta una tabla que contiene los parámetros expuestos

anteriormente.
Temperatura 𝒏𝒊 𝑵𝒊
3 - 8,4 9 9
8,4 – 13,8 13 22
13,8 – 19,2 23 45
19,2 – 24,6 24 69
24,6 – 30,0 21 90 = n
Tabla 3. Temperatura expresada en intervalos, con sus respectivas frecuencias absolutas y acumuladas.
En esta oportunidad se trabajará en el primer intervalo de clase, ya que éste contiene al

percentil de interés correspondiente a 5. Así, reemplazando en la ecuación (1.2), se obtiene:
90 ∙ 𝑘
5,4 ∙ ( 100 − 0)
→ 𝑃𝑘 = 3 + → 𝑘 = 3,7%
9
Conclusión
En un 3,7% de los productos, no estaban las condiciones que indica el fabricante.

SOLUCIÓN 1-C
Sea
H: Humedad relativa del aire, expresada en porcentaje.
𝐻`: Nueva humedad posterior al cambio climático.
Es importante destacar que se pide en el enunciado explícitamente utilizar propiedades,

excluyendo así cualquier otro método de solución del problema.
En general, siendo “X” una variable cualquiera, y “a” y “b” constantes, se tienen las
siguientes propiedades del promedio y la desviación estándar. 6
Promedio
𝑎∙𝑥+𝑏 = 𝑎∙𝑥+𝑏 = 𝑎∙𝑥+𝑏
Desviación Estándar
𝑠(𝑎 ∙ 𝑥 + 𝑏) = 𝑠(𝑎 ∙ 𝑥) + 𝑠(𝑏) = 𝑎 ∙ 𝑠(𝑥)
Para efectos del ejercicio, es necesario definir matemáticamente la variable 𝐻`, lo cual se
expone a continuación.
4
𝐻` = 𝐻 + ∙ 𝐻 = 1,04 ⋅ 𝐻
100
Así, es posible relacionar la expresión 𝐻` = 1,04 ⋅ 𝐻 con la generalidad expuesta
anteriormente. Esto, asociando la variable “X” con “H”, y por otro lado las constantes “a” y
“b” con los valores 1,04 y 0 respectivamente.
Al realizar dicha relación, se obtienen los siguientes parámetros:
𝐻` = 1,04 ⋅ 𝐻 = 1,04 ⋅ 38,167 → 𝐻` = 39,694
𝑠(𝐻`) = 1,04 ⋅ 𝑠(𝐻) = 1,04 ⋅ 13,584 → 𝑠(𝐻`) = 14,127
Conclusión
La nueva humedad relativa promedio dada por el cambio climático y su desviación típica,
están dados por 39,694% y 14,127 respectivamente.

PROBLEMA 2
La información siguiente corresponde a longitudes en milímetros de 36 piezas fabricadas
en un proceso:
Longitud Stem-and-Leaf Plot
Frequency Stem & Leaf
1,00 Extremes (=<31,0)

1,00 31 . 5
5,00 31 . 66777 7
11,00 32 . 88999999999
8,00 32 . 00001111
4,00 32 . 2233
2,00 32 . 55
3,00 32 . 667
1,00 Extremes (>=32,8)
n mínimo máximo ∑x ∑ x2
36 31,0 32,8 1152,6 36907,06
Tabla 4. Datos asociados a longitudes de piezas fabricadas en un proceso.
Determine el porcentaje de piezas con longitud inferior a (𝑥̅ − 𝑠)
SOLUCIÓN
Según lo requerido en el enunciado es necesario obtener el promedio y la desviación
estándar de las 36 piezas fabricadas en el proceso. A continuación, se expone el cálculo de
dichos parámetros.
Promedio
∑ 𝑥 1152,6
𝑥= = = 32,017 [𝑚𝑚]
𝑛 36
Desviación Estándar Muestral
El cálculo de la desviación muestral, en esta oportunidad se obtendrá a partir de la varianza

muestral, cuya ecuación se expone en la ecuación (1.3)
𝑘
(𝑥𝑖 − 𝑥)2
𝑉(𝑥) = ∑ (1.3)
𝑛−1
𝑖=1

Con el fin de encontrar una ecuación más práctica, considerando la forma en que se
entregan los datos en el presente problema, se reducirá la fórmula de la varianza de la
siguiente forma.
𝑘 𝑘 𝑘
(𝑥𝑖 − 𝑥)2 1 1 2
𝑉(𝑥) = ∑ = ∙ ∑(𝑥𝑖 − 𝑥)2 = ∙ ∑(𝑥𝑖 2 − 2 ⋅ 𝑥𝑖 ⋅ 𝑥 + 𝑥 )
𝑛−1 𝑛−1 𝑛−1
𝑖=1 𝑖=1 𝑖=1
𝑘 𝑘 𝑘
1 2
→ 𝑉(𝑥) = ( ∑ 𝑥𝑖 2 − 2 ∑ 𝑥𝑖 ⋅ 𝑥 + ∑ 𝑥 )
𝑛−1 8
𝑖=1 𝑖=1 𝑖=1
𝑘 𝑘
1 2
→ 𝑉(𝑥) = ( ∑ 𝑥𝑖 2 − 2 ⋅ 𝑥 ∑ 𝑥𝑖 + 𝑥 ⋅ 𝑛)
𝑛−1
𝑖=1 𝑖=1
𝑘 𝑘
1 𝑛 2
→ 𝑉(𝑥) = ( ∑ 𝑥𝑖 2 − 2 ⋅ 𝑥 ∑ 𝑥𝑖 ⋅ + 𝑥 ⋅ 𝑛)
𝑛−1 𝑛
𝑖=1 𝑖=1
𝑘
1 2
→ 𝑉(𝑥) = ( ∑ 𝑥𝑖 2 − 2 ⋅ 𝑥 ⋅ 𝑛 ∙ 𝑥 + 𝑥 ⋅ 𝑛)
𝑛−1
𝑖=1
𝑘
1 2 2
→ 𝑉(𝑥) = ( ∑ 𝑥𝑖 2 − 2 ⋅ 𝑥 ⋅ 𝑛 ∙ +𝑥 ⋅ 𝑛)
𝑛−1
𝑖=1
2
∑𝑘𝑖=1 𝑥𝑖 2 − 𝑛 ∙ 𝑥
→ 𝑉(𝑥) = (1.4)
𝑛−1
Así, reemplazando los valores dados en la ecuación (1.4) se obtiene la varianza muestral.
36907,06 − 36 ∙ 32,0162
→ 𝑉(𝑥) = = 0,1767
36 − 1
Luego, se sabe que la desviación estándar se relaciona con la varianza, de la forma expuesta
en la ecuación (1.5)
𝑠(𝑥) = √𝑉(𝑥) (1.5)

Reemplazando los valores dados en el enunciado, en la ecuación (1.5), es posible obtener

la desviación típica muestral.
→ 𝑠(𝑥) = √0,1767 = 0,4204 [𝑚𝑚]
Finalmente, es posible obtener el valor numérico de la expresión 𝑥 − 𝑠(𝑥), el cual

corresponde a 31,6 [mm]
Conclusión
A partir del gráfico de tallo y hoja, es posible afirmar que existen 2 piezas con longitud 9
inferior a 31,6 [mm] de un total de 36 piezas estudiadas.

PROBLEMA 3
Se realiza un estudio para evaluar el diámetro (X), expresado en milímetros, de cierto
producto utilizado en el ensamblaje de ciertas piezas, requeridas en construcciones
antisísmicas.
Se obtuvo la siguiente información en una muestra de 200 productos, provenientes de cada
una de tres máquinas: A , B Y C
Máquinas
Diámetro 10
A(%) B(%)
4,95 – 7,25 5,0 7,5
7,25 – 9,55 26,0 13,0
9,55 – 11,85 37,5 17,0
11,85 – 14,15 12,5 34,0
14,15 – 16,45 10,0 15,0
16,45 – 18,75 9,0 13,5
Total 100 100
Tabla 5. Representación del diámetro expresado en milímetros de cierto producto, en las máquinas A y B.
Máquina C
200
∑ 𝑥𝑖 = 2798,90
𝑖=1
200
∑ 𝑥𝑖2 = 40891,3
𝑖=1
Tabla 6. Valores asociados al diámetro de cierto producto, en la máquina C.
a) Se cree que la distribución del diámetro de los productos fabricados por la máquina
C es más homogénea que en los productos fabricados por la máquina A. Analice la
aseveración utilizando medidas estadísticas adecuadas.
b) Si en un control se ajusta la máquina B de modo que el diámetro de cada producto

disminuye en 1,5 milímetros. Determine el porcentaje de variabilidad del nuevo
diámetro y compárelo con el porcentaje de variabilidad antes del ajuste. ¿Cuál
distribución resulta ser más heterogénea? Justifique su respuesta utilizando
propiedades.
c) Suponga que por error se ingresa un producto con diámetro de 16,4 milímetros
cuando su valor correcto es de 6,4 milímetros en la máquina C. Determine cuál sería
el valor correcto de la desviación estándar del diámetro del producto de la máquina
C, justificando su respuesta.

SOLUCIÓN 3 - A
Sea:
𝑋𝑖 : Diámetro de cierto producto en milímetros, provenientes de la máquina "𝑖" ,con 𝑖 =
𝑎, 𝑏, 𝑐
Para realizar un análisis comparativo en cuanto a homogeneidad, se sabe que se tiene la

siguiente relación:
𝐴 𝑚𝑒𝑛𝑜𝑟 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑉𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 → 𝑀𝑒𝑛𝑜𝑟 𝐷𝑖𝑠𝑝𝑒𝑟𝑠𝑖ó𝑛 → 𝑀𝑎𝑦𝑜𝑟 𝐻𝑜𝑚𝑜𝑔𝑒𝑛𝑒𝑖𝑑𝑎𝑑 11

Primero, se determinará el coeficiente de variación del diámetro de los productos
provenientes de la máquina C. Para esto se obtendrá el diámetro promedio y la desviación
estándar muestral.
Observación
Para el caso de la desviación típica, se reemplazará en las ecuaciones (1.4) y (1.5), ya
expuestas en problemas anteriores.
∑ 𝑥𝑖 2798,90
→ 𝑥𝑐 = = = 13,995 [𝑚𝑚]
𝑛 200
40891,3 − 200 ∙ 13,9952

→ s(𝑥𝑐 ) = √ = 2,942 [𝑚𝑚]
199
s(𝑥𝑐 ) 2,942
→ 𝐶. 𝑉(𝑥𝑐 ) = ∙ 100% = ∙ 100% = 21,02%
𝑥𝑐 13,995
Por otro lado, para calcular el coeficiente de variación de los productos provenientes de la
máquina A, se calculará el promedio y la desviación estándar directo de la calculadora, a
partir de la siguiente tabla.
Máquina A
𝒙𝒊 𝑛𝑖
6,1 10
8,4 52
10,7 75
13 25
15,3 20
17,6 18
Tabla 7. Representación de marcas de clase y distribución de frecuencias de productos provenientes de máquina A.

Así, los valores obtenidos de los parámetros de interés son:
→ 𝑥𝐴 = 11,2405 [𝑚𝑚]
→ 𝑆(𝑥𝐴 ) = 3,0413[𝑚𝑚]
3,0413
→ 𝐶. 𝑉(𝑥𝐴 ) = ∙ 100% = 27,056%
11,2405
Conclusión
A partir del análisis de coeficientes de variación, se observa que 𝐶. 𝑉(𝑥𝐴 ) > 𝐶. 𝑉(𝑥𝐶 ). Según 12
lo anteriormente expuesto, es posible afirmar que los diámetros de ciertos productos
provenientes de la máquina C son más homogéneos que la distribución de diámetros de
productos provenientes de la máquina A.
SOLUCIÓN 3 – B
Sea:
𝑋`𝐵 : Nuevo diámetro expresado en milímetros, de productos provenientes de la máquina

B.
En general, se sabe que al realizar un análisis comparativo entre dos o más distribuciones
de cierta variable, se cumple la siguiente relación:
𝐴 𝑚𝑎𝑦𝑜𝑟 % 𝑑𝑒 𝑉𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 → 𝑀𝑎𝑦𝑜𝑟 𝐻𝑒𝑡𝑒𝑟𝑜𝑔𝑒𝑛𝑒𝑖𝑑𝑎𝑑
Dicho esto, se obtendrá el porcentaje de variabilidad de la distribución de diámetros de

productos provenientes de la máquina B, antes de realizar el ajuste, para lo cual se utilizará
la tabla expuesta en el enunciado, obteniendo los siguientes resultados.
→ 𝑥𝐵 = 12,4595
→ 𝑠(𝑥𝐵 ) = 3,26067
3,26067
→ % 𝑑𝑒 𝑉𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑎𝑛𝑡𝑒𝑠 𝑑𝑒𝑙 𝑎𝑗𝑢𝑠𝑡𝑒 = ∙ 100% = 26,17%
12,4595
Luego, la expresión matemática de 𝑋`𝐵 está dada por:
𝑋`𝐵 = 𝑥𝐵 − 1,5

Así, aplicando propiedades del promedio y la desviación típica, se obtienen los siguientes
valores de dichos parámetros.
→ 𝑋`𝐵 = 𝑥𝐵 − 1,5 = 𝑥𝐵 − 1,5 = 12,4595 − 1,5 → 𝑋`𝐵 = 10,9595
→ 𝑠(𝑋`𝐵 ) = 𝑠(𝑥𝐵 − 1,5) = 𝑠(𝑥𝐵 ) → 𝑠(𝑋`𝐵 ) = 3,26067
Con esto, el porcentaje de variabilidad de la distribución de diámetros de productos

provenientes de la máquina B posterior al ajuste está dado por: 13
3,2607
% 𝑑𝑒 𝑉𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 = ∙ 100% = 29,75%
10,9595
Conclusión
A partir del análisis del porcentaje de variabilidad, es posible afirmar que la distribución de
diámetros de productos provenientes de la máquina B posterior al ajuste realizado es más
heterogénea que la de los productos provenientes de la máquina B antes del ajuste.
SOLUCIÓN 3 – C
Sea:
𝑋𝑐´ : Diámetro modificado, en milímetros, de productos provenientes de la máquina C.
Es necesario excluir el dato correspondiente a 16,4 [mm] y agregar en su lugar el valor

acertado correspondiente a 6,4 [mm]. Al realizar esto, y reemplazar en las ecuaciones (1.3)
y (1.4), la nueva desviación estándar estará dada según las siguientes expresiones.
2798,90 − 16,4 + 6,4

→ 𝑋𝑐´ = = 13,9445 [𝑚𝑚]
200
40891,3 − 16,42 + 6,42 − 200 ∙ 13,94452
→ 𝑉(𝑋𝑐´ ) = = 8,912
200 − 1
→ 𝑠(𝑋𝑐! ) = 2,985 [𝑚𝑚]
Conclusión
Según las expresiones expuestas anteriormente, el valor correcto de la desviación
estándar del diámetro del producto proveniente de la máquina C corresponde a
2,985[mm]

PROBLEMA 4
Se ha realizado un estudio en una empresa dedicada al área de las telecomunicaciones,
conductividad y redes, para ello se evaluaron entre otras variables, tipo de redes (Y) y el
costo de los productos, en miles de pesos (X); medidas en una muestra de 100 productos
de esta empresa, las cuales se muestran en la siguiente tabla:
Costo de Tipo de Redes (Y)

Productos, en
Total
miles de Casas Edificios Empresas 14
pesos (X)
100-200 15 4 0 19
200-300 8 11 5 24
300-400 8 12 15 35
400-500 1 13 8 22
Total 32 40 28 100
a) Para el costo de los productos de redes para edificios, determine y ubique en el

polígono de frecuencias el valor numérico de la mediana de dicho costo.
b) Las utilidades obtenidas por las ventas de redes para casas en esta empresa de
Telecomunicaciones están dadas por:
Si el costo del producto es inferior a 180 mil pesos, se obtiene una utilidad diaria de
$5000, si fluctúa entre 180 mil pesos y 400 mil pesos, la utilidad aumenta en un 15%
y si el costo es superior a 400 mil pesos, la utilidad inicial sólo en un 10%.
Determine la utilidad promedio por producto.
c) Para comparar los costos de los primeros productos, para redes de empresas, se
solicita otro estudio de una muestra de 28 productos del año anterior.
Informe de costos de productos de redes para empresas
Tallo Hoja Frecuencia
2 699 3
3 011155568 9
4 003567889 9
5 244459 6
6 1 1
Compare la dispersión del costo entre los dos estudios realizados e indique cual se
comporta en forma más homogénea.

SOLUCIÓN 4 - A
Sea:
𝑋: Costo de los productos utilizados en una empresa de Telecomunicaciones, en miles de
pesos.
𝑌: Tipo de redes en que trabaja una empresa de Telecomunicaciones; subdividida en casas,

edificios y empresas.
Observación 15
Es necesario notar que el estudio solicitado, se aplica exclusivamente a redes para edificios.
Es por esto que se realiza la siguiente tabla para facilitar dicho análisis.
𝑿 Tipo de redes para Edificios

100-200 4
200-300 11
300-400 12
400-500 13
Total 40
Cálculo de Mediana
En general, para determinar la mediana de cierta variable, es necesario realizar el cálculo

que se expone a continuación. Donde “X” corresponde a una variable aleatoria cualquiera
y “n” al número de muestra.
Variables Discretas
𝑥𝑛+1 , 𝑠𝑖 𝑛 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟
2
𝑀𝑒(𝑥) = { 𝑥𝑛 + 𝑥𝑛+1 (1.6)
2 2
, 𝑠𝑖 𝑛 𝑒𝑠 𝑝𝑎𝑟
2
Variables Contínuas
𝑎𝑖 𝑛
𝑀𝑒(𝑥) = 𝑥𝑖−1 + ∙ ( − 𝑁𝑖−1 ) (1.7)
𝑛𝑖 2

Es importante denotar que las variables contenidas en la ecuación (1.7) coinciden con la de
cálculo de percentiles, expuesta en la ecuación (1.2). Esto se explica ya que la mediana de
una distribución de variable representa el dato ubicado en el centro de ésta, por lo que su
valor es equivalente al del percentil 50.
Así, calculamos la mediana del costo, a partir de la ecuación (1.7) debido a que esta variable
estudiada es de tipo contínua.
100 40
→ 𝑀𝑒(𝑥) = 𝑃50 = 300 + ∙ ( − 15)
12 2 16
→ 𝑀𝑒(𝑥) = 341,6 [𝑚𝑖𝑙𝑒𝑠 $]
Polígono de Frecuencias
A continuación, se expone el polígono de frecuencias solicitado, donde en el eje “X” se

representa el costo de los productos utilizados por la empresa de Telecomunicaciones y en
el eje “Y” se representa el número de edificios.
Figura 1. Representación de la Mediana de la distribución de costos, en polígono de frecuencias.

SOLUCIÓN 4 – B
Sea:
𝑈: Utilidad diaria obtenida del producto, en miles de pesos.
Para facilitar el análisis, se planteará la siguiente función Utilidad:
5000, 𝑥 < 180 17

𝑈(𝑥) = {5750, 180 ≤ 𝑥 ≤ 400
5500, 𝑥 > 400
Así, es necesario saber la cantidad de casas que se encuentran en cada intervalo de “X”. Es
por esto, que a continuación se calculará el porcentaje de datos concentrados hasta los
$180.000 en costo, con ayuda de la fórmula de percentiles, expuesta en la ecuación (1.2)
32 ∙ 𝑘
( 100 − 0)
→ 180 = 100 + 100 ∙
15
→ 𝑘 = 37,5%
A partir de lo anteriormente calculado, es posible definir las frecuencias relativas (ℎ𝑖 )

asociadas a la variable utilidad, las cuales se obtienen a partir de la ecuación (1.8), donde 𝑛𝑖
corresponde a la frecuencia absoluta y 𝑛 al número de muestra estudiado.
𝑛𝑖
ℎ𝑖 = (1.8)
𝑛
U 5000 5750 5500

𝒉𝒊 0,375 0,594 0,031
Tabla 8. Utilidades con sus respectivas frecuencias relativas.
Así, la utilidad promedio queda dada a partir de la ecuación (1.9), donde “X” corresponde a
una variable cuantitativa cualquiera.
𝑥̅ = ∑ 𝑥𝑖 ∙ ℎ𝑖 (1.9)

̅ = ∑ 𝑢𝑖 ∙ ℎ𝑖
→𝑈
= 5000 ∙ 0,375 + 5750 ∙ 0,594 + 5500 ∙ 0,031
= 5461
Conclusión
La utilidad promedio obtenida por las ventas de redes para casas en la empresa de
Telecomunicaciones, corresponde a 5461 pesos.
18
SOLUCIÓN 4 – C
Se sabe que en general:
𝐴 𝑚𝑒𝑛𝑜𝑟 𝑐𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 → 𝑀𝑎𝑦𝑜𝑟 𝐻𝑜𝑚𝑜𝑔𝑒𝑛𝑒𝑖𝑑𝑎𝑑
Con el fin de facilitar el análisis comparativo, para el presente inciso se considerarán las
siguientes variables:
𝑋1 = Costo de productos de redes de empresas del presente año, en miles de pesos
𝑋2 = Costo de productos de redes de empresas del año anterior, en miles de pesos
Primero, calcularemos el coeficiente de variación para la distribución de costos "𝑋1 ", es

decir para los datos expuestos en la tabla enunciada, obteniendo:
𝑠(𝑥1 ) 68,525
→ 𝐶. 𝑉(𝑋1 ) = = = 0,190 → 19% 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑
𝑥1
̅̅̅ 360,714
Por otro lado, calculamos el coeficiente de variación de la distribución de costos"𝑋2 ", es

decir para los datos expuestos en el gráfico de tallo y hoja.
𝑠(𝑥2 ) 101,715
→ 𝐶. 𝑉(𝑋2 ) = = = 0,241 → 24,1% 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑
𝑥2
̅̅̅ 421,429
Observación
Los valores expuestos anteriormente pueden ser obtenidos directamente con la calculadora,
o bien “manualmente” a partir de las fórmulas de varianza (1.4) y promedio.

Conclusión
A partir del análisis de coeficiente de variación, es posible afirmar a partir de la evidencia
estadística que se dispone, que la variable asociada a la distribución de costos del presente
año es más homogénea que la asociada a los costos del año anterior.
19

Unidad 2 - Probabilidades
PROBLEMA 1
El porcentaje de reclamos en una empresa de correos es de 15%, se realiza un seguimiento
de estos reclamos ya que esta cifra se considera excesiva. Se toma una muestra de 25
despachos. ¿Cuál es la probabilidad de que al menos dos de ellos tengan reclamos?
SOLUCIÓN
20
En los ejercicios de probabilidades, SIEMPRE antes de realizar cualquier cálculo, se
recomienda definir claramente los sucesos que se estudian, y expresar matemáticamente
tanto las probabilidades que se piden como las que se estipulan en el enunciado.
Definición de Sucesos
Sea:
R: Existe un reclamo en un despacho realizado en una empresa de correos.
Definición de Probabilidades
→ 𝑃(𝑅) = 0,15
Probabilidades que se requieren
En esta oportunidad, no es posible visualizar en forma directa lo que se está pidiendo. Es

por esto, que antes de expresar matemáticamente la probabilidad, se realizará un análisis
“informal” de lo que se requiere, como se muestra a continuación.
Se pide la probabilidad de que al menos dos de ellos tengan reclamos, lo que quiere decir
que tengan reclamos 2,3,4, 5, … o 25 despachos. Es por esto que se decide analizar el
complemento de lo que se requiere, vale decir que de un total de 25 despachos, ninguno
presente reclamos o uno presente reclamos, lo que escrito en términos “informales” estará
dado por:
→ 1 − [𝑃(𝑁𝑖𝑛𝑔𝑢𝑛𝑜 𝑡𝑒𝑛𝑔𝑎 𝑟𝑒𝑐𝑙𝑎𝑚𝑜𝑠) o P(𝑈𝑛𝑜 𝑡𝑒𝑛𝑔𝑎 𝑟𝑒𝑐𝑙𝑎𝑚𝑜𝑠")]
Esto descrito en términos matemáticos, podría expresarse de la siguiente forma:
→ 1 − [𝑃(𝑅 𝐶 ∩ 𝑅 𝐶 ∩ … ∩ 𝑅 𝐶 ) ∪ 𝑃(𝑅 ∩ 𝑅 𝐶 ∩ 𝑅 𝐶 … 𝑅 𝐶 ) ∙ 25]
→ 1 − [𝑃(𝑅 𝐶 )25 + 25 ∙ 𝑃(𝑅 𝐶 )24 ∙ 𝑃(𝑅)]

Desarrollo del Problema
Es necesario conocer 𝑃(𝑅 𝐶 ), para lo que se utilizará la ecuación (2.1), en la que “A”
corresponde a un suceso cualquiera.
P(𝐴𝐶 ) = 1 − P(A) (2.1)
Así, 𝑃(𝑅 𝐶 ) queda dado por:
𝑃(𝑅) = 0,15 → 𝑃(𝑅 𝐶 ) = 1 − 𝑃(𝑅) = 0,85

21
Finalmente, reemplazando en la expresión matemática de la probabilidad que se pide, se
obtiene lo siguiente:
→ 1 − [𝑃(𝑅 𝐶 )25 + 25 ∙ 𝑃(𝑅 𝐶 )24 ∙ 𝑃(𝑅)]
→ 1 − [0,8525 + 25 ∙ 0,8524 ∙ 0,15]
→ 0,907
Conclusión
La probabilidad de que, en una muestra de 25 despachos, al menos dos presenten reclamos
es de un 90,7%

PROBLEMA 2
El MOP quiere inscribir 4 nuevas carreteras, para lo cual llamará a 4 licitaciones. Por las
condiciones impuestas solo podrían adjudicárselas las empresas Alfa y Beta. Estas empresas
por decisión de sus respectivos directorios, llegaron al acuerdo siguiente: si una de ellas se
adjudica dos de las carreteras en forma consecutiva, la otra no seguirá participando. Por
antecedentes que se manejan, Alfa tiene una probabilidad constante de ganar en cualquiera
de estas licitaciones de 0,6 y Beta de 0,4. ¿Cuál es la probabilidad de que Beta “no siga
participando”?
22
SOLUCIÓN
Sean los sucesos:
A: La licitación la gana la empresa “α”
B: La licitación la gana la empresa “β”
→ 𝑃(𝐴) = 0,6
→ 𝑃(𝐵) = 0,4
Probabilidades que se requieren
En esta oportunidad, no es factible saber directamente lo que se requiere para solucionar

el problema, según la información proporcionada en el enunciado. Es por esto, que para
facilitar dicho requerimiento, se procederá a realizar un diagrama de árbol que nos permita
visualizar el espacio muestral.
A
A
B
Ilustración 2. Representación de espacio muestral, ganando la primera licitación la empresa“𝛼”

A
A
B B
B
Ilustración 3. Representación de espacio muestral, ganando la primera licitación la empresa “𝛽”
Así, el espacio muestral descrito matemáticamente, queda dado por: 23

Ω: {𝐴𝐴, 𝐴𝐵, 𝐵𝐴𝐴, 𝐵𝐴𝐵, 𝐵𝐵}
Luego, para determinar la probabilidad que se pide, se considerarán en ambos diagramas

las condiciones impuestas por los directorios de ambas empresas.
A
A
B
Ilustración 4. Representación de que la empresa “𝛽” no siga participando, habiendo ocurrido A en la primera licitación.
A
A
B B
B
Ilustración 5. Representación de que la empresa “𝛽” no siga participando, habiendo ocurrido B en la primera licitación.
Así, la probabilidad de que la empresa “Beta” no siga participando queda expresada de la

siguiente forma:
→ 𝑃(𝐴 ∩ 𝐴) ∪ 𝑃(𝐵 ∩ 𝐴 ∩ 𝐴)
Al ser A y B sucesos independientes, la expresión que se requiere calcular queda dada como
se muestra a continuación.
→ 𝑃(𝐴 ∩ 𝐴) ∪ 𝑃(𝐵 ∩ 𝐴 ∩ 𝐴)

→ 𝑃(𝐴) ∙ 𝑃(𝐴) + 𝑃(𝐵) ∙ 𝑃(𝐴) ∙ 𝑃(𝐴)
Así, reemplazando las probabilidades dadas en el enunciado, se obtiene:
→ 0,6 ∙ 0,6 + 0,4 ∙ 0,6 ∙ 0,6 → 0,504
Conclusión
La probabilidad de que la empresa “Beta” no siga participando es de un 50,4%
24

PROBLEMA 3
En una planta industrial adquieren reguladores de voltaje de tres diferentes fabricantes B1,
B2 y B3; el 50% de los reguladores se compran a B1, el 34% se compran a B2 y el resto a B3.
El porcentaje de reguladores que resultan defectuosos, de los fabricados por B1 es 6%, de
los fabricados por B2 es 10% y de los reguladores adquiridos a B3 el 92% resultan buenos.
Se elige al azar un regulador de los adquiridos por la planta y al probarlo resulta no

defectuoso, ¿De qué fabricante es más probable que provenga y cuál es el valor de cada
una de las probabilidades? Defina sucesos y probabilidad. Justifique su respuesta. 25
SOLUCIÓN
Sean los sucesos:
𝐵𝑖 : El regulador de voltaje proviene del fabricante "𝑖", con 𝑖 = 1,2,3
D: El regulador de voltaje se encuentra defectuoso
→ 𝑃(𝐵1 ) = 0,5
→ 𝑃(𝐵2 ) = 0,34
→ 𝑃(𝐵3 ) = 1 − 0,5 − 0,34 = 0,16
→ 𝑃(𝐷/𝐵1 ) = 0,06
→ 𝑃(𝐷/𝐵2 ) = 0,1
→ 𝑃(𝐷𝐶 /𝐵3 ) = 0,92
Probabilidad que se requiere
→ 𝑃(𝐷𝐶 ) = ?
→ 𝑃(𝐵1 /𝐷𝐶 ) = ?
→ 𝑃(𝐵2 /𝐷𝐶 ) = ?
→ 𝑃(𝐵3 /𝐷𝐶 ) = ?

Primero se determinará la probabilidad 𝑃(𝐷𝐶 ), para lo cual se procederá a descomponer

las probabilidades expuestas en el enunciado. Para esto, se utilizará como base la
generalidad de las propiedades expuestas en las ecuaciones (2.2) y (2.3), en donde “A” y
“B” corresponden a dos sucesos cualquiera.
𝑃(𝐴 ∩ 𝐵)
𝑃(𝐴⁄𝐵 ) = (2.2)
𝑃(𝐵)
26
𝑃(𝐴 ∩ 𝐵 𝐶 ) = 𝑃(𝐴) − 𝑃(𝐴 ∩ 𝐵) (2.3)
𝑃(𝐷 ∩ 𝐵1 )
→ 𝑃(𝐷/𝐵1 ) = → 𝑃(𝐷 ∩ 𝐵1 ) = 0,5 ∙ 0,06 = 0,03
𝑃(𝐵1 )
𝑃(𝐷 ∩ 𝐵2 )
→ 𝑃(𝐷/𝐵2 ) = → 𝑃(𝐷 ∩ 𝐵2 ) = 0,34 ∙ 0,1 = 0,034
𝑃(𝐵2 )
𝐶
𝑃(𝐷𝐶 ∩ 𝐵3 ) 𝑃(𝐵3 ) − 𝑃(𝐷 ∩ 𝐵3 )
→ 𝑃(𝐷 /𝐵3 ) = 0,92 → = = 0,92
𝑃(𝐵3 ) 𝑃(𝐵3 )
→ 𝑃(𝐷 ∩ 𝐵3 ) = 0,16 − 0,16 ∙ 0,92 = 0,0128
Luego, es posible calcular la probabilidad de que ocurra D.
→ 𝑃(𝐷) = 𝑃(𝐷 ∩ 𝐵1 ) + 𝑃(𝐷 ∩ 𝐵2 ) + 𝑃(𝐷 ∩ 𝐵3 )
→ 𝑃(𝐷) = 0,03 + 0,034 + 0,0128 = 0,0768
A partir de la propiedad expuesta en la ecuación (2.1), se obtiene 𝑃(𝐷𝐶 )
→ 𝑃(𝐷𝐶 ) = 1 − 𝑃(𝐷) = 1 − 0,0768 = 0,9232

Posteriormente, es necesario calcular las probabilidades de que el regulador de voltaje se

encuentre defectuoso, dado que proviene de cada uno de los fabricantes, con el fin de
responder lo que se pregunta en el enunciado. Estas probabilidades, quedan dadas de la
siguiente forma:
𝑃(𝐵1 ∩ 𝐷𝐶 ) 𝑃(𝐵1 ) − 𝑃(𝐵1 ∩ 𝐷) 0,5 − 0,03

→ 𝑃(𝐵1 /𝐷𝐶 ) = = = = 0,539
𝑃(𝐷𝐶 ) 𝑃(𝐷𝐶 ) 0,9232
27
𝐶)
𝑃(𝐵2 ∩ 𝐷𝐶 ) 𝑃(𝐵2 ) − 𝑃(𝐵2 ∩ 𝐷) 0,34 − 0,034
→ 𝑃(𝐵2 /𝐷 = = = = 0,3315
𝑃(𝐷𝐶 ) 𝑃(𝐷𝐶 ) 0,9232
𝑃(𝐵3 ∩ 𝐷𝐶 ) 𝑃(𝐵3 ) − 𝑃(𝐵3 ∩ 𝐷) 0,16 − 0,0128

→ 𝑃(𝐵3 /𝐷𝐶 ) = = = = 0,159
𝑃(𝐷𝐶 ) 𝑃(𝐷𝐶 ) 0,9232
Conclusión
El regulador extraído al azar que resultó no defectuoso es más probable que provenga de
los fabricados por 𝐵1, con una probabilidad correspondiente a un 53,9%

PROBLEMA 4
Una empresa dedicada a transportar carga pesada dentro de una mina posee tres camiones
para el trabajo diario. Si el 40% de las veces se utiliza el camión A, el 25% utiliza el camión
C, el 15% de las veces se utiliza el camión A y C, el 48% se utiliza el camión B cuando se ha
utilizado el camión C, el 30% de los días no se utiliza ninguno de los 3 camiones. Además, el
25% de las veces se utiliza el camión B y no el A. Se elige al azar un día de trabajo, determine
la probabilidad que, en ese día, la empresa sólo utilice uno de los tres camiones. Utilice
propiedades de las probabilidades. 28
SOLUCIÓN
Sean los sucesos:
A: Se utiliza el camión A.
B: Se utiliza el camión B.
C: Se utiliza el camión C.
→ 𝑃(𝐴) = 0,4
→ 𝑃(𝐶) = 0,25
→ 𝑃(𝐵) = 0,35
→ 𝑃(𝐴 ∩ 𝐶) = 0,15
→ 𝑃(𝐵/𝐶) = 0,48
→ 𝑃(𝐵 ∩ 𝐴𝐶 ) = 0,25
→ 𝑃(𝐴𝐶 ∩ 𝐵 𝐶 ∩ 𝐶 𝐶 ) = 0,3

→ 𝑃(𝐴 ∩ 𝐵 𝐶 ∩ 𝐶 𝐶 ) + 𝑃(𝐴𝐶 ∩ 𝐵 ∩ 𝐶 𝐶 ) + 𝑃(𝐴𝐶 ∩ 𝐵 𝐶 ∩ 𝐶) = ?
Como es habitual en este tipo de ejercicios, se procederá a descomponer las probabilidades

expuestas en el enunciado. Para esto, se utilizará como base la generalidad de las
propiedades expuestas en las ecuaciones (1), (2) y (3) ya expuestas en ejercicios anteriores. 29
Además, se aplicará en el desarrollo del ejercicio las propiedades representadas en las
ecuaciones (2.4) y (2.5), en donde “A” y “B” corresponden a dos sucesos cualesquiera.
𝑃(𝐴 ∪ 𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) (2.4)
𝑃(𝐴 ∪ 𝐵)𝐶 = 𝑃(𝐴𝐶 ∩ 𝐵 𝐶 ) (2.5)
Así, las probabilidades obtenidas a partir de la descomposición de probabilidades dadas,

quedan dadas como se muestra a continuación.
→ 𝑃(𝐴𝐶 ∩ 𝐵) = 0,25 → 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) = 0,25 → 𝑃(𝐴 ∩ 𝐵) = 0,35 − 0,25 = 0,1
𝐵 𝑃(𝐵 ∩ 𝐶)
→ 𝑃 ( ) = 0,48 → = 0,48 → 𝑃(𝐵 ∩ 𝐶) = 0,48 ∙ 0,25 = 0,12
𝐶 𝑃(𝐶)
→ 𝑃(𝐴𝐶 ∩ 𝐵 𝐶 ∩ 𝐶 𝐶 ) = 𝑃(𝐴 ∪ 𝐵 ∪ 𝐶)𝐶 = 1 − 𝑃(𝐴 ∪ 𝐵 ∪ 𝐶)
= 1 − [𝑃(𝐴 ∪ 𝐵) + 𝑃(𝐶) − (𝑃(𝐴 ∪ 𝐵) ∩ 𝐶)]
= 1 − [𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) + 𝑃(𝐶) − (𝑃(𝐴 ∩ 𝐶) ∪ 𝑃(𝐵 ∩ 𝐶))]
= 1 − [𝑃(𝐴) + 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) + 𝑃(𝐶) − (𝑃(𝐴 ∩ 𝐶) + 𝑃(𝐵 ∩ 𝐶) − 𝑃(𝐴 ∩ 𝐵 ∩ 𝐶))]

= 1 − 𝑃(𝐴) − 𝑃(𝐵) − 𝑃(𝐶) + 𝑃(𝐴 ∩ 𝐵) + 𝑃(𝐴 ∩ 𝐶) + 𝑃(𝐵 ∩ 𝐶) − 𝑃(𝐴 ∩ 𝐵 ∩ 𝐶) = 0,3
→ 𝑃(𝐴 ∩ 𝐵 ∩ 𝐶) = 1 − 0,4 − 0,35 − 0,25 + 0,1 + 0,15 + 0,12 − 0,3 = 0,07
Luego, a partir de las probabilidades encontradas anteriormente, es posible determinar las

probabilidades requeridas, obteniendo lo siguiente:
30
𝐶 𝐶) 𝐶)
→ 𝑃(𝐴 ∩ 𝐵 ∩ 𝐶 = 𝑃(𝐴 ∩ (𝐵 ∪ 𝐶) = 𝑃(𝐴 ∩ [1 − (𝐵 ∪ 𝐶)])
= 𝑃(𝐴) − 𝑃(𝐴 ∩ (𝐵 ∪ 𝐶)) = 𝑃(𝐴) − [𝑃(𝐴 ∩ 𝐵) ∪ (𝐴 ∩ 𝐶)]
= 𝑃(𝐴) − [𝑃(𝐴 ∩ 𝐵) + 𝑃(𝐴 ∩ 𝐶) − 𝑃(𝐴 ∩ 𝐵 ∩ 𝐶)]
= 𝑃(𝐴) − 𝑃(𝐴 ∩ 𝐵) − 𝑃(𝐴 ∩ 𝐶) + 𝑃(𝐴 ∩ 𝐵 ∩ 𝐶)
= 0,4 − 0,1 − 0,15 + 0,07
= 0,22
Análogamente se obtienen las dos probabilidades restantes, obteniendo:
→ 𝑃(𝐴𝐶 ∩ 𝐵 ∩ 𝐶 𝐶 ) = 𝑃(𝐵) − 𝑃(𝐴 ∩ 𝐵) − 𝑃(𝐵 ∩ 𝐶) + 𝑃(𝐴 ∩ 𝐵 ∩ 𝐶)
= 0,35 − 0,1 − 0,12 + 0,07
= 0,2
→ 𝑃(𝐴𝐶 ∩ 𝐵 𝐶 ∩ 𝐶) = 𝑃(𝐶) − 𝑃(𝐴 ∩ 𝐶) − 𝑃(𝐵 ∩ 𝐶) + 𝑃(𝐴 ∩ 𝐵 ∩ 𝐶)
= 0,25 − 0,15 − 0,12 + 0,07
= 0,05

Así, es posible determinar la probabilidad total requerida, realizando la suma de las 3

probabilidades anteriores.
→ 𝑃(𝐴 ∩ 𝐵 𝐶 ∩ 𝐶 𝐶 ) + 𝑃(𝐴𝐶 ∩ 𝐵 ∩ 𝐶 𝐶 ) + 𝑃(𝐴𝐶 ∩ 𝐵 𝐶 ∩ 𝐶)
= 0,22 + 0,2 + 0,05
= 0,47
Conclusión
La probabilidad de que en el día de trabajo elegido al azar, la empresa sólo utilice uno de 31
los tres camiones es de un 47%.

PROBLEMA 5
En un estudio realizado, por una compañía de seguros, sobre las causas mecánicas que
provocan accidentes de tránsito, se encontró que las más frecuentes son por frenos,
dirección y neumáticos. El estudio mostró que el 48% de los accidentes se deben a causa de
los frenos, el 30% a causa de los neumáticos, el 10% a causa de la dirección, el 9% a frenos
y neumáticos, el 4% a neumáticos y dirección, el 51% a frenos o dirección. La probabilidad
que haya presentado todas las causas mencionadas es de 0,01. Además, se detectó que de
todos los automóviles involucrados en accidentes un 25% no tenía contratado un seguro y
que de ellos un 10% sufrió un accidente grave, en cambio de los que tenían seguro un 18% 32
sufrió un accidente grave.
a) ¿Cuál es la probabilidad que un automóvil haya sufrido un accidente grave?

b) Si se elige un automóvil que está involucrado en un accidente. ¿Cuál es la
probabilidad que sólo haya sido provocado por una de las causas mencionadas?
c) Si se seleccionan al azar y en forma independiente 15 automóviles involucrados en
accidentes. Determine la probabilidad que por lo menos 3 automóviles tengan
seguro.
SOLUCIÓN 5-A
Sean los sucesos:
𝐹: El accidente se debe a causa de frenos.
𝐷: El accidente se debe a causa de dirección.
𝑁: El accidente se debe a causa de neumáticos.
𝐴: El automóvil sufre accidente grave.
𝑆: El automóvil tiene asociado un contrato de seguro.

→ 𝑃(𝐹) = 0,48
→ 𝑃(𝑁) = 0,3
→ 𝑃(𝐷) = 0,1
→ 𝑃(𝐹 ∩ 𝑁) = 0,09
33
→ 𝑃(𝑁 ∩ 𝐷) = 0,04
→ 𝑃(𝐹 ∪ 𝐷) = 0,51
→ 𝑃(𝐹 ∩ 𝐷 ∩ 𝑁) = 0,01
→ 𝑃 (𝐴⁄ 𝑆 𝐶 ) = 0,1
→ 𝑃( 𝑆 𝐶 ) = 0,25
→ 𝑃(𝐴⁄𝑆) = 0,18
→ 𝑃(𝐴) = ?
Al igual que en ejercicios anteriores, se procederá a descomponer las probabilidades

expuestas en el enunciado.
Así, las probabilidades asociadas a los automóviles que sufren accidentes, quedan dadas
como se muestra a continuación.
→ 𝑃( 𝑆 𝐶 ) = 0,25 → 𝑃(𝑆) = 1 − 𝑃( 𝑆 𝐶 ) = 0,75
𝑃(𝐴 ∩ 𝑆)
→ 𝑃(𝐴⁄𝑆) = 0,18 → = 0,18
𝑃(𝑆)
→ 𝑃(𝐴 ∩ 𝑆) = 0,18 ∙ 0,75 = 0,135

𝐴 𝑃(𝐴 ∩ 𝑆 𝐶 )
→ 𝑃 ( ⁄ 𝑆 𝐶 ) = 0,1 → = 0,1
𝑃( 𝑆 𝐶 )
𝑃(𝐴) − 𝑃(𝐴 ∩ 𝑆)
→ = 0,1
1 − 𝑃(𝑆)
A partir de las probabilidades expuestas anteriormente, es posible despejar la probabilidad

requerida, obteniendo:
34
→ 𝑃(𝐴) = 0,1 ∙ (1 − 0,25) + 0,135
→ 𝑃(𝐴) = 0,16
Observación
La descomposición de probabilidades condicionadas, se ha realizado a partir del Teorema
de Bayes y las Leyes de Morgan. Estas propiedades han sido representadas en las ecuaciones
(2.2) y (2.3)
Conclusión
La probabilidad que el automóvil sufra accidente grave corresponde a un 16%.
SOLUCIÓN 5-B
→ 𝑃(𝐹 ∪ 𝐷 ∪ 𝑁⁄𝐴) = ?
Primero que todo, se procederá a descomponer la probabilidad 𝑃(𝐹 ∩ 𝐷), a partir de los
datos estipulados en el enunciado.
→ 𝑃(𝐹 ∪ 𝐷) = 0,51 → 𝑃(𝐹) + 𝑃(𝐷) − 𝑃(𝐹 ∩ 𝐷) = 0,51
→ 𝑃(𝐹 ∩ 𝐷) = 0,48 + 0,1 − 0,51 = 0,07

Volviendo al cálculo de la probabilidad requerida, aplicando “Teorema de Bayes”, se

obtiene:
𝑃((𝐹 ∪ 𝐷 ∪ 𝑁) ∩ 𝐴)
→ 𝑃(𝐹 ∪ 𝐷 ∪ 𝑁⁄𝐴) =
𝑃(𝐴)
Se observa que el suceso asociado a los automóviles que sufren accidentes, es

independiente de los sucesos asociados a las causas por las que ocurren accidentes. Así, la
probabilidad requerida queda dada por:
35
𝑃(𝐹 ∪ 𝐷 ∪ 𝑁) ∙ 𝑃(𝐴)
→ = 𝑃(𝐹 ∪ 𝐷 ∪ 𝑁)
𝑃(𝐴)
Luego, utilizando la propiedad de las probabilidades (2.4), asociada a la unión de sucesos

dependientes, la expresión anterior se reduce a:
= 𝑃(𝐹) + 𝑃(𝐷) + 𝑃(𝑁) − 𝑃(𝐹 ∩ 𝐷) − 𝑃(𝐹 ∩ 𝑁) − 𝑃(𝐷 ∩ 𝑁) + 𝑃(𝐷 ∩ 𝑁 ∩ 𝐹)
Reemplazando, se obtiene:
→ 𝑃(𝐹 ∪ 𝐷 ∪ 𝑁) = 0,48 + 0,1 + 0,3 − 0,04 − 0,07 − 0,09 + 0,01
= 0,69
Conclusión
La probabilidad de que sólo se asocie una causa de las estudiadas en este problema a un
automóvil que sufre un accidente, es de un 69%.
SOLUCIÓN 5-C
Se tiene una muestra aleatoria de 15 automóviles involucrados en accidentes, además es

relevante recordar que:
→ 𝑃(𝑆) = 0,75
A continuación, se define la siguiente variable, con el fin de representar de buena forma la

probabilidad requerida.
Sea:
X: Número de automóviles que tienen contratado un seguro, en una muestra aleatoria de

15 asociados a accidentes.

Probabilidad Requerida:
𝑃(𝑋 ≥ 3) = ?
Desarrollo del Problema:
𝑃(𝑋 ≥ 3) = 1 − 𝑃(𝑋 < 3)
= 1 − [𝑃(𝑋 = 0) + 𝑃(𝑋 = 1) + 𝑃(𝑋 = 2)]

36
15
= 1 − [𝑃(𝑆 𝐶 )15 + 15 ∙ 𝑃(𝑆) ∙ 𝑃(𝑆 𝐶 )14 + ( ) ∙ 𝑃(𝑆)2 ∙ 𝑃(𝑆 𝐶 )13 ]
2
15 (0,25)2 (1
= 1 − [(1 − 0,25)15 + 15 ∙ (0,25) ∙ (1 − 0,25)14 + ( )∙ ∙ − 0,25)13 ]
2
= 0,7639
Conclusión
La probabilidad que por lo menos 3 de los 15 automóviles elegidos de forma aleatoria
tengan un contrato de seguro corresponde a un 76,39%

PROBLEMA 6
En un estudio encargado por la gerencia de ciertos servicentros de Santiago, parte de él se
enfocó a clientes con vehículos del último año (A), vehículos que usan Diesel (D) y clientes
que pagan el combustible con tarjeta de crédito (T), obteniéndose la siguiente información:
P(A)=0,17 P(A∩D)=0,06
P(D)= 0,10 P(A∩ T)=0,08
P(T)= 0,36 P(Dc∩ T)=0,33
37
Además, el 52% de los vehículos no tienen ninguna de las tres características anteriores.
Si un cliente elegido al azar no paga con tarjeta de crédito. ¿Cuál es la probabilidad que su
vehículo sea del último año y no use Diesel? Utilice propiedades de las probabilidades.
SOLUCIÓN
Sean los sucesos:
A: El cliente tiene un vehículo de último año
D: El cliente tiene un vehículo que usa Diesel
C: El cliente paga el combustible con tarjeta de crédito
En esta oportunidad las probabilidades vienen definidas en la siguiente tabla:
P(A)=0,17 P(A∩D)=0,06
P(D)= 0,10 P(A∩ T)=0,08
P(T)= 0,36 P(Dc∩ T)=0,33
Además, en el enunciado, se da como dato la siguiente probabilidad:
→ 𝑃(𝐴𝐶 ∩ 𝐷𝐶 ∩ 𝑇 𝐶 ) = 0,52

𝐶
→ 𝑃 (𝐴 ∩ 𝐷 ⁄ 𝑇 𝐶 ) = ?

Al igual que en ejercicios anteriores, se procederá a descomponer las probabilidades

expuestas en el enunciado. Para esto, se utilizará como base la generalidad de las
propiedades representadas en las ecuaciones (2.1), (2.2), (2.3), (2.4) Y (2.5); las cuales han
sido expuestas en problemas anteriores.
Así, las probabilidades obtenidas a partir de la descomposición de probabilidades

enunciadas, quedan dadas como se muestra a continuación.
38
→ P(𝐷𝐶 ∩ T) = 0,33 → 𝑃(𝑇) − 𝑃(𝐷 ∩ 𝑇) = 0,33 → 𝑃(𝐷 ∩ 𝑇) = 0,03
→ 𝑃(𝐴𝐶 ∩ 𝐷𝐶 ∩ 𝑇 𝐶 ) = 𝑃(𝐴 ∪ 𝐷 ∪ 𝑇)𝐶 = 1 − 𝑃(𝐴 ∪ 𝐷 ∪ 𝑇)
= 1 − [𝑃(𝐴 ∪ 𝐷) + 𝑃(𝑇) − 𝑃((𝐴 ∪ 𝐷) ∩ 𝑇)]
= 1 − [𝑃(𝐴) + 𝑃(𝐷) − 𝑃(𝐴 ∩ 𝐷) + 𝑃(𝑇) − (𝑃((𝐴 ∩ 𝑇) ∪ 𝑃(𝐷 ∩ 𝑇)))]
= 1 − [𝑃(𝐴) + 𝑃(𝐷) − 𝑃(𝐴 ∩ 𝐷) + 𝑃(𝑇) − (𝑃(𝐴 ∩ 𝑇) + 𝑃(𝐷 ∩ 𝑇) − 𝑃(𝐴 ∩ 𝑇 ∩ 𝐷))]
=1 − 𝑃(𝐴) − 𝑃(𝐷) + 𝑃(𝐴 ∩ 𝐷) − 𝑃(𝑇) + 𝑃(𝐴 ∩ 𝑇) + 𝑃(𝐷 ∩ 𝑇) − 𝑃(𝐴 ∩ 𝑇 ∩ 𝐷) = 0,52
→ 𝑃(𝐴 ∩ 𝑇 ∩ 𝐷) = 1 − 0,52 − 0,17 − 0,1 + 0,06 − 0,36 + 0,08 + 0,03
= 0,02

Luego, a partir de las probabilidades encontradas anteriormente, es posible determinar la

probabilidad requerida. No obstante, es necesario descomponer la probabilidad
condicional buscada para facilitar el reemplazo, obteniendo lo siguiente:
𝐶 𝑃((𝐴 ∩ 𝐷𝐶 ) ∩ 𝑇 𝐶 )
→ 𝑃 (𝐴 ∩ 𝐷 ⁄ 𝑇𝐶) = 𝑃( 𝑇 𝐶 )
𝑃(𝐴 ∩ 𝐷𝐶 ∩ 𝑇 𝐶 ) 39
=
1 − 𝑃(𝑇)
𝑃(𝐴 ∩ (𝐷 ∪ 𝑇)𝐶 )
=
1 − 𝑃(𝑇)
𝑃(𝐴 ∩ [1 − 𝐷 ∪ 𝑇])
=
1 − 𝑃(𝑇)
𝑃(𝐴) − 𝑃(𝐴 ∩ (𝐷 ∪ 𝑇))

=
1 − 𝑃(𝑇)
𝑃(𝐴) − [𝑃((𝐴 ∩ 𝐷) ∪ (𝐴 ∩ 𝑇))]

=
1 − 𝑃(𝑇)
𝑃(𝐴) − 𝑃((𝐴 ∩ 𝐷) − 𝑃(𝐴 ∩ 𝑇) + 𝑃(𝐴 ∩ 𝑇 ∩ 𝐷)

=
1 − 𝑃(𝑇)
0,17 − 0,06 − 0,08 + 0,02

=
1 − 0,36
= 0,0781
Conclusión
La probabilidad de que el vehículo elegido al azar sea de último año y no use Diesel, dado
que el cliente no paga con tarjeta de crédito es de un 7,81%.

Unidad 3 - Variable Aleatoria Unidimensional
PROBLEMA 1
Una empresa que fabrica reproductores de DVD ha detectado que el número de aparatos
defectuoso (X) por partida, se puede considerar una variable aleatoria con la siguiente
función de cuantía:
𝑿 𝟎 𝟏 𝟐 𝟑 𝟒 𝟓
𝑷(𝒙) 0 0,66 0,15 0,12 0,05 0,02 40
Tabla 9. Distribución de probabilidades respecto al número de reproductores de DVD defectuosos.
¿Cuál es el número esperado de aparatos defectuosos por partida?
SOLUCIÓN
Primero que todo, es importante denotar que "𝑋" es una variable aleatoria discreta. Esto,
debido a que no existen valores intermedios entre un valor que toma la variable y otro; por
ejemplo, entre 𝑋 = 0 "𝑎𝑝𝑎𝑟𝑎𝑡𝑜𝑠" Y 𝑋 = 1 (𝑎𝑝𝑎𝑟𝑎𝑡𝑜), no existen aparatos intermedios.
Se sabe, que en general la esperanza de una variable aleatoria discreta, se define como se
muestra en la ecuación (3.1), donde "𝑋" es una variable discreta cualquiera.
𝐸(𝑋) = ∑ 𝑋𝑖 ∙ 𝑃(𝑥𝑖 ) (3.1)
Así, el número esperado de aparatos defectuosos queda dado por:
𝐸(𝑋) = 0 ∙ 0 + 1 ∙ 0,66 + 2 ∙ 0,15 + 3 ∙ 0,12 + 4 ∙ 0,05 + 5 ∙ 0,02
= 1,62
Conclusión
El número esperado de aparatos defectuosos por partida, corresponde a 1,62 “aparatos”

PROBLEMA 2
El tiempo que un adolescente hace funcionar su MP4, en cierto periodo, se considera una
variable aleatoria con función de densidad, en cientos de horas:
𝑥 𝑠𝑖 0 < 𝑥 < 1
𝑓(𝑥) = {2 − 𝑥 𝑠𝑖 1 ≤ 𝑥 < 2
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
a) De los adolescentes que hacen funcionar más de 60 horas, el equipo. ¿Qué 41

porcentaje lo hace funcionar menos de 150 horas?
b) Calcule el tiempo esperado que un adolescente hace funcionar su Mp4.
c) ¿Cuál es el tiempo mínimo que hace funcionar su MP4, el 40% de los adolescentes
que más lo usan?
SOLUCIÓN 2-A
Sea:
X: Tiempo que un adolescente hace funcionar su MP4, en cientos de horas.
Es importante identificar, que se está en presencia de una probabilidad condicional, donde

la condición es que los adolescentes hagan funcionar más de 60 horas su MP4. Por otro
lado, es necesario definir de buena forma la probabilidad que se requiere, la cual queda
dada de la siguiente forma:
→ 𝑃 (𝑋 < 150⁄𝑋 > 60) = ?
Para resolver este problema, es necesario identificar que “X” corresponde a una variable
aleatoria contínua. Para este tipo de variables, en general es válido utilizar la ecuación (3.2)
para el cálculo de probabilidades, donde “X” es una variable aleatoria continua cualquiera
y; “a” y “b” representan valores constantes.
𝑏
𝑃(𝑎 ≤ 𝑥 ≤ 𝑏) = ∫ 𝑓(𝑥) ∙ 𝑑𝑥 (3.2)
𝑎
𝑃(𝑋 < 1,5 ∩ 𝑋 > 0,6) 𝑃(0,6 < 𝑋 < 1,5)

→ 𝑃 (𝑋 < 1,5⁄𝑋 > 0,6) = =
𝑃(𝑋 > 0,6) 1 − 𝑃(𝑋 ≤ 0,6)

1,5
∫0,6 𝑓(𝑥) ∙ 𝑑𝑥
= 0,6
1 − ∫0 𝑓(𝑥) ∙ 𝑑𝑥
1 1,5
∫0,6 𝑥 ∙ 𝑑𝑥 + ∫1 (2 − 𝑥) ∙ 𝑑𝑥 0,695
= 0,6 =
1 − ∫0 𝑥 ∙ 𝑑𝑥 0,82
= 0,848
Conclusión 42
De los adolescentes que hacen funcionar su MP4 más de 60 horas, un 84,8% lo hace
funcionar menos de 150 horas.
SOLUCIÓN 2-B
En general, la esperanza de una variable aleatoria contínua, se encuentra dada como se

muestra en la ecuación (3.3), donde “X” es una variable aleatoria contínua cualquiera y el
intervalo [a,b] representa el recorrido de dicha variable, donde “a” y “b” corresponden a
valores reales constantes.
𝑏
𝐸(𝑋) = ∫ 𝑥 ∙ 𝑓(𝑥) ∙ 𝑑𝑥 (3.3)
𝑎
Además, es importante notar que suponiendo válidas las condiciones expuestas

anteriormente, se cumple la expresión expuesta en la ecuación (4), la cual será útil en
ejercicios posteriores.
𝑏
∫ 𝑓(𝑥) ∙ 𝑑𝑥 = 1 (3.4)
𝑎
Así, contextualizando lo estipulado anteriormente con el ejercicio en cuestión, el tiempo

esperado queda dado a partir de la ecuación (3.3), obteniendo lo siguiente:
2
→ 𝐸(𝑋) = ∫ 𝑥 ∙ 𝑓(𝑥) ∙ 𝑑𝑥
0
1 2
= ∫ 𝑥 ∙ 𝑥 ∙ 𝑑𝑥 + ∫ 𝑥 ∙ (2 − 𝑥) ∙ 𝑑𝑥
0 0
1 2
= ∫ 𝑥 2 ∙ 𝑑𝑥 + ∫ (2 ∙ 𝑥 − 𝑥 2 ) ∙ 𝑑𝑥
0 0
=1

Conclusión
El tiempo esperado, que un adolescente hace funcionar su MP4 corresponde a cien horas.
SOLUCIÓN 2-C
Primero que todo, se representará como 𝑃60 el punto mínimo en del 40% de los
adolescentes que más usan el dispositivo. Es decir, podría asociarse a que el valor 𝑃60
representa el percentil 60 de la distribución de la variable “X”. Es importante denotar, que
es éste valor 𝑃60 la incógnita que se requiere calcular, quedando esto representado de la
siguiente forma, en vista de los datos que se tienen: 43
𝑃(𝑥 ≤ 𝑃60 ) = 0,6
Así, aplicando la expresión de la ecuación (3), es posible representar lo siguiente:

𝑃60
→∫ 𝑓(𝑥) ∙ 𝑑𝑥 = 0,6
0
Observación
Se nota que el valor 𝑃60 pertenece a la segunda parte de la función de densidad, esto se
puede explicar, debido a que anteriormente se ha determinado que el tiempo esperado
corresponde a 1 “cientos de horas”, lo que recae en la mitad de la distribución de
probabilidad. Lo anterior, queda demostrado analizando la integral de la primera parte de
la función de densidad, lo cual se expone a continuación:
1 1
→ ∫ 𝑓(𝑥) ∙ 𝑑𝑥 = ∫ 𝑥 ∙ 𝑑𝑥 = 0,5
0 0
Así, sabiendo que 𝑃60 pertenece a la segunda parte de la función de densidad, es válido
realizar el siguiente desarrollo:
𝑃60
→∫ 𝑓(𝑥) ∙ 𝑑𝑥 = 0,6
0
2
→ 1 − ∫ 𝑓(𝑥) ∙ 𝑑𝑥 = 0,6
𝑃60
2
→ 0,4 = ∫ (2 − 𝑥) ∙ 𝑑𝑥
𝑃60
𝑥2 2
→ 0,4 = [2 ∙ 𝑥 − ] |
2 𝑃60

22 𝑃60 2
→ 0,4 = [4 − − 2 ∙ 𝑃60 + ]
2 2
Despejando, se obtiene la siguiente ecuación cuadrática:
𝑃60 2
→ − 2 ∙ 𝑃60 + 1,6 = 0
2
Resolviendo la ecuación, se obtienen como soluciones:
→ 𝑃601 = 2,894 44
→ 𝑃602 = 1,106
Es posible notar, que 𝑃601 no pertenece al recorrido de la variable “X”, es por esto que el
valor válido corresponde a:
→ 𝑃60 = 1,106
Conclusión
El mínimo tiempo que hace funcionar su MP4, el 40% de los adolescentes que más lo usan
corresponde a 110,6 horas.

PROBLEMA 3
La demanda diaria de “pan especial” en una panadería es una variable aleatoria (X), en
cientos de Kilogramos, con función de densidad:
0,25 𝑠𝑖 2 < 𝑥 ≤ 6
𝑓(𝑥) = {
45
Si la panadería recibe una utilidad diaria, en (um); según la demanda de pan, que consiste
en que si la demanda se encuentra: entre 200 y menos de 300 kilos, la utilidad es de 30
(um); entre 300 y menos de 550 Kg, la utilidad es de 35 (um) y más de 550 Kg, la utilidad es
37 (um) ¿Cuál es la utilidad esperada?
SOLUCIÓN
Sean las variables:
X: Demanda diaria de “pan especial” en una panadería, en cientos de kilos.
U: Utilidad obtenida según demanda de “pan especial”, en unidades monetarias.
Cálculo de Probabilidades
Es importante notar que “X” corresponde a una variable aleatoria contínua, por lo que el
cálculo de probabilidades necesarias se realiza en base a la ecuación (3.2), la cual ha sido
expuesta en problemas anteriores.
3
→ P(2 ≤ x ≤ 3) = ∫ 0,25 ∙ 𝑑𝑥 = 0,25
2
5,5
→ P(3 ≤ x ≤ 5,5) = ∫ 0,25 ∙ 𝑑𝑥 = 0,625
3
6
→ P(5,5 ≤ x ≤ 6) = ∫ 0,25 ∙ 𝑑𝑥 = 0,125
5,5
A partir de las probabilidades expuestas anteriormente, es posible definir la distribución de

probabilidad de la variable “U”, la cual es importante denotar que corresponde a una
variable aleatoria discreta. Esta distribución, queda representada en la tabla 10.

U 𝑷(𝑼)
30 0,25
35 0,625
37 0,125
Tabla 10. Distribución de probabilidad de utilidad obtenida, en unidades monetarias.
Así, es posible determinar la utilidad esperada, a partir de la ecuación (3.1), la cual ha sido
expuesta en problemas anteriores.
→ 𝐸(𝑈) = ∑ 𝑃(𝑈𝑖 ) ∙ 𝑈𝑖 46
= 0,25 ∙ 30 + 0,625 ∙ 35 + 0,125 ∙ 37
= 34
Conclusión
La utilidad esperada corresponde a 34 unidades monetarias.

PROBLEMA 4
Una industria que elabora cierto dispositivo, compra el componente principal de su
producto a dos proveedores A y B. Los tiempos de vida útil (en miles de horas) de los
componentes tienen las siguientes funciones de densidad:
𝑥
;0 ≤ 𝑥 < 1
2
1 1
𝑓𝑋 (𝑥) = ;1 ≤ 𝑥 < 2 𝑓𝑌 (𝑦) = { ; 0 ≤ 𝑦 < 2,8
2 𝑘 47
3−𝑥 0 ; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
; 2≤𝑥<3
{ 2
Si la proporción de dispositivos con el componente principal comprado al proveedor A es

igual a la proporción de dispositivos con el componente principal comprado al proveedor
B:
a) Determine en cuál de los proveedores el componente principal utilizado tiene mayor

duración esperada. Justifique su respuesta
b) Si un componente principal de un dispositivo del proveedor A, elegido al azar, ha
durado más de 500 horas, ¿Cuál es la probabilidad que su vida útil sea superior a
2200 horas?
SOLUCIÓN 4-A
Sea:
X: Tiempo de vida útil de un componente del proveedor A, en miles de horas.
Y: Tiempo de vida útil de un componente del proveedor B, en miles de horas.
Es necesario determinar la esperanza de ambos tiempos de vida útil, a partir de las

funciones de densidad expuestas en el enunciado. Para poder realizar dicho cálculo, se
utilizará la expresión representada en la ecuación (3.3), ya que ambas son variables
aleatorias contínuas.

Esperanza de “X”
3
→ 𝐸(𝑋) = ∫ 𝑓(𝑥) ∙ 𝑥 ∙ 𝑑𝑥
0
1 2 3
𝑥2 𝑥 3−𝑥
=∫ ∙ 𝑑𝑥 + ∫ ∙ 𝑑𝑥 + ∫ ( ) ∙ 𝑥 ∙ 𝑑𝑥
0 2 1 2 2 2
= 1,5 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 ℎ𝑜𝑟𝑎𝑠.

48
Esperanza de “Y”
En esta oportunidad, es necesario determinar previamente el valor numérico de la

constante “k”. Para esto, se utilizará la expresión mostrada en la ecuación (3.4), la cual ha
sido analizada y expuesta en problemas anteriores.
2,8
1
→∫ ∙ 𝑑𝑦 = 1
0 𝑘
1 2,8
→ ∙ [𝑦] | = 1
𝑘 0
→ 𝑘 = 2,8
Así, la esperanza queda dada por:

3
→ 𝐸(𝑌) = ∫ 𝑓(𝑦) ∙ 𝑦 ∙ 𝑑𝑦
0
2,8
1
=∫ ∙ 𝑦 ∙ 𝑑𝑦
0 2,8
= 1,4 𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 ℎ𝑜𝑟𝑎𝑠.
Conclusión
Se ha logrado determinar que 𝐸(𝑌) < 𝐸(𝑋). En base a lo expuesto anteriormente, es
posible afirmar que el proveedor A presenta una mayor duración esperada que el proveedor
B.

SOLUCIÓN 4-B
Es posible identificar, que la probabilidad requerida es de tipo condicional, y queda

representada matemáticamente de la siguiente forma:
𝑃 (𝑥 > 2,2⁄𝑥 > 0,5) = ?
Resolviendo la probabilidad anterior, se obtiene:
𝑃(𝑥 > 2,2 ∩ 𝑥 > 0,5)

→ 𝑃 (𝑥 > 2,2⁄𝑥 > 0,5) = 49
𝑃(𝑥 > 0,5)
𝑃(𝑥 > 2,2)

=
1 − 𝑃(𝑥 ≤ 0,5)
3 3−𝑥
∫2,2( 2 ) ∙ 𝑑𝑥 0,16
= 0,5 𝑥 =
1 − ∫0 2 ∙ 𝑑𝑥 0,938
= 0,171
Conclusión
La probabilidad que la vida útil del componente principal del dispositivo estudiado sea
superior a 2200 horas, dado que ha durado más de 500 horas, corresponde a un 17,1%

PROBLEMA 5
El tiempo de llegado, adelantado o retrasado, medido en minutos, de un tren de alta
velocidad entre la ciudad A y B, es una variable aleatoria con la siguiente función de
densidad:
0 𝑠𝑖 𝑥 < −1
2
𝑥 −1 50
(𝑥 + 1) + ( ) 𝑠𝑖 − 1 ≤ 𝑥 < 0
2
𝐹𝑥 (𝑋) =
𝑥2 + 1
(𝑥 + 1) − ( ) 𝑠𝑖 0 ≤ 𝑥 < 1
2
{ 1 𝑠𝑖 𝑥 ≥ 1
Determine la probabilidad que el tren llegue entre 33 segundos de adelanto y 15

segundos de retraso.
SOLUCIÓN
Sea:
X: Tiempo de llegado, adelantado o retrasado; en minutos.
Observación
Es muy importante notar que la función presentada en el enunciado, corresponde a una
función de distribución de probabilidad acumulada.
Previo a realizar cálculos y análisis, se llevarán los valores de estudio, a las unidades en que
se encuentra definida la variable.
→ 33 (segundos) → 0,55 (𝑚𝑖𝑛𝑢𝑡𝑜𝑠)
→ 15 (segundos) → 0,25 (𝑚𝑖𝑛𝑢𝑡𝑜𝑠)
Considerando negativo el tiempo de retraso y positivo el tiempo de adelanto del tren, la

probabilidad que se requiere calcular, queda expresada de la siguiente forma:
𝑃(−0,25 < 𝑥 < 0,55) = ?
Para resolver la expresión expuesta anteriormente, es óptimo hacer uso directo de la

función de distribución dada, simplemente evaluando el valor que toma la variable en dicha
función. Como es una función acumulada, los valores obtenidos de forma directa al

reemplazar, será la probabilidad de que la variable tome valores desde el límite inferior del
recorrido de la variable hasta el valor que se está evaluando.
Así, la probabilidad requerida queda dada por:
𝑃(−0,25 < 𝑥 < 0,55) = 𝐹(0,55) − 𝐹(−0,25)
= 0,899 − 0,281
= 0,618
51
Conclusión
La probabilidad que el tren llegue entre 33 segundos de adelanto y 15 segundos de retraso,
corresponde a un 61,8%

Unidad 4 - Modelos de Distribucio n Discretos
PROBLEMA 1
El tiempo que una persona emplea en desarrollar cierta tarea, en minutos, es una variable
aleatoria (X) con función de densidad:
1
𝑓(𝑥) = { 10 ; 𝑠𝑖 30 ≤ 𝑥 ≤ 40
0; 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 52
d) Si se eligen al azar y en forma independiente 20 personas. ¿Cuál es la probabilidad
que 12 de ellas se demoren más del tiempo esperado en desarrollar la tarea?
e) Si se eligen personas hasta encontrar una que se haya demorado menos de 35
minutos en desarrollar la tarea. ¿Cuál es la probabilidad que se hayan elegido por
lo menos 4 personas?
SOLUCIÓN 1-A
Sea:
X= Tiempo que una persona emplea en desarrollar cierta tarea, en minutos.
Es posible notar que se da el número de muestra, con lo que se hace factible calcular la
probabilidad de que ocurra un éxito a partir de la función de densidad. Los parámetros
expuestos anteriormente, son suficientes para conformar un modelo binomial.
En general, la función de cuantía asociada a la distribución binomial, se encuentra dada

como se muestra en la ecuación (4.1)
𝑛
( ) ∙ 𝑝 𝑥 ∙ 𝑞 𝑛−𝑥 , 𝑥 = 0,1, … , 𝑛
𝑝(𝑥) = { 𝑥 (4.1)
0, 𝑒. 𝑜. 𝑐
Dónde:
𝑋: 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒𝑓𝑖𝑛𝑖𝑑𝑎 𝑐𝑜𝑚𝑜 “𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠 𝑑𝑒𝑙 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜

𝑑𝑒 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖, 𝑒𝑛 𝑢𝑛𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 “𝑛”
𝑛: 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑣𝑒𝑐𝑒𝑠 𝑒𝑛 𝑞𝑢𝑒 𝑠𝑒 𝑟𝑒𝑎𝑙𝑖𝑧𝑎 𝑒𝑙 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜 𝑑𝑒 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖.
𝑝: 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑞𝑢𝑒 𝑜𝑐𝑢𝑟𝑟𝑎 𝑢𝑛 é𝑥𝑖𝑡𝑜 𝑒𝑛 𝑒𝑙 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜 𝑑𝑒 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖.
𝑞: 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑞𝑢𝑒 𝑜𝑐𝑢𝑟𝑟𝑎 𝑢𝑛 𝑓𝑟𝑎𝑐𝑎𝑠𝑜 𝑒𝑛 𝑒𝑙 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜 𝑑𝑒 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖.

Observación
Es posible observar, que el espacio muestral del resultado del experimento de Bernoulli,
está dado por “p + q”. A partir de esto, se puede afirmar que dicha probabilidad “p + q” da
como resultado 1.
A partir de lo expuesto anteriormente, se sabe que la probabilidad que ocurra un éxito

corresponde al parámetro “p” de Bernoulli, y en este caso corresponde a la probabilidad
que una persona se demore más del tiempo esperado en desarrollar la tarea.
Para determinar el valor de “p”, debe determinarse en forma previa el valor numérico del 53
tiempo esperado en desarrollar la tarea, lo que queda expuesto a continuación:
40 40
1
→ 𝐸(𝑋) = ∫ 𝑓(𝑥) ∙ 𝑥 ∙ 𝑑𝑥 = ∫ ∙ 𝑥 ∙ 𝑑𝑥 = 35
30 30 10
Así, la probabilidad requerida “p”, queda dada de la siguiente forma:

40 40
1
→ 𝑝 = 𝑃(𝑋 > 35) = ∫ 𝑓(𝑥) ∙ 𝑑𝑥 = ∫ ∙ 𝑑𝑥 = 0,5
35 35 10
Con la probabilidad obtenida anteriormente, es posible definir una variable aleatoria que
siga una distribución binomial.
Sea:
Y= Número de personas que demoran más del tiempo esperado en desarrollar cierta tarea,
en una muestra aleatoria de 20 personas.
𝑌~𝐵𝑖𝑛(𝑛 = 20; 𝑝 = 0,5)
Así, la función de cuantía queda dada de la siguiente forma:
20
( ) ∙ 0,5𝑦 ∙ 0,520−𝑦 , 𝑦 = 0,1, … ,20
𝑝(𝑦) = { 𝑦
0, 𝑒. 𝑜. 𝑐
Luego, la probabilidad requerida, es posible definirla y desarrollarla, como se muestra a

continuación:
→ 𝑃(𝑌 = 12) = ?
20
→ 𝑃(𝑌 = 12) = ( ) ∙ 0,512 ∙ (1 − 0,5)20−12
12
= 0,12

Conclusión
Si se eligen al azar y en forma independiente 20 personas. La probabilidad que 12 de ellas
tarden más del tiempo esperado en realizar la tarea es de un 12%
SOLUCIÓN 1-B
Es posible notar a partir del enunciado, que se eligen personas hasta encontrar una que se
haya demorado menos de 35 minutos. Con esto, se puede definir una variable que siga un
modelo de distribución geométrica. Esta distribución, al igual que la binomial se encuentra
relacionada con el experimento de Bernoulli. Específicamente, dicha relación se da en las 54
siguientes aseveraciones:
i. El experimento de Bernoulli se repite hasta obtener un éxito.

ii. El resultado del experimento puede ser un éxito o un fracaso.
iii. La probabilidad de éxito (p) es independiente del obtenido en otro procedimiento.
Así, contextualizando el modelo al problema planteado, es posible definir la variable

aleatoria, como se muestra a continuación.
Sea:
T: Número de personas que se eligen hasta encontrar una que se demore menos de 35
minutos.
𝑇~𝐺𝑒𝑜(𝑝 =? )
Observación
Se nota que la probabilidad de éxito de Bernoulli "𝑝" corresponde a que se encuentre una
persona que tarde menos de 35 minutos en desarrollar la tarea. Además, es posible
observar que, a diferencia del modelo binomial, la distribución geométrica depende sólo
del parámetro “p”, independiente del tamaño de muestra aleatoria.
Así, es posible determinar el parámetro p, de la siguiente forma:

35
1
→ p = P(X < 35) = ∫ ∙ 𝑑𝑥 = 0,5
30 10
Luego, la probabilidad requerida se encuentra dada por:
𝑃(𝑇 ≥ 4) = ?
La probabilidad requerida, es posible determinarla a partir de la aplicación de propiedades

básicas de las probabilidades y la función de cuantía de T. La última, se puede obtener a

partir de la ecuación (2), la cual representa la función de cuantía de una distribución

geométrica, en forma general.
𝑝(𝑥) = 𝑝 ∙ 𝑞 𝑥−1 , 𝑠𝑖 𝑥 = 1,2,3,4, … (4.2)
Dónde:
𝑋 = 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑝𝑟𝑢𝑒𝑏𝑎𝑠 𝑛𝑒𝑐𝑒𝑠𝑎𝑟𝑖𝑎𝑠 ℎ𝑎𝑠𝑡𝑎 𝑜𝑏𝑡𝑒𝑛𝑒𝑟 𝑒𝑙 𝑝𝑟𝑖𝑚𝑒𝑟 é𝑥𝑖𝑡𝑜.
𝑝 = 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑞𝑢𝑒 𝑜𝑐𝑢𝑟𝑟𝑎 𝑢𝑛 é𝑥𝑖𝑡𝑜 𝑒𝑛 𝑒𝑙 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜 𝑑𝑒 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖.

55
𝑞: 𝑃𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑞𝑢𝑒 𝑜𝑐𝑢𝑟𝑟𝑎 𝑢𝑛 𝑓𝑟𝑎𝑐𝑎𝑠𝑜 𝑒𝑛 𝑒𝑙 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜 𝑑𝑒 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖.
Así, la función de cuantía de “T”, queda dada según la siguiente expresión:
𝑝(𝑇) = 0,5 ∙ 0,5𝑥−1 , 𝑠𝑖 𝑥 = 1,2,3, …
Finalmente, es posible determinar la probabilidad requerida, como se muestra a

continuación.
𝑃(𝑇 ≥ 4) = 1 − [𝑃(𝑇 = 1) + 𝑃(𝑇 = 1) + 𝑃(𝑇 = 3)]
= 1 − [0,5 ∙ 0,50 + 0,5 ∙ 0,51 + 0,5 ∙ 0,52 ]
= 0,125
Conclusión
La probabilidad de que se hayan elegido a lo menos 4 personas, dado que se eligen personas
hasta encontrar una que haya tardado menos de 35 minutos en desarrollar la tarea
corresponde a un 12,5%.

PROBLEMA 2
Una cajera de supermercado demora en promedio 100 segundos en atender a un cliente.
Si se establecen válidos los supuestos de Poisson:
a) ¿Cuál es la probabilidad que la cajera atienda a más de un cliente en dos minutos?

b) Si la cajera es observada en 5 períodos diferentes de dos minutos cada uno elegidos al
azar. ¿Cuál es la probabilidad que en sólo uno de los períodos atienda a un cliente?
SOLUCIÓN 2-A 56
Sea:
X: Número de clientes que atiende la cajera, en dos minutos.
𝑋~𝑃𝑜𝑖(𝜆` =? )
En general la función de cuantía de la distribución de Poisson, está dada por la ecuación

(4.3)
𝜆𝑥 ∙ 𝑒 −𝜆
𝑝(𝑥) = , 𝑠𝑖 𝑥 = 0,1,2,3, … , 𝜆 (4.3)
𝑥!
Dónde
𝑋 = 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑠𝑢𝑐𝑒𝑠𝑜𝑠 𝑞𝑢𝑒 𝑜𝑐𝑢𝑟𝑟𝑒𝑛 𝑒𝑛 𝑢𝑛𝑎 𝑢𝑛𝑖𝑑𝑎𝑑.
𝜆 = 𝑃𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑠𝑢𝑐𝑒𝑠𝑜𝑠 𝑒𝑛 𝑢𝑛𝑎 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑎𝑑𝑎 𝑢𝑛𝑖𝑑𝑎𝑑.
A partir del enunciado, es posible identificar que la cajera atiende en promedio a un cliente
en 100 segundos. Con esto se puede afirmar que 𝜆 corresponde al tiempo promedio que la
cajera tarda en atender a un cliente, cuando se estudian 100 segundos. Sin embargo, en la
pregunta se pide analizar la variable X para 2 minutos, es decir 120 segundos. Al cambiar la
unidad de estudio, cambia el parámetro 𝜆, es por esto que dicho parámetro se puede
despejar con una “regla de tres simple”, tal como se muestra a continuación:
𝜆 → 𝑈𝑛𝑖𝑑𝑎𝑑
1 → 100 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠
𝜆` → 120 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠
→ 𝜆` = 1,2
→ 𝑋~𝑃𝑜𝑖(𝜆` = 1,2)
Luego, la probabilidad requerida se puede definir de la siguiente forma:

𝑃(𝑋 > 1) = ?
Así, a partir de la función de cuantía dada para la distribución de Poisson y las propiedades
básicas asociadas al cálculo de probabilidades, es posible desarrollar la probabilidad
anteriormente expuesta.
→ 𝑃(𝑋 > 1) = 1 − 𝑃(𝑋 ≤ 1) = 1 − [𝑃(𝑋 = 0) + 𝑃(𝑋 = 1)]
1,20 ∙ 𝑒 −1,2 1,21 ∙ 𝑒 −1,2

=1−[ + ]
0! 1! 57
= 1 − [0,3012 + 0,3614]
= 0,3374
Conclusión
La probabilidad que la cajera atienda a más de un cliente en dos minutos corresponde a un
33,74%.
SOLUCIÓN 2-B
Es posible definir una variable aleatoria, que siga una distribución binomial. Esto ya que se
identifica un tamaño de muestra aleatoria (n) correspondiente a 5 periodos de dos minutos
y que la probabilidad de que en un período de dos minutos, la cajera atienda a un cliente
corresponde a la probabilidad de éxito (p), la cual es posible obtenerla bajo los supuestos
de Poisson.
Así, dicha variable aleatoria se define de la siguiente forma:
Sea:
W= Número de períodos en que la cajera atiende a un cliente en dos minutos, en una

muestra aleatoria de tamaño 5.
𝑊~𝐵𝑖𝑛(𝑛 = 5, 𝑝 =? )
Como se ha estipulado anteriormente, el parámetro “p” corresponde a la probabilidad que

en un periodo de dos minutos, la cajera atienda a un cliente (éxito del experimento de
Bernoulli). Esta probabilidad, se obtiene a partir del modelo de Poisson, tal como se muestra
a continuación:
1,21 ∙ 𝑒 −1,2
→ 𝑝 = 𝑃(𝑋 = 1) = = 0,3614
1!

Así, se tienen los parámetros necesarios para definir la distribución y la función de cuantía
para W. La última, es posible obtenerla a partir de la ecuación (4.1)
𝑊~𝐵𝑖𝑛(𝑛 = 5 , 𝑝 = 0,3614)
5 𝑤 5−𝑤
𝑝(𝑤) = {(𝑤 ) ∙ 𝑝 ∙ 𝑞 , 𝑤 = 0,1,2,3,4,5
0, 𝑒. 𝑜. 𝑐
Finalmente es posible definir y desarrollar la probabilidad requerida, tal como se expone a

continuación: 58
→ 𝑃(𝑊 = 1) = ?
5
→ 𝑃(𝑊 = 1) = ( ) ∙ 0,36141 ∙ [1 − 0,3614]5−1
1
= 0,3005
Conclusión
La probabilidad que en sólo uno de los períodos la cajera atienda a un cliente, en una
muestra aleatoria de 5 periodos diferentes observados, de dos minutos cada uno,
corresponde a un 30,05%.

PROBLEMA 3
En una planta industrial adquieren cierto tipo de producto. En un envío de 20 productos,
dos tienen defectos de pintura y tres tienen defectos en el etiquetado. Determine la
probabilidad de que resulten al menos dos productos con defectos en el etiquetado entre
cuatro productos elegidos al azar para una revisión. Defina variable aleatoria y distribución
de probabilidad. Justifique su respuesta.
SOLUCIÓN 59
A partir de los datos estipulados en el enunciado, es posible notar que los datos situación
sigue un modelo de distribución hipergeométrica.
En general, una distribución hipergeométrica se utiliza para modelar situaciones de

poblaciones finitas, donde se cumplen los siguientes puntos:
i. El experimento se repite un número determinado de n veces sin reposición.

ii. El resultado del experimento puede ser un éxito (E) o un fracaso (F). Estos
parámetros, corresponden a valores numéricos de datos, no a probabilidades de
éxito o fracaso. En número de éxitos “E”, se representará como 𝑁1 en el presente
documento.
iii. La probabilidad de éxito cambia de experimento en experimento.
iv. Se conoce el tamaño de la población (N)
Por otro lado, en general se tiene la siguiente función de cuantía para la distribución de
probabilidad Hipergeométrica:
(𝑁𝑥1 ) ∙ (𝑁−𝑁
𝑛−𝑥
1
)
𝑁 ; 𝑥 = 1,2,3, … . 𝑛 ≤ 𝑁1
𝑃(𝑥) = { ( ) (4.4)
𝑛
0, 𝑒. 𝑜. 𝑐
Dónde:
𝑋 = 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠, 𝑒𝑛 𝑢𝑛𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑑𝑒 𝑡𝑎𝑚𝑎ñ𝑜 𝑛
𝑛 = 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎
𝑁: 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
𝑁1 : 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑐𝑎𝑠𝑜𝑠 𝑓𝑎𝑣𝑜𝑟𝑎𝑏𝑙𝑒𝑠 (é𝑥𝑖𝑡𝑜𝑠) 𝑒𝑛 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛

Así, contextualizando lo expuesto anteriormente con el problema propuesto, es posible

definir la variable aleatoria de interés para el estudio, con su respectiva distribución de
probabilidad.
Sea:
X: Número de productos con defectos en el etiquetado en una muestra de 4 productos.
𝑋~𝐻𝑖𝑝(𝑛 = 4; 𝑁1 = 3; 𝑁 = 20)
Luego, es posible definir la función de cuantía, a partir de la ecuación (4.4) asociada al 60

modelo de distribución Hipergeométrica.
(𝑥3) ∙ (4−𝑥
17
)
; 𝑥 = 1,2,3
𝑃(𝑋 = 12) = { (20
4
)
0, 𝑒. 𝑜. 𝑐
Finalmente, es posible plantear y desarrollar la probabilidad requerida, tal como se muestra

a continuación:
→ 𝑃(𝑋 ≥ 2) = ?
𝑃(𝑋 ≥ 2) = 𝑃(𝑌 = 2) + 𝑃(𝑌 = 3)
= 0,08421 + 3,5087 ∙ 10−3
= 0,8772
Conclusión
La probabilidad de que resulten al menos dos productos con defectos en el etiquetado entre
cuatro productos elegidos al azar para una revisión, corresponde a 87,72%

PROBLEMA 4
Una empresa de pavimentación tiene contrato con una municipalidad para el
mantenimiento de sus calles. Estas calles dan un promedio de 2 defectos por milla, después
de ser utilizadas durante un año. Si se consideran que los defectos se ajustan a una
distribución de Poisson.
a) ¿Cuál es la probabilidad que se presente un defecto en cualquier milla, después de

soportar trafico un año?
b) ¿Cuál es la probabilidad que se presenten por lo menos 2 defectos en 5 millas? 61
SOLUCIÓN 4-A
Sea:
X: Número de defectos que presenta el pavimento en cada milla.
𝑋~𝑃𝑜𝑖(𝜆 = 2)
Es necesario definir la función de cuantía asociada a la variable “X” a partir de la ecuación

(4.3) , quedando representada como se muestra en la siguiente expresión.
2𝑥 ∙ 𝑒 −10
𝑝(𝑥) = , 𝑠𝑖 𝑥 = 0,1,2
𝑥!
Finalmente, la probabilidad requerida es posible definirla y desarrollarla, como se muestra

a continuación.
→ 𝑃(𝑋 = 1) =?
21 ∙ 𝑒 −2
→ 𝑃(𝑋 = 1) = = 0,2707
1!
Conclusión
La probabilidad que se presente un defecto en cualquier milla, después de soportar trafico
un año, corresponde a un 27,07%

SOLUCIÓN 4-B
Observación
Es importante denotar, que la variable “X” se define para una milla. Por lo que para realizar
un estudio basado en 5 millas, se debe definir una nueva variable aleatoria, la cual se
distribuya con un respectivo 𝜆` asociado a las 5 millas.
Sea:
Y= Número de defectos que presenta el pavimento, en 5 millas. 62

𝑌~𝑃𝑜𝑖(𝜆` =? )
El parámetro λ`, es posible determinarlo a partir de una “regla de tres simple”, como se
expone a continuación:
5∙2
→ λ` = → λ` = 10
1
Así, es posible definir la distribución de probabilidad de “Y”, y su función de cuantía, a partir
de la ecuación (4.3)
𝑌~𝑃𝑜𝑖(𝜆` = 10)
10𝑦 ∙ 𝑒 −10
𝑝(𝑦) = , 𝑠𝑖 𝑦 = 0,1,2,3, … ,10
𝑦!
Finalmente, se define y desarrolla la probabilidad requerida, estipulada en el enunciado.
→ 𝑃(𝑌 ≥ 2) = ?
→ 𝑃(𝑌 ≥ 2) = 1 − [𝑃(𝑌 = 0) + 𝑃(𝑌 = 1)]
100 ∙ 𝑒 −10 101 ∙ 𝑒 −10

=1−[ + ]
0! 1!
= 0,9995
Conclusión
La probabilidad que se presenten por lo menos 2 defectos en 5 millas es de un 99,95%

Unidad 5 - Modelos de Distribucio n Contí nuos
PROBLEMA 1
La resistencia de un cable eléctrico de alta tensión se considera una variable aleatoria con
distribución normal con una media de 36 (ohmios) y una varianza de 0,64 (ohmios)2. Un
cable se considera defectuoso si su resistencia es inferior a 35 (ohmios)
63
f) De los cables que tienen una resistencia superior a 34 (ohmios) ¿Qué proporción
de cables se consideran defectuosos?
g) Se eligen al azar y en forma independiente 10 cables, ¿Cuál es la probabilidad que
más de 2 cables resulten defectuosos?
SOLUCIÓN 1-A
Sea:
X= Resistencia de un cable eléctrico de alta tensión, en ohmios.
𝑋~𝑁(𝜇 = 36; 𝜎 2 = 0,64)
→ 𝑃 (𝑥 < 35⁄𝑥 > 34) = ?
𝑃(34 < 𝑥 < 35)

→ 𝑃 (𝑥 < 35⁄𝑥 > 34) =
𝑃(𝑥 > 34)
𝑃(𝑥 < 35) − 𝑃(𝑋 < 34)

=
1 − 𝑃(𝑥 ≤ 34)
35 − 36 34 − 36
𝑃 (𝑧 < 0,8 ) − 𝑃 (𝑧 < 0,8 )
=
34 − 36
1 − 𝑃 (𝑧 ≤ 0,8 )

𝑃(𝑧 < −1,25) − 𝑃(𝑧 < −2,5)

=
1 − 𝑝(𝑧 ≤ −2,5)
0,1056 − 0,00672
=
0,00672
= 0,1
Conclusión 64
La proporción de cables que se consideran defectuosos, de los que tienen una resistencia
superior a 34 ohmios, corresponde a 0,1.
SOLUCIÓN 1-B
Sea:
Y: Numero de cables defectuosos, en una muestra de tamaño 10.
𝑌~𝐵𝑖𝑛(𝑛 = 10; 𝑝 = 0,1)
→ 𝑃(𝑌 > 2) = ?
→ 𝑃(𝑌 > 2) = 1 − [𝑃(𝑌 = 0) + 𝑃(𝑌 = 1) + 𝑃(𝑌 = 2)]
= 0,0814
Conclusión
La probabilidad que más de 2 cables resulten defectuosos, en una muestra elegida aleatoria
de 10 cables, corresponde a un 8,14%.

PROBLEMA 2
Al curar el concreto se hace vulnerable a vibraciones de choque, que pueden causar
agrietamiento o daños ocultos en el material. Como parte de un estudio de fenómenos de
vibración, el artículo “Shock Vibration Test of concrete” (ACI Materials J. 2002) informó que
la rapidez máxima de una partícula en (mm/s) que viaja por un espécimen que es sometido
a un proceso de curado se distribuye normal con media 529,29 (mm/s) y desviación
estándar 154,36.
a) Se toma una muestra aleatoria de 12 especímenes de concreto que se someten a un 65

proceso de curado. ¿Cuál es la probabilidad de que al menos en dos de estos
especímenes la velocidad máxima con que viaja una partícula fluctúe entre 400
(mm/s) y 600 (mm/s)?
b) En una palmeta de concreto de 2 m2, se encontraron en promedio 1,3 grietas. ¿Cuál
es la probabilidad que en cinco palmetas se encuentren a lo menos tres grietas?
Suponga válidos los supuestos de Poisson.
SOLUCIÓN 2-A
Sea:
X: Rapidez máxima de una partícula que viaja por un espécimen que es sometido a un
proceso de curado, en [mm/s]
𝑋~𝑁(𝜇 = 529,29; 𝜎 2 = (154,36)2 )
Sea:
Y: Número de especímenes en que la velocidad máxima de la partícula fluctúa entre 400

[mm/s] y 600 [mm/s], en una muestra de 12 especímenes de concreto elegidos al azar y en
forma independiente.
𝑌~𝐵𝑖𝑛(𝑛 = 12; 𝑝 = ? )
→ 𝑝 = 𝑃(400 ≤ 𝑥 ≤ 600)
= 𝑃(𝑥 ≤ 600) − 𝑃(𝑥 ≤ 400)

600 − 529,29 400 − 529,29

= 𝑃 (𝑍 ≤ ) − 𝑃 (𝑍 ≤ )
154,36 154,36
= 𝑃(𝑍 ≤ 0,46) − 𝑃(𝑍 ≤ −0,83)
= 0,6772 − 0,2033
= 0,4739
66
𝑌~𝐵𝑖𝑛(𝑛 = 12; 𝑝 = 0,4739)
→ 𝑃(𝑌 ≥ 2) = 1 − 𝑃(𝑌 < 2)
= 1 − [𝑃(𝑌 = 0) + 𝑃(𝑌 = 1)]
12 12
= 1 − [( ) 0,47390 ∙ (1 − 0,4739)12−0 + ( ) 0,47391 ∙ (1 − 0,4739)12−1 ]
0 1
= 0,99469
Conclusión
La probabilidad que al menos en dos de los 12 especímenes tomados en forma aleatoria, la
velocidad máxima con que viaja una partícula fluctúe entre 400 (mm/s) y 600 (mm/s) es de
un 99,47%
SOLUCIÓN 2-B
Sea:
T= Número de grietas, en cinco palmetas de concreto de 2 [𝑚2 ]
𝑇~𝑃𝑜𝑖(𝜆 = ? )
1,3 ∙ 5
→𝜆= = 6,5
1

𝑇~𝑃𝑜𝑖(𝜆 = 6,5)
𝑒 −6,5 ∙ 6,5𝑡
𝑝(𝑡) = , 𝑠𝑖 𝑡 = 0,1,2, … ,6
𝑡!
→ 𝑃(𝑇 ≥ 3) = 1 − 𝑃(𝑇 < 3)

67
= 1 − [𝑃(𝑇 = 0) + 𝑃(𝑇 = 1) + 𝑃(𝑇 = 2)]
= 0,95696
Conclusión
La probabilidad que en cinco palmetas de concreto de 2 m2 se encuentren a lo menos tres
grietas es de un 95,67%

PROBLEMA 3
La duración en minutos, de un proceso textil tiene un comportamiento Normal, con una
desviación típica de 26.3 (minutos). Además, se sabe que el 60% de los procesos duran por
lo menos 40 minutos.
De los procesos que han tenido una duración de a lo más 62 minutos. ¿Qué porcentaje, de
ellos, duró más de 48 minutos?
68
SOLUCIÓN
Sea
X: Duración de un proceso textil, en minutos.
𝑋~𝑁(𝜇 =? ; 𝜎 2 = 26,32 )
→ 𝑃(𝑋 > 40) = 0,6
→ 𝑃(𝑥 ≤ 40) = 1 − 0,6 = 0,4
40 − 𝜇
→ 𝑃 (𝑍 ≤ ) = 0,4
26,3
40 − 𝜇
→ = −0,26
26,3
→ 𝜇 = 46,575 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
→ 𝑃(𝑥 > 48⁄𝑥 < 62) = ?

𝑃(48 < 𝑋 < 62)

→ 𝑃(𝑥 > 48⁄𝑥 < 62) =
𝑃(𝑋 < 62)
𝑃(𝑋 < 62) − 𝑃(𝑋 < 48)

=
𝑃(𝑋 < 62)
62 − 46,575 48 − 46,575 69
𝑃 (𝑍 < ) − 𝑃 (𝑍 < )
26,3 26,3
=
62 − 46,575
𝑃 (𝑍 < )
26,3
𝑃(𝑍 < 0,58) − 𝑃(𝑍 < 0,04)

=
𝑃(𝑍 < 0,58)
0,7224 − 0,5199
=
0,7224
= 0, ,2803
Conclusión
El porcentaje de procesos que duró más de 48 minutos, de los que han tenido una duración
de a lo más 62 minutos, corresponde a un 28,03%.

PROBLEMA 4
“Avance del tiempo en flujo de tránsito”, es el tiempo transcurrido entre el tiempo que un
automóvil termina de pasar por un punto fijo y el instante en que el siguiente automóvil
comienza a pasar por ese punto. La variable aleatoria X: “avance en el tiempo en el flujo de
tránsito, entre dos automóviles consecutivos elegidos al azar en un período de flujo intenso,
en segundos”, se distribuye exponencial con media 6,67 segundos. ¿Cuál es el menor
tiempo del 40% de los casos en que hay mayor avance de tiempo, en el flujo del tránsito?
SOLUCIÓN 4 70
Sea:
X: Avance en el tiempo en el flujo de tránsito, entre dos automóviles consecutivos elegidos

al azar en un período de flujo intenso, en segundos
𝑋~𝐸𝑥𝑝(𝜆 = ? )
1
𝜆= (1)
𝐸(𝑋)
Dónde
X: Variable aleatoria que sigue una distribución exponencial.
1
→𝜆= = 0,15
6,67
𝑋~𝐸𝑥𝑝(𝜆 = 0,15)
→ 𝑃(𝑋 ≥ 𝑥0 ) = 0,4
→ 𝑃(𝑋 < 𝑥0 ) = 0,6
→ 1 − 𝑒 −0,15∙𝑥0 = 0,6
→ 𝑒 −0,15∙𝑥0 = 0,4
→ −0,15 ∙ 𝑥0 = ln(0,4)
→ 𝑥0 = 6,11 𝑠𝑒𝑔𝑢𝑛𝑑𝑜𝑠
Conclusión
El menor tiempo del 40% de los casos en que hay mayor avance de tiempo, en el flujo del
tránsito, corresponde a 6,11 segundos.

PROBLEMA 5
Una empresa dedicada a la fabricación de pinturas tiene su planta en una localidad rural
cerca de la ciudad, por esta razón los pedidos grandes son cargados en camiones el día
anterior a su despacho y estos se guardan en una bodega que se encuentra en la misma
ciudad.
Se ha detectado que el tiempo de desplazamiento de un camión entre la planta y la bodega

se distribuye uniformemente en el intervalo de 40 a 60 minutos.
71
Además, el tiempo que transcurre desde que el camión abandona la bodega hasta que llega
al destino de entrega del pedido, se distribuye según una normal con media 2 horas y
desviación estándar 15 minutos.
a) De cuatro camiones que salen de la planta hacia la bodega elegidos de distintos

despachos. ¿Cuál es la probabilidad que al menos uno de estos camiones demore
más de 45 minutos?
b) Si el tiempo que emplea un camión en devolverse a la bodega, después de dejar su
pedido, es un 10% menor que el tiempo que emplean en ir a dejar un pedido. ¿Qué
porcentaje de los camiones se demoran en volver entre 1,5 horas y 2,0 horas?
c) La pintura se envía en tinetas de igual tamaño y forma, etiquetadas con el tipo de
pintura que contiene. Un cliente ha solicitado que le envíen un pedido que consta
de 10 tinetas de pintura látex blanca y 5 tinetas de pintura elastomérica. Al llegar el
camión con el pedido a su destino se dan cuenta que se han desprendido las
etiquetas, la persona encargada de recibir el despacho elige al azar 3 tinetas. ¿Cuál
es la probabilidad que sólo una de las tinetas elegidas contenga pintura
elastomérica?
SOLUCIÓN 5-A
Sea:
X: Tiempo que emplea un camión en desplazarse desde la planta a la bodega, en minutos.
𝑥~𝑈(40; 60)
60
1
𝑃(𝑋 > 45) = ∫ ∙ 𝑑𝑥 = 0,75
45 20

Sea:
Y: Número de camiones que demoran más de 45 minutos en desplazarse desde la planta a

la bodega, en una muestra de cuatro camiones.
𝑦~𝐵𝑖𝑛(𝑛 = 4; 𝑝 = 0,75
→ 𝑃(𝑌 ≥ 1) = ?
→ 𝑃(𝑌 ≥ 1) = 1 − 𝑃(𝑌 = 0)
72
4
= 1 − ( ) 0,750 ∙ 0,254−0
0
= 0,9961
Conclusión
La probabilidad que al menos uno de cuatro camiones que salen de la planta hacia la bodega
elegidos de distintos despachos, demoren más de 45 minutos es de un 99,61%
SOLUCIÓN 5-B
Sea:
T: Tiempo que emplea un camión en desplazarse desde la bodega a su lugar de destino, en
horas.
𝑇~𝑁(𝜇 = 2; 𝜎 2 = 0,252 )
Sea:
T`: Tiempo que emplea un camión en desplazarse desde su lugar de destino a la bodega, en
horas.
T` = 0,9 ∙ T
𝑇`~𝑁(𝜇 = 1,8; 𝜎 2 = 0,2252 )
→ 𝑃(1,5 < 𝑇` < 2) = ?
→ 𝑃(1,5 < 𝑇` < 2) = 𝑃(−1,33 < 𝑍 < 0,89)
= 𝐹(0,89) − 𝐹(−1,33)
= 0,8133 − 0,0918 = 0,7215

Conclusión
El porcentaje de los camiones que tardan en volver a la bodega entre 1,5 horas y 2 horas es
de un 72,15%.
SOLUCIÓN 5-C
Sea:
W: Número de tinetas con pintura elastomérica, de las tres seleccionadas. 73
𝑊~𝐻𝑖𝑝(𝑁 = 15, 𝑁1 = 5, 𝑛 = 3)
𝑃(𝑊 = 1) = ?
5 10
( )∙( )
𝑃(𝑊 = 1) = 1 2 = 0,4945
15
( )
3
Conclusión
La probabilidad que sólo una de las tres tinetas elegidas al azar contenga pintura
elastomérica es de un 49,45%

Unidad 6 - Variable Aleatoria Bidimensional
PROBLEMA 1
En empresas que prestan servicio de soporte computacional los fines de semana, se ha

estudiado que el número (Y) de llamadas recibidas solicitando atención de emergencia cada
fin de semana y el número (X) de especialistas disponibles, son variables aleatorias con
distribución de probabilidad conjunta:
Y 0 1 2 3 4 74
X
1 0,15 0,10 0,05 0,02 0
2 0,04 0,23 0,12 0,02 0,01
3 0,01 0,12 0,08 0,03 0,02
A. En los fines de semana en que hay dos especialistas disponibles ¿Cuál es el número
esperado de llamadas de emergencia recibidas?
B. ¿Cuál es la probabilidad que en un fin de semana el número de llamadas solicitando
atención de emergencia sobrepase el número de especialistas disponibles?
C. Determine el porcentaje de variabilidad del número de llamadas que solicitan
atención de emergencia los fines de semana.
D. Determine 𝐶𝑜𝑣(𝑥, 𝑦)
E. Determine el coeficiente de Pearson asociado a la dependencia entre las variables
“x” e “y”.
SOLUCIÓN – A
Se tienen:
X = Número de especialistas disponibles en un fin de semana.
Y = Número de llamadas recibidas solicitando atención de emergencia en un fin de semana.
𝑦
Primero que todo, es necesario obtener la función de densidad 𝑓( ⁄𝑥 = 2), la cual
se presenta a continuación.
𝒀 𝒚
𝑷( ⁄𝒙 = 𝟐)
𝟎 0,04⁄
0,42 = 0,0952
𝟏 0,23⁄
0,42 = 0,548
𝟐 0,12⁄
0,42 = 0,286
𝟑 0,02⁄
0,42 = 0,0476
𝟒 0,01⁄
0,42 = 0,0238

Observación
Para obtener el valor de probabilidad asociada a cuando la variable "𝑦" toma el valor "0",
se debe realizar el cociente entre la intercepción de 𝑥 = 2 e 𝑦 = 0; dividido por la
probabilidad total asociada a 𝑥 = 2, la cual se obtiene realizando la sumatoria de las
probabilidades, cuando la variable "𝑥" toma dicho valor.
Una vez obtenidos los valores de la función de probabilidad, es posible determinar la

esperanza de dicha función.
75
𝑦 𝑦
𝐸( ⁄𝑥 = 2) = ∑4𝑖=0 𝑦𝑖 ∗ 𝑃( ⁄𝑥 = 2)
= 0 ∗ 0,0952 + 1 ∗ 0,548 + 2 ∗ 0,286 + 3 ∗ 0,0476 + 4 ∗ 0,023
= 1,358
Conclusión
En un fin de semana en que hay dos especialistas, el número esperado de llamadas de
emergencia recibidas es de 1,358.
SOLUCIÓN – B
A partir del enunciado, es posible definir la probabilidad solicitada, la cual se expone a

continuación.
𝑃(𝑦 > 𝑥) =?
Para obtener el valor de la probabilidad anteriormente señalada, se deben encontrar todas

las opciones de éxito del suceso, como se muestra a continuación.
𝒙 𝒚
𝟏 2
𝟏 3
𝟏 4
𝟐 3
𝟐 4
𝟑 4
Así, es posible realizar la sumatoria de las probabilidades expuestas en el enunciado de

todas las combinaciones mostradas en la tabla anterior.

𝑃(𝑦 > 𝑥) = 𝑃(𝑥 = 1, 𝑦 = 2) + 𝑃(𝑥 = 1, 𝑦 = 3) + 𝑃(𝑥 = 1, 𝑦 = 4) + 𝑃(𝑥 = 2, 𝑦 = 3)

+ 𝑃(𝑥 = 2, 𝑦 = 4 + 𝑃(𝑥 = 3, 𝑦 = 4)
→ 𝑃(𝑦 > 𝑥) = 0,05 + 0,02 + 0,02 + 0 + 0,01 + 0,02
→ 𝑃(𝑦 > 𝑥) = 0,12
Conclusión
La probabilidad de que el número de llamadas de emergencia supere al número de
especialistas disponibles en un fin de semana es de un 12%.
76
SOLUCIÓN – C
Para determinar el porcentaje de variabilidad, es posible determinar el coeficiente de

variación. Para esto, como se pide encontrar dicho parámetro asociado a la variable y, se
obtendrá la función marginal de esta variable, la cual queda representada en la siguiente
tabla.
𝒚 𝑷(𝒚)
𝟎 0,2
𝟏 0,45
𝟐 0,25
𝟑 0,07
𝟒 0,03
Luego, se puede trabajar la función marginal, como una función de densidad discreta
cualquiera, por lo que el cálculo de la esperanza queda dado de la siguiente forma.
𝐸(𝑦) = ∑4𝑖=0 𝑦𝑖 ∗ 𝑃(𝑦𝑖 ) = 0 ∗ 0,2 + 1 ∗ 0,45 + 2 ∗ 0,25 + 3 ∗ 0,07 + 4 ∗ 0,03
→ 𝐸(𝑦) = 1,28
Por otro lado, el valor de la desviación estándar, se puede obtener a partir de la

fórmula de la varianza, como se muestra a continuación.
𝜎𝑦2 = 𝐸(𝑦 2 ) − 𝐸(𝑦)2
= 02 ∗ 0,2 + 12 ∗ 0,45 + 22 ∗ 0,25 + 32 ∗ 0,07 + 42 ∗ 0,03 − 1,282
→ 𝜎𝑦2 = 0,9216
→ 𝜎𝑦 = 0,96

Así, es posible determinar el coeficiente de variación realizando el cociente entre la

esperanza y la desviación poblacional, ambas asociadas a la variable y.
0,96
→ 𝐶. 𝑉(𝑦) = = 0,75
1,28
Observación
En la presente solución del problema planteado, se plantea un camino a seguir para
resolverlo, lo que no significa que sea el único. Por ejemplo, los valores correspondientes a
la esperanza y la desviación estándar, se pueden determinar además a partir de la 77
calculadora ingresando la función marginal presentada al principio de este ítem.
Conclusión
El porcentaje de variabilidad asociado al número de llamadas de emergencia en un
fin de semana es de un 75%.
SOLUCIÓN – D
Para determinar la covarianza asociada a las variables “x” e “y”, es necesario

desarrollar la ecuación (1)
𝐶𝑜𝑣(𝑥, 𝑦) = 𝐸(𝑥 ∙ 𝑦) − 𝐸(𝑥) ∙ 𝐸(𝑦) (6.1)
Para determinar los parámetros pertenecientes a la ecuación (1), es necesario

ingresar los valores a la calculadora, tal como se expone en la siguiente tabla.

𝒙 𝒚 𝑷(𝒙𝒊 , 𝒚𝒊 )[𝑭𝑹𝑬𝑸]
𝟏 𝟎 0,15
𝟏 𝟏 0,1
𝟏 𝟐 0,05
𝟏 𝟑 0,02
𝟏 𝟒 0
𝟐 𝟎 0,04
𝟐 𝟏 0,23
𝟐 𝟐 0,12
𝟐 𝟑 0,02 78
𝟐 𝟒 0,01
𝟑 𝟎 0,01
𝟑 𝟏 0,12
𝟑 𝟐 0,08
𝟑 𝟑 0,03
𝟑 𝟒 0,02
Así, con ayuda de la calculadora, es posible determinar los siguientes valores:
→ ∑ 𝑥 ∙ 𝑦 ∙ 𝑝(𝑥𝑖 , 𝑦𝑖 ) = 2,75
→ 𝐸(𝑥) = 1,94
→ 𝐸(𝑦) = 1,28
Observación
∑ 𝑥∙𝑦∙𝑝(𝑥𝑖 ,𝑦𝑖 )
Es importante denotar que la 𝐸(𝑥 ∙ 𝑦) es equivalente a , donde N corresponde
𝑁
a la frecuencia total acumulada. Así, al estar trabajando con probabilidades, es posible
identificar que 𝑁 = 1, lo que indica que en los casos en que se trabaje con probabilidades,
se cumplirá la siguiente expresión:
𝐸(𝑥 ∙ 𝑦) = ∑ 𝑥 ∙ 𝑦 ∙ 𝑝(𝑥𝑖 , 𝑦𝑖 ) (6.2)
De acuerdo a lo anteriormente expuesto, obtener la covarianza, reemplazando

directamente los valores dados por la calculadora, en la ecuación (6.1).
𝐶𝑜𝑣(𝑥, 𝑦) = 2,75 − 1,94 ∙ 1,28
→ 𝐶𝑜𝑣(𝑥, 𝑦) = 0,2668

SOLUCIÓN – E
Al estar trabajando con probabilidades, el coeficiente de Pearson, es posible

obtenerlo directamente a partir de la calculadora. Este valor, en este caso es equivalente al
coeficiente de correlación "𝑟".
De acuerdo a lo anterior, el valor obtenido corresponde a:
→ 𝜌(𝑥, 𝑦) = 𝑟 = 0,366
Otra forma de obtener el valor asociado al coeficiente de Pearson, es a partir de la 79

ecuación (3).
𝐶𝑜𝑣(𝑥, 𝑦)
𝜌(𝑥, 𝑦) = (6.3)
𝜎𝑥 ∙ 𝜎𝑦
Reemplazando en la fórmula anterior, se obtiene:
0,2668
→ 𝜌(𝑥, 𝑦) =
0,759 ∙ 0,96
→ 𝜌(𝑥, 𝑦) = 0,366
Conclusión
El coeficiente de correlación asociado a las variables "𝑥" e "𝑦" corresponde a 0,366. Esto,
representa que la relación lineal entre dichas variables es baja, lo que indica que existe poca
dependencia entre ambas variables.

PROBLEMA 2
En un estricto control de calidad la proporción de vigas, sometidas a prueba, que

cumplen con la exigencia inicial I y II, son variables aleatorias X e Y respectivamente, con
función de densidad conjunta:
2
𝑓(𝑥, 𝑦) = {5 (2𝑥 + 3𝑦) 𝑠𝑖 0 ≤ 𝑥 ≤ 1 ; 0 ≤ 𝑦 ≤ 1
Determine la probabilidad que una viga, elegida al azar, cumpla con menos del 70% 80
de lo exigido en el control II, si en el control I cumplió con el 90% de lo exigido.
SOLUCIÓN
Sean:
X = Proporción de vigas, sometidas a una prueba, que cumplen con la exigencia inicial I.
Y = Proporción de vigas, sometidas a una prueba, que cumplen con la exigencia inicial II.
La probabilidad solicitada, queda expresada a continuación.
𝑦 < 0,7
𝑃( ⁄𝑥 = 0,) = ?
9
Para determinar dicha probabilidad, es necesario definir la función marginal de x,

integrando la función conjunta con respecto a la variable y, limitando todo su recorrido.
1
2 4 3
𝑓𝑥 (𝑥) = ∫ ∗ (2𝑥 + 3𝑦)𝑑𝑦 = 𝑥 +
0 5 5 5
Luego, es necesario evaluar la función marginal en 𝑥 = 0,9, obteniendo como resultado

1,32.
Posteriormente, se definirá la función de densidad para y, cuando la variable x toma el

valor 0,9. Esto queda expuesto a continuación.

𝑦 𝑓(0,9 ; 𝑦) 2 ∗ (1,8 + 3𝑦)

𝑓 ( ⁄𝑥 = 0,9) = =
𝑓𝑥 (0,9) 5 ∗ 1,32
Con esto, es posible determinar la probabilidad objetivo de la siguiente forma.

0,7
𝑦 < 0,7⁄ 2
→ 𝑃( 𝑥 = 0,9) = ∫ ∗ (1,8 + 3𝑦)𝑑𝑦 = 0,605
0 6,6
Conclusión 81
La probabilidad que una viga, elegida al azar, cumpla con menos del 70% de lo exigido en el
control II, dado que en el control I cumplió con el 90% de lo exigido, es de un 60,5%.

PROBLEMA 3
En una empresa dedicada a la fabricación de cables para alta tensión afirman que la
producción de cables diaria, en miles de metros, en el turno de la mañana (X) y la
producción de cables diaria, en miles de metros, en el turno de la tarde (Y), se pueden
considerar variables aleatorias con función de densidad conjunta:
2𝑥 + 𝑦
𝑓(𝑥, 𝑦) = { 1,12 𝑠𝑖 0 ≤ 𝑥 ≤ 1 ; 0 ≤ 𝑦 ≤ 0,8
0 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜 82
a) Calcular P(Y>0,6/X=0,7)
b) Si se seleccionan 8 días en forma independiente. ¿Cuál es la probabilidad que en
menos de 3 días se haya obtenido una producción inferior a 0,5 miles de metros de
cables, en el turno de la mañana?
SOLUCIÓN 3– A
Sean:
X = Producción de cables diaria en el turno de la mañana, en miles de metros.
Y = Producción de cables diaria en el turno de la tarde, en miles de metros.
El procedimiento para resolver esta parte del ejercicio, es análogo al realizado en el

problema 2. Dicho mecanismo, se presenta a continuación.
𝑦 > 0,6⁄
→ 𝑃( 𝑥 = 0,7) =?
0,8
2𝑥 + 𝑦 1
→ 𝑓𝑥 (𝑥) = ∫ 𝑑𝑦 = ∗ (10𝑥 + 2)
0 1,12 7
Luego, es necesario evaluar la función marginal en 𝑥 = 0,7, obteniendo como resultado

1,285.
Posteriormente, se definirá la función de densidad para y, cuando la variable x toma el

valor 0,9. Esto queda expuesto a continuación.
2 ∗ 0,7 + 𝑦
𝑦 𝑓(0,7 ; 𝑦) 1,12 1,4 + 𝑦
𝑓 ( ⁄𝑥 = 0,7) = = =
𝑓𝑥 (0,7) 1,285 1,439

Con esto, es posible determinar la probabilidad objetivo de la siguiente forma.

0,8
𝑦 > 0,6⁄ 1,4 + 𝑦
→ 𝑃( 𝑥 = 0,7) = ∫ 𝑑𝑦 = 0,292
0,6 1,439
SOLUCIÓN 3 – B
Sea:
W = Número de días que hayan tenido una producción inferior a 0,5 miles de metros de 83
cable, en el turno de la mañana, en una muestra aleatoria de 8 días.
𝑤~𝐵𝑖𝑛(𝑛 = 8, 𝑝 =? )
Al estar en presencia de una distribución binomial, es necesario obtener el parámetro “p”

asociado a la probabilidad de Bernoulli, el cual se determina de la siguiente forma.
0,5 0,8
2𝑥 + 𝑦
→𝑝=∫ ∫ 𝑑𝑦𝑑𝑥 = 0,3214
𝑥=0 𝑦=0 1,12
Así, la distribución binomial presenta la siguiente estructura.
𝑤~𝐵𝑖𝑛(𝑛 = 8, 𝑝 = 0,3214)
A partir de la distribución planteada, es posible definir la función de cuantía con la cual

trabajaremos, quedando representada a continuación.
8 𝑤 8−𝑤
𝑃(𝑤) = {(𝑤 ) 0,3214 ∗ 0,6788 𝑠𝑖 𝑤 = 0,1, … . ,8
Finalmente, es posible plantear y resolver la probabilidad objetivo, como se muestra a
continuación.
𝑃(𝑤 < 3) = 𝑃(𝑤 = 0) + 𝑃(𝑤 = 1) + 𝑃(𝑤 = 2)
8 8 8
= ( ) 0,32140 ∗ 0,67888 + ( ) 0,32141 ∗ 0,67887 + ( ) 0,32142 ∗ 0,67886
0 1 2
→ 𝑃(𝑤 < 3) = 0,4987

Conclusión
La probabilidad de que en 8 días seleccionados al azar y en forma independiente, se
obtenga una producción inferior a 0,5 miles de metros de cables, en menos de tres días en
el turno de la mañana es de un 49,87%.
PROBLEMA 4
Los neumáticos de un vehículo en particular deben estar a una presión de 26

(libras/pulgada). La presión de aire real en cada neumático es una variable aleatoria, tal que 84
X es la presión de aire en el neumático delantero izquierdo e Y es la presión de aire del
neumático delantero derecho, cuya función de probabilidad conjunta está dada por:
3(𝑥 2 + 𝑦 2 )
𝑓(𝑥, 𝑦) = { 380000 𝑠𝑖 20 ≤ 𝑥 ≤ 30 ; 20 ≤ 𝑦 ≤ 30
¿Cuál es la probabilidad de que la presión del neumático derecho exceda a la presión del
neumático izquierdo en al menos dos (𝐼𝑏⁄𝑝𝑢𝑙𝑔2 )?
SOLUCIÓN
Sea:
X = Presión de aire para neumático izquierdo, en [Ib/pulg 2 ]
Y = Presión de aire para neumático derecho, en [Ib/pulg 2 ]
La probabilidad a calcular solicitada en el enunciado, queda definida de la siguiente forma:
𝑃(𝑦 ≥ 2 + 𝑥) = ?
En estos casos, es necesario realizar un análisis gráfico, con el fin de definir de buena forma
los límites de integración.
Observación
Para definir los límites de integración, es necesario dejarlos en función de una sola variable,
lo que nos permite desarrollar eficientemente la integración, es por esto que se realiza el
análisis gráfico.
Así, gráficamente se pueden definir los límites de la superficie de integración.

85
30 28
3
∫ ∫ (𝑥 2 + 𝑦 2 )𝑑𝑥𝑑𝑦
𝑦=22 𝑥=𝑦−2 380000
30 (28)3 (𝑦 − 2)3
3 2
= ∫ ( + 28𝑦 − − (𝑦 − 2) ∙ 𝑦 2 ) 𝑑𝑦
380000 𝑦=22 3 3
→ P(y ≥ 2 + x) = 0,3176
Conclusión
La probabilidad de que la presión del neumático izquierdo exceda a la presión del

neumático derecho en al menos 2 [𝐼𝑏/𝑝𝑢𝑙𝑔2 ] es de un 31,76%.

PROBLEMA 5
En el proceso de fabricación de cierto artículo, se consideran las variables aleatorias:
X = costo de materia prima utilizada, Y = costo en mano de obra, ambas en miles de $, con
función de densidad conjunta:
2𝑥 2 𝑦
𝑓(𝑥, 𝑦) = { 105 𝑠𝑖 1 < 𝑥 < 4 ; 2 < 𝑦 < 3
Determine el costo total esperado por artículo fabricado.

86
SOLUCIÓN
Se tiene:
X = Costo de materia prima utilizada, en miles de pesos.
Y = Costo en mano de obra, en miles de pesos.
A partir de las variables, notamos que existen dos tipos de costos asociados a la fabricación
de un artículo, por lo que se deben obtener ambos costos esperados para resolver con éxito
el problema. Para esto, inicialmente se recomienda determinar las funciones marginales de
cada variable.
3
2𝑥 2 𝑦 2𝑥 2 𝑥2
→ 𝑓𝑥 (𝑥) = ∫ 𝑑𝑦 = ∗ (32 − 22 ) =
2 105 105 ∗ 2 21
4
2𝑥 2 𝑦 2𝑦 43 13 126𝑦 2
→ 𝑓𝑦 (𝑦) = ∫ 𝑑𝑥 = ∗( − )= = 𝑦
1 105 105 3 3 315 5
Así, a partir de las funciones expuestas anteriormente, es posible obtener los costos
esperados.
4 4
𝑥2
→ 𝐸(𝑥) = ∫ 𝑥 ∗ 𝑓𝑥 (𝑥)𝑑𝑥 = ∫ 𝑥 ∗ 𝑑𝑥 = 3,0357
1 1 21
3 3
2
→ 𝐸(𝑦) = ∫ 𝑦 ∗ 𝑓𝑦 (𝑦)𝑑𝑦 = ∫ 𝑦 ∗ 𝑦 𝑑𝑦 = 2,535
2 2 5
Conclusión
El costo total esperado por artículo fabricado corresponde a 5,57 miles de pesos.

Unidad 7 - Estimacio n Puntual
PROBLEMA 1
El número de accidentes que ocurren en una empresa, en un mes, se considera una variable
aleatoria con distribución de Poisson. Calcular la probabilidad de que en un mes se registre
un accidente, si al tomar una muestra aleatoria de 10 meses se obtuvo:
1 0 3 1 2 0 1 2 3 1
Tabla 11. Número de Accidentes ocurridos en 10 meses elegidos de forma aleatoria.
87
SOLUCIÓN
Sea:
X: Número de accidentes que ocurren en una empresa, en un mes.
𝑋~𝑃𝑜𝑖(𝜆)
A continuación, se expresa la probabilidad requerida:
→ 𝑃(𝑋 = 1) = ?
Esta probabilidad, la podemos resolver utilizando la función de cuantía asociada al modelo

de Poisson, quedando dada de la siguiente forma:
𝑒 −𝜆 ∙ 𝜆1
→ 𝑃(𝑋 = 1) =
1!
Como podemos notar, es necesario obtener el parámetro "𝜆" para resolver la probabilidad
requerida. Es por esto, que a continuación se procederá a realizar la estimación puntual de
este parámetro poblacional, ya que este valor es desconocido.
Estimación Puntual
i. Para realizar de buena forma la estimación, es necesario identificar la función de

verosimilitud, la cual queda expresada de la siguiente forma:
𝑛
𝑒 −𝜆 ∙ 𝜆𝑥𝑖
→ 𝐿(𝑥, 𝜆) = ∏( )
𝑥𝑖 !
𝑖=1
ii. En segundo lugar, se recomienda aplicar logaritmo natural a la función de

verosimilitud, de ser necesario, con el fin de linealizar dicha ecuación. En este caso,
se nota que si es necesario realizar dicha operación, ya que el parámetro 𝜆 se
encuentra en el exponente.

𝑛
→ ln(𝐿(𝑥, 𝜆)) = ln(∏( ))
𝑥𝑖 !
𝑖=1
𝑛
→ ln(𝐿(𝑥, 𝜆)) = ∑(ln( ))
𝑥𝑖 !
𝑖=1
→ ln(𝐿(𝑥, 𝜆)) = ∑(−𝜆 ∙ ln(𝑒 ) + 𝑥𝑖 ∙ ln(𝜆) − ln(𝑥𝑖 !))

88
𝑖=1
iii. Una vez linealizada la ecuación, se procede a derivar parcialmente la expresión

despejada con respecto al parámetro, es decir en este caso “𝜆”.
𝑛
𝜕 𝑥𝑖
→ ln(𝐿(𝑥, 𝜆)) = ∑(− ln(𝑒 ) + )
𝜕𝜆 𝜆
𝑖=1
𝑛
𝜕 1
→ ln(𝐿(𝑥, 𝜆)) = −𝑛 + ∙ ∑ 𝑥𝑖
𝜕𝜆 𝜆
𝑖=1
iv. Habiendo derivado con respecto al parámetro, realizamos la estimación puntual,

igualando dicha derivada a cero. A partir de este momento el parámetro 𝜆 pasa a
ser un estimador.
𝑛
𝜕 1
→ ln(𝐿(𝑥, 𝜆)) = 0 → −𝑛 + ∙ ∑ 𝑥𝑖 = 0
𝜕𝜆 𝜆̂ 𝑖=1
v. Finalmente, despejamos el estimador puntual.

𝑛
1
→ ∙ ∑ 𝑥𝑖 = 𝑛
𝜆̂ 𝑖=1
∑𝑛𝑖=1 𝑥𝑖
→ 𝜆̂ = = 𝑥̅
𝑛
Habiendo realizado la estimación máximo verosímil del parámetro, es posible asociar a la
muestra dada en el enunciado la relación obtenida, calculando así 𝜆̂.

1+0+3+1+⋯+1
𝜆̂ = 𝑥̅ = = 1,4 𝑚𝑒𝑠𝑒𝑠.
10
Así, la probabilidad requerida quedaría dada por:
𝑒 −1,4 ∙ 1,41
→ 𝑃(𝑋 = 1) =
1!
→ 𝑃(𝑋 = 1) = 0,345
Conclusión 89
La probabilidad que en un mes se registre un accidente corresponde a un 34,5%.

PROBLEMA 2
La amplitud de una señal de radar refundida desde la superficie del mar es una variable
aleatoria con la siguiente función de densidad, con α desconocido:
2 −α x2
𝑓(𝑥, α ) = {2α 𝑥𝑒 𝑥>0 ; α >0
0 𝑥≤0
En una muestra aleatoria de 10 de estas señales de radar, se obtuvieron los siguientes

resultados:
90
10 15 18 14 11 11 10 16 18 17
Determine la estimación máximo verosímil del parámetro (α+1)
SOLUCIÓN
Sea:
X: Amplitud de una señal de radar refundida desde la superficie del mar.
Estimación Puntual
i. Función de Verosimilitud
𝑛
2
→ 𝐿(𝑥) = ∏( 2α 2 𝑥𝑖 𝑒 −α 𝑥𝑖 )
𝑖=1
ii. Se observa que el parámetro a derivar se encuentra en el exponente, por lo que es

conveniente aplicar logaritmo natural.
𝑛
2
→ ln(𝐿(𝑥)) = ln(∏( 2α 2 𝑥𝑖 𝑒 −α 𝑥𝑖 ))
𝑖=1
𝑛
2
→ ln(𝐿(𝑥)) = ∑(ln(2α 2 𝑥𝑖 𝑒 −α 𝑥𝑖 ))
𝑖=1
→ ln(𝐿(𝑥)) = ∑(2 ∙ ln(2α) + ln(𝑥𝑖 ) − α 𝑥𝑖 2 ∙ ln(𝑒))

𝑖=1

despejada con respecto al parámetro, es decir en este caso “𝛼”.

𝑛
𝜕 1
→ ln(𝐿(𝑥)) = ∑(2 ∙ ∙ 2 − 𝑥𝑖 2 )
𝜕𝛼 2𝛼
𝑖=1
𝑛
𝜕 2∙𝑛
→ ln(𝐿(𝑥)) = − ∑ 𝑥𝑖 2
𝜕𝛼 𝛼
𝑖=1
iv. Derivamos e igualamos a cero. 91
𝑛
𝜕 2∙𝑛
→ ln(𝐿(𝑥)) = 0 → − ∑ 𝑥𝑖 2 = 0
𝜕𝛼 𝛼̂
𝑖=1
𝑛
2∙𝑛
→ = ∑ 𝑥𝑖 2
𝛼̂
𝑖=1
2∙𝑛
→ 𝛼̂ =
∑𝑛𝑖=1 𝑥𝑖 2
Así, es posible obtener 𝐸. 𝑀. 𝑉(𝛼) a partir de la muestra expuesta en el enunciado.
2 ∙ 10
→ 𝐸. 𝑀. 𝑉(𝛼) = = 9,72 ∙ 10−3
102 + 152 + ⋯ + 172
Finalmente, la estimación máximo verosímil requerida queda dada por:
→ 𝐸. 𝑀. 𝑉(𝛼 + 1) = 1,00972
Conclusión
La estimación máximo verosímil del parámetro (α+1) corresponde a 1,00972.

PROBLEMA 3
El tiempo de germinación de una planta, en días, se distribuye según una variable aleatoria
X, cuya función de densidad, con parámetro α desconocido es:
α 𝑒 −α (x−20) , 𝑥 > 20 ; α > 0

𝑓(𝑥) = {
0, 𝑒𝑛 𝑜𝑡𝑟𝑜 𝑐𝑎𝑠𝑜
Se toma una muestra aleatoria de 100 plantas y se obtiene:

100
∑𝑖=1 𝑥𝑖 = 2200. 92
Para una muestra aleatoria de la variable X, determine el estimador máximo verosímil de
α y su estimación máxima verosímil.
SOLUCIÓN
Sea:
X: Tiempo de germinación de una planta, en días.
Estimación Puntual
𝑛
→ 𝐿(𝑥, 𝛼) = ∏( α 𝑒 −α (x𝑖 −20) )

𝑖=1

→ ln(𝐿(𝑥, 𝛼)) = ln(∏( α 𝑒 −α (x𝑖 −20) ))

𝑖=1
→ ln(𝐿(𝑥, 𝛼)) = ∑(ln(α 𝑒 −α (x𝑖 −20) ))

𝑖=1
→ ln(𝐿(𝑥, 𝛼)) = ∑(ln(α) − α (x𝑖 − 20). ln(𝑒))

𝑖=1

despejada con respecto al parámetro, es decir en este caso “𝛼”.

𝑛
𝜕 1
→ ln(𝐿(𝑥, 𝛼)) = ∑( − (x𝑖 − 20))
𝜕𝛼 𝛼
𝑖=1
𝑛
𝜕 𝑛
→ ln(𝐿(𝑥, 𝛼)) = − ∑ 𝑥𝑖 + 20𝑛
𝜕𝛼 𝛼
𝑖=1
iv. Derivamos e igualamos a cero. 93
𝑛
𝜕 𝑛
→ ln(𝐿(𝑥, 𝛼)) = 0 → − ∑ 𝑥𝑖 + 20𝑛 = 0
𝜕𝛼 𝛼̂
𝑖=1
𝑛
𝑛
→ = ∑ 𝑥𝑖 − 20𝑛
𝛼̂
𝑖=1
𝑛 1
→ 𝛼̂ = =
∑𝑛𝑖=1 𝑥𝑖− 20𝑛 𝑥̅ − 20
Así, es posible obtener 𝐸. 𝑀. 𝑉(𝛼) a partir de los datos muestrales expuestos en el

enunciado.
100
→ 𝐸. 𝑀. 𝑉(𝛼) = = 0,5
2200 − 20 ∙ 100
Conclusión
1
El estimador máximo verosímil de α está dado por 𝑥̅ −20 y su estimación máxima verosímil
corresponde a 0,5.

PROBLEMA 4
Sea (X1,X2,…X10) una m.a.t (10) de X ~ N(; 2). Sean ̂1 y ̂ 2 dos estimadores de , tal que:
𝑋1 + 𝑋10
̂1 =
𝜃
2
𝑋1 + 2𝑋5 + 𝑋10
̂2 =
𝜃
4
94
Analice insesgamiento de ̂1 y ̂ 2 e indique cual de los estimadores es mejor. Justifique su
respuesta.
SOLUCIÓN
Análisis de Insesgamiento
Se sabe por definición que en general para que un estimador "𝛼̂" , se clasifique como
insesgado para cierto parámetro "𝛼", se debe cumplir la relación expuesta en la ecuación
(7.1)
𝐸(𝛼
̂) = 𝛼 (7.1)
Así, es necesario en primera instancia analizar insesgamiento con el fin de identificar cual
de los 2 estimadores expuestos es mejor. Es válido decir que evidentemente un estimador
insesgado respecto a su respectivo parámetro poblacional, será mejor que un estimador no
insesgado para el mismo.
A continuación, se procede a analizar insesgamiento para ambos parámetros, aplicando

propiedades de la esperanza, ya estudiadas anteriormente.
𝑋1 + 𝑋10
̂1 ) = 𝐸(
→ 𝐸(𝜃 )
2
𝑋1 𝑋10
̂1 ) = 𝐸(
→ 𝐸(𝜃 + )
2 2
1 1
̂1 ) =
→ 𝐸(𝜃 ∙ 𝐸(𝑋1 ) + ∙ 𝐸(𝑋10 )
2 2
1 1
̂1 ) =
→ 𝐸(𝜃 ∙𝜇+ ∙𝜇
2 2

̂1 ) = 𝜇
→ 𝐸(𝜃
̂1 𝑒𝑠 𝑖𝑛𝑠𝑒𝑠𝑔𝑎𝑑𝑜 𝑝𝑎𝑟𝑎 𝜃1 [𝜇]

→𝜃
̂2 tal como se muestra a continuación:

Análogamente, se realiza el estudio para 𝜃
𝑋1 + 2𝑋5 + 𝑋10
̂2 ) = 𝐸(
→ 𝐸(𝜃 )
4 95
1
̂2 ) =
→ 𝐸(𝜃 ∙ 𝐸(𝑋1 + 2𝑋5 + 𝑋10 )
4
1
̂2 ) =
→ 𝐸(𝜃 ∙ [𝐸(𝑋1) + 2𝐸(𝑋5 ) + 𝐸(𝑋10 )]
4
1
̂2 ) =
→ 𝐸(𝜃 ∙ [𝜇 + 2𝜇 + 𝜇]
4
4𝜇
̂2 ) =
→ 𝐸(𝜃
4
̂2 ) = 𝜇
→ 𝐸(𝜃
̂2 𝑒𝑠 𝑖𝑛𝑠𝑒𝑠𝑔𝑎𝑑𝑜 𝑝𝑎𝑟𝑎 𝜃2 [𝜇]

→𝜃
Análisis de Varianza Mínima
En el enunciado se pide determinar cual de los dos estimadores es mejor, con respecto a
sus respectivos parámetros. Se ha determinado que ambos son estimadores insesgados,
por lo que con la información que se dispone no es posible definir cual de los dos es mejor.
Es por esto, que se realizará un análisis de varianza mínima. Es importante notar, que a
menor varianza, existirá menor variabilidad entre la estimación y su valor poblacional, por
lo que el estimador estudiado será mejor que el que presente más discontinuidad.
Para realizar este análisis, se aplicarán propiedades de la varianza, las cuales ya han sido
estudiadas anteriormente. Estás propiedades se aplicarán bajo el supuesto de que la
variable normal estudiada es independiente.
𝑋1 + 𝑋10
̂1 ) = 𝑉(
→ 𝑉(𝜃 )
2

𝑋1 𝑋10
̂1 ) = 𝑉(
→ 𝑉(𝜃 + )
2 2
1 1
̂1 ) =
→ 𝑉(𝜃 ∙ 𝑉(𝑋1 ) + ∙ 𝑉(𝑋10 )
4 2
1 2 1 2
̂1 ) =
→ 𝑉(𝜃 ∙𝜎 + ∙𝜎
4 4
̂1 ) = 0,5 ∙ 𝜎 2
→ 𝑉(𝜃
96
̂1 es estimador
Al ser 0,5 ∙ 𝜎 2 inferior al parámetro poblacional 𝜎 2 , es posible afirmar que 𝜃
insesgado para 𝜃1 de varianza mínima.
̂2 , tal como se
Análogamente, se realiza el análisis de varianza mínima para el estimador 𝜃
𝑋1 + 2𝑋5 + 𝑋10
̂2 ) = 𝑉(
→ 𝑉(𝜃 )
4
1
̂2 ) =
→ 𝑉(𝜃 ∙ 𝑉(𝑋1 + 2𝑋5 + 𝑋10 )
16
1
̂2 ) =
→ 𝑉(𝜃 ∙ [𝑉(𝑋1) + 4𝑉(𝑋5 ) + 𝑉(𝑋10 )]
16
1
̂2 ) =
→ 𝑉(𝜃 ∙ [𝜎 2 + 4𝜎 2 + 𝜎 2 ]
16
6𝜎 2
̂2 ) =
→ 𝑉(𝜃
16
̂2 ) = 0,375 ∙ 𝜎 2
→ 𝑉(𝜃
̂2 es un
Al ser 0,375 ∙ 𝜎 2 inferior al parámetro poblacional 𝜎 2 , es posible afirmar que 𝜃
estimador insesgado para 𝜃2 de varianza mínima.
Conclusión
Se ha determinado que tanto 𝜃 ̂1 como 𝜃
̂2 son estimadores insesgados para sus respectivos
parámetros poblacionales. Además, a partir de un análisis de varianza mínima, se ha
identificado que el mejor estimador insesgado para su parámetro corresponde a 𝜃 ̂2 , pues
𝑉(𝜃̂2 ) < 𝑉(𝜃
̂1 )

PROBLEMA 5
Para una variable aleatoria “Y” se sabe que E(Y)=θ/3; y V(Y)= θ/6. Se proponen los siguientes
estimadores para el parámetro θ desconocido, a partir de una muestra aleatoria de tamaño
4:
3 3
θ̂1 = (𝑌1 + 𝑌2 + 𝑌3 + 𝑌4 ) θ̂2 = (𝑌1 + 𝑌2 + 𝑌3 − 𝑌4 )
4 2
Determine:
97
a) Cuál de estos estimadores es insesgado.
b) Cuál estimador presenta menor varianza.
SOLUCIÓN 5-A
Análisis de Insesgamiento
Al igual que en el ejercicio anterior, se procederá a realizar análisis de insesgamiento, con

el fin de determinar cual de los dos estimadores planteados en el enunciado es mejor. Para
esto, se hará un estudio en base a la ecuación (1)
3
̂1 ) = 𝐸( (𝑌1 + 𝑌2 + 𝑌3 + 𝑌4 ))
→ 𝐸(𝜃
4
3
̂1 ) = 𝐸(𝑌1 + 𝑌2 + 𝑌3 + 𝑌4 )
→ 𝐸(𝜃
4
3
̂1 ) =
→ 𝐸(𝜃 ∙ [𝐸(𝑌1 ) + 𝐸(𝑌2 ) + 𝐸(𝑌3 ) + 𝐸(𝑌4 )]
4
3
̂1 ) =
→ 𝐸(𝜃 ∙ [𝜇 + 𝜇 + 𝜇 + 𝜇]
4
3
̂1 ) =
→ 𝐸(𝜃 ∙ [4𝜇] = 3 ∙ 𝜇
4
𝜃
̂1 ) = 3 ∙
→ 𝐸(𝜃 =𝜃
3
̂1 𝑒𝑠 𝑖𝑛𝑠𝑒𝑠𝑔𝑎𝑑𝑜 𝑝𝑎𝑟𝑎 𝜃
→𝜃

̂2 tal como se muestra a continuación:

Análogamente, se realiza el estudio para 𝜃
3
̂2 ) = 𝐸( (𝑌1 + 𝑌2 + 𝑌3 − 𝑌4 ))
→ 𝐸(𝜃
2
3
̂2 ) =
→ 𝐸(𝜃 ∙ 𝐸(𝑌1 + 𝑌2 + 𝑌3 − 𝑌4 )
2
3
̂2 ) =
→ 𝐸(𝜃 ∙ [𝐸(𝑌1 ) + 𝐸(𝑌2 ) + 𝐸(𝑌3 ) − 𝐸(𝑌4 )]
2
98
3
̂2 ) =
→ 𝐸(𝜃 ∙ [𝜇 + 𝜇 + 𝜇 − 𝜇]
2
3 ∙ 2𝜇
̂2 ) =
→ 𝐸(𝜃 = 3𝜇
2
𝜃
̂2 ) = 3 ∙
→ 𝐸(𝜃 =𝜃
3
̂2 𝑒𝑠 𝑖𝑛𝑠𝑒𝑠𝑔𝑎𝑑𝑜 𝑝𝑎𝑟𝑎 𝜃
→𝜃
Conclusión
̂1 como 𝜃
Se ha determinado que tanto 𝜃 ̂2 son estimadores insesgados para 𝜃
SOLUCIÓN 5-B
Análisis de Varianza Mínima
De la misma forma que en el problema anterior, en el enunciado se pide determinar cual

de los dos estimadores es mejor, con respecto a sus respectivos parámetros. Por un lado,
ha determinado que ambos son estimadores insesgados, por lo que con la información que
se dispone no es posible definir cual de los dos es mejor. Es por esto, que se realizará un
análisis de varianza mínima.
Para realizar este análisis, se aplicarán propiedades de la varianza, las cuales ya han sido
estudiadas anteriormente. Estás propiedades se aplicarán bajo el supuesto de que la
variable normal estudiada es independiente.
3
̂1 ) = 𝑉( (𝑌1 + 𝑌2 + 𝑌3 + 𝑌4 )
→ 𝑉(𝜃
4

9
̂1 ) =
→ 𝑉(𝜃 𝑉(𝑌1 + 𝑌2 + 𝑌3 + 𝑌4 )
16
9
̂1 ) =
→ 𝑉(𝜃 ∙ [𝑉(𝑌1 ) + 𝑉(𝑌2 ) + 𝑉(𝑌3 ) + 𝑉(𝑌4 )]
16
9
̂1 ) =
→ 𝑉(𝜃 ∙ [𝜎 2 + 𝜎 2 + 𝜎 2 + 𝜎 2 ]
16 99
9 9 𝜃
̂1 ) =
→ 𝑉(𝜃 ∙ 4𝜎 2 = ∙4∙
16 16 6
3
̂1 ) =
→ 𝑉(𝜃 ∙𝜃
8
̂2 , tal como se
Análogamente, se realiza el análisis de varianza mínima para el estimador 𝜃
3
̂2 ) = 𝑉( (𝑌1 + 𝑌2 + 𝑌3 − 𝑌4 )
→ 𝑉(𝜃
2
9
̂2 ) =
→ 𝑉(𝜃 ∙ 𝑉(𝑌1 + 𝑌2 + 𝑌3 − 𝑌4 )
4
9
̂2 ) =
→ 𝑉(𝜃 ∙ [𝑉(𝑌1 ) + 𝑉(𝑌2 ) + 𝑉(𝑌3 ) + 𝑉(𝑌4 )]
4
9
̂2 ) =
→ 𝑉(𝜃 ∙ [𝜎 2 + 𝜎 2 + 𝜎 2 + 𝜎 2 ]
4
36𝜎 2 36𝜃
̂2 ) =
→ 𝑉(𝜃 =
4 4∙6
3
̂2 ) =
→ 𝑉(𝜃 ∙𝜃
2
Conclusión
̂1 ) < 𝑉(𝜃
Realizando el análisis de varianza mínima, se logra identificar que 𝑉(𝜃 ̂2 ). Con esto,
es posible afirmar que 𝜃̂2 es mejor estimador insesgado para 𝜃 que 𝜃 ̂1 .

PROBLEMA 6
Sea X1, X2, X3,……Xn una muestra aleatoria de tamaño n de X que representa número de
brocas para taladro de corte que se revisan hasta encontrar “r” defectuosas, cuya función
de cuantía está dada por:
𝑥−1 𝑟 𝑥−𝑟
𝑃(𝑋 = 𝑥) = { 𝑟 − 1) 𝑝 (1 − 𝑝)
( 𝑠𝑖 𝑥 = 𝑟, 𝑟 + 1, 𝑟 + 2, …
100
En que:
𝑟
𝐸(𝑋) =
𝑝
𝑟(1 − 𝑝)
𝑉(𝑋) =
𝑝2
h) Encuentre el Estimador Máximo Verosímil de p.

1
i) Pruebe que 𝑝∗ = 𝑝̂ es un estimador insesgado para p.
SOLUCIÓN 6-A
Sea:
X: Número de brocas para taladros de corte que se revisan hasta encontrar “r” defectuosas.
Estimación Puntual
𝑛
𝑥𝑖 − 1 𝑟
→ 𝐿(𝑥, 𝑝) = ∏( ( ) 𝑝 (1 − 𝑝)𝑥𝑖 −𝑟 )
𝑟−1
𝑖=1

𝑛
𝑥𝑖 − 1 𝑟
→ ln(𝐿(𝑥, 𝑝)) = ln(∏( ( ) 𝑝 (1 − 𝑝)𝑥𝑖 −𝑟 ))
𝑟−1
𝑖=1

𝑛
𝑥𝑖 − 1 𝑟
→ ln(𝐿(𝑥, 𝑝)) = ∑(( ) 𝑝 (1 − 𝑝)𝑥𝑖 −𝑟 ))
𝑟−1
𝑖=1
𝑛
𝑥𝑖 − 1
→ ln(𝐿(𝑥, 𝑝)) = ∑ (ln( ( )) + 𝑟 ∙ ln(𝑝) + (𝑥𝑖 − 𝑟) ∙ ln(1 − 𝑝))
𝑟−1
𝑖=1
𝑛 𝑛
𝑥𝑖 − 1
→ ln(𝐿(𝑥, 𝑝)) = ∑ ln (( )) + 𝑟 ∙ 𝑛 ∙ ln(𝑝) + ln(1 − 𝑝) ∙ ∑( 𝑥𝑖 − 𝑟)
𝑟−1 101
𝑖=1 𝑖=1

despejada con respecto al parámetro, es decir en este caso “𝑝”.
𝑛
𝜕 𝑟∙𝑛 1
→ ln(𝐿(𝑥, 𝑝)) = − ∑(𝑥𝑖 − 𝑟) ∙
𝜕𝑝 𝑝 (1 − 𝑝)
𝑖=1
iv. Derivamos e igualamos a cero.

𝑛
𝜕 𝑟∙𝑛 1
→ ln(𝐿(𝑥, 𝑝)) = 0 → − ∑(𝑥𝑖 − 𝑟) ∙ =0
𝜕𝑝 𝑝̂ (1 − 𝑝̂ )
𝑖=1
𝑛
𝑟∙𝑛 1
→ = ∙ ∑(𝑥𝑖 − 𝑟)
𝑝̂ (1 − 𝑝̂ )
𝑖=1
→ (1 − 𝑝̂ ) ∙ 𝑟 ∙ 𝑛 = ∑(𝑥𝑖 − 𝑟) ∙ 𝑝̂
𝑖=1
→ 𝑟 ∙ 𝑛 − 𝑟 ∙ 𝑛 ∙ 𝑝̂ = 𝑝̂ ∑(𝑥𝑖 ) − 𝑟 ∙ 𝑛 ∙ 𝑝̂
𝑖=1
𝑟∙𝑛
→ 𝑝̂ =
∑𝑛𝑖=1(𝑥𝑖 )
𝑟
→ 𝑝̂ =
𝑥̅

Conclusión
𝑟
El estimador máximo verosímil de p, corresponde a
𝑥̅
SOLUCIÓN 6-B
Por probar:
1
𝐸(𝑝∗ ) =
𝑝
Lo anterior se debe a que en el enunciado se expone la siguiente expresión: 102

1
𝑝∗ =
𝑝̂
Así, se comienza la verificación a partir de la parte izquierda de la ecuación, con el fin de

llegar a la expresión derecha de la ecuación, tal como se muestra a continuación:
1
→ 𝐸(𝑝∗ ) = ∙ 𝐸(𝑋̅)
𝑟
1 𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛
= ∙ 𝐸[ ]
𝑟 𝑛
1
= ∙ 𝐸[𝑋1 + 𝑋2 + ⋯ + 𝑋𝑛 ]
𝑟∙𝑛
1
= ∙ [𝐸(𝑋1 ) + 𝐸(𝑋2 ) + ⋯ 𝐸(𝑋𝑛 )]
𝑟∙𝑛
1
= ∙ 𝑛 ∙ 𝐸(𝑋)
𝑟∙𝑛
En el enunciado se expone que:
𝑟
→ 𝐸(𝑋) =
𝑝
Así, reemplazando en la expresión, se obtiene:

1 𝑟
→ 𝐸(𝑝∗ ) = ∙𝑛∙
𝑟∙𝑛 𝑝
1
=
𝑝
Conclusión
A partir de la expresión expuesta anteriormente, queda verificado que 𝑝∗ es insesgado
para 𝑝.
103

Unidad 8- Intervalos de Confianza
PROBLEMA 1
Se realiza un estudio para analizar el comportamiento de cierto río, en relación a sus
desbordes que han ocurrido en los últimos años. Se sabe que la descarga de agua debido a
los desbordes tiene un comportamiento normal con una desviación típica de 200 [𝑝𝑖𝑒𝑠 3⁄𝑠]
Al tomar una muestra de 11 desbordamientos de los ocurridos en los últimos años se

104
obtuvo una descarga promedio de 5090 [𝑝𝑖𝑒𝑠 3⁄𝑠]
Estime con un 95% de confianza la descarga promedio de los desbordes del río.
SOLUCIÓN
Sea:
X: Descargas de agua debido a los desbordes de cierto río, en [𝑝𝑖𝑒𝑠 3⁄𝑠]
A partir del enunciado, es posible identificar que se entrega la desviación estándar

poblacional, asociada a la variable "𝑋", la cual corresponde a 200 [𝑝𝑖𝑒𝑠 3⁄𝑠]. Así, es posible
definir la siguiente distribución para dicha variable:
𝑋~𝑁(𝜇 =? ; 𝜎 2 = (200 [𝑝𝑖𝑒𝑠 3⁄𝑠]) 2 )
Así, es posible denotar que lo que se requiere es estimar la media poblacional asociada a la
variable de interés, para lo cual existe la siguiente fórmula para realizar la estimación por
intervalo.
Caso 1
“Estimación por intervalo de la Media [𝜇], con la varianza poblacional [𝜎 2 ] conocida”
𝜎 𝜎
𝑃 (𝑥 − 𝑧1−𝛼 ∙ ≤ 𝜇 ≤ 𝑥 + 𝑧1−𝛼 ∙ )= 1−𝛼 (8.1)
2 √𝑛 2 √𝑛
Datos
A partir del enunciado, es posible identificar los siguientes datos:
𝜎 = 200 [𝑝𝑖𝑒𝑠 3⁄𝑠]
𝑛 = 11
𝑥 = 5090 [𝑝𝑖𝑒𝑠 3⁄𝑠]
𝛼 = 0,05

A partir de lo anterior, es necesario determinar 𝑧1−𝛼 , con ayuda de la tabla de distribución

2
normal, obteniendo lo que se muestra a continuación:
→ 𝑧1−𝛼 = 𝑧0,975 = 1,96

2
Observación
Es importante mencionar, que en este caso se debe buscar en la tabla el valor de adentro de
𝛼
la misma, ya que el dato que se tiene “1 − 2 = 0,975”, corresponde a una probabilidad, no
al recorrido de la variable tipificada [Z] 105
Así, a partir de los datos identificados, es posible reemplazar en la ecuación (8.1),

obteniendo:
200 200
→ 𝑃 (5090 − 1,96 ∙ ≤ 𝜇 ≤ 5090 + 1,96 ∙ ) = 0,95
√11 √11
→ 𝜇 ∈ [4971,808 ; 5208,192]
Conclusión
Con una confianza del 95%, es posible afirmar que la descarga promedio de los desbordes
del río, fluctúa entre 4971,808 [𝑝𝑖𝑒𝑠 3⁄𝑠] y 5208,192 [𝑝𝑖𝑒𝑠 3⁄𝑠]

PROBLEMA 2
El concreto que se está utilizando en una nueva obra de construcción de estacionamientos,
se le ha aplicado un nuevo método de curado. Se realizaron ensayos en muestras de
concreto midiendo su resistencia en [𝐼𝑏 ∙ 𝑝𝑙𝑔2 ], los resultados se presentan en la siguiente
tabla:
Resistencia ni
2000-2700 1
2700-2900 2
106
2900-3100 5
3100-3300 8
3300-3500 9
3500-3700 7
Tabla 12.Resistencia asociada a ensayos de muestras de concreto, en 𝐼𝑏 ∙ 𝑝𝑙𝑔2
Si la resistencia se distribuye en forma normal.
a. Estime con una confianza del 95% la resistencia del promedio del concreto.
b. Se puede afirmar que la varianza de la resistencia del concreto es de
(265[𝐼𝑏 ∙ 𝑝𝑙𝑔2 ])2. Utilice 𝛼 = 0,05
c. Si se define el error de estimación como la mitad de la amplitud de un intervalo.
Encuentre y compare el error de estimación de un intervalo para la resistencia
promedio con una confianza del 95% y 90%
d. Estime con un 90% de confianza la proporción de ensayos que mostraron una
resistencia en el concreto inferior a 3100 ([𝐼𝑏 ∙ 𝑝𝑙𝑔2 ])
SOLUCIÓN 2 - A
Sea:
X: Resistencia asociada al concreto, en [𝐼𝑏 ∙ 𝑝𝑙𝑔2 ]
𝑋~𝑁(𝜇 = ? ; 𝜎 2 = ? )
Es posible identificar que se requiere estimar la media poblacional asociada a la variable de

interés, desconociendo la desviación poblacional. Para esto, se tiene la siguiente fórmula
asociada a la estimación por intervalo.

Caso 2
“Estimación por intervalo de la Media [𝜇], con la varianza poblacional [𝜎 2 ] desconocida”
𝑠(𝑥) 𝑠(𝑥)
𝑃 (𝑥 − 𝑡(𝑛−1 , 𝛼
1− )
∙ ≤ 𝜇 ≤ 𝑥 + 𝑡(𝑛−1 , 𝛼
1− )
∙ )= 1−𝛼 (8.2)
2 √𝑛 2 √𝑛
Datos
A partir de la tabla expuesta en el enunciado, es posible obtener los siguientes datos:
𝑛 = 32
107
𝑥 = 3260,938 [𝐼𝑏 ∙ 𝑝𝑙𝑔2 ]
𝑠(𝑥) = 289,809 [𝐼𝑏 ∙ 𝑝𝑙𝑔2 ]
𝛼 = 0,05
Además, con ayuda de la tabla asociada a la distribución “t-Student”, es posible obtener el

siguiente valor:
→ 𝑡(𝑛−1 , 𝛼
1− )
= 𝑡(31 , 0,975) = 2,0395
2
Así, es posible estimar la media reemplazando en la ecuación (8.2), como se muestra a

continuación:
289,809 289,809
→ 𝑃 (3260,938 − 2,0395 ∙ ≤ 𝜇 ≤ 3260,938 + 2,0395 ∙ ) = 0,95
√32 √32
→ 𝜇 ∈ [3155,513 ; 3364,487]
Conclusión
Con un 95% de confianza, es posible denotar que la resistencia media al concreto fluctúa
entre 3155,513 [𝐼𝑏 ∙ 𝑝𝑙𝑔2 ] y 3364,487 [𝐼𝑏 ∙ 𝑝𝑙𝑔2 ]

SOLUCION 2 - B
A partir de la información dispuesta en este problema, es posible estimar por intervalo la

varianza poblacional. Para esto, se tiene la ecuación expuesta en el “Caso 3”
Caso 3
“Estimación por intervalo de la varianza poblacional [𝜎 2 ]”
(𝑛 − 1) ∙ [𝑠(𝑥)]2 2
(𝑛 − 1) ∙ [𝑠(𝑥)]2
𝑃( ≤ 𝜎 ≤ )= 1−𝛼 (8.3) 108
𝑥2 𝛼 𝑥2 𝛼
(𝑛−1,1− 2 ) (𝑛−1, 2 )
Datos
A partir de la tabla expuesta en el enunciado, es posible obtener los siguientes datos:
𝑛 = 32
𝑉(𝑥) = (289,809 [𝐼𝑏 ∙ 𝑝𝑙𝑔2 ])2
𝛼 = 0,05
Con ayuda de la tabla asociada a la distribución “Chi-Cuadrado” es posible determinar los

valores contenidos en la ecuación (8.3). Es importante denotar que la significancia asociada
al problema estudiado, no se distribuye de forma simétrica en los extremos de la
distribución, ya que la simetría no corresponde a una propiedad de la distribución “Chi-
Cuadrado”. A partir de esto, se obtiene:
2 2
→ 𝑥(𝑛−1,1− 𝛼 = 𝑥(31,0,975) = 48,232
)
2
2 2
→ 𝑥(𝑛−1, 𝛼 = 𝑥(31,0,025) = 17,539
)
2
Así, reemplazando en la ecuación (8.3), se obtiene la siguiente estimación:
(31) ∙ [289,809 ]2 (31) ∙ [289,809 ]2

𝑃( ≤ 𝜎2 ≤ ) = 0,95
48,232 17,539
→ 𝜎 2 ∈ [ 53982,148 ; 148450,1369 ]
Conclusión
Se tiene que 2652 = 70225 [𝐼𝑏 ∙ 𝑝𝑙𝑔2 ]2 pertenece al intervalo confidencial, calculado con
un 95% de confianza. A partir de lo anterior, es posible afirmar que el valor planteado en el
enunciado está dentro del rango de estimación de la varianza. No obstante, no se tiene la
información suficiente, para estimar que la varianza se asocia puntualmente a dicho valor
enunciado.

SOLUCION 2 - C
A partir del enunciado, es posible identificar que se define el “error de estimación” de

acuerdo a la siguiente expresión:
𝑎𝑖
𝐸= (8.4)
2
Dónde "𝑎𝑖 " corresponde a la amplitud del intervalo estimado, a un determinado nivel de
confianza.
109
Error de estimación con 95% de confianza
Primero calcularemos el error de estimación asociado a la resistencia promedio. Para esto,
es importante notar que en el inciso 2-A se ha logrado determinar el siguiente intervalo
para la media con el 95% de confianza:
→ 𝜇 ∈ [3155,513 ; 3364,487]
Así, de acuerdo a la ecuación (4) es posible determinar el error de estimación, como se

muestra a continuación:
3364,487 − 3155,513
→𝐸=
2
→ 𝐸 = 104,487
Error de estimación con 90% de confianza

A continuación, se procederá a determinar la estimación por intervalo asociada a la
resistencia media, considerando un 90% de confianza. Para esto, se utilizará la ecuación
(8.2), que corresponde a la estimación de la media con la desviación estándar poblacional
desconocida, obteniendo lo siguiente:
289,809 289,809
→ 𝑃 (3260,938 − 𝑡31,;0,95 ∙ ≤ 𝜇 ≤ 3260,938 + 𝑡31,;0,95 ∙ ) = 0,9
√32 √32
Luego, con ayuda de la tabla asociada a la distribución “t-Student”, buscamos el valor

asociado a 31 grados de libertad y una probabilidad del 95%, obteniendo el siguiente valor:
→ 𝑡31,;0,95 = 1,6955

Reemplazando en la ecuación anterior, obtenemos:
289,809 289,809
→ 𝑃 (3260,938 − 1,6955 ∙ ≤ 𝜇 ≤ 3260,938 + 1,6955 ∙ ) = 0,9
√32 √32
→ 𝜇 ∈ [3174,074 ; 3347,801]
110
Así, a partir de la ecuación (8.4) es posible determinar el error de estimación, como se

3347,801 − 3174,074
→𝐸=
2
→ 𝐸 = 86,863
Observación
Es importante entender “a priori”, vale decir antes de realizar los cálculos, que al aumentar
el nivel de confianza, entonces la amplitud de un intervalo de estimación tiende a aumentar,
debido a que se debe tener más confianza en que el parámetro poblacional si pertenezca al
intervalo de estimación. Así, al ser más grande la amplitud a medida que se aumenta la
confianza, el error de estimación también debe tender a aumentar.
Conclusión
El error de estimación de la media, asociado a un 95% de confianza es más elevado que el
correspondiente al de un 90%, lo cual es consistente de acuerdo a lo esperado.
SOLUCION 2- D
a) Estime con un 90% de confianza la proporción de ensayos que mostraron una

resistencia en el concreto inferior a 3100 ([𝐼𝑏 ∙ 𝑝𝑙𝑔2 ])
Caso 4: “Estimación por intervalo de la proporción [p]”
En este caso, se pide estimar por intervalos la proporción, para lo que utilizaremos la
expresión representada en la ecuación (8.5)
𝑝̂ ∙ 𝑞̂ 𝑝̂ ∙ 𝑞̂
𝑃 (𝑝̂ − 𝑧1−𝛼 ∙ √ ≤ 𝑝 ≤ 𝑝̂ + 𝑧1−𝛼 ∙ √ )= 1−𝛼 (8.5)
2 𝑛 2 𝑛

Luego, es necesario determinar los valores asociados a los estimadores 𝑝̂ y 𝑞̂, para lo que
debemos recordar que el valor de “p” se asocia a la probabilidad de éxito de un experimento
de Bernoulli y “q” a la probabilidad de fracaso del mismo experimento, En este caso, a partir
de la tabla expuesta en el enunciado, es posible obtener el valor de los estimadores,
considerando un caso exitoso que “los ensayos presenten una resistencia en el concreto
inferior a 3100 [𝐼𝑏 ∙ 𝑝𝑙𝑔2 ]”.
8
→ 𝑝̂ = = 0,25
32
111
24
→ 𝑞̂ = = 0,75
32
Por otro lado, es necesario conocer el valor de "𝑧1−𝛼 ”, para lo que se utilizará la tabla de la
2
distribución normal, obteniendo:
1,64 + 1,65
→ 𝑧1−0,9 = 𝑧0,95 = = 1,645
2 2
Así, es posible obtener la estimación de la proporción estudiada, reemplazando en la

ecuación (8.5), tal como se muestra a continuación:
0,25 ∙ 0,75 0,25 ∙ 0,75

→ 𝑃 (0,25 − 1,645 ∙ √ ≤ 𝑝 ≤ 0,25 + 1,645 ∙ √ ) = 0,9
32 32
→ 𝑝 ∈ [0,124 ; 0,376]
Conclusión
Con un 90% de confianza, es posible afirmar que la proporción de ensayos que mostraron
una resistencia en el concreto inferior a 3100 [𝐼𝑏 ∙ 𝑝𝑙𝑔2 ], fluctúa entre 0,124 y 0,376.

PROBLEMA 3
Si la distribución del espesor (X) del recubrimiento de cierta pintura de baja viscosidad
expresada en milímetros, se distribuye Normal con media  y varianza 2
a) Estime con 98% de confianza el espesor medio del recubrimiento, en base a la
siguiente muestra aleatoria de espesores observadas:
0,83 0,88 0,88 1,04 1,09 1,12 1,29 1,31
1,48 1,49 1,59 1,62 1,65 1,71 1,76 1,83
112
b) ¿Qué tamaño de muestra es adecuado para estimar la proporción de recubrimientos
con un espesor entre 1,0 y 1,5 milímetros, con 90% de confianza y un error de
estimación de 0,035? (suponga que los datos del inciso A corresponden a una
muestra piloto)
SOLUCIÓN 3 - A
Sea:
𝑋: Espesor del recubrimiento de cierta pintura de baja viscosidad, en milímetros.
𝑋~𝑁(𝜇 = ? ; 𝜎 2 = ? )
Datos
A partir del enunciado, es posible recopilar los siguientes datos relevantes:
𝑛 = 16
1 − 𝛼 = 0,98 → 𝛼 = 0,02
𝑥 = 1,348
𝑠(𝑥) = 0,3385
Es importante identificar que se está pidiendo estimar por intervalo la media del espesor,
desconociendo la varianza poblacional. Así, notamos que estamos en presencia del “Caso
2”, por lo que reemplazaremos los datos anteriores en la ecuación (8.2), tal como se
0,3385 0,3385
→ 𝑃 (1,348 − 𝑡15,;0,99 ∙ ≤ 𝜇 ≤ 1,348 + 𝑡15,;0,99 ∙ ) = 0,98
√16 √16
Luego, buscamos en la tabla de la distribución “t-Student”, el siguiente valor:
→ 𝑡15,;0,99 = 2,6025

Reemplazando el valor obtenido en la ecuación principal, es posible realizar la estimación

requerida.
0,3385 0,3385
→ 𝑃 (1,348 − 2,6025 ∙ ≤ 𝜇 ≤ 1,348 + 2,6025 ∙ ) = 0,98
√16 √16
→ 𝜇 ∈ [1,1278 ; 1,568]
Conclusión
Con un 98% de confianza, es posible afirmar que el espesor medio del recubrimiento de 113
cierta pintura, fluctúa entre 1,1278 [mm] y 1,568 [mm]
SOLUCIÓN 3 – B
Primero que todo es necesario obtener los valores de 𝑝̂ 𝑦 𝑞̂, considerando como “éxito” que
el espesor fluctúe entre 1 y 1,5 milímetros. Esto se realizará a partir de los datos expuestos
en la tabla de la parte A del ejercicio.
7
→ 𝑝̂ = = 0,4375
16
9
→ 𝑞̂ = = 0,5625
16
Además, con respecto al nivel de significación, se tiene que:
→ 1 − 𝛼 = 0,9 → 𝛼 = 0,1
Luego, a partir de la ecuación que representa el error de estimación en este caso, es posible
despejar el valor del número de muestra asociado a un error de 0,035. Para esto, se utilizará
la ecuación (8.6), que representa el cálculo del error de estimación por intervalo de la
proporción.
𝑝̂ ∙ 𝑞̂
𝐸 = 𝑧1−𝛼 ∙ √ (8.6)
2 𝑛
Así, reemplazando en la ecuación (8.6), se obtiene:
0,4325 ∙ 0,5675
→ 0,035 = 𝑧0,95 ∙ √
𝑛

0,4325 ∙ 0,5675
→ 0,035 = 1,645 ∙ √
𝑛
→ 𝑛 = 543,62 ≈ 544 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠
Observación
Es importante denotar que al realizar el cálculo del número de muestras asociado a cierto
error de estimación, en caso de que se obtengan valores decimales, siempre se aproximará
al entero sucesor, con el fin de ser conservador. 114
Conclusión
Con un 90% de confianza, es posible afirmar que el número de muestras apropiado para
que el error asociado a la estimación de recubrimientos con espesor comprendido entre 1
y 1,5 milímetros corresponda a 0,035; se asocia a 544 muestras.

PROBLEMA 4
Un ingeniero recolectó información acerca del tiempo de trabajo, en horas, requerido por
una máquina (A) para fabricar silenciadores para automóvil. Al tomar una muestra de 30
silenciadores fabricados por la máquina A, se obtuvo:
Máquina A
Tiempo N° de silenciadores
0,48-1,18 4
1,18-1,88 8 115
1,88-2,58 9
2,58-3,28 6
3,28-3,98 3
Estime con un 90% de confianza la proporción de silenciadores fabricados con la máquina,

a cuyo tiempo de fabricación fluctúa entre 1,18 horas y 2,6 horas.
SOLUCIÓN
Sea:
𝑋: Tiempo de trabajo requerido por una máquina A, en horas.
“A priori”, es importante identificar que estamos en presencia del “caso 4”, el cual
corresponde a la estimación de la proporción, donde dicho parámetro en este caso se asocia
a un “éxito” correspondiente a que el tiempo de fabricación de la máquina fluctúe entre
1,18 y 2,6 horas.
Así, para utilizar la ecuación (8.5), es necesario conocer los valores de los estimadores 𝑝̂ y
𝑞̂. Para esto se utilizará la tabla expuesta en el enunciado, donde se observa que el valor
2,6 no se encuentra puntualmente como límite de intervalo, por lo que será necesario
realizar un cálculo de percentiles.
30𝑘
( − 21)
→ 2,6 = 2,58 + 0,7 ∙ 100
6
→ 𝑘 = 70,571%
Luego, a partir del porcentaje obtenido, es necesario obtener la posición en que se

encuentra el valor 2,6.
70,571
→ ∙ 30 = 21,1714
100

Así, según lo anterior se podría concluir a priori, que la cantidad de silenciadores

concentrados en una duración de hasta 2,6 horas; corresponde a 21,1714 “silenciadores”.
Con esto, es posible identificar entonces que la cantidad de silenciadores comprendidos
entre una duración de 1,18 y 2,6 horas estará dado por 17,1714 “silenciadores”, los cuales
serán los casos exitosos de la muestra estudiada.
17,1714
→ 𝑝̂ = = 0,5724
30
→ 𝑞̂ = 0,4276 116
Además, el nivel de significación está dado por:
→ 1 − 𝛼 = 0,9 → 𝛼 = 0,1
Finalmente, reemplazando en la ecuación (8.5) es posible obtener la estimación por

intervalo de la proporción de silenciadores que presentan un tiempo de fabricación entre
1,18 y 2,6 horas.
0,572 ∙ 0,428 0,572 ∙ 0,428

→ 𝑃 (0,4238 − 𝑧0,95 ∙ √ ≤ 𝑝 ≤ 0,4238 + 𝑧0,95 ∙ √ ) = 0,9
30 30
0,572 ∙ 0,428 0,572 ∙ 0,428

→ 𝑃 (0,4238 − 1,645 ∙ √ ≤ 𝑝 ≤ 0,4238 + 1,645 ∙ √ ) = 0,9
30 30
→ 𝑝 ∈ [0,424 ; 0,721]
Conclusión
Con un 90% de confianza, es posible afirmar que la proporción de silenciadores que
presentan un tiempo de fabricación comprendido entre 1,18 horas y 2,6 horas; fluctúa entre
0,424 y 0,721.

PROBLEMA 5
Se está estudiando la duración de ciertos procesos productivos y se toma una muestra
aleatoria, de tamaño 10. Se define como “Proceso Corto” cuando su duración es menor que
5 minutos, los datos obtenidos, en minutos, fueron:
3 5 8 6 10 5,5 4 4,2 4,5 2
a) Se pide estimar por intervalo de confianza del 98% la proporción de “Procesos

Cortos”. 117
b) ¿Cuál debería ser el tamaño de la muestra si la proporción estimada disminuye en
un 10% y utilizamos un 95% de confianza manteniendo el mismo error probable
antes de la modificación?
c) Estimar la varianza de dichos tiempos con un nivel de confianza del 99%
SOLUCIÓN 5 - A
Sea:
X = Duración de cierto proceso productivo, en minutos.
Es posible identificar, que se está solicitando estimar por intervalos la proporción de

“Procesos Cortos”, para lo cual se utilizará la ecuación (8.5), asociada al caso 4. Antes de
esto, es necesario obtener los valores de los estimadores, a partir de los datos muestrales
expuestos en la tabla del enunciado, como se muestra a continuación:
5
→ 𝑝̂ = = 0,5
10
→ 𝑞̂ = 0,5
Con respecto a la confianza, se tiene:
→ 1 − 𝛼 = 0,98 → 𝛼 = 0,02
Así, reemplazando en la ecuación (8.5), se obtiene:
0,5 ∙ 0,5 0,5 ∙ 0,5

→ 𝑃 (0,5 − 𝑧0,99 ∙ √ ≤ 𝑝 ≤ 0,4238 + 0,5 + 𝑧0,99 ∙ √ ) = 0,98
10 10

0,5 ∙ 0,5 0,5 ∙ 0,5

→ 𝑃 (0,5 − 2,33 ∙ √ ≤ 𝑝 ≤ 0,4238 + 0,5 + 2,33 ∙ √ ) = 0,98
10 10
→ 𝑝 ∈ [0,132 ; 0,868]
Conclusión
Con un 98% de confianza, es posible afirmar que la proporción de “Procesos Cortos”, se
encuentra comprendida entre 0,132 y 0,868. 118
SOLUCION 5 - B
Primero que todo determinaremos a partir de la ecuación (8.6), el error probable asociado
a la estimación realizada sin la modificación.
0,5 ∙ 0,5
→ 𝐸 = 2,33 ∙ √ = 0,3684
10
Luego, realizando la modificación, los nuevo estimadores asociados a la proporción de

“Procesos Cortos”, estarán dados por:
10
̂ = 0,5 −
→ 𝑝` ∙ 0,5 = 0,45
100
̂ = 0,55
→ 𝑞`
Además, se tiene que el nivel de confianza está dado por:
→ 1 − 𝛼 = 0,95 → 𝛼 = 0,05
Luego, a partir de la ecuación (6), se obtendrá el número de muestras asociado al error

calculado anteriormente, tal como se muestra a continuación:
0,45 ∙ 0,55
→ 0,3684 = 𝑧0,975 ∙ √
𝑛
0,45 ∙ 0,55
→ 0,3684 = 1,96 ∙ √
𝑛
→ 𝑛 = 7,0056 ≈ 8 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠

Conclusión
Con un 95% de confianza, es posible afirmar que el número de muestras asociado a un error
de estimación de “Procesos Cortos” igual a 0,3684; corresponde a 8 muestras.
SOLUCION 5 - C
Primero, notamos que estamos en presencia del caso 3, ya que se requiere estimar la
varianza, por lo que utilizaremos la ecuación (8.3) para realizar la estimación.
Para esto, se tiene una confianza dada por: 119
→ 1 − 𝛼 = 0,99 → 𝛼 = 0,01
Por otro lado, es necesario conocer el valor de la desviación estándar muestral, la cual es
posible obtenerla a partir de la tabla expuesta en el enunciado.
→ 𝑠(𝑥) = 2,3489
Así, es posible reemplazar en la ecuación (8.3), como se muestra a continuación:
(10 − 1) ∙ [2,3489]2 2
(10 − 1) ∙ [2,3489]2
→ 𝑃( 2 ≤ 𝜎 ≤ 2 ) = 0,99
𝑥(9,0,995) 𝑥(9, 0,005)
(9) ∙ [2,3489]2 (9) ∙ [2,3489]2

→ 𝑃( ≤ 𝜎2 ≤ ) = 0,99
23,589 1,735
→ 𝜎 2 ∈ [2,105 ; 28,620]
Conclusión
Con un 99% de confianza, es posible afirmar que la varianza poblacional de los datos
asociados a la duración en minutos de cierto proceso productivo, fluctúa entre 2,105 y
28,620 [min2]

Unidad 9- Prueba de Hipo tesis para una Poblacio n
PROBLEMA 1.
Se quiere analizar que la tensión de ruptura de un hilo no cumple con el requerimiento de

que sea al menos 100 [psi]. La experiencia ha indicado que la tensión a la ruptura es una
variable aleatoria normal con desviación típica igual a 2 [psi]. Se prueba una muestra de 9
especímenes con los siguientes valores:
120
95 98 99 97 96 94 96 101 97
Tabla 13.Valores de la tensión de ruptura, en una muestra aleatoria de tamaño 9.
¿Qué se concluye con un nivel de significación de 0,05?
SOLUCIÓN
Sea:
X= Tensión de ruptura de un hilo utilizado en la fabricación de material de tapicería, en
psi.
𝑋~𝑁(𝜇, 𝜎 2 = 4)
Datos
m.a.t (9)
𝛼 = 0,05
Dócima
𝐻0 : 𝜇 ≥ 100
𝐻1 : 𝜇 < 100
Estadística
𝑥̅ − 𝜇0
𝑇= 𝜎 (9.1)
⁄ 𝑛
√
A partir de la tabla 1, se puede obtener el valor del promedio de la muestra “𝑥̅ ” .Es posible
determinarla ingresando los valores de la tabla a la calculadora con frecuencia 1 , o bien por
la fórmula del promedio estudiada en estadística descriptiva.

𝑥̅ = 97 [𝑝𝑠𝑖]
Así, reemplazando en la ecuación (9.1), es posible determinar el estadístico de prueba “T”.
97 − 100
𝑇= = −4,5
2⁄
√9
Región Crítica
121
Al no ser una igualdad, se considera sólo la región crítica según la desigualdad de la hipótesis
alternativa [H1]
𝑅𝐶: 𝑇 < −𝑧1−𝛼 (9.2)
Reemplazando en la ecuación (7.2), con ayuda de la tabla de la distribución “Normal” es

posible determinar la región de rechazo.
𝑅𝐶: 𝑇 < −𝑧(0,95) → 𝑇 < −1,645
Conclusión
Es posible observar que el estadístico de prueba “T” pertenece a la región crítica. A partir
de esto es posible rechazar la hipótesis nula. Según lo expuesto anteriormente, se puede
concluir con un nivel de confianza del 95%, que la tensión de ruptura de un hilo utilizado en
la fabricación de material no cumple con el requerimiento de que sea al menos de 100 [psi].

PROBLEMA 2.
En una embotelladora de refresco, el proceso de llenado realizado por una máquina está
fuera de control cuando la desviación estándar de la cantidad de refresco vertida supera
0,02 [u.m]. Para controlar la variabilidad se tomó una muestra aleatoria de 28 botellas
llenadas por la máquina y se obtuvo una desviación estándar s=0,027 [u.m]. ¿Qué se puede
concluir con un 90% de confianza?
SOLUCIÓN
Sea: 122
X= Cantidad de refresco vertida, en [u.m]
𝑋~𝑁(𝜇, 𝜎 2 )
Datos
m.a.t (28)
𝛼 = 0,10
𝑠(𝑥) = 0,027 [𝑢. 𝑚]
Dócima
𝐻0 : 𝜎 2 ≤ 0,022
𝐻1 : 𝜎2 > 0,022
Estadística
(𝑛 − 1) ∗ 𝑠 2
𝑇= (9.3)
𝜎02
(28 − 1) ∗ (0,027)2
𝑇= = 49,208
0,0202

Región Crítica
Al no ser una igualdad, se considera sólo la región crítica según la desigualdad de la hipótesis
alternativa [H1]
2
𝑅𝐶: 𝑇 > 𝑋(𝑛−1;1−𝛼) (9.4)
Reemplazando en la ecuación (9.4) , con ayuda de la tabla de la distribución “Chi-cuadrado”

es posible determinar la región de rechazo. 123
𝑅𝐶: 𝑇 > 𝑋(227; 0,9) → 𝑇 > 36,741
Conclusión
de esto es posible rechazar la hipótesis nula [H0]. Según lo expuesto anteriormente, se
puede concluir con un nivel de confianza del 90%, que si la desviación estándar de la
cantidad de refresco vertida supera 0,02 [u.m], entonces la máquina esta fuera de control.

PROBLEMA 3
Una empresa dedicada a la fabricación de vidrio quiere incluir lunas entre los productos que
fabrican, piensan comercializarlas en la industria de automóvil. Las especificaciones de
estos productos siguen una resistencia media al impacto de 8 [kg/cm2]. Para ello ha
realizado pruebas de fabricación obteniendo los siguientes resultados de resistencia al
impacto:
7,2 4,3 8,7 9,0 6,7 10,2 5,4 7,2 8,3 124
Tabla 14.Resistencia al impacto de una muestra aleatoria de tamaño 9.
Con un nivel de significación de 1%. ¿Se puede afirmar que las lunas fabricadas cumplen
con la especificación requerida?
SOLUCIÓN
Sea:
X= Resistencia al impacto de lunas producidas por una empresa dedicada a la fabricación
𝑘𝑔
de vidrios, en [ ⁄𝑐𝑚2 ]
𝑋~𝑁(𝜇, 𝜎 2 )
Datos
m.a.t (9)
𝛼 = 0,01
Dócima
𝐻0 : µ = 8
𝐻1 : µ ≠ 8
Estadística
𝑥̅ − µ0
𝑇= 𝑠 (9.5)
⁄ 𝑛
√

Los valores de la desviación estándar muestral (s) y del promedio (𝑥̅ ), se pueden determinar
a partir de la tabla 2. Estos valores, se pueden obtener ingresando los valores de las
muestras a la calculadora con frecuencia 1, o bien por la fórmula de varianza muestral y del
promedio respectivamente, las cuales fueron estudiadas en estadística descriptiva.
𝑥̅ = 7,444
𝑠(𝑥) = 1,839
125
7,444 − 8
𝑇= = −0,907
1,839
⁄
√9
Región Crítica
𝑅𝐶: 𝑇 < −𝑡(𝑛−1;1−𝛼) ˅ 𝑇 > 𝑡(𝑛−1;1−𝛼) (9.6)

2 2
Reemplazando en la ecuación (9.6), con ayuda de la tabla de la distribución “t-Student”, es

𝑅𝐶: 𝑇 < −𝑡(8 ; 0,995) ˅ 𝑇 > 𝑡(8 ;0,995) → 𝑇 < −3,3554 ˅ 𝑇 > 3,3554
Conclusión
Es posible observar que el estadístico de prueba “T” no pertenece a la región crítica. A partir
de esto, se puede afirmar que no existe información suficiente para rechazar la hipótesis
nula [H0]. Según lo expuesto anteriormente, se puede concluir con un nivel de confianza del
99%, que la resistencia media al impacto de las lunas corresponde a 8 [kg/cm2], con esto se
puede afirmar que dichos productos si cumplen con las especificaciones requeridas para su
comercialización.

PROBLEMA 4
El tiempo de acceso al disco duro (X) en un cierto modelo de computador es una variable
aleatoria con media 15 [ms]. Se ha propuesto una modificación técnica con objeto de
disminuir este tiempo de acceso. Se prueba el nuevo sistema en 10 computadores
obteniéndose:
∑ 𝑥 = 131 [𝑚𝑠] ∑ 𝑥 2 = 1801 [𝑚𝑠]2

126
¿Hay suficiente evidencia estadística, al nivel de significación 0,05, a favor de la hipótesis de
que el nuevo modelo disminuye el tiempo de acceso?
SOLUCIÓN
Sean:
X= Tiempo de acceso al disco duro en un cierto modelo de computador, sin realizar
modificación, en milisegundos.
𝑥~𝑁(µ = 15, 𝜎 2 )
Y=Tiempo de acceso al disco duro en un cierto modelo de computador, habiendo aplicado

modificación técnica, en milisegundos.
𝑦~𝑁(µ, 𝜎 2 )
Datos
m.a.t (10)
𝛼 = 0,05
Dócima
𝐻0 : µ ≥ 15
𝐻1 : µ < 15

Estadística
𝑦̅ − µ0
𝑇= 𝑠 (9.7)
⁄ 𝑛
√
El valor del promedio y la desviación estándar muestral, es posible obtenerlos según las
fórmulas de estadística descriptiva.
127
∑𝑦
𝑦̅ = = 13,1
𝑛
∑ 𝑦 2 − 𝑛 ∗ 𝑦̅ 2 1801 − 10 ∗ 13,12
𝑉(𝑦) = = = 9,433
𝑛−1 10 − 1
𝑠(𝑦) = √𝑉(𝑦) = 3,071
Así, reemplazando en la ecuación (9.7), es posible determinar el estadístico de prueba “T”
13,1 − 15
𝑇= = −1,956
3,071
⁄
√10
Región Crítica
Se sabe que los formularios están hechos para igualdades. En el planteamiento de la dócima
es posible notar que se está en presencia de una desigualdad. Así se considera en la región
crítica sólo la parte de ella en donde la desigualdad coincide con la de la hipótesis alternativa
[H1]
𝑅𝐶: 𝑇 < 𝑡(𝑛−1; 1−𝛼) (9.8)

Reemplazando en la ecuación (9.8), con ayuda de la tabla de la distribución “t-

Student”, es posible determinar la región de rechazo.
𝑅𝐶: 𝑇 < 𝑡(9;0,95) → 𝑇 < 1,8331
Conclusión
128
de esto, se puede rechazar la hipótesis nula [H0]. Según lo expuesto anteriormente, es
posible concluir con un nivel de confianza del 95%, que el tiempo de acceso al disco duro
disminuye al realizar la modificación técnica, esto en comparación con el tiempo empleado
originalmente.

PROBLEMA 5
Una empresa se plantea la posibilidad de establecer un servicio complementario de
información a sus clientes. Éste será rentable únicamente si más del 40% de los clientes
están interesados. Para poder tomar una decisión se realizó un sondeo con una muestra
aleatoria de 100 clientes, de los cuales 45 están de acuerdo.
¿Existe evidencia suficiente al nivel de significación 4% para apoyar la hipótesis de

rentabilidad?
129
SOLUCIÓN
Sea:
X= Número de clientes interesados en establecer un servicio complementario de
información.
𝑥~𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝑝)
Datos
m.a.t (100)
𝛼 = 0,04
Dócima
𝐻0 : 𝑝 ≤ 0,4
𝐻1 : 𝑝 > 0,4
Estadística
𝑝̂ − 𝑝0
𝑇= (9.9)
√𝑝0 𝑞0⁄𝑛
El valor del estimador 𝑝̂ es posible determinarlo a partir de la muestra aleatoria, donde 45

clientes están de acuerdo.

45
𝑝̂ = = 0,45
100
0,45 − 0,4
𝑇= = 1,021
√0,4 ∗ 0,6⁄ 130
100
Región Crítica
En este caso, es importante recordar que los formularios están hechos para igualdades. En
el planteamiento de la dócima es posible notar que se está en presencia de una desigualdad.
Así se considera en la región crítica sólo la parte de ella en donde la desigualdad coincide
con la de la hipótesis alternativa [H1]
𝑅𝐶: 𝑇 > 𝑧(1−𝛼) (9.10)
Reemplazando en la ecuación (9.10), con ayuda de la tabla de la distribución “Normal”, es

𝑅𝐶: 𝑇 > 𝑧(0,96) → 𝑇 > 1,75
Conclusión
Es posible observar que el estadístico de prueba “T” no pertenece a la región crítica.

A partir de esto, se puede afirmar que no existe información suficiente para rechazar la
hipótesis nula [H0]. Según lo expuesto anteriormente, se puede concluir con un nivel de
confianza del 96%, que no existe evidencia suficiente para apoyar la hipótesis de
rentabilidad.

Unidad 10- Do cimas Bilaterales
PROBLEMA 1
Se revisó la dureza del agua de dos muestras obtenidas a partir de brocas de salida
separadas de una planta de energía. Los resultados codificados (partes por millón) se
presentan a continuación:
Y = Dureza del Agua 131

Ubicación 𝑛𝑖 ∑ 𝑦𝑖 ∑ 𝑦𝑖2
1 9 504 29101
2 14 868 54201
Tabla 15.Datos en base a la dureza del agua provenientes de los lugares 1 y 2.
Pruebe la hipótesis “la varianza de la dureza del agua proveniente del lugar 1 es igual que
la del lugar 2” (𝜎12 = 𝜎22 ). Utilice un nivel de significación 0,05.
SOLUCIÓN
Sea:
Y= Dureza del agua, en partes por millón.
𝑌~𝑁(𝜇, 𝜎 2 )
Datos
𝑛1 = 9
𝑛2 = 14
𝛼 = 0,05
2 muestras aleatorias independientes
Dócima
𝐻0 : 𝜎12 = 𝜎22 → 𝜎12 − 𝜎22 = 0
𝐻1 : 𝜎21 ≠ 𝜎22 → 𝜎21 − 𝜎22 ≠ 0

Estadística
𝑠12
𝑇= (10.1)
𝑠22
A partir de los datos expuestos en la tabla 1, se puede obtener el valor de la desviación

estándar para ambas muestras.
∑ 𝑦𝑖2 − 𝑛 ∗ 𝑦̅ 2 29101 − 9 ∗ 562

𝑉(𝑦1 ) = = = 109,625 132
𝑛−1 9−1
𝑠(𝑦1 ) = √𝑉(𝑦1 ) = 10,470
∑ 𝑦𝑖2 − 𝑛 ∗ 𝑦̅ 2 54201 − 14 ∗ 622

𝑉(𝑦2 ) = = = 29,615
𝑛−1 14 − 1
𝑠(𝑦2 ) = √𝑉(𝑦2 ) = 5,442
10,4702
𝑇= = 3,701
5,4422
Región Crítica
𝑅𝐶: 𝑇 < 𝐹(𝑛 𝛼 ˅ 𝑇 > 𝐹(𝑛 𝛼 (10.2)

1 −1,𝑛2 −1; 2
) 1 −1,𝑛2 −1;1− 2
)
Reemplazando en la ecuación (10.2), con ayuda de la tabla de la distribución “F”, es posible

determinar la región de rechazo.
𝑅𝐶: 𝑇 < 𝐹(8,13; 0,025) ˅ 𝑇 > 𝐹(8,13; 0,975)
El valor de 𝐹(8,13; 0,025) no es posible determinarlo directamente de la tabla, es por esto

que se trabaja de la siguiente forma:
1
𝐹(8,13; 0,025) = = 0,2403
𝐹(13,8,0,975)

Así, la región de rechazo de la prueba de hipótesis está dada por:
𝑅𝐶: 𝑇 < 0,2403 ˅ 𝑇 > 3,38
Conclusión
de esto es posible rechazar la hipótesis nula. Según lo expuesto anteriormente, se puede
concluir con un nivel de significación 0,05, que la hipótesis “la varianza de la dureza del agua
proveniente del lugar 1 es igual que la del lugar 2” es incierta. 133

PROBLEMA 2
Se midió la resistencia a la tensión en dos tipos de varillas (10 [mm] y 12 [mm] de diámetro).
Los resultados de 50 mediciones, para cada tamaño son:
Y = Resistencia a la Tensión [𝑵⁄ ]

𝒎𝒎𝟐
Varilla n ∑ 𝑦𝑖 ∑ 𝑦𝑖2
10 [mm] de
50 27250,0 14879474,0
diámetro (1) 134
12 [mm] de
50 27750,0 15420850,0
diámetro (2)
Tabla 16. Datos de la resistencia a la tensión en 2 varillas.
Se afirma que las mediciones de resistencia a la tensión de las varillas de 12 [mm] de

diámetro debería, en promedio, ser 8 unidades [𝑁⁄𝑚𝑚2] mayores que las correspondientes
a las varillas de 10 [mm] de diámetro. Suponiendo normalidad en la distribución de los
datos. Analice la afirmación con un 95% de confianza.
SOLUCIÓN
Sea:
Y= Resistencia a la tensión, en [N/mm2]
𝑌~𝑁(𝜇, 𝜎 2 )
Datos
𝑛1 = 50
𝑛2 = 50
𝛼 = 0,05
Dócima
𝐻0 : 𝜇1 + 8 = 𝜇2 → 𝜇1 − 𝜇2 = − 8
𝐻1 : 𝜇1 + 8 ≠ 𝜇2 → 𝜇1 − 𝜇2 ≠ − 8
Según el enunciado dado, no se sabe si las varianzas poblacionales son iguales o distintas,
es por esto que es necesario analizar homocedasticidad. Este análisis se realiza según la
siguiente prueba de hipótesis:

Dócima previa
𝐻0 : 𝜎12 = 𝜎22 → 𝜎12 − 𝜎22 = 0

𝐻1 : 𝜎21 ≠ 𝜎22 → 𝜎21 − 𝜎22 ≠ 0
Estadística previa
𝑠12 135
𝑇= (10.3)
𝑠22
A partir de la tabla 2, es posible determinar las desviaciones de ambas muestras.
∑ 𝑦𝑖2 − 𝑛 ∗ 𝑦̅ 2 14879474,0 − 50 ∗ 545,02

𝑉(𝑦1 ) = = = 576
𝑛−1 50 − 1
𝑠(𝑦1 ) = √𝑉(𝑦1 ) = 24
∑ 𝑦𝑖2 − 𝑛 ∗ 𝑦̅ 2 15420850,0 − 50 ∗ 555,02

𝑉(𝑦2 ) = = = 400
𝑛−1 50 − 1
𝑠(𝑦2 ) = √𝑉(𝑦2 ) = 20
242
𝑇= = 1,44
202
Región Crítica previa
𝑅𝐶: 𝑇 < 𝐹(𝑛 𝛼 ˅ 𝑇 > 𝐹(𝑛 𝛼 (10.4)

1 −1,𝑛2 −1; 2
) 1 −1,𝑛2 −1;1− 2
)


𝑅𝐶: 𝑇 < 𝐹(49,49; 0,025) ˅ 𝑇 > 𝐹(49,49; 0,975) → 𝑇 < 0,568 ˅ 𝑇 > 1,762
Conclusión previa
Con un 95% de confianza, se puede afirmar que no existe información suficiente para
rechazar la hipótesis nula. A partir de esto es factible inferir que las varianzas poblacionales
son iguales. 136
Ahora se sabe que ambas varianzas poblacionales son iguales y desconocidas, a partir de
esto es posible realizar el test de hipótesis.
Estadística
𝑦̅1 − 𝑦̅2 − 𝜇0
𝑇= (10.5)
𝑠𝑝 √1⁄𝑛1 + 1⁄𝑛2
Con
(𝑛1 − 1)𝑠12 + (𝑛2 − 1)𝑠22
𝑠𝑝 = √ (10.6)
𝑛1 + 𝑛2 − 2
A partir de las fórmulas estadísticas (10.5) y (10.6); se obtiene:
𝑠𝑝 = 22,091
545 − 555 + 8
𝑇= = −0,453
22,091√1⁄50 + 1⁄50
Región Crítica
𝑅𝐶: 𝑇 < −𝑡(𝑛 𝛼 ˅ 𝑇 > 𝑡(𝑛 𝛼 (10.7)

𝑝 ;1− 2 ) 𝑝 ;1− 2 )
Con
𝑛𝑝 = 𝑛1 + 𝑛2 − 2 → 𝑛𝑝 = 98

Reemplazando en la ecuación (10.7), con ayuda de la tabla de la distribución “t-Student” es

𝑅𝐶: 𝑇 < −𝑡(98;0,975) ˅ 𝑇 > 𝑡(98;0,975) → 𝑇 < −1,9845 ˅ 𝑇 > 1,9845
Conclusión
de esto es posible “aceptar” la hipótesis nula [H0]. Según lo expuesto anteriormente, se 137
puede concluir con un nivel de confianza del 95%, que las mediciones de resistencia a la
tensión de varillas de 12 [mm] de diámetro, son en promedio 8 unidades mayores que las
correspondientes a las varillas de 10 [mm] de diámetro.

PROBLEMA 3
Los datos que se muestran a continuación son los grados de dureza de Brinell obtenidos
para muestras de dos aleaciones de magnesio:
Aleación 1 64,8 63,7 63,6 64,8 65,8 63,7 65,1 64,9 63,7 65,5
Aleación 2 69,4 61,9 69,9 70,1 71,1 73,5 63,3 68,2 69,7 66,8
Tabla 17.Grados de dureza de Brinell para muestras de dos aleaciones de Magnesio.
138
Los datos muestrales, ¿Apoyan la hipótesis 𝜇1 < 𝜇2 ? Utilice 𝛼 = 0,05
SOLUCIÓN
Sea:
X= Grados de dureza de Brinell
𝑋~𝑁(𝜇, 𝜎 2 )
Datos
𝑛1 = 10
𝑛2 = 10
𝛼 = 0,05
Dócima
𝐻0 : 𝜇1 ≥ 𝜇2 → 𝜇1 − 𝜇2 ≥ 0
𝐻1 : 𝜇1 < 𝜇2 → 𝜇1 − 𝜇2 < 0
Al igual que en problema anterior, no se sabe si las varianzas poblacionales son iguales o
distintas, es por esto que es necesario analizar homocedasticidad. Este análisis se realiza
según la siguiente prueba de hipótesis:
Dócima previa
𝐻0 : 𝜎12 = 𝜎22 → 𝜎12 − 𝜎22 = 0

𝐻1 : 𝜎21 ≠ 𝜎22 → 𝜎21 − 𝜎22 ≠ 0

Estadística previa
𝑠12
𝑇= (10.8)
𝑠22
A partir de la tabla 3, es posible determinar las desviaciones de ambas muestras.
𝑠(𝑥1 ) = 0,822
𝑠(𝑥2 ) = 3,527
139
0,8222
𝑇= = 0,0543
3,5272
𝑅𝐶: 𝑇 < 𝐹(𝑛 𝛼 ˅ 𝑇 > 𝐹(𝑛 𝛼 (10.9)

1 −1,𝑛2 −1; 2
) 1 −1,𝑛2 −1;1− 2
)

𝑅𝐶: 𝑇 < 𝐹(9,9; 0,025) ˅ 𝑇 > 𝐹(9,9; 0,975) → 𝑇 < 0,2484 ˅ 𝑇 > 4,0260
Conclusión previa
Con un 95% de confianza, es posible rechazar la hipótesis nula. A partir de esto se es factible
inferir que las varianzas poblacionales son distintas.
Ahora se sabe que ambas varianzas poblacionales son distintas y desconocidas, a partir de
esto es posible resolver el problema de Behrens-Fisher.
Estadística
𝑥̅1 − 𝑥̅2
𝑇= (10.10)
2 2
√𝑠1 ⁄𝑛 + 𝑠2⁄𝑛
1 2

Reemplazando los parámetros estadísticos en la ecuación (10.10), es posible determinar el

estadístico de prueba.
64,56 − 68,39
𝑇= = −3,344
2 2
√0,822 ⁄ + 3,527 ⁄
10 10
Región Crítica
140
𝑅𝐶: 𝑇 < −𝑡(𝑣;1−𝛼) (10.11)
2
Con
𝑠2 𝑠2
( 1 ⁄𝑛1 + 2⁄𝑛2 )2
𝑣= 2 → 𝑣 = 9,9748 ≈ 9
𝑠 𝑠2
( 1 ⁄𝑛1 )2⁄ ( 2⁄𝑛2 )2⁄
(𝑛1 − 1) + (𝑛2 − 1)
Reemplazando en la ecuación 11, con ayuda de la tabla de la distribución “t-Student” es

𝑅𝐶: 𝑇 < −𝑡(9;0,975) → 𝑇 < −2,2622
Conclusión
de esto es posible rechazar la hipótesis nula [H0]. Según lo expuesto anteriormente, se
puede concluir con un nivel de confianza del 95%, que los datos muestrales obtenidos
apoyan la hipótesis 𝜇1 < 𝜇2

PROBLEMA 4
Se quiere comparar la eficiencia en la solución de problemas de dos equipos de trabajo en

el área de control de calidad. Para ello se tomó una muestra aleatoria de 10 problemas
diferentes y se les pidió la solución a ambos grupos. Los tiempos de solución en minutos
que necesitó cada equipo aparecen a continuación:
Problema 01 02 03 04 05 06 07 08 09 10
Equipo 1 12 15 14 21 19 12 25 18 17 20 141
Equipo 2 25 26 21 23 31 19 35 28 27 26
Tabla 18. Tiempos de solución de probemas de los equipos 1 y 2.
Pruebe con 𝛼 = 0,10, que el tiempo medio para solucionar problemas es el mismo en
ambos equipos.
SOLUCIÓN
Sea:
X= Tiempos de solución que tarda un equipo en resolver problemas diferentes, en minutos.
𝑥~𝑁(µ, 𝜎 2 )
Datos
𝑛 = 10
𝛼 = 0,10
2 muestras aleatorias pareadas
Observación
Es posible identificar que son muestras pareadas, debido a que se realizan distintas
observaciones al mismo individuo. Para efectos del problema, se tienen distintos equipos
que resuelven los mismos tipos de problemas estipulados.
Dócima
𝐻0 : 𝜇1 = 𝜇2 → 𝜇1 − 𝜇2 = 0
𝐻1 : 𝜇1 ≠ 𝜇2 → 𝜇1 − 𝜇2 ≠ 0

Estadística
𝑥
̅̅̅1 − ̅̅̅
𝑥2
𝑇= 𝑠 (10.12)
𝑑
⁄
√𝑛
Para el cálculo del parámetro 𝑠𝑑 es recomendable realizar las diferencias entre los tiempos
del equipo 1 y 2 para cada problema. Posteriormente se plantea ingresar dichos valores a
la calculadora con frecuencia 1. Finalmente es posible obtener la desviación típica muestral
utilizando la misma metodología aprendida en “estadística descriptiva” 142
Así, reemplazando en la ecuación (10.12) los parámetros obtenidos, es posible determinar

el estadístico de prueba “T”
17,3 − 26,1
𝑇= = −8,451
3,293
⁄
√10
Región Crítica
𝑅𝐶: 𝑇 < −𝑡(𝑛−1;1−𝛼) ˅ 𝑇 > 𝑡(𝑛−1;1−𝛼) (10.13)

2 2
Reemplazando en la ecuación (10.13), con ayuda de la tabla de la distribución “t-Student”,

es posible determinar la región de rechazo.
𝑅𝐶: 𝑇 < −𝑡(9;0,95) ˅ 𝑇 > 𝑡(9;0,95) → 𝑇 < −1,8331 ˅ 𝑇 > 1,8331
Conclusión
de esto, se puede rechazar la hipótesis nula [H0]. Según lo expuesto anteriormente, es
posible concluir con un nivel de confianza del 90%, que el tiempo medio para solucionar
problemas no es el mismo en ambos equipos.

PROBLEMA 5
El Ministerio del Trabajo desea saber si un plan de seguridad en el trabajo es efectivo en la
reducción del número de accidentes laborales y, por tanto, en la pérdida de horas de trabajo
debido a accidentes. Para ello, hace un seguimiento en 12 fábricas (seleccionadas
aleatoriamente) observando las horas de trabajo semanales pérdidas a causa de accidentes.
Para ello, hace un seguimiento en 12 fábricas (seleccionadas aleatoriamente) observando
las horas de trabajo semanales perdidas a causa de accidentes, antes y después de
implantar el plan de seguridad. Los datos son los de la tabla siguiente:
143
Fábrica 1 2 3 4 5 6 7 8 9 10 11 12
Antes (1) 55 63 90 47 75 90 73 92 110 33 44 74
Después (2) 52 60 85 49 65 87 67 85 95 35 47 70
Tabla 19.Horas pérdidas de trabajo debido a accidentes, antes y después de implementar plan de seguridad.
Con un nivel de significación de 0,05. Analizar estos datos a través de un test de

hipótesis y obtener conclusiones acerca del problema planteado.
SOLUCIÓN
Sea:
X= Tiempo perdido de trabajo semanalmente debido a accidentes, en horas.
𝑋~𝑁(µ, 𝜎 2 )
Datos
𝑛 = 12
𝛼 = 0,05
Observación
observaciones al mismo individuo. En esta ocasión particular, se tienen estudios antes y
después de implementar el plan de seguridad, aplicados dentro de las mismas fábricas.

Dócima
𝐻0 : 𝜇1 ≤ 𝜇2 → 𝜇1 − 𝜇2 ≤ 0
𝐻1 : 𝜇1 > 𝜇2 → 𝜇1 − 𝜇2 > 0
Estadística
𝑥
̅̅̅1 − ̅̅̅
𝑥2 144
𝑇= 𝑠 (10.14)
𝑑
⁄
√𝑛
Reemplazando en la ecuación (10.14) los parámetros calculados, es posible determinar el

estadístico de prueba “T”
70,500 − 66,417
𝑇= = 2,732
5,178
⁄
√12
Región Crítica
𝑅𝐶: 𝑇 > 𝑡(𝑛−1;1−𝛼) (10.15)

𝑅𝐶: 𝑇 > 𝑡(11;0,95) → 𝑇 > 1,7959
Conclusión
Es posible observar que el estadístico de prueba “T” pertenece a la región crítica. A

partir de esto, se puede rechazar la hipótesis nula [H0]. Según lo expuesto anteriormente,
es posible concluir con un nivel de confianza del 95%, que con la implementación del plan
de seguridad, se han logrado disminuir los tiempos medios de trabajo perdidos debido a
accidentes laborales.

PROBLEMA 6
Dos pegamentos, I y II, pueden utilizarse para fabricar vigas laminadas. De 80 vigas
fabricadas por el pegamento I, 8 fallaron en una prueba de resistencia, mientras que 16 de
las 80 vigas hechas con el pegamento II fallaron en la misma prueba. ¿Se puede concluir con
un nivel de significación de 0,05 que el pegamento I es mejor que el II?
SOLUCIÓN
Sea: 145
X= Número de vigas fabricadas que fallan en una prueba de resistencia, en una muestra de
tamaño 80.
𝑥~𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝑝)
Datos
m.a.t (80)
𝛼 = 0,05
Dócima
𝐻0 : 𝑝1 ≥ 𝑝2 → 𝑝1 − 𝑝2 ≥ 0
𝐻1 : 𝑝1 < 𝑝2 → 𝑝1 − 𝑝2 < 0
Estadística
𝑝̂1 − 𝑝̂ 2
𝑇= (10.16)
𝑝̂ ∗ 𝑞̂ 𝑝̂ ∗ 𝑞̂
√ 1 1+ 2 2
𝑛1 𝑛2
El valor del estimador 𝑝̂1 es posible determinarlo a partir de la muestra aleatoria, donde 8
vigas fallan.
8
𝑝̂1 = = 0,1
80

Análogamente, el valor del estimador 𝑝̂ 2 es posible determinarlo a partir de la muestra

aleatoria, donde se plantea que 16 vigas fallan.
16
𝑝̂2 = = 0,2
80
Así, reemplazando en la ecuación (10.16), es posible determinar el estadístico de prueba
“T”.
146
0,1 − 0,2
𝑇= = −1,789
√0,1 ∗ 0,9 + 0,2 ∗ 0,8
80 80
Región Crítica
𝑅𝐶: 𝑇 < −𝑍1−𝛼 (10.17)
Reemplazando en la ecuación (10.17), con ayuda de la tabla de la distribución “Normal”,

𝑅𝐶: 𝑇 < −𝑧(0,95) → 𝑇 < −1,645
Conclusión
de esto, es posible rechazar la hipótesis nula [H0]. Según lo expuesto anteriormente, se
puede concluir con un nivel de confianza del 95%, que el pegamento I es “mejor” que el II.
Lo anterior, en base a un estudio realizado en muestras de vigas a las que se les midió la
resistencia a la tracción.

PROBLEMA 7
De acuerdo con los datos del Departamento de Evaluación, Medición y Registro Educacional
DEMRE, se efectúa un estudio de los puntajes obtenidos en la PSU de Matemática, de los
alumnos que la han rendido por segunda vez, a fin de analizar si se produce una mejoría de
más de 50 puntos en los puntajes promedios. Para tales efectos, se selecciona una muestra
aleatoria de doce alumnos que han rendido dicha prueba en forma consecutiva en los dos
últimos años y los resultados obtenidos fueron los siguientes:
Alumno 1 2 3 4 5 6 7 8 9 10 11 12
147
PSU 2012 450 650 600 550 520 590 440 400 540 380 650 450
PSU 2013 507 697 662 623 592 667 478 458 611 429 703 493
Suponiendo validos los supuestos necesarios, ¿Qué concluiría usted, con nivel de
significación del 10%?
SOLUCIÓN
Sea:
X= Puntajes de PSU obtenidos por alumnos en el área de Matemáticas.
𝑥~𝑁(µ, 𝜎 2 )
Datos
𝑛 = 12
𝛼 = 0,1
Observación
observaciones al mismo individuo. Para efectos de este problema en particular, se tienen
pruebas de selección universitarias de distintos años rendidas por los mismos alumnos.
Dócima
𝐻0 : 𝜇1 + 50 ≥ 𝜇2 → 𝜇1 − 𝜇2 ≥ −50
𝐻1 : 𝜇1 + 50 < 𝜇2 → 𝜇1 − 𝜇2 < −50

Estadística
𝑥1 − 𝑥
̅̅̅ ̅̅̅2 − µ0
𝑇= 𝑠𝑑 (10.18)
⁄
√𝑛
Reemplazando en la ecuación (10.18) los parámetros calculados, es posible determinar el

estadístico de prueba “T”
148
518,333 − 576,667 + 50
𝑇= = −2,245
12,858
⁄
√12
Región Crítica
𝑅𝐶: 𝑇 < −𝑡(𝑛−1;1−𝛼) (10.19)

𝑅𝐶: 𝑇 < 𝑡(11;0,9) → 𝑇 < −1,3634
Conclusión
de esto, se puede rechazar la hipótesis nula [H0]. A partir de lo descrito anteriormente, es
posible inferir con un nivel de confianza del 90%, que el rendimiento de los alumnos que
dan la PSU de Matemáticas por segunda vez consecutiva, aumenta en promedio más de 50
puntos en el año 2013. Lo anterior, comparando dichos puntajes con los del año 2012.

PROBLEMA 8
Un ingeniero recolectó información acerca del tiempo de trabajo, en horas, requerido por
dos máquinas (A y B) para fabricar silenciadores para automóvil. Al tomar una muestra de
30 silenciadores fabricados por la máquina A, se obtuvo:
X: Tiempo que emplea la

máquina B en fabricar un
silenciador, en horas
𝟐𝟎 149
∑ 𝒙𝒊 = 𝟓𝟎, 𝟖
𝒊=𝟏
𝟐𝟎
∑ 𝒙𝟐𝒊 = 𝟏𝟒𝟏, 𝟓𝟕𝟐

𝒊=𝟏
Tabla 20.Datos obtenidos de los tiempos empleados por la máquina B en fabricar un silenciador.
Máquina A
Tiempo Número de Silenciadores
O,48-1,18 4
1,18-1,88 8
1,88-2,58 9
2,58-3,28 6
3,28-3,98 3
Tabla 21. Frecuencia absoluta según tiempo de fabricación de silenciadores.
El ingeniero cree que el tiempo promedio empleado por la máquina A en fabricar los
silenciadores es menor que el tiempo promedio empleado por la máquina B. ¿Con un nivel
de significación del 5%, estaría usted de acuerdo?

SOLUCIÓN
Sean:
X= Tiempo que emplea la máquina B en fabricar un silenciador, en horas.
𝑋~𝑁𝑜𝑟𝑚𝑎𝑙(µ𝑥 ; 𝜎𝑥2 )
Y= Tiempo que emplea la máquina A en fabricar un silenciador, en horas.

150
𝑌~𝑁𝑜𝑟𝑚𝑎𝑙(µ𝑦 ; 𝜎𝑦2 )
Datos
𝑛1 = 20
𝑛2 = 30
𝛼 = 0,05
Dócima
𝐻0 : 𝜇𝑥 ≤ 𝜇𝑦 → 𝜇𝑥 − 𝜇𝑦 ≤ 0
𝐻1 : 𝜇𝑥 > 𝜇𝑦 → 𝜇𝑥 − 𝜇𝑦 > 0
Según el enunciado dado, no se sabe si las varianzas poblacionales son iguales o distintas,
es por esto que es necesario analizar homocedasticidad. Este análisis se realiza según la
siguiente prueba de hipótesis:
Dócima previa
𝐻0 : 𝜎𝑥2 = 𝜎𝑦2 → 𝜎𝑥2 − 𝜎𝑦2 = 0

𝐻1 : 𝜎2𝑥 ≠ 𝜎2𝑦 → 𝜎2𝑥 − 𝜎2𝑦 ≠ 0
Estadística previa
𝑠𝑥2
𝑇 = 2 (10.20)
𝑠𝑦

A partir de la tabla 6, es posible determinar la desviación estándar de la muestra

representativa correspondiente a la máquina B.
∑ 𝑥𝑖2 − 𝑛 ∗ 𝑥̅ 2 141,572 − 20 ∗ 2,542

𝑉(𝑥) = = = 0,66
𝑛−1 20 − 1
𝑠(𝑥) = √𝑉(𝑥) = 0,812
Por otro lado, a partir de la tabla 7, es posible obtener la desviación estándar 151
correspondiente a los datos de la máquina A.
𝑠(𝑦) = 0,837 → 𝑉(𝑦) = 0,701

“T”.
0,660
𝑇= = 0,942
0,701
𝑅𝐶: 𝑇 < 𝐹(𝑛 𝛼 ˅ 𝑇 > 𝐹(𝑛 𝛼 (10.21)

1 −1,𝑛2 −1; 2
) 1 −1,𝑛2 −1;1− 2
)

𝑅𝐶: 𝑇 < 𝐹(19,29; 0,025) ˅ 𝑇 > 𝐹(19,29; 0,975) → 𝑇 < 0,418 ˅ 𝑇 > 2,2131
Conclusión previa
Con un 95% de confianza, se puede afirmar que no existe información suficiente para
rechazar la hipótesis nula. A partir de esto es factible inferir que las varianzas poblacionales
son iguales.

Ahora se sabe que ambas varianzas poblacionales son iguales y desconocidas, a partir de
esto es posible realizar el test de hipótesis.
Estadística
𝑥−𝑦
𝑇= (10.22)
𝑠𝑝 √1⁄𝑛1 + 1⁄𝑛2
152
Con
(𝑛1 − 1)𝑠𝑥2 + (𝑛2 − 1)𝑠𝑦2
𝑠𝑝 = √ (10.23)
𝑛1 + 𝑛2 − 2
𝑠𝑝 = 0,828
2,540 − 2,137
𝑇= = 1,686
0,828√1⁄20 + 1⁄30
Región Crítica
𝑅𝐶: 𝑇 > 𝑡(𝑛𝑝 ;1−𝛼) (10.24)
Con
𝑛𝑝 = 𝑛1 + 𝑛2 − 2 → 𝑛𝑝 = 48
Reemplazando en la ecuación (10.24), con ayuda de la tabla de la distribución “t-Student”

𝑅𝐶: 𝑇 > 𝑡(48;0,95) → 𝑇 > 1,6772
Conclusión
de esto, es factible rechazar la hipótesis nula [H0]. Así, con un 95% de confianza, se decide
apoyar lo que plantea el ingeniero.

PROBLEMA 9
Muchos autores afirman que las mujeres fumadoras tienen un mayor nivel de neurosis que
las no fumadoras. La siguiente información presenta los puntajes (Y) obtenidos por grupos
de mujeres (seleccionadas aleatoriamente) de edad entre 35 y 50 años fumadoras y no
fumadoras en una prueba diseñada para medir el nivel de neurosis.
Fumadoras (1) 24 36 18 34 28 18 25 32 36 37
No fumadoras (2) 13 16 17 19 27 22 28 20 13 18
Tabla 22.Resultados de puntajes obtenidos por mujeres fumadoras y no fumadoras.
153
¿Se puede inferir con 𝛼 = 0,05, que la diferencia media de puntaje es por más de 3 puntos?
Observación: Mayor puntaje implica mayor nivel de neurosis.
SOLUCIÓN
Sea:
Y= Puntajes obtenidos por grupo de mujeres de edad entre 35 y 50 años, en una prueba
que mide el nivel de neurosis.
𝑌~𝑁𝑜𝑟𝑚𝑎𝑙(µ𝑦 ; 𝜎𝑦2 )
Datos
𝑛1 = 10
𝑛2 = 10
𝛼 = 0,05
Dócima
𝐻0 : 𝜇1 ≤ 𝜇2 + 3 → 𝜇1 − 𝜇2 ≤ 3
𝐻1 : 𝜇1 > 𝜇2 + 3 → 𝜇1 − 𝜇2 > 3
No se sabe si las varianzas poblacionales son iguales o distintas, es por esto que es necesario
analizar homocedasticidad. Este análisis se realiza según la siguiente prueba de hipótesis:

Dócima previa
𝐻0 : 𝜎12 = 𝜎22 → 𝜎12 − 𝜎22 = 0

𝐻1 : 𝜎21 ≠ 𝜎22 → 𝜎21 − 𝜎22 ≠ 0
Estadística previa
𝑠12 154
𝑇= (10.25)
𝑠22

“T”.
7,3002
𝑇= = 1,998
5,1652
𝑅𝐶: 𝑇 < 𝐹(𝑛 𝛼 ˅ 𝑇 > 𝐹(𝑛 𝛼 (10.26)

1 −1,𝑛2 −1; 2
) 1 −1,𝑛2 −1;1− 2
)

𝑅𝐶: 𝑇 < 𝐹(9,9; 0,025) ˅ 𝑇 > 𝐹(9,9; 0,975) → 𝑇 < 0,2484 ˅ 𝑇 > 4,0260
Conclusión previa
Con un 95% de confianza, es posible plantear que no existe información suficiente para
rechazar la hipótesis nula. Con esto, para efectos de este estudio, es factible inferir que las
varianzas poblacionales son iguales.
Ahora se sabe que ambas varianzas poblacionales son iguales y desconocidas.

Estadística
𝑦1 − 𝑦2 − µ0
𝑇= (10.27)
𝑠𝑝 √1⁄𝑛1 + 1⁄𝑛2
Con
(𝑛1 − 1)𝑠𝑥2 + (𝑛2 − 1)𝑠𝑦2 155
𝑠𝑝 = √ (10.28)
𝑛1 + 𝑛2 − 2
𝑠𝑝 = 6,323
28,800 − 19,300 − 3
𝑇= = 2,299
6,323√1⁄10 + 1⁄10
Región Crítica
𝑅𝐶: 𝑇 > 𝑡(𝑛𝑝 ;1−𝛼) (10.29)
Con
𝑛𝑝 = 𝑛1 + 𝑛2 − 2 → 𝑛𝑝 = 18
Reemplazando en la ecuación (10.28), con ayuda de la tabla de la distribución “t-Student”

𝑅𝐶: 𝑇 > 𝑡(18;0,95) → 𝑇 > 1,7341
Conclusión
de esto, es factible rechazar la hipótesis nula [H0]. Así, con un 95% y asumiendo que la
hipótesis previa planteada por “muchos autores” es cierta; es posible afirmar que la
diferencia media de puntajes entre fumadoras y no fumadoras corresponde a más de 3
puntos.

PROBLEMA 10
Se anuncia que una nueva dieta reducirá en dos semanas el peso de una persona en más de
2,5 [kg]. El “peso” de 7 personas antes y después de someterse a dicha dieta es:
Antes (1) 58,5 63,0 61,7 68,8 64,0 62,6 56,7

Después (2) 60,0 54,9 58,1 62,1 58,5 59,5 54,4
Tabla 23.”Peso” de 7 personas antes y después de someterse a nueva dieta en [kg]
¿Qué se puede concluir con 𝛼 = 0,025?

156
SOLUCIÓN
Sean:
𝑋1= “Peso” de ciertas personas antes de someterse a la dieta estipulada, en kg.
𝑋1 ~𝑁(µ, 𝜎 2 )
𝑋2= “Peso” de ciertas personas antes de someterse a la dieta estipulada, en kg.
𝑋2 ~𝑁(µ, 𝜎 2 )
Datos
𝑛=7
𝛼 = 0,025
Observación
Es posible identificar que son muestras pareadas, debido a que se realizan distintos estudios
referentes al “peso”, realizados sobre los mismos individuos antes y después de someterse
a cierta dieta.
Dócima
𝐻0 : 𝜇1 ≤ 𝜇2 + 2,5 → 𝜇1 − 𝜇2 ≤ 2,5
𝐻1 : 𝜇1 > 𝜇2 + 2,5 → 𝜇1 − 𝜇2 > 2,5

Estadística
𝑥1 − 𝑥
̅̅̅ ̅̅̅2 − µ0
𝑇= 𝑠𝑑 (10.30)
⁄
√𝑛
Reemplazando en la ecuación (10.30) los parámetros calculados, es posible

determinar el estadístico de prueba “T”
157
62,186 − 58,214 − 2,5
𝑇= = 1,227
3,174
⁄
√7
Región Crítica
𝑅𝐶: 𝑇 > 𝑡(𝑛−1;1−𝛼) (10.31)

𝑅𝐶: 𝑇 > 𝑡(6;0,975) → 𝑇 > 2,4469
Conclusión
de esto, se puede denotar que no existe información suficiente para rechazar la hipótesis
nula [H0]. Según lo expuesto anteriormente, es concluyente inferir con un nivel de confianza
del 97,5%, que la información proporcionada no permite afirmar con certeza que la nueva
dieta reducirá el peso de una persona en más de 2,5 [kg]

Unidad 11- Bondad de Ajuste
PROBLEMA 1
Una racha de lluvias es un período de días consecutivos de lluvia donde el día
inmediatamente anterior a la racha es seco y el día inmediatamente posterior también es
seco. Es importante el estudio de las rachas de lluvia para la planificación vial, estudios de
la calidad de aire, entre otros. La tabla siguiente presenta la distribución de las rachas, según
Nº de días con lluvia hasta que llega el último día de lluvia en la racha. 158
X N° de Rachas
1 194
2 101
3 66
4 30
5 y más 26
Total 417
Tabla 24. Número de Rachas según números de días con lluvia hasta que llega el último día de lluvia.
Si la distribución de probabilidades de X: “Número de días con lluvia hasta que llega el

último día de lluvia en la racha” se modela mediante una Distribución de Probabilidad
Geométrica, con parámetro P.
a) A partir de una muestra aleatoria de tamaño n de X, determine el E.M.V para P,

desconocido.
b) Pruebe, con 5% nivel de significación, que los datos de la muestra provienen de una
Distribución de Probabilidad Geométrica, con parámetro conocido P=0,45.
SOLUCIÓN 1-A
Datos
m. a. t (n)
Si 𝑋~𝐺𝑒𝑜(𝑝), entonces 𝑝(𝑥) = 𝑝 · 𝑞 𝑥−1

Función de Verosimilitud
𝑛
𝐿(𝑥, 𝑝) = ∏ 𝑝 · (1 − 𝑝)𝑥𝑖 −1 = 𝑝𝑛 · (1 − 𝑝)∑ 𝑥𝑖 −𝑛

𝑖=1
Estimación Máximo Verosímil
Aplicando logaritmo natural a la función de verosimilitud, la expresión queda dada por:

ln 𝐿(𝑥, 𝑝) = 𝑛 · ln 𝑝 + (∑𝑥𝑖 − 𝑛) · ln(1 − 𝑝) 159
Derivando parcialmente con respecto al parámetro "𝑝" e igualando a cero, se obtiene:
𝜕 𝑙𝑛𝐿(𝑥, 𝑝) 𝑛 1
= − (∑𝑥𝑖 − 𝑛)
𝜕𝑝 𝑝 1−𝑝
𝑛 1
− (∑𝑥𝑖 − 𝑛) = 0
𝑝̂ 1 − 𝑝̂
Finalmente, se despeja el estimador:
1
𝑛 − 𝑝 · ∑𝑥𝑖 = 0 → 𝑝̂ =
𝑥
SOLUCIÓN 1-B
Datos
α = 0,05
Dócima
𝐻0 : 𝑋 ~𝐺𝑒𝑜 (𝑝 = 0,45)
𝐻1 : 𝑋 ≁ 𝐺𝑒𝑜 (𝑝 = 0,45)

Estadística
Para realizar el ejercicio de forma ordenada y óptima, se recomienda realizar tabla resumen
con los siguientes parámetros a considerar:
𝑿 𝑶𝒊 𝒑(𝒙) 𝒆𝒊
1 194 0,45 187,6500
2 101 0,2475 103,2075
3 66 0,1361 56,7537
4 30 0,0749 31,2333 160
5 y más 26 0,0915 38,1555
Tabla 25. Tabla Estadística de Bondad de Ajuste.
Dónde:
𝑂𝑖 = Frecuencia Observada. En este caso equivale al número de rachas para cada valor de la
variable.
𝑝(𝑥)= Probabilidad. Esta se calcula con la ecuación (11.1), que corresponde al modelo de
distribución geométrica.
𝑒𝑖 = Frecuencia Esperada. Esta se calcula según la ecuación (11.2).
𝑝(𝑥) = 𝑝 · 𝑞 𝑥−1 (11.1)
𝑒𝑖 = 𝑛 · 𝑝(𝑥) (11.2)
Es importante mencionar que para efectos de este curso, se estipulará un valor mínimo de
𝑒𝑖 igual a 5. Es decir, el test de hipótesis se llevará a cabo solo cuando se cumpla 𝑒𝑖 ≥ 5 para
cada valor de la variable (en discretas) o para cada intervalo (en contínuas). En caso de que
lo anterior no se cumpla, se deberá proceder a reagrupar los intervalos o valores de la
variable.
Por otro lado, es importante SIEMPRE VERIFICAR que dentro de la tabla estadística se
encuentre considerado todo el recorrido de la variable. Para efectos de este ejercicio, es
posible observar en la tabla que esto se cumple, debido a que 𝑅𝑒𝑐(𝑋) = 1 , 2 ,3, …
Por último, es posible denotar que en el cálculo de probabilidades [p(x)], el último valor de
la variable o intervalo de clase NO se calcula. Es decir, se ajusta con el fin de que la suma
total de probabilidades sea exactamente 1.

Estadístico de Prueba
Una vez realizada la tabla estadística, se procede a calcular el estadístico de prueba Chi
2
Cuadrado Observado (𝑥𝑜𝑏𝑠 ). Este se obtiene a partir de la ecuación (11.3)
2
∑(𝑂𝑖 − 𝑒𝑖 )2
𝑥𝑜𝑏𝑠 = (11.3)
𝑒𝑖
Así, se obtiene:
2
𝑥𝑜𝑏𝑠 = 5,6897 161
Punto Crítico
En este tipo de dócimas, es necesario determinar un punto crítico, el cual es posible

2
encontrarlo con la tabla “Chi Cuadrado”. Este punto está dado por 𝑥(1−𝛼 ,𝑣)
Dónde:
𝑣 =𝑘−𝑟−1
𝑘 = 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣á𝑙𝑜𝑠 𝑟𝑒𝑎𝑔𝑟𝑢𝑝𝑎𝑑𝑜𝑠
𝑟 = 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟𝑒𝑠 𝑢𝑡𝑖𝑙𝑖𝑧𝑎𝑑𝑜𝑠
Así, el valor del punto crítico será:

2 2
𝑥(1−0,05, 5−0−1) = 𝑥(0,95 ,4) = 9,4877
Región Crítica
Finalmente, la región de crítica estará dada por la ecuación (11.4)

2 2
𝑅𝐶: 𝑥𝑜𝑏𝑠 > 𝑥(1−𝛼, 𝑣) (11.4)
Reemplazando en la ecuación (11.4), se tiene:
2
𝑅𝐶: 𝑥𝑜𝑏𝑠 > 9,4877
Conclusión
Como Chi-cuadrada de tabla es mayor que Chi-cuadrada calculada, no hay evidencia
muestral para rechazar 𝐻0 con 5% de significancia. Con esto, es posible afirmar que los datos
de la muestra provienen de una Distribución de Probabilidad Geométrica.

PROBLEMA 2
El encargado del control de calidad en el proceso de fabricación de cierto tipo de arandelas,
manifiesta que el diámetro interno de una arandela, en pulgadas, tiene un comportamiento
Normal, con media 0,289 pulgadas y desviación típica de 0,003 pulgadas. En una muestra
aleatoria de 120 arandelas, se obtuvo:
Diámetro interno N° de arandelas

Menos de 0,284 8
0,284-0,288 32
0,288-0,292 54 162
0,292-0,296 22
Tabla 26.Número de Arandelas según diámetro interno de una de éstas.
¿Los datos de la muestra dan evidencia suficiente para concluir que el diámetro interno de
las arandelas tiene el comportamiento manifestado por el encargado del control de calidad?
(Utilice α=0,025)
SOLUCIÓN
Sea:
X=Diámetro interno de una arandela, en pulgadas
𝑋~𝑁(𝜇 , 𝜎 2 )
Datos
𝑛 = 120
𝛼 = 0,025
Dócima
𝐻0 : 𝑋 ~𝑁 (𝜇 = 0,289 , 𝜎 2 = (0,003)2
2
𝐻1 : 𝑋 ≁ 𝑁 (𝜇 = 0,289 , 𝜎2 = (0,003)
Estadística
X 𝑶𝒊 𝒑(𝒙) 𝒆𝒊
𝑴𝒆𝒏𝒐𝒔 𝒅𝒆 𝟎, 𝟐𝟖𝟒 8 0,0485 5,820
0,284 - 0,288 32 0,3232 38,784
0,288 – 0,292 54 0,4706 56,472
0,292 – 0,296 22 0,1488 17,856
0,296 y más 4 8,9·10−3 1,068

Al momento de verificar el recorrido de “X”, que en este caso corresponde a 𝑅𝑒𝑐(𝑥) = {𝐼𝑅 }
según el modelo de distribución normal, es posible denotar que los valores muestrales de
la tabla solo están dados hasta 0,296; por lo que ha sido necesario agregar un último
intervalo de clase como se muestra en la tabla (4)
Es importante recordar el cálculo de probabilidades según la distribución normal. Se

recomienda tipificar los datos según la ecuación (11.5), para así ayudarse con la tabla de
distribución normal ya estudiada anteriormente.
𝑥−µ 163
𝑧= (11.5)
𝜎
En el último intervalo, es posible denotar que no se cumple el criterio 𝑒𝑖 ≥ 5, por lo que no
es posible aplicar el test. Según esto, se procede a reagrupar el último intervalo con el
penúltimo, dando origen a la tabla (5)
Menos de 𝟎, 𝟐𝟖𝟒 8 0,0485 5,82
0,284 - 0,288 32 0,3232 38,784
0,288 – 0,292 54 0,4706 56,472
0,292 y más 26 0,1577 18,924
Tabla 28. Tabla Estadística de Bondad de Ajuste, con intervalos de clase reagrupados.
A partir de la ecuación (11.3), se procede a calcular el estadístico de prueba Chi Cuadrado

2
Observado (𝑥𝑜𝑏𝑠 ), obteniendo:
2
𝑥𝑜𝑏𝑠 = 4,757
Punto Crítico
A diferencia del problema anterior, fue necesario reagrupar los intervalos de clase, por lo
que se deben utilizar un valor de 𝑘 = 4 en el análisis de "𝑣".
Así, el valor del punto crítico será:

2 2
𝑥(1−𝛼, 𝑣) = 𝑥(0,975 ,3) = 9,348
𝑣 =𝑘−𝑟−1= 4−0−1= 3

Región Crítica

2 2
𝑅𝐶: 𝑥𝑜𝑏𝑠 > 𝑥(1−𝛼, 𝑣) (11.6)
Reemplazando en la ecuación (6), se tiene:
2
𝑅𝐶: 𝑥𝑜𝑏𝑠 > 9,348
164
Conclusión
Como Chi-cuadrada de tabla es mayor que Chi-cuadrada calculada, no hay evidencia
muestral para rechazar 𝐻0 con 5% de significancia. Con esto, es posible afirmar que el
diámetro de una arandela tiene un comportamiento normal con los valores muestrales
dados.

PROBLEMA 3
El número de autos de lujo que vende diariamente cierta automotora (X), se modela
mediante la siguiente función:
2𝑥
𝑝(𝑥) = {6 ∗ 𝑥! , 𝑠𝑖 𝑥 = 1; 2; 3; 4
0 , 𝑒. 𝑜. 𝑐
Para analizar si este modelo ha cambiado, debido a la fuerte baja del dólar, se observan las 165
ventas realizadas durante 90 días tomados en forma aleatoria. Se obtuvo:
Número de autos vendidos Número de días

(X)
1 25
2 34
3 22
4 9
Total 90
Tabla 29.Número de días tomados aleatoriamente, según autos vendidos en ellos.
Con un nivel de significación del 5%. ¿Concluiría usted que el modelo ha cambiado?
SOLUCIÓN
Sea:
X=Número de autos de lujo que se venden diariamente.
Datos
𝑛 = 90
𝛼 = 0,05
Dócima
𝐻0 : 𝑋 ~𝑝(𝑥)
𝐻1 : 𝑋 𝑛𝑜 𝑡𝑖𝑒𝑛𝑒 𝑒𝑙 𝑚𝑜𝑑𝑒𝑙𝑜 𝑝𝑙𝑎𝑛𝑡𝑒𝑎𝑑𝑜

Estadística
1 25 0,33 30
2 34 0,33 30
3 33 0,22 20
4 9 0,11 10
Las probabilidades se calculan según el modelo planteado, el cual se muestra como

166
ecuación (7)
2𝑥
𝑝(𝑥) = , 𝑠𝑖 𝑥 = 1; 2; 3; 4 (11.7)
6 ∗ 𝑥!

2
2
𝑥𝑜𝑏𝑠 = 1,667
Punto Crítico
Con ayuda de la tabla Chi-Cuadrado es posible determinar el valor del punto crítico, el cuál
está dado por:
2 2
𝑥(1−𝛼, 𝑣) = 𝑥(0,95 ,3) = 7,815
𝑣 =𝑘−𝑟−1= 4−0−1= 3
Región Crítica

2 2
𝑅𝐶: 𝑥𝑜𝑏𝑠 > 𝑥(1−𝛼, 𝑣) (11.8)
2
𝑅𝐶: 𝑥𝑜𝑏𝑠 > 7,815
Conclusión
De acuerdo a la evidencia presentada, con un 5% de significación, es posible afirmar que el
número de autos de lujo que se venden diariamente, se ajusta al modelo propuesto.

PROBLEMA 4
A continuación, se presenta una muestra de 100 conductores electrónicos, a los cuales se

les midió su resistencia (X), en Ω
Resistencia (X) Número de Conductores

10-12 18
12-14 24
14-16 21
16-18 16
167
18 y más 10
Tabla 8.
𝟏𝟎𝟎
∑ 𝑿𝒊 = 𝟏𝟑𝟖𝟔
𝒊=𝟏
𝟏𝟎𝟎
∑ 𝑿𝟐𝒊 = 𝟐𝟎𝟎𝟖𝟒
𝒊=𝟏
Tabla 9.
a) Pruebe si la resistencia de los conductores eléctricos tiene un comportamiento

Normal con media µ y varianza 7,84 [Ω2 ], con un nivel de significación igual a 0,05.
b) Estime con 95% de confianza la proporción de conductores que tienen una
resistencia superior a 13 [Ω]
SOLUCIÓN 4-A
Sea:
X=Resistencia de un conductor eléctrico, en ohmios.
Datos
𝑛 = 100
𝛼 = 0,05
Dócima
𝐻0 : 𝑋 ~𝑁 (𝜇 , 𝜎 2 = 7,84)
𝐻1 : 𝑋 ≁ 𝑁 (𝜇 , 𝜎2 = 7,84)

Estadística
Como en este caso el parámetro "𝜇"es desconocido, se debe estimar. Se sabe que el mejor
estimador es la media muestral, según esto se obtiene:
1386
𝜇̂ = = 13,86
100
Menos de 10 11 0,0838 8,38
168
10-12 18 0,1708 17,08
12-14 24 0,2653 26,53
14-16 21 0,2565 25,65
16-18 16 0,1542 15,42
Desde 18 10 0,0694 6,94
Al igual que en el problema 2, para el cálculo de probabilidades se recomienda estandarizar

los datos según la ecuación (11.8), para así ayudarse con la tabla de distribución normal.
𝑥−µ
𝑧= (11.9)
𝜎
Por ejemplo, para el cálculo de p(x) para el segundo intervalo de clase, es decir el que
contiene a los valores entre 10 y 12 de la variable “X”, es posible analizarlo según funciones
de distribución. Para esto, es importante recordar que el valor buscado en la tabla (Z)
corresponde a los valores acumulados desde el “−∞” hasta el mismo. Con esto es posible
analizar de la siguiente forma la probabilidad:
12 − 13,86 10 − 13,86
𝑝2 (𝑥) = 𝐹(12) − 𝐹(10) = 𝐹 (𝑍 = ) − 𝐹 (𝑍 = )
2,8 2,8
= 0,2546 − 0,0838 = 0,1708


2
2
𝑥𝑜𝑏𝑠 = 3,324
Punto Crítico
Con ayuda de la tabla Chi-Cuadrado es posible determinar el valor del punto crítico, el cual
169
está dado por:
2 2
𝑥(1−𝛼, 𝑣) = 𝑥(0,95 ,4) = 9,488
𝑣 =𝑘−𝑟−1= 6−1−1= 4
Recordar que en este caso se estimó el valor del parámetro “µ”, por lo que el valor de "𝑟"
que corresponde al número de estimadores utilizados, se debe considerar como 1, en el
análisis de "𝑣".
Región Crítica

2 2
𝑅𝐶: 𝑥𝑜𝑏𝑠 > 𝑥(1−𝛼, 𝑣) (11.10)
2
𝑅𝐶: 𝑥𝑜𝑏𝑠 > 9,488
Conclusión
Basándose en la información proporcionada, con un 95% de confianza, es posible afirmar
que la resistencia se distribuye en forma normal.

SOLUCIÓN 4-B
Datos
m.a.t (100)
Sea:
W: Número de conductores con resistencia superior a 13 ohmios, en la muestra de tamaño
100.
𝑊~𝐵𝑖𝑛(𝑛 = 100, 𝑝 =? ) 170

Es necesario encontrar el valor de “𝑝̂ ” para desarrollar el intervalo de confianza. Para esto
se utilizarán percentiles, según la ecuación (11)
𝑛·𝑘
( 100 − 𝑁𝑖−1 )
𝑃𝐾 = 𝑋𝑖−1 + 𝑎𝑖 · (11.11)
𝑛𝑖
100 · 𝑘
( 100 − 29)
13 = 12 + 2 · → 𝑘 = 41%
24
Así, el valor del estimador de proporción estará dado por:
𝑝̂ = 100% − 41% = 59% → 𝑝̂ = 0,59
Finalmente, es posible determinar el intervalo de confianza pedido a partir de la ecuación

(12)
𝑝̂ · 𝑞̂ 𝑝̂ · 𝑞̂
𝑃 (𝑝̂ − 𝑧(1−𝛼) · √ < 𝑝 < 𝑝̂ + 𝑧(1−𝛼) · √ )=1−𝛼 (11.12)
2 𝑛 2 𝑛
Se utiliza la tabla de distribución normal, consiguiendo:
𝑧(1−𝛼) = 𝑧(0,975) = 1,96

2

Reemplazando en la ecuación (11.12) se obtiene:
0,59 · 0,41 0,59 · 0,41

𝑃 (0,59 − 1,96 · √ < 𝑝 < 0,59 + 1,96 · √ ) = 0,95
100 100
Así, el intervalo de confianza pedido corresponde a:
𝑃 ∈ [0,4936 ; 0,6864]
171

Unidad 12- Regresio n Lineal
PROBLEMA 1
Un ingeniero está investigando el efecto de la temperatura de operación de proceso en el
rendimiento del producto. El estudio da como resultado los siguientes datos:
Temperatura, ℃ 100 110 120 130 140 150 160 170 180 190
Rendimiento, % 45 51 54 61 66 70 74 78 85 89
Tabla 30. Datos asociados a la temperatura de operación de cierto proceso y rendimiento del producto procesado. 172
c) Ajuste una recta de regresión e interprete los valores de los coeficientes.

d) Pruebe con 5% nivel de significación, si existe relación lineal entre las variables.
e) Indique qué porcentaje de variabilidad del rendimiento está explicado por la
temperatura. Comente el resultado.
f) Pruebe con 5% de significación que al aumentar la temperatura en 1℃ el
rendimiento del producto aumenta en menos de un 0,5%.
g) Construya un intervalo de 95% de confianza para el rendimiento del producto
cuando la temperatura de operación del proceso es de 150℃.
h) Estime con 98% la variación del rendimiento cuando la temperatura de operación
del proceso aumenta en 10 ℃.
i) Construya un intervalo de 95% para el intercepto. Comente los resultados.
SOLUCIÓN 1-A
Sean:
X: Temperatura de operación de proceso de cierto producto, en ℃.
Y: Rendimiento del producto, en %.
Se tiene el modelo de regresión lineal, mostrado en la ecuación (1)
𝑌𝑖 = 𝛽0 + 𝛽1 ∙ 𝑥𝑖 + 𝑢𝑖 , ∀𝑖 = 1,2, … , 𝑛 (12.1)
Luego, es posible obtener los parámetros 𝛽0 y 𝛽1 directamente de la calculadora,

ingresando los valores muestrales de ambas variables, los cuales se han expuesto en la tabla
1. Así, se obtiene la siguiente recta ajustada presentada a continuación.
𝑦̂𝑖 = −2,7394 + 0,4830 𝑥𝑖 , 𝑐𝑜𝑛 𝑖 = 1,2, … ,10

Conclusión
El valor -2,7394 no tiene sentido práctico y el valor 0,4830 indica que si la temperatura de
operación del proceso aumenta en 1℃, el rendimiento promedio del producto aumenta en
0,483%. Además, para que logremos visualizar de mejor forma el ajuste realizado, se
expone el siguiente gráfico en el cual se han dispuesto los puntos asociados a las variables
de interés, para luego obtener la línea de tendencia con sus respectivos parámetros.
Ajuste Lineal
173
100
90
y = 0,483x - 2,7394
80 R² = 0,9963
70
Rendimiento , en %
60
50
40
30
20
10
0
0 50 100 150 200
Temperatura de Operación, en ºC
SOLUCIÓN 1-B
En este caso, se planteará un test de hipótesis que pruebe si existe relación lineal entre las
variables estudiadas.
Dócima
𝐻0 : ⍴ = 0
𝐻1 : ⍴ ≠ 0

Estadística
El estadístico de prueba a utilizar en este caso, se presenta en la ecuación (12.2), donde "𝑟"
es el coeficiente de correlación, "𝑟 2 " el coeficiente de determinación y "𝑛" el número de
muestra. El valor asociado al coeficiente de correlación, es posible determinarlo
directamente de la calculadora, ingresando los parámetros estipulados en el enunciado.
𝑟 ∙ √𝑛 − 2
𝑇= (12.2)
√1 − 𝑟 2
174
0,9981√8
𝑇= → 𝑇 = 46,169
√1 − 0,99812
Región Crítica
En este tipo de dócima, la región de rechazo está dada según la ecuación (12.3).
𝑇 < −𝑡(𝑛−2;1−𝛼) ˅ 𝑇 > 𝑡(𝑛−2;1−𝛼) (12.3)

2 2
Reemplazando en la ecuación (12.3), con ayuda de la tabla de la distribución “t-Student”, es

𝑅𝐶: 𝑇 < −𝑡(8 ; 0,975) ˅ 𝑇 > 𝑡(8 ;0,975) → 𝑇 < −2,3060 ˅ 𝑇 > 2,3060
Conclusión
Con un 95% de confianza, es posible observar que el valor asociado al estadístico de prueba
(T) pertenece a la región de rechazo, por lo que se rechaza la hipótesis nula. Con esto, es
posible inferir que el modelo lineal es significativo, por lo que sí existe asociación lineal
entre las variables en estudio.

SOLUCIÓN 1-C
Directamente de la calculadora, es posible obtener el valor del coeficiente de correlación

"𝑟", valor que nos permite obtener el coeficiente de determinación, el cual está dado por
𝑟 2 = 0,9963. Esto indica que el 99,63% de la variabilidad en el rendimiento está explicada
por el modelo, es decir por la temperatura. A partir de lo anteriormente expuesto, es
posible inferir que el ajuste es bastante bueno, ya que sólo queda un 0,37% de variación
asociado a otras variables que se encuentran fuera del alcance de este estudio.
175
SOLUCIÓN 1-D
En este caso, se planteará un test de hipótesis que pruebe lo que se plantea en el enunciado,
el cual está dado como se expone a continuación.
Dócima
𝐻0 : 𝛽1 ≥ 0,5
𝐻1 : 𝛽1 < 0,5
Observación
Lo anteriormente expuesto, es posible interpretarlo de la siguiente forma:
𝐻0 : Al aumentar la temperatura en 1ºC, el rendimiento del producto no aumenta en menos

de un 0,5%.
𝐻1 : Al aumentar la temperatura en 1ºC, el rendimiento del producto aumenta en menos de

un 0,5%.
Estadística
En este tipo de dócimas, el valor del estadístico de prueba según el formulario oficial, está
dado según la ecuación (12.4).
𝛽1
𝑇= (12.4)
𝑠𝛽1

Dónde:
𝑠𝑦𝑥
𝑠𝛽1 = (12.5)
√∑(𝑥𝑖 − 𝑥̅ )2
𝑛−1 2
𝑠𝑦𝑥 = √ (𝑠 − 𝑏12 𝑠𝑥2 ) (12.6)
𝑛−2 𝑦
176
9
𝑠𝑦𝑥 = √ (14,65192 − 0,48302 ∙ 30,27652 ) = 0,9503
8
0,9503
𝑠𝛽1 = = 0,0105
√218500 − 10 ∙ 1452
0,483 − 0,5
𝑇= → 𝑇 = −1,6191
0,0105
Observación
Se sabe que los formularios se plantean, en base a una dócima igualada a cero, por lo que
en este caso fue necesario restar el valor 0,5 que corresponde al valor porcentual del
rendimiento del producto, el cual se pide probar en el enunciado.
Región Crítica
En este caso, la región de rechazo se encuentra dada de la siguiente forma:
𝑇 < −𝑡(𝑛−2,1−𝛼) → 𝑇 < −𝑡(8,0,95) → 𝑇 < −1,86
Conclusión
[T] no pertenece a la región de rechazo, por lo que no existe información suficiente para
rechazar la hipótesis nula. A partir de esto, es posible inferir que al aumentar la temperatura
en 1ºC, el rendimiento del producto no aumenta en menos de un 0,5%, por lo que no se
acepta la información planteada.

SOLUCIÓN 1-E
El intervalo de confianza solicitado, es posible obtenerlo a partir de la ecuación (12.7).
1 (𝑥 − 𝑥̅ )2
𝐼𝐶 (𝑌) = 𝑏0 + 𝑏1 𝑥 ∓ 𝑡(𝑛−2;1−𝛼) ∙ 𝑠𝑦𝑥 ∙ √1 + + (12.7)
2 𝑛 ∑(𝑥𝑖 − 𝑥̅ )2
Reemplazando en la ecuación expuesta anteriormente, contextualizándola así con el

ejercicio, se obtiene el siguiente intervalo confidencial.
177
1 (150 − 145)2
𝐼𝐶(𝑌/𝑥 = 150) = −2,7394 + 0,483 ∙ 150 ∓ 𝑡(8;0,975) ∙ 0,9503√1 + +
10 8250
𝐼𝐶(𝑌/𝑥 = 150) = 69,7106 ∓ 2,306 ∙ 0,9503 ∙ 1,050
𝐼𝐶(𝑌/𝑥 = 150) = (67,41 ; 72,01)%
Conclusión
Con un 95% de confianza, es posible afirmar que cuando la temperatura de operación es de
150ºC, el rendimiento del producto fluctúa entre un 67,41% y un 72,01%.
SOLUCIÓN 1-F
El intervalo de confianza solicitado, es posible obtenerlo a partir de la ecuación (12.8).
𝐼𝐶 (𝛽1 ) = 𝑏1 ∓ 𝑡(𝑛−2;1−𝛼) ∙ 𝑠𝑏1 (12.8)

2
Reemplazando en la ecuación expuesta anteriormente, es posible estimar los valores del

rendimiento, para cuando la temperatura de operación aumenta 1ºC, obteniendo lo
siguiente:
𝐼𝐶 (𝛽1 ) = 0,483 ∓ 𝑡(8;0,99) ∙ 0,0105 = 0,483 ± 2,8965 ∙ 0,0105
𝐼𝐶 (𝛽1 ) = (0,4526 ; 0,5134)%
Finalmente, es necesario obtener el intervalo confidencial que represente la variación del

rendimiento, cuando la temperatura de operación aumenta en 10ºC, lo que se determina
de la siguiente forma:
10 ∙ 𝐼𝐶 (𝛽1 ) = (45,26; 51,34)%

Conclusión
Con un 98% de confianza, cuando la temperatura de operación del proceso aumenta en 10
ºC, el rendimiento del producto fluctúa entre un 45,26% y un 51,34%.
SOLUCIÓN 1-G
El intervalo de confianza solicitado, es posible obtenerlo a partir de las ecuaciones (12.9) y

(12.10).
178
𝐼𝐶 (𝛽0 ) = 𝑏0 ∓ 𝑡(𝑛−2;1−𝛼) ∙ 𝑠𝑏0 (12.9)
2
1 𝑥̅ 2
𝑠𝑏0 = 𝑠𝑦𝑥 ∙ √ + (12.10)
𝑛 ∑(𝑥𝑖 − 𝑥)2
Reemplazando en las ecuaciones expuestas anteriormente, se obtiene:
1 1452
𝑠𝑏0 = 0,9503 ∙ √ + → 𝑠𝑏0 = 1,5465
10 10 ∙ 28,72282
𝑰𝑪 (𝛃𝟎 ) = −𝟐, 𝟕𝟑𝟗𝟒 ∓ 𝒕(𝟖;𝟎,𝟗𝟕𝟓) ∙ 𝟏, 𝟓𝟒𝟔𝟓 = −𝟐, 𝟕𝟑𝟗𝟒 ∓ 𝟐, 𝟑𝟎𝟔 ∙ 𝟏, 𝟓𝟒𝟔𝟓
→ 𝑰𝑪 (𝛃𝟎 ) = (−𝟔, 𝟑𝟎𝟓𝟔; 𝟎, 𝟖𝟐𝟔𝟖)
Conclusión
Con un 95% de confianza, es posible inferir que el valor del intercepto fluctúa entre -6,3056
y 0,8268. Como el cero pertenece al intervalo confidencial, podríamos afirmar con 95% de
confianza que en el modelo no debiera incluirse el intercepto. El modelo más adecuado
sería 𝑦𝑖 = 𝛽 𝑥𝑖 + 𝑢𝑖 .

PROBLEMA 2
Para determinar si existe una relación lineal entre el consumo de electricidad (Kw-hora) y
el número de habitaciones en una vivienda se recogieron datos para un mismo mes de una
muestra de viviendas, obteniendo los siguientes datos:
∑12 12 12 2 12 2 12
𝑖=1 𝑥𝑖 = 105; ∑𝑖=1 𝑦𝑖 = 80; ∑𝑖=1 𝑥𝑖 = 1067; ∑𝑖=1 𝑦𝑖 = 570; ∑𝑖=1 𝑥𝑖 ⋅ 𝑦𝑖 = 758
a) Estime la ecuación de regresión muestral por medio del método de los mínimos
cuadrados e interprete los valores obtenidos de los coeficientes en el contexto del
problema. 179
b) Estime con 95% de confianza el consumo de electricidad esperado en una vivienda
con 8 habitaciones.
c) ¿Podría afirmar que por cada habitación adicional en una vivienda, el consumo de
electricidad aumenta en más de 350 w-hora? Use α = 0,05
SOLUCIÓN
Sean:
X=Número de habitaciones en la vivienda
Y=Consumo de electricidad, en [Kw-hora]
SOLUCIÓN 2-A
Se tiene el modelo condicionado a la siguiente forma:
𝑦𝑖 = 𝛽0 + 𝛽1 𝑥𝑖 + 𝑢𝑖
𝑛 ∙ ∑𝑛𝑖=1 𝑥𝑖 ⋅ 𝑦𝑖 − ∑𝑛𝑖=1 𝑥𝑖 ⋅ ∑𝑛𝑖=1 𝑦𝑖

̂1 =
𝑏1 = 𝛽 (12.11)
𝑛 ⋅ ∑𝑛𝑖=1 𝑥𝑖2 − (∑𝑛𝑖=1 𝑥𝑖 )2
∑𝑛𝑖=1 𝑦𝑖 ∑𝑛𝑖=1 𝑥𝑖
̂0 =
𝑏0 = 𝛽 − 𝑏1 ∙ (12.12)
𝑛 𝑛
Reemplazando en las ecuaciones (12.11) y (12.12), se obtienen los parámetros de la
regresión, como se muestra a continuación.
12 ∙ 758 − 105 ∙ 80
𝑏1 = = 0,3912
12 ⋅ 1067 − (105)2
80 105
𝑏0 = − 0,3912 ∙ = 3,2434
12 12

Por lo tanto, la ecuación de regresión estimada es:
𝑦𝑖 = 3,2434 + 0,3912𝑥𝑖
Conclusión
El valor del intercepto en este caso no tendría sentido práctico y la pendiente indica que
por cada habitación adicional en la vivienda el consumo de electricidad aumenta en 0,391
Kw-hora. 180
SOLUCIÓN 2-B
El intervalo de confianza solicitado, es posible obtenerlo a partir de las ecuaciones (12.13)

y (14).
1 (𝑥 − 𝑥̅ )2
𝐼𝐶 (µ) = 𝛽0 + 𝛽1 𝑥 ∓ 𝑡(𝑛−2;1−𝛼) ∙ 𝑠𝑦𝑥 ∙ √ + (12.13)
2 𝑛 ∑(𝑥𝑖 − 𝑥)2
𝑛−1 2
𝑠𝑦𝑥 = √ (𝑠𝑦 − 𝑏12 𝑠𝑥2 ) (12.14)
𝑛−2
Reemplazando en las ecuaciones expuestas anteriormente, se obtiene:
11
𝑠𝑦𝑥 = √ (3,333 − 0,39122 ∙ 13,4773) = 1,1822
10
1 (8 − 8,75)2
𝐼𝐶 (µ/(𝑥 = 8)) = 3,2434 + 0,3912𝑥 ∓ 𝑡(10;0,975) ∙ 1,1822 ∙ √ +
12 148,25
1 (8 − 8,75)2
𝐼𝐶 (µ/(𝑥 = 8)) = 3,2434 + 0,3912𝑥 ∓ 2,2281 ∙ 1,1822 ∙ √ +
12 148,25
𝐼𝐶 (µ/(𝑥 = 8)) = (6,1437; 6,6027)
Conclusión
Con un 95% de confianza, es posible inferir que el consumo de electricidad esperado en una
vivienda que contiene 8 habitaciones, fluctúa entre 6,1437 [kw/h] y 6,6027 [kw/h]

SOLUCIÓN 2-C
En este caso, se planteará un test de hipótesis que pruebe lo que se plantea en el enunciado,
el cual está dado como se expone a continuación.
Dócima
𝐻0 : 𝛽1 ≤ 0,35
181
𝐻1 : 𝛽1 > 0,35
Observación
Lo anteriormente expuesto, es posible interpretarlo de la siguiente forma:
𝐻0 : El consumo no aumenta en más de 350 [W/h]
𝐻1 : El consumo aumenta en más de 350 [W/h]
Estadística
En este tipo de dócimas, el valor del estadístico de prueba según el formulario oficial, está
dado según la ecuación (12.15).
𝛽1
𝑇= (12.15)
𝑠𝛽1
Dónde:
𝑠𝑦𝑥
𝑠𝛽1 = (12.16)
√∑(𝑥𝑖 − 𝑥̅ )2
1,1822
𝑠𝛽1 = = 0,0971
√1067 − 12 ∙ 8,752
0,3912 − 0,35
𝑇= → 𝑇 = 0,4243
0,0971
Observación
Se sabe que los formularios se plantean, en base a una dócima igualada a cero, por lo que
en este caso fue necesario restar el valor 0,35 que corresponde al consumo en [kw/hr], el
cual se pide probar en el enunciado.

Región Crítica
En este caso, la región de rechazo se encuentra dada de la siguiente forma:
𝑇 > 𝑡(𝑛−2,1−𝛼) → 𝑇 > 𝑡(10,0,95) → 𝑇 > 1,8125
Conclusión
[T] no pertenece a la región de rechazo, por lo que no existe información suficiente para 182
rechazar la hipótesis nula. A partir de esto, no podríamos afirmar que por cada habitación
adicional en una vivienda, el consumo de electricidad aumenta en más de 350 [w/h]

Anexo 1 - Uso de Calculadora para Ca lculos Estadí sticos Ba sicos
1.CALCULADORA CASIO Fx-100MS (NEGRA)

A continuación, se muestra como calcular el promedio y la desviación estándar muestral de
la distribución de datos expuesta en la tabla 1, donde "𝑋" es una variable cualquiera y ni su
frecuencia absoluta.
X ni
28 5 183
39 3
57 8
Tabla 31. Distribución de datos de variable “X”.
i. Designar modo estadístico
MODE MODE 1 (SD)
ii. Limpiar memoria con datos estadísticos
MODE
SHIFT 1 (SCL) =
(CLR)
iii. Ingresar datos de la variable
28 = M+(DT)
39 = M+(DT)
57 = M+(DT)

iv. Cambiar frecuencias, si es necesario

Las frecuencias vienen predeterminadas con valor “1”; por lo que es necesario
cambiarlas en este caso.
(en freq 1)
REPLAY(↓) REPLAY(↓) =
5
184
(en freq 2)
3
(en freq 3)
8
v. Cálculo de promedio
SHIFT 2 1
Así, se obtiene como valor:

𝑥̅ = 44,5625
vi. Cálculo de desviación típica o estándar
SHIFT 2 3

𝑠(𝑥) = 13,421

2.CALCULADORA CASIO Fx-570ES PLUS (GRIS)

A continuación, se muestra como calcular el promedio y la desviación estándar muestral de
la distribución de datos expuesta en la tabla 2, donde "𝑌" es una variable cualquiera y ni su
frecuencia absoluta.
Y ni
5 4
10 12
15 7
Tabla 32. Distribución de datos de variable Y. 185
i. Designar modo estadístico
1
MODE 3 (STAT)
(1-VAR)
ii. Limpiar datos.

Al realizar la operación anterior, los datos anteriores se borran
automáticamente.
iii. Ingresar datos.

Completar la tabla mostrada en pantalla, como se expone en la tabla 3.
Y FREQ
5 4
10 12
15 7
Tabla 33. Tabla mostrada en pantalla de calculadora CASIO fx-570ES plus.
Observación
En caso de que no aparezca la columna “FREQ”, se debe seguir la secuencia de pasos que
se expone a continuación.
MODE
SHIFT ↓ 4 (STAT) 1 (ON)
(SET UP)

iv. Cálculo de Promedio
ON SHIFT 1(STAT) 4 (VAR) 2 =

𝑌̅ = 10,652 186
v. Cálculo Desviación Estándar
ON SHIFT 1(STAT) 4 (VAR) 4 =
𝑠(𝑦) = 3,472

Apuntes Ejercicios Resueltos Analisis Estadistico para La Ingenieria 1.2 PDF

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Apuntes Ejercicios Resueltos Analisis Estadistico para La Ingenieria 1.2 PDF

Hochgeladen von

Copyright:

Verfügbare Formate

Apuntes de Ejercicios Resueltos

Análisis Estadístico para la Ingeniería

Preparado por Camilo Ignacio Bustamante Santander

Departamento de Ingeniería en Minas

Universidad de Santiago de Chile

Unidad 1: Estadística Descriptiva ........................................................................................................ 3

ANALISIS ESTADISTICO PARA LA INGENIERIA | Departamento Ingeniería en Minas

Unidad 1 - Estadí stica Descriptiva

Temperatura (°C) Humedad Relativa del aire (%)

Y: Temperatura, cuando la humedad relativa es mayor o igual al 40%, en °C.

ANALISIS ESTADISTICO PARA LA INGENIERIA | Departamento Ingeniería en Minas

Marca de Clase [𝑿𝒊 ] < 40 ≥ 40

Por otro lado, se tiene la siguiente generalidad:

En el enunciado se estipulan ciertas condiciones indicadas por el fabricante para que el

i. Humedad Relativa inferior al 81%.

Es necesario saber el porcentaje de datos contenidos hasta el 5% de la distribución, para

ANALISIS ESTADISTICO PARA LA INGENIERIA | Departamento Ingeniería en Minas

A continuación, se presenta una tabla que contiene los parámetros expuestos

En esta oportunidad se trabajará en el primer intervalo de clase, ya que éste contiene al

ANALISIS ESTADISTICO PARA LA INGENIERIA | Departamento Ingeniería en Minas

Es importante destacar que se pide en el enunciado explícitamente utilizar propiedades,

𝑎∙𝑥+𝑏 = 𝑎∙𝑥+𝑏 = 𝑎∙𝑥+𝑏

𝑠(𝑎 ∙ 𝑥 + 𝑏) = 𝑠(𝑎 ∙ 𝑥) + 𝑠(𝑏) = 𝑎 ∙ 𝑠(𝑥)

Al realizar dicha relación, se obtienen los siguientes parámetros:

𝐻` = 1,04 ⋅ 𝐻 = 1,04 ⋅ 38,167 → 𝐻` = 39,694

𝑠(𝐻`) = 1,04 ⋅ 𝑠(𝐻) = 1,04 ⋅ 13,584 → 𝑠(𝐻`) = 14,127

ANALISIS ESTADISTICO PARA LA INGENIERIA | Departamento Ingeniería en Minas

Frequency Stem & Leaf

1,00 Extremes (=<31,0)

Determine el porcentaje de piezas con longitud inferior a (𝑥̅ − 𝑠)

El cálculo de la desviación muestral, en esta oportunidad se obtendrá a partir de la varianza

ANALISIS ESTADISTICO PARA LA INGENIERIA | Departamento Ingeniería en Minas

𝑠(𝑥) = √𝑉(𝑥) (1.5)

ANALISIS ESTADISTICO PARA LA INGENIERIA | Departamento Ingeniería en Minas

Reemplazando los valores dados en el enunciado, en la ecuación (1.5), es posible obtener

→ 𝑠(𝑥) = √0,1767 = 0,4204 [𝑚𝑚]

Finalmente, es posible obtener el valor numérico de la expresión 𝑥 − 𝑠(𝑥), el cual

ANALISIS ESTADISTICO PARA LA INGENIERIA | Departamento Ingeniería en Minas

Tabla 6. Valores asociados al diámetro de cierto producto, en la máquina C.

b) Si en un control se ajusta la máquina B de modo que el diámetro de cada producto

ANALISIS ESTADISTICO PARA LA INGENIERIA | Departamento Ingeniería en Minas

Para realizar un análisis comparativo en cuanto a homogeneidad, se sabe que se tiene la

𝐴 𝑚𝑒𝑛𝑜𝑟 𝐶𝑜𝑒𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑑𝑒 𝑉𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 → 𝑀𝑒𝑛𝑜𝑟 𝐷𝑖𝑠𝑝𝑒𝑟𝑠𝑖ó𝑛 → 𝑀𝑎𝑦𝑜𝑟 𝐻𝑜𝑚𝑜𝑔𝑒𝑛𝑒𝑖𝑑𝑎𝑑 11

40891,3 − 200 ∙ 13,9952

ANALISIS ESTADISTICO PARA LA INGENIERIA | Departamento Ingeniería en Minas

Así, los valores obtenidos de los parámetros de interés son:

𝑋`𝐵 : Nuevo diámetro expresado en milímetros, de productos provenientes de la máquina

𝐴 𝑚𝑎𝑦𝑜𝑟 % 𝑑𝑒 𝑉𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 → 𝑀𝑎𝑦𝑜𝑟 𝐻𝑒𝑡𝑒𝑟𝑜𝑔𝑒𝑛𝑒𝑖𝑑𝑎𝑑

Dicho esto, se obtendrá el porcentaje de variabilidad de la distribución de diámetros de

Luego, la expresión matemática de 𝑋`𝐵 está dada por:

ANALISIS ESTADISTICO PARA LA INGENIERIA | Departamento Ingeniería en Minas

→ 𝑋`𝐵 = 𝑥𝐵 − 1,5 = 𝑥𝐵 − 1,5 = 12,4595 − 1,5 → 𝑋`𝐵 = 10,9595

→ 𝑠(𝑋`𝐵 ) = 𝑠(𝑥𝐵 − 1,5) = 𝑠(𝑥𝐵 ) → 𝑠(𝑋`𝐵 ) = 3,26067

Con esto, el porcentaje de variabilidad de la distribución de diámetros de productos

Es necesario excluir el dato correspondiente a 16,4 [mm] y agregar en su lugar el valor

2798,90 − 16,4 + 6,4

→ 𝑠(𝑋𝑐! ) = 2,985 [𝑚𝑚]

ANALISIS ESTADISTICO PARA LA INGENIERIA | Departamento Ingeniería en Minas

Costo de Tipo de Redes (Y)

a) Para el costo de los productos de redes para edificios, determine y ubique en el

ANALISIS ESTADISTICO PARA LA INGENIERIA | Departamento Ingeniería en Minas

𝑌: Tipo de redes en que trabaja una empresa de Telecomunicaciones; subdividida en casas,

𝑿 Tipo de redes para Edificios