Sie sind auf Seite 1von 15

Universidad Católica Andrés Bello

Facultad de Ingeniería

Escuela de Ingeniería Industrial

Métodos Estadísticos

Martínez, Jhon & Suarez, Marlon

Asignación N°4

1. Considere los datos (números pseudoaleatorios) mostrados en la tabla.

0,78961 0,05230 0,10699 0,55877 0,14151


0,76086 0,12079 0,27738 0,65726 0,79269
0,80548 0,82654 0,29453 0,20852 0,42989
0,58518 0,98611 0,34488 0,34358 0,11537
0,89898 0,57880 0,67621 0,05010 0,00121
0,28269 0,73059 0,70119 0,18284 0,49962
0,38618 0,76910 0,68334 0,55170 0,10850
0,79982 0,45679 0,21631 0,87616 0,55743
0,58962 0,33216 0,03185 0,61168 0,09264
0,69623 0,17028 0,05475 0,91512 0,76262
0,29931 0,30861 0,83358 0,51781 0,03272
0,57410 0,26593 0,85903 0,43308 0,35286
0,24000 0,65559 0,38507 0,90829 0,94187
0,93655 0,88809 0,81772 0,36982 0,19904
0,54325 0,62400 0,09133 0,41678 0,33954
0,58244 0,85853 0,88752 0,33729 0,15506
0,23949 0,53559 0,33381 0,49383 0,75103
0,19962 0,65002 0,74579 0,79113 0,63453
0,19147 0,40644 0,08128 0,73435 0,22724
0,22287 0,07281 0,64183 0,44267 0,72102

a. Transforma los datos de la tabla aplicando la siguiente regla

i. Si 0,0000 ≤ 𝑅 < 0,7165, entonces 𝑥 = 0

ii. Si 0,7165 ≤ 𝑅 < 0,9553, entonces 𝑥 = 1

iii. Si 0,9553 ≤ 𝑅 < 0,9951, entonces 𝑥 = 2

iv. Si 0,9951 ≤ 𝑅 ≤ 1,0000, entonces 𝑥 = 3

Donde R representa el número pseudoaleatorio de la tabla. Asuma que los nuevos datos provienen de
1
una distribución de Poisson de parámetro 𝜆 = . Aplica la prueba de Chi-Cuadrado de la bondad de
2
ajuste y calcule el P-valor de la prueba.
Solución

Definiendo la variable y la prueba de hipótesis correspondiente

𝑋: 𝑁ú𝑚𝑒𝑟𝑜 𝑃𝑠𝑒𝑢𝑑𝑜𝑎𝑙𝑒𝑡𝑜𝑟𝑖𝑜 𝑔𝑒𝑛𝑒𝑟𝑎𝑑𝑜


1
Η𝑜 : 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑠𝑢𝑚𝑖𝑛𝑖𝑠𝑡𝑟𝑎𝑑𝑜𝑠 𝑝𝑟𝑜𝑣𝑖𝑒𝑛𝑒𝑛 𝑑𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑑𝑒 𝑃𝑜𝑖𝑠𝑠𝑜𝑛 𝑐𝑜𝑛 𝑝𝑎𝑟𝑎𝑚𝑒𝑡𝑟𝑜 𝜆 =
2
1
Η1 : 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑠𝑢𝑚𝑖𝑛𝑖𝑠𝑡𝑟𝑎𝑑𝑜𝑠 𝑝𝑟𝑜𝑣𝑖𝑒𝑛𝑒𝑛 𝑑𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑑𝑒 𝑃𝑜𝑖𝑠𝑠𝑜𝑛 𝑐𝑜𝑛 𝑝𝑎𝑟𝑎𝑚𝑒𝑡𝑟𝑜 𝜆 ≠
2
Agrupando los datos según las reglas mencionadas anteriormente, y calculando la probabilidad
asociada a la distribución de Poisson correspondiente. En el caso de la última probabilidad se restó la
probabilidad acumulada hasta el intervalo anterior.

Regla 0,0000≤R<0,7165 0,7165≤R<0,9553 0,9553≤R<0,9951 0,9951≤R≤1,0000


𝑥𝑖 0 1 2 3
𝑓𝑖 73 26 1 0
𝑃[𝑋 = 𝑥𝑖] 0,6065 0,3033 0,0758 0,0144
𝑒𝑖 60,6531 30,3265 7,5816 1,4388
(𝑂𝑖 − 𝑒𝑖)2
2,5134 0,6172 5,7135 1,4388
𝑒𝑖

Aplicando el estadístico de prueba correspondiente es

3
(𝑂𝑖 − 𝑒𝑖 )2
𝜒𝑜2 = ∑ = 10,283
𝑒𝑖
𝑖=1

Para halla el P-valor correspondiente se emplea la siguiente ecuación

2
𝜒3,1−𝛼 = 𝜒𝑜2 = 10,283

𝜶 = 𝟎, 𝟎𝟏𝟔𝟑𝟎𝟖 ó 𝟏, 𝟔𝟑𝟎𝟖%

Por lo tanto, dado que el P-valor es menor a 10% se rechazará la hipótesis nula. En consecuencia, los datos
1
suministrados provienen de una distribución de Poisson con 𝜆 ≠ .
2

b. Asuma que los datos provienen de una distribución uniforme de parámetros (0,1). Aplicar la
prueba de Kolomogorov-Smirnov y calcular el P-valor.

Solución

Definiendo la variable y la prueba de hipótesis correspondiente

𝑋: 𝑁ú𝑚𝑒𝑟𝑜 𝑃𝑠𝑒𝑢𝑑𝑜𝑎𝑙𝑒𝑡𝑜𝑟𝑖𝑜 𝑔𝑒𝑛𝑒𝑟𝑎𝑑𝑜

𝐻𝑜 : 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑠𝑢𝑚𝑖𝑠𝑡𝑟𝑎𝑑𝑜𝑠 𝑝𝑟𝑜𝑣𝑖𝑒𝑛𝑒𝑛 𝑑𝑒 𝑢𝑛𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑐𝑜𝑛 𝑓𝑢𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑭𝒙

𝐻1 : 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑠𝑢𝑚𝑖𝑠𝑡𝑟𝑎𝑑𝑜𝑠 𝑛𝑜 𝑝𝑟𝑜𝑣𝑖𝑒𝑛𝑒𝑛 𝑑𝑒 𝑢𝑛𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑐𝑜𝑛 𝑓𝑢𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑭𝒙


0; 𝑥 < 𝑎
𝐹𝑥 (𝑥) = {𝑥; 𝑎 ≤ 𝑥 ≤ 𝑏
1; 𝑥 ≥ 𝑏

Agrupando y ordenando los datos se obtiene la siguiente tabla:

Nº x H(x) F(x) |H(x)-F(x)| F(x) H(x) x Nº


1 0,00121 0,010 0,0012 0,0088 0,0104 0,4996 0,510 0,49962 51
2 0,03185 0,020 0,0319 0,0119 0,0022 0,5178 0,520 0,51781 52
3 0,03272 0,030 0,0327 0,0027 0,0056 0,5356 0,530 0,53559 53
4 0,05010 0,040 0,0501 0,0101 0,0032 0,5433 0,540 0,54325 54
5 0,05230 0,050 0,0523 0,0023 0,0017 0,5517 0,550 0,55170 55
6 0,05475 0,060 0,0548 0,0053 0,0026 0,5574 0,560 0,55743 56
7 0,07281 0,070 0,0728 0,0028 0,0112 0,5588 0,570 0,55877 57
8 0,08128 0,080 0,0813 0,0013 0,0059 0,5741 0,580 0,57410 58
9 0,09133 0,090 0,0913 0,0013 0,0112 0,5788 0,590 0,57880 59
10 0,09264 0,100 0,0926 0,0074 0,0176 0,5824 0,600 0,58244 60
11 0,10699 0,110 0,1070 0,0030 0,0248 0,5852 0,610 0,58518 61
12 0,10850 0,120 0,1085 0,0115 0,0304 0,5896 0,620 0,58962 62
13 0,11537 0,130 0,1154 0,0146 0,0183 0,6117 0,630 0,61168 63
14 0,12079 0,140 0,1208 0,0192 0,0160 0,6240 0,640 0,62400 64
15 0,14151 0,150 0,1415 0,0085 0,0155 0,6345 0,650 0,63453 65
16 0,15506 0,160 0,1551 0,0049 0,0182 0,6418 0,660 0,64183 66
17 0,17028 0,170 0,1703 0,0003 0,0200 0,6500 0,670 0,65002 67
18 0,18284 0,180 0,1828 0,0028 0,0244 0,6556 0,680 0,65559 68
19 0,19147 0,190 0,1915 0,0015 0,0327 0,6573 0,690 0,65726 69
20 0,19904 0,200 0,1990 0,0010 0,0238 0,6762 0,700 0,67621 70
21 0,19962 0,210 0,1996 0,0104 0,0267 0,6833 0,710 0,68334 71
22 0,20852 0,220 0,2085 0,0115 0,0238 0,6962 0,720 0,69623 72
23 0,21631 0,230 0,2163 0,0137 0,0288 0,7012 0,730 0,70119 73
24 0,22287 0,240 0,2229 0,0171 0,0190 0,7210 0,740 0,72102 74
25 0,22724 0,250 0,2272 0,0228 0,0194 0,7306 0,750 0,73059 75
26 0,23949 0,260 0,2395 0,0205 0,0257 0,7344 0,760 0,73435 76
27 0,24000 0,270 0,2400 0,0300 0,0242 0,7458 0,770 0,74579 77
28 0,26593 0,280 0,2659 0,0141 0,0290 0,7510 0,780 0,75103 78
29 0,27738 0,290 0,2774 0,0126 0,0291 0,7609 0,790 0,76086 79
30 0,28269 0,300 0,2827 0,0173 0,0374 0,7626 0,800 0,76262 80
31 0,29453 0,310 0,2945 0,0155 0,0409 0,7691 0,810 0,76910 81
32 0,29931 0,320 0,2993 0,0207 0,0304 0,7896 0,820 0,78961 82
33 0,30861 0,330 0,3086 0,0214 0,0389 0,7911 0,830 0,79113 83
34 0,33216 0,340 0,3322 0,0078 0,0473 0,7927 0,840 0,79269 84
35 0,33381 0,350 0,3338 0,0162 0,0502 0,7998 0,850 0,79982 85
36 0,33729 0,360 0,3373 0,0227 0,0545 0,8055 0,860 0,80548 86
37 0,33954 0,370 0,3395 0,0305 0,0523 0,8177 0,870 0,81772 87
38 0,34358 0,380 0,3436 0,0364 0,0535 0,8265 0,880 0,82654 88
39 0,34488 0,390 0,3449 0,0451 0,0564 0,8336 0,890 0,83358 89
40 0,35286 0,400 0,3529 0,0471 0,0415 0,8585 0,900 0,85853 90
41 0,36982 0,410 0,3698 0,0402 0,0510 0,8590 0,910 0,85903 91
42 0,38507 0,420 0,3851 0,0349 0,0438 0,8762 0,920 0,87616 92
43 0,38618 0,430 0,3862 0,0438 0,0425 0,8875 0,930 0,88752 93
44 0,40644 0,440 0,4064 0,0336 0,0519 0,8881 0,940 0,88809 94
45 0,41678 0,450 0,4168 0,0332 0,0510 0,8990 0,950 0,89898 95
46 0,42989 0,460 0,4299 0,0301 0,0517 0,9083 0,960 0,90829 96
47 0,43308 0,470 0,4331 0,0369 0,0549 0,9151 0,970 0,91512 97
48 0,44267 0,480 0,4427 0,0373 0,0435 0,9366 0,980 0,93655 98
49 0,45679 0,490 0,4568 0,0332 0,0481 0,9419 0,990 0,94187 99
50 0,49383 0,500 0,4938 0,0062 0,0139 0,9861 1,000 0,98611 100
Definiendo el estadístico de prueba como

𝐷𝑛 =max|𝐻(𝑥) − 𝐹(𝑥)|
∀𝑥

𝐷100 = 0,0564

Para halla el P-valor correspondiente se emplea la tabla de percentiles para la prueba correspondiente

n 0,20 0,10 0,05 0,02 0,01


100 0,106 0,121 0,134 0,150 0,161

Dado que el valor del estadístico de prueba es menor a 0,106, el P-valor será menor a mayor a 0,20. Por lo tanto,
no se rechazará la hipótesis nula. En consecuencia, según las evidencias muéstrales los datos provienen de una
población con función de distribución 𝐹𝑥 .

c. Transformar los datos de la tabla aplicando la ecuación 𝑥 = −2 ln(1 − 𝑅), donde R representa el
número pseudoaleatorio de la tabla. Asuma que los nuevos datos provienen de una distribución
exponencial de media 2. Aplicar la prueba de Kolmogorov-Smirnov y calcular el P-valor.

Solución

Definiendo la variable y la prueba de hipótesis correspondiente

𝑋: 𝑁ú𝑚𝑒𝑟𝑜 𝑃𝑠𝑒𝑢𝑑𝑜𝑎𝑙𝑒𝑡𝑜𝑟𝑖𝑜 𝑔𝑒𝑛𝑒𝑟𝑎𝑑𝑜

𝐻𝑜 : 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑠𝑢𝑚𝑖𝑠𝑡𝑟𝑎𝑑𝑜𝑠 𝑝𝑟𝑜𝑣𝑖𝑒𝑛𝑒𝑛 𝑑𝑒 𝑢𝑛𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑐𝑜𝑛 𝑓𝑢𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑭𝒙

𝐻1 : 𝑙𝑜𝑠 𝑑𝑎𝑡𝑜𝑠 𝑠𝑢𝑚𝑖𝑠𝑡𝑟𝑎𝑑𝑜𝑠 𝑛𝑜 𝑝𝑟𝑜𝑣𝑖𝑒𝑛𝑒𝑛 𝑑𝑒 𝑢𝑛𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑐𝑜𝑛 𝑓𝑢𝑛𝑐𝑖ó𝑛 𝑑𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑭𝒙

0, 𝑥<0
𝐹𝑥 (𝑥) = { 1
− 𝑥
1−𝑒 2 , 𝑥≥0

Agrupando y ordenando los datos según la ecuación mencionada se obtiene lo siguiente:

Nº R x H(x) F(x) |H(x)-F(x)| F(x) H(x) x R Nº


1 0,00121 0,00242 0,010 0,0012 0,0088 0,0104 0,4996 0,510 1,38477 0,49962 51
2 0,03185 0,06474 0,020 0,0319 0,0119 0,0022 0,5178 0,520 1,45883 0,51781 52
3 0,03272 0,06653 0,030 0,0327 0,0027 0,0056 0,5356 0,530 1,53397 0,53559 53
4 0,05010 0,10280 0,040 0,0501 0,0101 0,0032 0,5433 0,540 1,56724 0,54325 54
5 0,05230 0,10743 0,050 0,0523 0,0023 0,0017 0,5517 0,550 1,60459 0,55170 55
6 0,05475 0,11261 0,060 0,0548 0,0053 0,0026 0,5574 0,560 1,63031 0,55743 56
7 0,07281 0,15119 0,070 0,0728 0,0028 0,0112 0,5588 0,570 1,63638 0,55877 57
8 0,08128 0,16955 0,080 0,0813 0,0013 0,0059 0,5741 0,580 1,70710 0,57410 58
9 0,09133 0,19155 0,090 0,0913 0,0013 0,0112 0,5788 0,590 1,72929 0,57880 59
10 0,09264 0,19443 0,100 0,0926 0,0074 0,0176 0,5824 0,600 1,74665 0,58244 60
11 0,10699 0,22631 0,110 0,1070 0,0030 0,0248 0,5852 0,610 1,75982 0,58518 61
12 0,10850 0,22970 0,120 0,1085 0,0115 0,0304 0,5896 0,620 1,78134 0,58962 62
13 0,11537 0,24517 0,130 0,1154 0,0146 0,0183 0,6117 0,630 1,89185 0,61168 63
14 0,12079 0,25746 0,140 0,1208 0,0192 0,0160 0,6240 0,640 1,95633 0,62400 64
15 0,14151 0,30516 0,150 0,1415 0,0085 0,0155 0,6345 0,650 2,01314 0,63453 65
16 0,15506 0,33698 0,160 0,1551 0,0049 0,0182 0,6418 0,660 2,05350 0,64183 66
17 0,17028 0,37333 0,170 0,1703 0,0003 0,0200 0,6500 0,670 2,09976 0,65002 67
18 0,18284 0,40384 0,180 0,1828 0,0028 0,0244 0,6556 0,680 2,13184 0,65559 68
19 0,19147 0,42507 0,190 0,1915 0,0015 0,0327 0,6573 0,690 2,14157 0,65726 69
20 0,19904 0,44389 0,200 0,1990 0,0010 0,0238 0,6762 0,700 2,25532 0,67621 70
21 0,19962 0,44534 0,210 0,1996 0,0104 0,0267 0,6833 0,710 2,29985 0,68334 71
22 0,20852 0,46770 0,220 0,2085 0,0115 0,0238 0,6962 0,720 2,38297 0,69623 72
23 0,21631 0,48748 0,230 0,2163 0,0137 0,0288 0,7012 0,730 2,41589 0,70119 73
24 0,22287 0,50430 0,240 0,2229 0,0171 0,0190 0,7210 0,740 2,55323 0,72102 74
25 0,22724 0,51557 0,250 0,2272 0,0228 0,0194 0,7306 0,750 2,62304 0,73059 75
26 0,23949 0,54753 0,260 0,2395 0,0205 0,0257 0,7344 0,760 2,65115 0,73435 76
27 0,24000 0,54887 0,270 0,2400 0,0300 0,0242 0,7458 0,770 2,73919 0,74579 77
28 0,26593 0,61830 0,280 0,2659 0,0141 0,0290 0,7510 0,780 2,78085 0,75103 78
29 0,27738 0,64974 0,290 0,2774 0,0126 0,0291 0,7609 0,790 2,86141 0,76086 79
30 0,28269 0,66449 0,300 0,2827 0,0173 0,0374 0,7626 0,800 2,87619 0,76262 80
31 0,29453 0,69778 0,310 0,2945 0,0155 0,0409 0,7691 0,810 2,93154 0,76910 81
32 0,29931 0,71138 0,320 0,2993 0,0207 0,0304 0,7896 0,820 3,11758 0,78961 82
33 0,30861 0,73810 0,330 0,3086 0,0214 0,0389 0,7911 0,830 3,13209 0,79113 83
34 0,33216 0,80741 0,340 0,3322 0,0078 0,0473 0,7927 0,840 3,14708 0,79269 84
35 0,33381 0,81236 0,350 0,3338 0,0162 0,0502 0,7998 0,850 3,21708 0,79982 85
36 0,33729 0,82284 0,360 0,3373 0,0227 0,0545 0,8055 0,860 3,27444 0,80548 86
37 0,33954 0,82964 0,370 0,3395 0,0305 0,0523 0,8177 0,870 3,40442 0,81772 87
38 0,34358 0,84191 0,380 0,3436 0,0364 0,0535 0,8265 0,880 3,50362 0,82654 88
39 0,34488 0,84587 0,390 0,3449 0,0451 0,0564 0,8336 0,890 3,58648 0,83358 89
40 0,35286 0,87039 0,400 0,3529 0,0471 0,0415 0,8585 0,900 3,91134 0,85853 90
41 0,36982 0,92350 0,410 0,3698 0,0402 0,0510 0,8590 0,910 3,91842 0,85903 91
42 0,38507 0,97249 0,420 0,3851 0,0349 0,0438 0,8762 0,920 4,17753 0,87616 92
43 0,38618 0,97611 0,430 0,3862 0,0438 0,0425 0,8875 0,930 4,36996 0,88752 93
44 0,40644 1,04323 0,440 0,4064 0,0336 0,0519 0,8881 0,940 4,38012 0,88809 94
45 0,41678 1,07838 0,450 0,4168 0,0332 0,0510 0,8990 0,950 4,58487 0,89898 95
46 0,42989 1,12385 0,460 0,4299 0,0301 0,0517 0,9083 0,960 4,77825 0,90829 96
47 0,43308 1,13507 0,470 0,4331 0,0369 0,0549 0,9151 0,970 4,93303 0,91512 97
48 0,44267 1,16920 0,480 0,4427 0,0373 0,0435 0,9366 0,980 5,51501 0,93655 98
49 0,45679 1,22052 0,490 0,4568 0,0332 0,0481 0,9419 0,990 5,69015 0,94187 99
50 0,49383 1,36177 0,500 0,4938 0,0062 0,0139 0,9861 1,000 8,55317 0,98611 100

Definiendo el estadístico de prueba como

𝐷𝑛 =max|𝐻(𝑥) − 𝐹(𝑥)|
∀𝑥

𝐷100 = 0,0564

Para halla el P-valor correspondiente se emplea la tabla de percentiles para la prueba correspondiente

n 0,20 0,10 0,05 0,02 0,01


100 0,106 0,121 0,134 0,150 0,161

Dado que el valor del estadístico de prueba es menor a 0,106, el P-valor será menor a mayor a 0,20. Por lo tanto,
no se rechazará la hipótesis nula. En consecuencia, según las evidencias muéstrales los datos provienen de una
población con función de distribución 𝐹𝑥 .
2. A continuación, se presentan los siguientes datos:

Tiempo de Número de Número de Número de


Número Distancia (X2)
suministro (Y) envases (X1) máquinas (X3) ubicaciones (X4)
1 09,95 2 50 1 1
2 24,45 8 110 1 1
3 31,75 11 120 2 1
4 35,00 10 550 2 2
5 25,02 8 295 1 1
6 16,86 4 200 1 1
7 14,38 2 375 1 1
8 09,60 2 52 1 1
9 24,35 9 100 1 1
10 27,50 8 300 2 1
11 17,08 4 412 2 2
12 37,00 11 400 3 2
13 41,95 12 500 3 3
14 11,66 2 360 1 1
15 21,65 4 205 2 2
16 17,89 4 400 2 1
17 69,00 20 600 4 4
18 10,30 1 585 1 1
19 34,93 10 540 2 1
20 46,59 15 250 3 2
21 44,88 15 290 3 1
22 54,12 16 510 3 3
23 56,63 17 590 2 2
24 22,13 6 100 2 1
25 21,15 5 400 1 1

El conjunto de datos anterior muestra información acerca del tiempo que requiere un vendedor para dar servicio
a una máquina expendedora de refrescos, con el número de envases contenidos en la máquina, la distancia del
vehículo de servicio al sitio donde se encuentra la máquina, el número de máquinas expendedoras y el número
de ubicaciones de las máquinas. Se desea construir todos los modelos de regresión lineal múltiple posibles
considerando desde una sola variable hasta las cuatro variables. Calcule para cada caso el coeficiente de
determinación y de correlación y establezca conclusiones acerca del mejor modelo.

Recordando las ecuaciones para modelos de regresión con una variable


̂𝑜 = 𝑌̅ − 𝛽
𝛽 ̂1 𝑋̅

𝑆𝑥𝑦 ∑(𝑥𝑖 − 𝑋̅)(𝑦𝑖 − 𝑌̅ )


̂1 =
𝛽 =
𝑆𝑥𝑥 ∑(𝑥𝑖 − 𝑋̅)2

Los coeficientes de determinación y de correlación vienen expresados por las siguientes ecuaciones:

∑(𝑦̂𝑖 − 𝑌̅ )2
𝑅2 =
∑(𝑦𝑖 − 𝑌̅ )2

∑(𝑦𝑖 − 𝑌̅ )2 − ∑(𝑦̂𝑖 − 𝑌̅)2


𝑟=√
∑(𝑦𝑖 − 𝑌̅)2
Nota: Para el cálculo de los modelos que involucran una sola variable se emplearon comandos de Excel y
cálculos manuales, para los modelos con más de una variable si se empleó una herramienta estadística adecuada.

Solución

Los promedios de las variables son:

Variable 𝑌 𝑋1 𝑋2 𝑋3 𝑋4
Promedio 29,0328 8,24 331,76 1,88 1,52
Syy /Sxx 6105,945 698,560 780230,560 18,640 16,240
Sxy 2027,713 34018,667 281,918 235,664

Haciendo uso del complemento para el análisis de datos de Microsoft Office Excel, se obtienen los valores
correspondientes de los estimadores.

Variables ̂𝑜
𝛽 ̂1
𝛽 ̂2
𝛽 ̂3
𝛽 ̂4
𝛽
X1 5,1145 2,0927
X2 14,5678 0,0436
X3 0,5990 15,1244
X4 6,9756 14,5113
X1-X2 2,2638 2,7443 0,0125
X1-X3 2,9199 2,5508 2,7098
X1-X4 2,6457 2,5477 3,5485
X2-X3 -1,9153 0,0149 13,8293
X2-X4 5,2580 0,0113 13,1847
X3-X4 -0,1318 11,6354 4,7960
X1-X2-X3 1,0013 2,5092 0,0112 1,9435
X1-X2-X4 1,3671 2,5349 0,0085 2,5993
X1-X3-X4 2,3763 2,5013 0,5701 3,2721
X2-X3-X4 -1,7672 0,0108 11,6058 3,5436
X1-X2-X3-X4 1,0681 2,4842 0,0086 0,6224 2,2939

Los modelos de regresión lineal serán los siguientes, cumpliendo los criterios de la siguiente ecuación:

̂𝑜 + 𝛽̂1 𝑋1 + ⋯ + 𝛽̂4 𝑋4
𝑅𝑒𝑐𝑡𝑎 𝑑𝑒 𝑚𝑒𝑗𝑜𝑟 𝑎𝑗𝑢𝑠𝑡𝑒: 𝑌 = 𝛽

Variables Y 𝑅2 r
X1 5,1145 + 2,0927𝑋1 0,9640 0,9818
X2 14,5678 + 0,0436𝑋1 0,2429 0,4929
X3 0,5990 + 15,1244𝑋1 0,6983 0,8356
X4 6,9756 + 14,5113𝑋1 0,5601 0,7484
X1-X2 2,2638 + 2,7443𝑋1 + 0,0125𝑋2 0,9811 0,9905
X1-X3 2,9199 + 2,5508𝑋1 + 2,7098𝑋2 0,9722 0,9860
X1-X4 2,6457 + 2,5477𝑋1 + 3,5485𝑋2 0,9830 0,9915
X2-X3 −1,9153 + 0,0149𝑋1 + 13,8293𝑋2 0,7216 0,8495
X2-X4 5,2580 + 0,0113𝑋1 + 13,1847𝑋2 0,5716 0,7560
X3-X4 −0,1318 + 11,6354𝑋1 + 4,7960𝑋2 0,7223 0,8499
X1-X2-X3 1,0013 + 2,5092𝑋1 + 0,0112𝑋2 + 1,9435𝑋3 0,9852 0,9926
X1-X2-X4 1,3671 + 2,5349𝑋1 + 0,0085𝑋2 + 2,5993𝑋3 0,9896 0,9948
X1-X3-X4 2,3763 + 2,5013𝑋1 + 0,5701𝑋2 + 3,2721𝑋3 0,9833 0,9916
X2-X3-X4 −1,7672 + 0,0108𝑋1 + 11,6058𝑋2 + 13,5436𝑋3 0,7330 0,8561
X1-X2-X3-X4 1,0681 + 2,4842𝑋1 + 0,0086𝑋2 + 0,6224𝑋3 + 2,2939𝑋4 0,9899 0,9949
Al ordenar los coeficientes de determinación de menor a mayor podemos apreciar cual es el mejor modelo que
se adapta a la variable dependiente.

Variables 𝑅2 r
X2 0,242917473 0,492866588
X4 0,560074917 0,748381532
X2-X4 0,57158123 0,756029913
X3 0,698309691 0,835649263
X2-X3 0,721624604 0,849484905
X3-X4 0,722326828 0,849898128
X2-X3-X4 0,732990763 0,856148797
X1 0,963954368 0,981811778
X1-X3 0,97220237 0,98600323
X1-X2 0,981137483 0,990523843
X1-X4 0,983029633 0,991478509
X1-X3-X4 0,983278947 0,991604229
X1-X2-X3 0,985175067 0,992559856
X1-X2-X4 0,989614927 0,994793912
X1-X2-X3-X4 0,989911963 0,994943196

Observamos que el número de envases (X1) influye en un mayor grado al tiempo de suministro (Y) de las
máquinas expendedoras, por otro lado, la que menos influye es la distancia del vehículo de servicio (X2) a la
máquina expendedora. En la tabla anterior se aprecia que el mejor modelo de regresión lineal es el que
contempla las cuatro variables.

Por otro lado, en los gráficos anexos se aprecia el grado dispersión de los modelos de una sola variable,
nuevamente la de mayor correlación es la variable X1 y la de menor correlación es la variable X2.
Anexos

Gráficos de los modelos que involucran una sola variable

Gráfico de la Variable X1
80

70 y = 2.9027x + 5.1145
R² = 0.964
Tiempo de Suministro (Y)

60

50
Tiempo de suministro según
40 el número de envases

30 Linear (Tiempo de
suministro según el número
20 de envases)

10

0
0 5 10 15 20 25
Número de envases (X1)

Gráfico de la Variable X2
80

70
y = 0.0436x + 14.568
Tiempo de Suministro (Y)

60 R² = 0.2429

50
Tiempo de suministro
40 según la distancia

30 Linear (Tiempo de
suministro según la
20 distancia)

10

0
0 200 400 600 800
Distancia (X2)
Gráfico de la Variable X3
80

70
y = 15.124x + 0.599
R² = 0.6983
Tiempo de Suministro (Y)

60

50
Tiempo de suministro según
40 el número de máquinas

30 Linear (Tiempo de
suministro según el número
20 de máquinas)

10

0
0 1 2 3 4 5
Número de máquinas (X3)

Gráfico de la Variable X4
80

70
y = 14.511x + 6.9756
R² = 0.5601
Tiempo de Suministro (Y)

60

50
Tiempo de suministro según
40 el número de ubicaciones

30 Linear (Tiempo de
suministro según el número
20 de ubicaciones)

10

0
0 1 2 3 4 5
Número de ubicaciones (X4)
Resultados obtenidos mediante Microsoft Excel

 Modelos de una sola variable

Resumen (x1)

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,981811778
Coeficiente de determinación R^2 0,963954368
R^2 ajustado 0,962387167
Error típico 3,093419627
Observaciones 25

ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 1 5885,852069 5885,852069 615,0800898 4,24118E-18
Residuos 23 220,0926348 9,569244992
Total 24 6105,944704

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95% Superior 95%
Intercepción 5,114515575 1,145804127 4,463691004 0,000177215 2,744239147 7,484792003 2,744239147 7,484792003
Número de envases (x1) 2,902704421 0,117040719 24,80080825 4,24118E-18 2,660587247 3,144821594 2,660587247 3,144821594

Resumen (x2)

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,492866588
Coeficiente de determinación R^2 0,242917473
R^2 ajustado 0,210000842
Error típico 14,17699306
Observaciones 25

ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 1 1483,24066 1483,24066 7,379779207 0,012306754
Residuos 23 4622,704044 200,9871323
Total 24 6105,944704

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95% Superior 95%
Intercepción 14,56780276 6,032587731 2,414851372 0,024094662 2,088444239 27,04716128 2,088444239 27,04716128
Distancia (x2) 0,043600787 0,016049912 2,716574904 0,012306754 0,010399015 0,07680256 0,010399015 0,07680256

Resumen (x3)

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,835649263
Coeficiente de determinación R^2 0,698309691
R^2 ajustado 0,685192721
Error típico 8,949385082
Observaciones 25

ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 1 4263,840357 4263,840357 53,23711894 2,00475E-07
Residuos 23 1842,104347 80,09149334
Total 24 6105,944704

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95% Superior 95%
Intercepción 0,598969957 4,288368785 0,139673145 0,890134139 -8,272196767 9,470136681 -8,272196767 9,470136681
Número de máquinas (x3) 15,12437768 2,072861292 7,296377111 2,00475E-07 10,8363374 19,41241797 10,8363374 19,41241797

Resumen (x4)

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,748381532
Coeficiente de determinación R^2 0,560074917
R^2 ajustado 0,54094774
Error típico 10,80691853
Observaciones 25

ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 1 3419,786476 3419,786476 29,2816291 1,69165E-05
Residuos 23 2686,158228 116,7894882
Total 24 6105,944704

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95% Superior 95%
Intercepción 6,975615764 4,613757038 1,51191658 0,144174532 -2,568667846 16,51989937 -2,568667846 16,51989937
Número de ubicaciones (x4) 14,51130542 2,681691807 5,411250234 1,69165E-05 8,963803253 20,05880758 8,963803253 20,05880758
 Modelos con dos variables

Resumen (x1-x2)

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,990523843
Coeficiente de determinación R^2 0,981137483
R^2 ajustado 0,979422709
Error típico 2,288046833
Observaciones 25

ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 5990,771221 2995,385611 572,1671503 1,07546E-19
Residuos 22 115,1734828 5,235158308
Total 24 6105,944704

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95% Superior 95%
Intercepción 2,263791434 1,060066238 2,135518851 0,044099451 0,065348613 4,462234256 0,065348613 4,462234256
Número de envases (x1) 2,744269643 0,093523844 29,34299438 3,90691E-19 2,550313061 2,938226226 2,550313061 2,938226226
Distancia (x2) 0,012527811 0,002798419 4,476746229 0,000188266 0,006724246 0,018331377 0,006724246 0,018331377

Resumen (x1-x3)

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,98600323
Coeficiente de determinación R^2 0,97220237
R^2 ajustado 0,969675313
Error típico 2,777595359
Observaciones 25

ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 5936,213912 2968,106956 384,7171892 7,65747E-18
Residuos 22 169,7307915 7,715035979
Total 24 6105,944704

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95% Superior 95%
Intercepción 2,919860406 1,34027143 2,178559015 0,040360129 0,140307584 5,699413228 0,140307584 5,699413228
Número de envases (x1) 2,550789975 0,173251512 14,72304596 7,14294E-13 2,19148833 2,910091619 2,19148833 2,910091619
Número de máquinas (x3) 2,709803299 1,060610535 2,554946619 0,018055393 0,510231676 4,909374923 0,510231676 4,909374923

Resumen (x1-x4)

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,991478509
Coeficiente de determinación R^2 0,983029633
R^2 ajustado 0,981486873
Error típico 2,170254715
Observaciones 25

ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 6002,324582 3001,162291 637,188698 3,36205E-20
Residuos 22 103,6201217 4,71000553
Total 24 6105,944704

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95% Superior 95%
Intercepción 2,645733123 0,944810089 2,800280345 0,010428924 0,686316924 4,605149322 0,686316924 4,605149322
Número de envases (x1) 2,547728047 0,108802884 23,41599737 4,82005E-17 2,322084676 2,773371417 2,322084676 2,773371417
Número de ubicaciones (x4) 3,548544588 0,713590816 4,972800251 5,6272E-05 2,068647813 5,028441362 2,068647813 5,028441362

Resumen (x2-x3)

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,849484905
Coeficiente de determinación R^2 0,721624604
R^2 ajustado 0,69631775
Error típico 8,789830839
Observaciones 25

ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 4406,199928 2203,099964 28,51498642 7,77928E-07
Residuos 22 1699,744776 77,26112618
Total 24 6105,944704

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95% Superior 95%
Intercepción -1,915252261 4,601185424 -0,416251919 0,681258494 -11,45752679 7,627022271 -11,45752679 7,627022271
Distancia (x2) 0,014917401 0,010989561 1,357415543 0,18841198 -0,007873553 0,037708354 -0,007873553 0,037708354
Número de máquinas (x3) 13,829284823 2,248375565 6,150789504 3,43321E-06 9,166439293 18,49213035 9,166439293 18,49213035
Resumen (x2-x4)

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,756029913
Coeficiente de determinación R^2 0,571581230
R^2 ajustado 0,532634069
Error típico 10,90433884
Observaciones 25

ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 3490,043382 1745,021691 14,67581245 8,92387E-05
Residuos 22 2615,901322 118,9046056
Total 24 6105,944704

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95% Superior 95%
Intercepción 5,258037028 5,163821662 1,018245279 0,319629246 -5,451073644 15,9671477 -5,451073644 15,9671477
Distancia (x2) 0,011254995 0,014641991 0,768679276 0,450257352 -0,019110635 0,041620625 -0,019110635 0,041620625
Número de ubicaciones (x4) 13,184740726 3,209361153 4,108213472 0,000463212 6,528933065 19,84054839 6,528933065 19,84054839

Resumen (x3-x4)

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,84989813
Coeficiente de determinación R^2 0,72232683
R^2 ajustado 0,697083812
Error típico 8,778737314
Observaciones 25

ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 4410,48767 2205,243835 28,61491821 7,56612E-07
Residuos 22 1695,457034 77,06622883
Total 24 6105,944704

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95% Superior 95%
Intercepción -0,13175025 4,239819278 -0,031074497 0,97549032 -8,924597266 8,661096761 -8,924597266 8,661096761
Número de máquinas (x3) 11,63544598 3,245217018 3,58541383 0,001648399 4,905277805 18,36561415 4,905277805 18,36561415
Número de ubicaciones (x4) 4,79599461 3,476751785 1,379446941 0,18161885 -2,414347276 12,0063365 -2,414347276 12,0063365
 Modelos con tres variables

Resumen (x1-x2-x3)

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,992559856
Coeficiente de determinación R^2 0,985175067
R^2 ajustado 0,983057219
Error típico 2,076171175
Observaciones 25

ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 3 6015,424482 2005,141494 465,1775106 2,3472E-19
Residuos 21 90,52022167 4,310486746
Total 24 6105,944704

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95% Superior 95%
Intercepción 1,001310967 1,097239424 0,912572903 0,371825395 -1,28052333 3,283145264 -1,28052333 3,283145264
Número de envases (x1) 2,509184848 0,129863615 19,32169259 7,46946E-15 2,239118676 2,77925102 2,239118676 2,77925102
Distancia (x2) 0,011158547 0,00260303 4,28675252 0,000327299 0,005745249 0,016571845 0,005745249 0,016571845
Número de máquinas (x3) 1,943535227 0,812677781 2,391520074 0,026217191 0,253479263 3,633591192 0,253479263 3,633591192

Resumen (x1-x2-x4)

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,994793912
Coeficiente de determinación R^2 0,989614927
R^2 ajustado 0,988131345
Error típico 1,73768705
Observaciones 25

ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 3 6042,534022 2014,178007 667,0443662 5,60166E-21
Residuos 21 63,41068195 3,019556284
Total 24 6105,944704

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95% Superior 95%
Intercepción 1,367068345 0,833704464 1,63975174 0,115952049 -0,366715 3,100851691 -0,366715 3,100851691
Número de envases (x1) 2,534918731 0,08718736 29,0743835 1,8976E-18 2,35360269 2,716234771 2,35360269 2,716234771
Distancia (x2) 0,00852152 0,002335203 3,649156139 0,001498443 0,0036652 0,01337784 0,0036652 0,01337784
Número de ubicaciones (x4) 2,599277556 0,627791365 4,140352516 0,000464526 1,293713942 3,904841169 1,293713942 3,904841169

Resumen (x1-x3-x4)

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,991604229
Coeficiente de determinación R^2 0,983278947
R^2 ajustado 0,980890225
Error típico 2,204949233
Observaciones 25

ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 3 6003,846881 2001,282294 411,6339284 8,29874E-19
Residuos 21 102,0978235 4,861801118
Total 24 6105,944704

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95% Superior 95%
Intercepción 2,3763283 1,073886606 2,212829816 0,038119207 0,143058848 4,609597753 0,143058848 4,609597753
Número de envases (x1) 2,501343196 0,138170405 18,10332103 2,72338E-14 2,214002109 2,788684283 2,214002109 2,788684283
Número de máquinas (x3) 0,570096391 1,018818968 0,559565937 0,581695348 -1,548653641 2,688846423 -1,548653641 2,688846423
Número de ubicaciones (x4) 3,272120099 0,877300964 3,729757782 0,001237436 1,447672868 5,096567331 1,447672868 5,096567331

Resumen (x2-x3-x4)

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,856148797
Coeficiente de determinación R^2 0,732990763
R^2 ajustado 0,694846586
Error típico 8,811095921
Observaciones 25

ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 3 4475,601066 1491,867022 19,21632148 3,13249E-06
Residuos 21 1630,343638 77,63541133
Total 24 6105,944704

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95% Superior 95%
Intercepción -1,767220588 4,614973604 -0,382931895 0,705618925 -11,36458359 7,830142412 -11,36458359 7,830142412
Distancia (x2) 0,010835712 0,011831838 0,915809713 0,370164076 -0,013769941 0,035441365 -0,013769941 0,035441365
Número de máquinas (x3) 11,60577633 3,257340068 3,562961217 0,001837751 4,83176683 18,37978584 4,83176683 18,37978584
Número de ubicaciones (x4) 3,543621944 3,747951956 0,945482222 0,355165414 -4,250670834 11,33791472 -4,250670834 11,33791472
 Modelo con las cuatro variables

Resumen (x1-x2-x3-x4)

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,994943196
Coeficiente de determinación R^2 0,989911963
R^2 ajustado 0,987894356
Error típico 1,754950088
Observaciones 25

ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 4 6044,347708 1511,086927 490,6365631 1,18976E-19
Residuos 20 61,59699625 3,079849812
Total 24 6105,944704

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95% Superior 95%
Intercepción 1,068134045 0,927733013 1,151337756 0,263172028 -0,867083109 3,003351199 -0,867083109 3,003351199
Número de envases (x1) 2,484232443 0,110072947 22,56896459 1,06266E-15 2,254624299 2,713840587 2,254624299 2,713840587
Distancia (x2) 0,008553692 0,002358775 3,626328786 0,001682212 0,003633375 0,013474009 0,003633375 0,013474009
Número de máquinas (x3) 0,622369141 0,81102045 0,767390195 0,451814572 -1,069389872 2,314128155 -1,069389872 2,314128155
Número de ubicaciones (x4) 2,293923555 0,748549197 3,064492705 0,006117573 0,73247729 3,855369819 0,73247729 3,855369819

Das könnte Ihnen auch gefallen