Sie sind auf Seite 1von 74

UNIVERSIDAD NACIONAL ABIERTA

VICERRECTORADO ACADMICO
REA: INGENIERA
CARRERA: INGENIERA INDUSTRIAL
ASIGNATURA: INFERENCIA ESTADISTICA

TRABAJO PRCTICO
INFERENCIA ESTADISTICA

INTEGRANTE:
JOHNNATAN ALEXANDER GARCIA 18.836.593
REA DE INGENIERA
CARRERA DE INGENIERA INDUSTRIAL

LAPSO: 2015/2
1

INDICE
Introduccin ............................................................................................................................. 3
Desarrollo ................................................................................................................................ 4
CASO DE ESTUDIO: ................................................................................................................ 4
Desarrollo del Objetivo 8 ...................................................................................................... 5
OBJETIVO 8 ................................................................................................................... 5
Solucin ................................................................................................................................. 6
Desarrollo Objetivo 8 ..................................................................................................... 6
OBJETIVO 9.......................................................................................................................... 43
Solucin ............................................................................................................................... 44
Desarrollo Objetivo 9 ................................................................................................ 44
Antes de proceder a los clculos respectivos, se deber de exponer la implicancia
de un modelo de regresin lineal mltiple, en donde: .................................................... 44
Anlisis para los clculos anteriores: ................................................................................ 47
Anlisis para los clculos anteriores: ................................................................................ 57
Ahora procederemos a comparar el modelo 1 con el modelo 2 y definir as cual modelo
elegir ................................................................................................................................... 67
Desarrollo Objetivo 10 ......................................................................................................... 68
Solucin ............................................................................................................................... 69
Desarrollo Objetivo 10 .............................................................................................. 69
Conclusin:............................................................................................................................ 74

Introduccin

Unas de las habilidades apreciadas en distintos niveles incluyendo el


empresarial, es la capacidad metdica y razonada, presente para el anlisis
de diversos modelos a razn de particulares situaciones los cuales puedan
ser analizados desde distintas perspectivas, y con la utilizacin de mltiples
herramientas computacionales, ya que la toma de decisin ser mejor
definida por medio de variados anlisis, de all la importancia que radica la
inferencia estadstica. La cual permite a razn de particulares relaciones y
clculos proyectar el devenir de una eleccin u otra,

o de mltiples

elecciones, que podran repercutir en perdida de ganancias o generacin de


eventos no deseados.
De esta manera, en la siguientes paginas analizaremos mltiples
variables contrastndolas desde distintos puntos de verificacin; cada una de
estas

verificaciones

presentara sus particulares caractersticas y

condiciones previas para su operacin, como veremos en algunos casos; los


cuales nos permitirn establecer la aplicacin o no aplicacin de los anlisis
a los distintos supuestos que verificaremos, todo ello bajo un marco
estadsticos analizando su comportamiento a razn de sus respectivas
grficas y resultados obtenidos por medio de Excel, MegaStat, SPSS, Minitab
y de StatPlus, (lo cual supone un nivel previo de formacin en cada uno de
estos programas para ejecutar las funciones requeridas); obteniendo
indicadores como niveles de significancia, FIV, Durbis Wattson, Pruebas de
Homecedasticidad, ANOVA, entre otras, que en conjunto formaran una visin
global en relacin a lo que est aconteciendo en las respectivas
evaluaciones, de esta manera adentrndonos a este profundo, extenso e
interesante mundo de la estadstica.

Desarrollo
CASO DE ESTUDIO:
El archivo \DATA.xls" contiene informacin extrada del Banco Mundial
de Datos (web:datos.bancomundial.org) referente a 113 pases y que forma
parte de un estudio sobre el cambio climtico. Las variables consideradas
son:

Y1: Las emisiones de CO2 derivadas del consumo de combustible lquido


(% del total).
Y2: Emisiones de CO2 (toneladas mtricas per cpita).
X1: Combustibles renovables y residuos (% del total de energa).
X2: Consumo de energa procedente de combustibles fsiles (% del
total).
X3: Crecimiento de la poblacin (% anual).
X4: Importaciones de energa, valor neto (% del uso de energa).
X5: INB per cpita, mtodo Atlas (En dlares a precios actuales).
X6: ndice de benecitos del FMAM para la biodiversidad (0= sin potencial
de biodiversidad a 100=mximo).
X7: Industria, valor agregado (% del PIB).
X8: PIB por unidad de uso de energa, (PPA a dlares por kg de
equivalente de petrleo).
X9: Promedio detallado de precipitaciones (mm anuales).
X10: Uso de energa (kg de equivalente de petrleo per cpita).
X11: Rentas totales de los recursos naturales (% del PIB).
X12: rea selvtica (kilmetros cuadrados).

Desarrollo del Objetivo 8


Lo primero ser, exponer su enunciado el cual dice:
OBJETIVO 8
8.1 Determinar cules de las variables consideradas en el caso de estudio
siguen o no una distribucin normal.

Tomar en cuenta las siguientes indicaciones:

Utilizar la frmula de Sturges.

Usar los criterios para la agrupacin de datos.

Establecer el cuerpo de hiptesis correspondiente.

Aplicar la prueba Chi-cuadrado con un nivel de significacin = 0,05.

8.2 Considerar la siguiente categorizacin,

8.2.a para determinar si las variables X3 y X9 son independientes.


8.2.b para determinar si las variables X2 y X11 son independientes.
Tomar en cuenta las siguientes indicaciones:

Establecer el cuerpo de hiptesis correspondiente.

Construir la respectiva tabla de contingencia.

Aplicar la prueba Chi-cuadrado con un nivel de significacin = 0,05.

Solucin
Desarrollo Objetivo 8
Inciso 8.1
Un anlisis variable a variable para la determinacin de un
cumplimiento de normalidad o no cumplimiento de esta condicin, se puede
establecer por distintos mtodos, entre los disponibles aplicaremos la prueba
de Kolomogorov-Smirnov, la cual, se adecua mejor para muestras mayores a
50 elementos.
No obstante primero se atender las solicitudes requeridas para cada
una de las variables de esta manera, el primer paso ser:

Utilizar la frmula de Sturges.

Usar los criterios para la agrupacin de datos.


Regla de Sturges (K):
K=1+ [(3,322) (log n)]

; Donde n es igual al tamao de la

Muestra.
La aplicacin de la Regla de Sturges, establecer el nmero de
intervalos de clase (siempre impar), para la elaboracin del respectivo
histograma de frecuencia, que corresponda a cada variable.
Luego de haber establecido el nmero de clases se proceder a
definir la amplitud de cada clase, a razn de la siguiente relacin:
Amplitud de Clase (A):

A= [Rango (R)/Numero de Clases (K)]= R/K

Donde Rango (R):

R= (Valor Mayor)-(Valor Menor)

Bajo los anteriores criterios de agrupacin de datos, se proceder a


establecer los histogramas de frecuencia para cada variable atendiendo las
especificaciones de Sturges, quedando para cada una de ellas de la
siguiente manera:

La tabla de distribucin de frecuencia abarcar los 113 pases con sus 113 muestra
TABLA DE STURGERS PARA Y1
"Las emisiones de dioxido de carbono del consumo de combustible liquidos (% del Total)"
n=
n= 113
Paises Muestra Y1
AGO 35,0197
ALB 87,7969
ARE 23,8373
ARM 18,2476
AUS 27,2236
AUT 51,3569
AZE 37,5841
BEL
47,0174
BEN 82,7896
BGD 24,0732
BIH
20,1584
BLR
27,6477
BOL
58,574
BRA
66,137
BWA 48,83
CAN 46,6985
CHE 77,093
CHL 65,9756
CHN 14,8391
CIV 54,6084
CMR 78,4412

Regla de Sturges
Numero de Clases
K=1+[(3,322) (log n)]
K= 7

Rango
R= V. Mayor - V. Menor

Amplitud de Clase
A=R/K

Valor Mayor= 98,7696


Valor Menor= 10,0214

A= 12,6783

R= 88,7482
L.I
,
L.S
Intervalos de clase Y1
[ 10,0214 , 22,6997 )
[ 22,6997 , 35,3780 )
[ 35,3780 , 48,0563 )
[ 48,0563 , 60,7347 )
[ 60,7347 , 73,4130 )
[ 73,4130 , 86,0913 )
[ 86,0913 , 98,7696 ]

fi

xi

15 16,3606
16 29,0389
20 41,7172
21 54,3955
14 67,0738
11 79,7521
16 92,4304
113 380,7685

Total
fi=Frecuencia
xi= Marca de Clase
F.R.S=Frecuencia Relativa Simple
% SIMPLE=Porcentaje
=Media
L.I=Limite Inferion
L.S=Limite Superior

F.R.S
0,1327
0,1416
0,1770
0,1858
0,1239
0,0973
0,1416
1

%SIMPLE
13,2743
14,1593
17,6991
18,5841
12,3894
9,7345
14,1593
100

(fi)( xi)
245,4084
464,6219
834,3437
1142,3055
939,0334
877,2734
1478,8871
5981,8734

(fi)( xi2)

4015,01745
13492,09686
34806,47168
62136,27883
62984,55188
69964,42213
136694,1883
384093,0271 52,9369

La tabla de distribucin de frecuencia abarcar los 113 pases con sus 113 muestra
TABLA DE STURGERS PARA Y2
"Las emisiones de dioxido de carbono (Toneladas metricas per capita)"
n=
n= 113
Paises Muestra Y2
AGO 1,3111
ALB
1,5075
ARE 23,1951
ARM 1,6948
AUS
17,467
AUT
8,4051
AZE
3,5553
BEL
9,7137
BEN
0,5163
BGD 0,3198
BI H
4,5804
BLR
6,3056
BOL
1,3182
BRA
1,884
BWA 2,4353
CAN 17,0519
CHE
5,0349
CHL
4,3516
CHN 5,1536
CI V
0,3649
CMR 0,3058

Regla de Sturges
Numero de Clases
K=1+[(3,322) (log n)]
K= 7

Rango
R= V. Mayor - V. Menor

Amplitud de Clase
A=R/K

Valor Mayor= 36,8168


Valor Menor= 0,0473

A= 5,2528

R= 36,7695
L.I
,
L.S
Intervalos de clase Y2
[ 0,0473
, 5,3001 )
[ 5,3001
, 10,5529 )
[ 10,5529 , 15,8057 )
[ 15,8057 , 21,0584 )
[ 21,0584 , 26,3112 )
[ 26,3112 , 31,5640 )
[ 31,5640 , 36,8168 ]

fi

xi

72 2,6737
30 7,9265
6 13,1793
3 18,4321
1 23,6848
0 28,9376
1 34,1904
113 129,0244

Total
fi=Frecuencia
xi= Marca de Clase
F.R.S=Frecuencia Relativa Simple
% SIMPLE=Porcentaje
=Media
L.I=Limite Inferion
L.S=Limite Superior

F.R.S
0,6372
0,2655
0,0531
0,0265
0,0088
0,0000
0,0088
1

%SIMPLE ( fi)( xi)

(fi)( xi2)

63,7168
26,5487
5,3097
2,6549
0,8850
0,0000
0,8850
100

514,7016
1884,8719
1042,1580
1019,2214
560,9714
0,0000
1168,9839
6190,9083 5,5093

192,5059
237,7944
79,0756
55,2962
23,6848
0,0000
34,1904
622,5472

La tabla de distribucin de frecuencia abarcar los 113 pases con sus 113 muestra
TABLA DE STURGERS PARA X1
"Combustibles renovables y residuos (% del total de energia)"
n=
n= 113
Paises Muestra X1
AGO 66,2047
ALB
10,6462
ARE
0,0804
ARM 0,2988
AUS
4,5237
AUT 15,0942
AZE
0,7259
BEL
3,6129
BEN 58,7777
BGD 33,0939
BI H
3,4158
BLR
4,6691
BOL 31,1781
BRA 30,6536
BWA 23,4092
CAN 4,9401
CHE
8,3192
CHL 16,9994
CHN 10,0894
CI V
74,8808
CMR 65,8963

Regla de Sturges
Numero de Clases
K=1+[(3,322) (log n)]
K= 7

Rango
R= V. Mayor - V. Menor

Amplitud de Clase
A=R/K

Valor Mayor= 94,134


Valor Menor= 0,0043

A= 13,4471

R= 94,1297
L.I
,
L.S
Intervalos de clase X1
[ 0,0043
, 13,4514 )
[ 13,4514 , 26,8985 )
[ 26,8985 , 40,3456 )
[ 40,3456 , 53,7927 )
[ 53,7927 , 67,2398 )
[ 67,2398 , 80,6869 )
[ 80,6869 , 94,1340 ]

fi

xi

63 6,7279
17 20,1750
7 33,6221
6 47,0692
8 60,5163
4 73,9634
8 87,4105
113 329,4841

F.R.S
0,5575
0,1504
0,0619
0,0531
0,0708
0,0354
0,0708
1

%SIMPLE
55,7522
15,0442
6,1947
5,3097
7,0796
3,5398
7,0796
100

( fi)( xi)

( fi)( xi2)

423,8546
2851,6298
342,9742
6919,4863
235,3544
7913,0957
282,4149 13293,0293
484,1300 29297,7321
295,8534 21882,3086
699,2836 61124,6942
2763,8650 143281,9760 24,4590

fi=Frecuencia
xi= Marca de Clase
F.R.S=Frecuencia Relativa Simple
% SIMPLE=Porcentaje
=Media
L.I=Limite Inferion
L.S=Limite Superior

La tabla de distribucin de frecuencia abarcar los 113 pases con sus 113 muestra
TABLA DE STURGERS PARA X2
"Consumo de energia procedente de combustibles fosiles (% del total)"
n=
n= 113
Paises Muestra X2
AGO 31,8019
ALB
65,1224
ARE 99,9196
ARM 70,5526
AUS 94,1176
AUT 72,7018
AZE
97,7647
BEL
73,1005
BEN 39,6693
BGD 66,6528
BI H
91,0714
BLR
92,3418
BOL 65,8204
BRA 52,6606
BWA 66,229
CAN 74,8897
CHE 51,4959
CHL 76,0434
CHN 86,7483
CI V 24,2533
CMR 28,8852

Regla de Sturges
Numero de Clases
K=1+[(3,322) (log n)]
K= 7

Rango
R= V. Mayor - V. Menor

Amplitud de Clase
A=R/K

Valor Mayor= 99,9957


Valor Menor= 2,9845

A= 13,8587

R= 97,0112
L.I
,
L.S
Intervalos de clase X2
[ 2,9845
, 16,8432 )
[ 16,8432 , 30,7020 )
[ 30,7020 , 44,5607 )
[ 44,5607 , 58,4195 )
[ 58,4195 , 72,2782 )
[ 72,2782 , 86,1370 )
[ 86,1370 , 99,9957 ]

fi

xi

8 9,91387
7 23,7726
9 37,6314
12 51,4901
19 65,3488
21 79,2076
37 93,0663
113 360,4307

F.R.S
0,0708
0,0619
0,0796
0,1062
0,1681
0,1858
0,3274
1

%SIMPLE
7,0796
6,1947
7,9646
10,6195
16,8142
18,5841
32,7434
100

(fi)( xi)

(fi)( xi2)

79,3110
786,2788
166,4083
3955,9603
338,6822 12745,0714
617,8812 31814,7648
1241,6280 81138,9540
1663,3593 131750,6743
3443,4542 320469,6360
7550,7242 582661,3396 66,8206

fi=Frecuencia
xi= Marca de Clase
F.R.S=Frecuencia Relativa Simple
% SIMPLE=Porcentaje
=Media
L.I=Limite Inferion
L.S=Limite Superior

10

La tabla de distribucin de frecuencia abarcar los 113 pases con sus 113 muestra
TABLA DE STURGERS PARA X3
"Crecimiento de la poblacion (% anual)"
n=
n= 113
Paises Muestra X3
AGO 3,4062
ALB
-0,7557
ARE 15,0326
ARM -0,4689
AUS
0,6247
AUT
0,3241
AZE
1,1339
BEL
0,7343
BEN
3,0778
BGD 1,2033
BI H
0,0499
BLR
-0,4592
BOL
1,6891
BRA
1,0881
BWA
1,817
CAN 0,9699
CHE
0,8937
CHL
1,1177
CHN 0,5223
CI V
2,0124
CMR 2,5535

Regla de Sturges
Numero de Clases
K=1+[(3,322) (log n)]
K= 7

Rango
R= V. Mayor - V. Menor

Amplitud de Clase
A=R/K

Valor Mayor= 15,0326


Valor Menor= -1,4772

A= 2,3585

R= 16,5098
L.I
,
L.S
Intervalos de clase X3
[ -1,4772 , 0,8813 )
[ 0,8813
, 3,2399 )
[ 3,2399
, 5,5984 )
[ 5,5984
, 7,9570 )
[ 7,9570
, 10,3155 )
[ 10,3155 , 12,6741 )
[ 12,6741 , 15,0326 ]

fi

xi

F.R.S

43 -0,2979
67 2,0606
2 4,4192
0 6,7777
0 9,1362
0 11,4948
1 13,8533
113 47,4439

0,3805
0,5929
0,0177
0,0000
0,0000
0,0000
0,0088
1

%SIMPLE

( fi)( xi)

38,0531
59,2920
1,7699
0,0000
0,0000
0,0000
0,8850
100

-12,8109
138,0612
8,8383
0,0000
0,0000
0,0000
13,8533
147,9419

(fi)( xi2)
3,8167
284,4908
39,0579
0,0000
0,0000
0,0000
191,9147
519,2801

1,3092

fi=Frecuencia
xi= Marca de Clase
F.R.S=Frecuencia Relativa Simple
% SIMPLE=Porcentaje
=Media
L.I=Limite Inferion
L.S=Limite Superior

11

La tabla de distribucin de frecuencia abarcar los 113 pases con sus 113 muestra
TABLA DE STURGERS PARA X4
"Importaciones de energia, valor neto (% del uso de energia)"
n=
n= 113

Regla de Sturges
Numero de Clases
K=1+[(3,322) (log n)]
K= 7

Paises Muestra X4
AGO -785,553
ALB 47,9984
ARE -264,2098
ARM 70,7847
AUS -138,2323
L.I
,
L.S
AUT 67,336
Grupos
Intervalos de clase X4
AZE -330,6913
1= [ -930,1576 , -783,4219 )
BEL
74,8389
2= [ -783,4219 , -636,6863 )
BEN 41,2223
3= [ -636,6863 , -489,9506 )
BGD 13,6963
4= [ -489,9506 , -343,2149 )
BIH
30,6007
5= [ -343,2149 , -196,4792 )
BLR 86,1984
6= [ -196,4792 ,
-49,7436 )
BOL -152,7443
7= [ -49,7436 ,
96,9921 ]
BRA 8,0841
BWA 53,1046 fi=Frecuencia
CAN -54,9101 xi= Marca de Clase
CHE 50,8547 F.R.S=Frecuencia Relativa Simple
CHL 69,3708 % SIMPLE=Porcentaje
CHN 6,327 =Media
CIV -12,9655 L.I=Limite Inferion
CMR -45,8392 L.S=Limite Superior

Rango
R= V. Mayor - V. Menor

Amplitud de Clase
A=R/K

Valor Mayor= 96,9921


Valor Menor= -930,1576

A= 146,7357

R= 1027,1497

fi

xi
2 -856,7898
2 -710,0541
1 -563,3184
1 -416,5828
5 -269,8471
13 -123,1114
89 23,6243
113 -2916,0793

F.R.S
0,0177
0,0177
0,0088
0,0088
0,0442
0,1150
0,7876
1

%SIMPLE
1,7699
1,7699
0,8850
0,8850
4,4248
11,5044
78,7611
100

(fi)(xi)

(fi)(xi2)

-1713,5795 1468177,4004
-1420,1082 1008353,6296
-563,3184 317327,6439
-416,5828 173541,1876
-1349,2354 364087,2291
-1600,4483 197033,4414
2102,5595 49671,4218
-4960,7131 3578191,9537 -43,9001

12

La tabla de distribucin de frecuencia abarcar los 113 pases con sus 113 muestra
TABLA DE STURGERS PARA X5
"INB per capita, metodo Atlas (En dolares a precios actuales)"
n=
n= 113
Paises Muestra X5
AGO 2350
ALB
3530
ARE
40670
ARM
2710
AUS
37330
AUT
44200
AZE
2710
BEL
42640
BEN
600
BGD
590
BIH
3780
BLR
4310
BOL
1240
BRA
5980
BWA 5570
CAN 41230
CHE
62680
CHL
8740
CHN
2490
CIV
980
CMR
990

Regla de Sturges
Numero de Clases
K=1+[(3,322) (log n)]
K= 7

Rango
R= V. Mayor - V. Menor

Amplitud de Clase
A=R/K

Valor Mayor= 78400


Valor Menor= 220

A= 11168,5714

R= 78180

[
[
[
[
[
[
[

L.I
,
L.S
Intervalos de clase X5
220
, 11388,5714 )
11388,5714 , 22557,1429 )
22557,1429 , 33725,7143 )
33725,7143 , 44894,2857 )
44894,2857 , 56062,8571 )
56062,8571 , 67231,4286 )
67231,4286 , 78400,0000 ]

fi

xi

81 5804,2857
10 16972,8571
4 28141,4286
9 39310,0000
7 50478,5714
1 61647,1429
1 72815,7143
113 275170

F.R.S
0,7168
0,0885
0,0354
0,0796
0,0619
0,0088
0,0088
1

%SIMPLE

(fi)( xi)

71,6814 470147,1429
8,8496
169728,5714
3,5398
112565,7143
7,9646
353790,0000
6,1947
353350,0000
0,8850
61647,1429
0,8850
72815,7143
100 1594044,2857

(fi)(xi2)

2728868344,8980
2880778795,9184
3167760008,1633
13907484900,0000
17836603214,2857
3800370222,4490
5302128246,9388
49623993732,6531 14106,5866

fi=Frecuencia
xi= Marca de Clase
F.R.S=Frecuencia Relativa Simple
% SIMPLE=Porcentaje
=Media
L.I=Limite Inferion
L.S=Limite Superior

13

La tabla de distribucin de frecuencia abarcar los 113 pases con sus 113 muestra
TABLA DE STURGERS PARA X6
"Indice de beneficios del FMAM para la biodiversidad
(0= sin potencial de biodiversidad a 100=maximo)"
n=
n= 113
Paises Muestra X6
AGO 8,2624
ALB
0,1846
ARE
0,2129
ARM 0,2271
AUS 87,6917
AUT
0,3265
AZE
0,795
BEL
0,0142
BEN
0,2271
BGD
1,448
BI H
0,3691
BLR
0,0284
BOL 12,5497
BRA
100
BWA 1,4055
CAN 21,5077
CHE
0,2271
CHL
15,318
CHN 66,6099
CI V
3,4355
CMR 12,5071

Regla de Sturges
Numero de Clases
K=1+[(3,322) (log n)]
K= 7

Rango
R= V. Mayor - V. Menor

Amplitud de Clase
A=R/K

Valor Mayor= 100


Valor Menor= 0,0142

A= 14,2837

R= 99,9858

[
[
[
[
[
[
[

L.I
,
L.S
Intervalos de clase X6
0,0142
,
14,2979 )
14,2979 ,
28,5816 )
28,5816 ,
42,8653 )
42,8653 ,
57,1489 )
57,1489 ,
71,4326 )
71,4326 ,
85,7163 )
85,7163 , 100,0000 ]

fi

xi

93 7,1560
7 21,4397
6 35,7234
1 50,0071
2 64,2908
1 78,5745
3 92,8582
113 350,0497

F.R.S
0,8230
0,0619
0,0531
0,0088
0,0177
0,0088
0,0265
1

%SIMPLE
82,3009
6,1947
5,3097
0,8850
1,7699
0,8850
2,6549
100

(fi)( xi)

(fi)( xi2)

665,5120 4762,4323
150,0781 3217,6337
214,3405 7656,9740
50,0071 2500,7101
128,5816 8266,6103
78,5745 6173,9476
278,5745 25867,9120
1565,6682 58446,2199 13,8555

fi=Frecuencia
xi= Marca de Clase
F.R.S=Frecuencia Relativa Simple
% SIMPLE=Porcentaje
=Media
L.I=Limite Inferion
L.S=Limite Superior

14

La tabla de distribucin de frecuencia abarcar los 113 pases con sus 113 muestra
TABLA DE STURGERS PARA X7
"Industria, valor agregado (% del PIB)"
n=
n= 113
Paises Muestra X7
AGO 66,5691
ALB
18,9763
ARE
54,8402
ARM 43,9088
AUS 27,8973
AUT
30,8256
AZE
68,4945
BEL
25,1412
BEN
14,4323
BGD 25,7383
BI H
27,8708
BLR
43,1676
BOL 36,3893
BRA 27,1408
BWA 46,5414
CAN 29,9549
CHE 26,8811
CHL
43,695
CHN 46,6927
CI V
23,2717
CMR 29,8109

Regla de Sturges
Numero de Clases
K=1+[(3,322) (log n)]
K= 7

Rango
R= V. Mayor - V. Menor

Amplitud de Clase
A=R/K

Valor Mayor= 76,4181


Valor Menor= 12,466

A= 9,1360

R= 63,9521
L.I
,
L.S
Intervalos de claseX7
[ 12,466
, 21,6020 )
[ 21,6020 , 30,7380 )
[ 30,7380 , 39,8740 )
[ 39,8740 , 49,0101 )
[ 49,0101 , 58,1461 )
[ 58,1461 , 67,2821 )
[ 67,2821 , 76,4181 ]

fi
17
43
29
14
3
4
3
113

xi
17,0340
26,1700
35,3060
44,4421
53,5781
62,7141
71,8501
311,0944

F.R.S
0,1504
0,3805
0,2566
0,1239
0,0265
0,0354
0,0265
1

%SIMPLE
15,0442
38,0531
25,6637
12,3894
2,6549
3,5398
2,6549
100

( fi)( xi)
289,5781
1125,3109
1023,8750
622,1887
160,7342
250,8563
215,5503
3688,0936

( fi)( xi2)

4932,6758
29449,4109
36148,9686
27651,3413
8611,8269
15732,2226
15487,3075
138013,7537 32,6380

fi=Frecuencia
xi= Marca de Clase
F.R.S=Frecuencia Relativa Simple
% SIMPLE=Porcentaje
=Media
L.I=Limite Inferion
L.S=Limite Superior

15

La tabla de distribucin de frecuencia abarcar los 113 pases con sus 113 muestra
TABLA DE STURGERS PARA X8
"PIB por unidad de uso de energia, (PPA a dolares por kg de equivalente de petroleo)"
n=
n= 113
Paises Muestra X8
AGO 9,996
ALB
11,2658
ARE
9,0067
ARM 6,7909
AUS
6,4213
AUT
9,7375
AZE
8,8394
BEL
6,8139
BEN
4,134
BGD 11,7112
BI H
5,6876
BLR
4,2304
BOL
6,6549
BRA 10,1603
BWA
11,96
CAN 4,8569
CHE 13,8973
CHL
9,0585
CHN 4,3876
CI V
4,7026
CMR 7,2757

Regla de Sturges
Numero de Clases
K=1+[(3,322) (log n)]
K= 7

Rango
R= V. Mayor - V. Menor

Amplitud de Clase
A=R/K

Valor Mayor= 17,8067


Valor Menor= 1,7651

A= 2,2917

R= 16,0416
L.I
,
L.S
Intervalos de clase X8
[ 1,7651
, 4,0568 )
[ 4,0568
, 6,3484 )
[ 6,3484
, 8,6401 )
[ 8,6401
, 10,9317 )
[ 10,9317 , 13,2234 )
[ 13,2234 , 15,5150 )
[ 15,5150 , 17,8067 ]

fi
11
22
31
27
13
7
2
113

xi

F.R.S

2,9109
5,2026
7,4942
9,7859
12,0776
14,3692
16,6609
68,5013

0,0973
0,1947
0,2743
0,2389
0,1150
0,0619
0,0177
1

%SIMPLE ( fi)( xi)

( fi)( xi2)

9,7345
19,4690
27,4336
23,8938
11,5044
6,1947
1,7699
100

93,2086
595,4718
1741,0740
2585,6236
1896,2760
1445,3202
555,1693
8912,1435 8,2649

32,0202
114,4569
232,3215
264,2193
157,0082
100,5845
33,3217
933,9324

fi=Frecuencia
xi= Marca de Clase
F.R.S=Frecuencia Relativa Simple
% SIMPLE=Porcentaje
=Media
L.I=Limite Inferion
L.S=Limite Superior

16

La tabla de distribucin de frecuencia abarcar los 113 pases con sus 113 muestra
TABLA DE STURGERS PARA X9
"Promedio detallado de precipitaciones (mm anuales)"
n=
n= 113
Paises Muestra X9
AGO 1010
ALB
1485
ARE
78
ARM
562
AUS
534
AUT
1110
AZE
447
BEL
847
BEN
1039
BGD
2666
BIH
1028
BLR
618
BOL
1146
BRA
1761
BWA
416
CAN
537
CHE
1537
CHL
1522
CHN
645
CIV
1348
CMR 1604

Regla de Sturges
Numero de Clases
K=1+[(3,322) (log n)]
K= 7

Rango
R= V. Mayor - V. Menor

Amplitud de Clase
A=R/K

Valor Mayor= 3240


Valor Menor= 51

A= 455,5714

R= 3189

[
[
[
[
[
[
[

L.I
,
L.S
Intervalos de claseX9
51
, 506,5714 )
506,5714 , 962,1429 )
962,1429 , 1417,7143 )
1417,7143 , 1873,2857 )
1873,2857 , 2328,8571 )
2328,8571 , 2784,4286 )
2784,4286 , 3240,0000 ]

fi

xi

21 278,7857
36 734,3571
24 1189,9286
17 1645,5000
8 2101,0714
3 2556,6429
4 3012,2143
113 11518,500

F.R.S
0,1858
0,3186
0,2124
0,1504
0,0708
0,0265
0,0354
1

%SIMPLE
18,5841
31,8584
21,2389
15,0442
7,0796
2,6549
3,5398
100

(fi)( xi)
5854,5000
26436,8571
28558,2857
27973,5000
16808,5714
7669,9286
12048,8571
125350,5000

(fi)( xi2)

1632150,9643
19414094,8776
33982320,1224
46030394,2500
35316009,1837
19609268,0969
36293739,6122
192277977,1071 1109,2965

fi=Frecuencia
xi= Marca de Clase
F.R.S=Frecuencia Relativa Simple
% SIMPLE=Porcentaje
=Media
L.I=Limite Inferion
L.S=Limite Superior

17

La tabla de distribucin de frecuencia abarcar los 113 pases con sus 113 muestra
TABLA DE STURGERS PARA X10
"Uso de energia (kg de equivalente de petroleo per capita)"
n=
n= 113
Paises Muestra X10
AGO 561,5501
ALB 679,8618
ARE 8374,4437
ARM 954,7304
AUS 5692,9259
AUT 4029,627
AZE 1411,5573
BEL 5374,4983
BEN 368,2161
BGD 173,4901
BIH 1381,1221
BLR 2918,1979
BOL
703,759
BRA 1221,3621
BWA 1029,2904
CAN 8076,3975
CHE 3411,4209
CHL 1859,6854
CHN 1551,4299
CIV 539,7272
CMR 332,3033

Regla de Sturges
Numero de Clases
K=1+[(3,322) (log n)]
K= 7

Rango
R= V. Mayor - V. Menor

Amplitud de Clase
A=R/K

Valor Mayor= 14601,8461


Valor Menor= 163,5456

A= 2062,6144

R= 14438,3005

[
[
[
[
[
[
[

L.I
,
L.S
Intervalos de clase X10
163,5456 , 2226,1600 )
2226,1600 , 4288,7743 )
4288,7743 , 6351,3887 )
6351,3887 , 8414,0030 )
8414,0030 , 10476,6174 )
10476,6174 , 12539,2317 )
12539,2317 , 14601,8461 ]

fi

xi

70 1194,8528
29 3257,4671
9 5320,0815
4 7382,6959
0 9445,3102
0 11507,9246
1 13570,5389
113 51678,8710

F.R.S
0,6195
0,2566
0,0796
0,0354
0,0000
0,0000
0,0088
1

%SIMPLE
61,9469
25,6637
7,9646
3,5398
0,0000
0,0000
0,8850
100

(fi)(xi)

(fi)(xi2)

83639,6945 99937121,3722
94466,5469 307721672,0675
47880,7334 254729403,8158
29530,7834 218016792,0544
0,0000
0,0000
0,0000
0,0000
13570,5389 184159526,6180
269088,2972 1064564515,9279 2381,3124

fi=Frecuencia
xi= Marca de Clase
F.R.S=Frecuencia Relativa Simple
% SIMPLE=Porcentaje
=Media
L.I=Limite Inferion
L.S=Limite Superior

18

La tabla de distribucin de frecuencia abarcar los 113 pases con sus 113 muestra
TABLA DE STURGERS PARA X11
"Rentas totales de los recursos naturales (% del PIB)"
n=
n= 113
Paises Muestra X11
AGO 60,4244
ALB
3,1947
ARE
27,769
ARM
1,2986
AUS
9,1525
AUT
0,5095
AZE
63,6858
BEL
0,0581
BEN
5,372
BGD
6,3823
BI H
2,0189
BLR
2,4423
BOL
36,6032
BRA
7,3562
BWA
9,1492
CAN
7,2625
CHE
0,0582
CHL
23,0378
CHN
7,0411
CI V
10,2118
CMR 13,5034

Regla de Sturges
Numero de Clases
K=1+[(3,322) (log n)]
K= 7

Rango
R= V. Mayor - V. Menor

Amplitud de Clase
A=R/K

Valor Mayor= 72,8652


Valor Menor= 0,0026

A= 10,4089

R= 72,8626
L.I
,
L.S
Intervalos de clase X11
[ 0,0026
, 10,4115 )
[ 10,4115 , 20,8205 )
[ 20,8205 , 31,2294 )
[ 31,2294 , 41,6384 )
[ 41,6384 , 52,0473 )
[ 52,0473 , 62,4563 )
[ 62,4563 , 72,8652 ]

fi

xi

80 5,2071
9 15,6160
10 26,0250
3 36,4339
4 46,8428
3 57,2518
4 67,6607
113 255,0373

F.R.S %SIMPLE
0,7080
0,0796
0,0885
0,0265
0,0354
0,0265
0,0354
1

70,7965
7,9646
8,8496
2,6549
3,5398
2,6549
3,5398
100

(fi)( xi)

(fi)( xi2)

416,5657
140,5441
260,2496
109,3017
187,3714
171,7554
270,6429
1556,4308

2169,0874
2194,7391
6772,9839
3982,2872
8777,0077
9833,3009
18311,8968
52041,3031 13,7737

fi=Frecuencia
xi= Marca de Clase
F.R.S=Frecuencia Relativa Simple
% SIMPLE=Porcentaje
=Media
L.I=Limite Inferion
L.S=Limite Superior

19

La tabla de distribucin de frecuencia abarcar los 113 pases con sus 113 muestra
TABLA DE STURGERS PARA X12
"Area selvatica (kilometros cuadrados)"
n=
n= 113
Paises Muestra X12
AGO 588544
ALB
7797
ARE
3141
ARM
2746
AUS 1520720
AUT
38720
AZE
9360
BEL
6747
BEN
47110
BGD 14498
BIH
21850
BLR
85136
BOL 581188
BRA 5261052
BWA 117062
CAN 3101340
CHE
12262
CHL 161182
CHN 1985706
CIV 104042
CMR 205760

Regla de Sturges
Numero de Clases
K=1+[(3,322) (log n)]
K= 7

Rango
R= V. Mayor - V. Menor

Amplitud de Clase
A=R/K

Valor Mayor= 8089100


Valor Menor= 349

A= 1155535,8571

R= 8088751
L.I
,
L.S
Intervalos de clase X12
[ 349
, 1155884,8571 )
[ 1155884,8571 , 2311420,7143 )
[ 2311420,7143 , 3466956,5714 )
[ 3466956,5714 , 4622492,4286 )
[ 4622492,4286 , 5778028,2857 )
[ 5778028,2857 , 6933564,1429 )
[ 6933564,1429 , 8089100,0000 ]

fi

xi

106 578116,9286
3 1733652,7857
2 2889188,6429
0 4044724,5000
1 5200260,3571
0 6355796,2143
1 7511332,0714
Total 113 28313071,500

F.R.S
0,9381
0,0265
0,0177
0,0000
0,0088
0,0000
0,0088
1

%SIMPLE
93,8053
2,6549
1,7699
0,0000
0,8850
0,0000
0,8850
100

(fi)(xi)

(fi)(xi2)

61280394,4286 35427233408691,4000
5200958,3571
9016655944244,7100
5778377,2857 16694822028029,4000
0,0000
0,0000
5200260,3571 27042707782071,5000
0,0000
0,0000
7511332,0714 56420109487271,4000
84971322,5000 144601528650308,0000

751958,6062

fi=Frecuencia
xi= Marca de Clase
F.R.S=Frecuencia Relativa Simple
% SIMPLE=Porcentaje
=Media
L.I=Limite Inferion
L.S=Limite Superior

Tabla de distribucin de frecuencias

20

Una vez ya obtenidos las correspondientes agrupaciones por medio


de los preceptos de la frmula de Herbert Sturges y su posteriores anlisis
encontrando las distintas marcas de clase, las frecuencias relativas simples,
y desviaciones estndar (desviacin tpica), junto con su porcentaje para
cada variable y su respectiva representacin en grafica de histograma,
procederemos a:

Establecer el cuerpo de hiptesis correspondiente.

Aplicar la prueba Chi-cuadrado con un nivel de significacin = 0,05.

Para el establecimiento de un cuerpo de hiptesis y aplicacin de la


prueba Chi-cuadrado, con la intensin de realizar el ajuste de bondad,
trabajaremos con las frecuencias observadas y las frecuencias esperadas.
En donde para esta ltima frecuencia nos guiaremos por el criterio de
Cochran definido en 1952, el cual establece que las frecuencia esperadas
menores a 5, no debern superar el 20% en caso que sea superado se
deber interpretar el Chi Cuadrado con cautela. Por lo cual definiremos
valores mnimos de 5 en nuestras frecuencias esperadas y la realizaremos
normal.
Bajo lo anterior establecernos una distribucin de frecuencia esperada
(fe), la cual tendr un comportamiento normal y la usaremos para contrastar
a las frecuencias observadas en cada variable.
Y la definiremos con estos valores:
La demostracin de normalidad para esta
frecuencia esperada, ser por medio de la
Prueba de Anderson Darling (similar a Shapiro
Wilk) para muestras menores a 50.

Grupos
( ; )
[ ; )
( ; )
( ; )
( ; )
( ; )
( ; ]
Total

fe
5
12
22
35
22
12
5
113

21

En donde la normalidad se establece si su significancia es superior a


0,05.

Valor p 0,351>0,05 lo cual concluye normalidad para fe


Histograma Frecuencia Esperada (fe)

22

A su vez grficamente se aprecia como los valores de frecuencia


esperada, se distribuyen normalmente.
Expuestas las justificaciones anteriores procederemos a la evaluacin
de concordancia existente entre la distribucin observada y la distribucin
terica normalizada que hemos establecido como frecuencia esperada para
este apartado; y as comprobar la distribucin o no distribucin normal en
cada variable.
Cuerpo de Hiptesis:
La hiptesis nula, establece que la variable analizada sigue un
comportamiento normal, en caso contrario la hiptesis alternativa ser que
no sigue un comportamiento de distribucin normal. Para ello:
La hiptesis nula (Ho) ser, si:

P(Value)<0,05

Chi-Cuadrada<12,59

La hiptesis alternativa (Ha) ser, si:

P(Value)>0,05

Chi-Cuadrada>12,59

Analizando para cada variable tenemos:

23

Variable Y1

Intervalos de clase Y1
L.I
;
L.S
[10,0214 ; 22,6997)
[22,6997 ; 35,378)
[35,378 ; 48,0563)
[48,0563 ; 60,7346)
[60,7346 ; 73,4129)
[73,4129 ; 86,0912)
[86,0912 ; 98,7696]

fi
15
16
20
21
14
11
16
113

fe
5
12
22
35
22
12
5
113

fi-fe
10
4
-2
-14
-8
-1
11

(fi-fe)^2
100
16
4
196
64
1
121

Nivel de Signicacion ()= 0,05


Grados de libertad (G.L)= [(# de Columnas-1)(# de Filas-1)]
G.L= 6

[(fi-fe)^2]/fe
20
1,333333333
0,181818182
5,6
2,909090909
0,083333333
24,2
54,30757576
^
Valor Critico

54,3>12,6.-->Se rechaza la hipotesis nula


Prueba de Cola Derecha
f(Chisq) Chi-square distribution

0
Chisq

Chi-square distribution
df = 6
Chi-square distribution
df = 6

6
P(Value)
,05

Chi-square

10

11

12
12.59

13

14

15

16

54,3070 >12.59

12,59

P(upper)

Chi-square

7,38E-10

54,3070

Conclusiones:
Con un nivel de Confianza de 95%(=0,05), se concluye que la variable
analizada no sigue una distribucin normal bajo los anteriores preceptos con
la prueba Chi Cuadrado

24

Variable Y2
Intervalos de clase Y2
L.I ; L.S
[0,0473 ; 5,3)
[5,3 ; 10,5528)
[10,5528 ; 15,8056)
[15,8056 ; 21,0584)
[21,0584 ; 26,3112)
[26,3112 ; 31,564)
[31,564 ; 36,8168]

fi
72
30
6
3
1
0
1

fe
5
12
22
35
22
12
5

fi-fe
67
18
-16
-32
-21
-12
-4

(fi-fe)^2
4489
324
256
1024
441
144
16

113
Nivel de Signicacion ()= 0,05
Grados de libertad (G.L)= [(# de Columnas-1)(# de Filas-1)]
G.L= 6

[(fi-fe)^2]/fe
897,8
27
11,63636364
29,25714286
20,04545455
12
3,2
1000,938961
^
Valor Critico

1000,9>12,6.-->Se rechaza la hipotesis nula


Prueba de Cola Derecha
f(Chisq) Chi-square distribution

0
Chisq

Chi-square distribution
df = 6
Chi-square distribution
df = 6

6
P(Value)
,05

Chi-square

10

11

12
12.59

13

14

15

16

1000 >12.59

12,59

P(upper)

Chi-square

8,94E-213

1000,0000

Conclusiones:
Con un nivel de Confianza de 95%(=0,05), se concluye que la variable
analizada no sigue una distribucin normal bajo los anteriores preceptos con
la prueba Chi Cuadrado

25

Variable X1

Intervalos de clase X1
L.I ; L.S
[0,0043 ; 13,4514)
[13,4514 ; 26,8985)
[26,8985 ; 40,3456)
[40,3456 ; 53,7927)
[53,7927 ; 67,2398)
[67,2398 ; 80,6869)
[80,6869 ; 94,134]

fi
63
17
7
6
8
4
8
113

fe
5
12
22
35
22
12
5
113

fi-fe
58
5
-15
-29
-14
-8
3

(fi-fe)^2
3364
25
225
841
196
64
9

Nivel de Signicacion ()= 0,05


Grados de libertad (G.L)= [(# de Columnas-1)(# de Filas-1)]
G.L= 6

[(fi-fe)^2]/fe
672,8
2,083333333
10,22727273
24,02857143
8,909090909
5,333333333
1,8
725,1816017
^
Valor Critico

725,2>12,6.-->Se rechaza la hipotesis nula


Prueba de Cola Derecha
f(Chisq) Chi-square distribution

0
Chisq

Chi-square distribution
df = 6
Chi-square distribution
df = 6

6
P(Value)
,05

Chi-square

10

11

12
12.59

13

14

15

16

725 >12.59

12,59

P(upper)

Chi-square

2,44E-153

725,0000

Conclusiones:
Con un nivel de Confianza de 95%(=0,05), se concluye que la variable
analizada no sigue una distribucin normal bajo los anteriores preceptos con
la prueba Chi Cuadrado

26

Variable X2

Intervalos de clase X2
L.I ; L.S
[2,9845 ; 16,8432)
[16,8432 ; 30,702)
[30,702 ; 44,5607)
[44,5607 ; 58,4195)
[58,4195 ; 72,2782)
[72,2782 ; 86,137)
[86,137 ; 99,9957]

fi
8
7
9
12
19
21
37
113

fe
5
12
22
35
22
12
5
113

fi-fe
3
-5
-13
-23
-3
9
32

Nivel de Signicacion ()= 0,05


Grados de libertad (G.L)= [(# de Columnas-1)(# de Filas-1)]
G.L= 6

(fi-fe)^2 [(fi-fe)^2]/fe
9
1,8
25 2,083333333
169 7,681818182
529 15,11428571
9 0,409090909
81
6,75
1024
204,8
238,6385281
^
Valor Critico

238,6>12,6.-->Se rechaza la hipotesis nula


f(Chisq) Chi-square distribution

0
Chisq

Chi-square distribution
df = 6
Chi-square distribution
df = 6

6
P(Value)
,05

Chi-square

10

11

12
12.59

13

14

15

16

238 >12.59

12,59

P(upper)

Chi-square

1,50E-48

238,0000

Conclusiones:
Con un nivel de Confianza de 95%(=0,05), se concluye que la variable
analizada no sigue una distribucin normal bajo los anteriores preceptos con
la prueba Chi Cuadrado

27

Variable X3
Intervalos de clase X3
L.I ; L.S
[-1,4772 ; 0,8813)
[0,8813 ; 3,2399)
[3,2399 ; 5,5984)
[5,5984 ; 7,957)
[7,957 ; 10,3155)
[10,3155 ; 12,6741)
[12,6741 ; 15,0326]

fi
43
67
2
0
0
0
1
113

fe
5
12
22
35
22
12
5
113

fi-fe
38
55
-20
-35
-22
-12
-4

Nivel de Signicacion ()= 0,05


Grados de libertad (G.L)= [(# de Columnas-1)(# de Filas-1)]
G.L= 6

(fi-fe)^2 [(fi-fe)^2]/fe
1444
288,8
3025 252,0833333
400 18,18181818
1225
35
484
22
144
12
16
3,2
631,2651515
^
Valor Critico

631,3>12,6.-->Se rechaza la hipotesis nula


Prueba de Cola Derecha
f(Chisq) Chi-square distribution

0
Chisq

Chi-square distribution
df = 6
Chi-square distribution
df = 6

6
P(Value)
,05

Chi-square

10

11

12
12.59

13

14

15

16

631>12.59

12,59

P(upper)

Chi-square

4,78E-133

631,0000

Conclusiones:
Con un nivel de Confianza de 95%(=0,05), se concluye que la variable
analizada no sigue una distribucin normal bajo los anteriores preceptos con
la prueba Chi Cuadrado

28

Variable X4
Intervalos de clase X4
L.I ; L.S
[-930,1576 ; -783,4219)
[-783,4219 ; -636,6863)
[-636,6863 ; -489,9506)
[-489,9506 ; -343,2149)
[-343,2149 ; -196,4792)
[-196,4792 ; -49,7436)
[-49,7436 ; 96,9921]

fi
2
2
1
1
5
13
89
113

fe
5
12
22
35
22
12
5
113

fi-fe
-3
-10
-21
-34
-17
1
84

Nivel de Signicacion ()= 0,05


Grados de libertad (G.L)= [(# de Columnas-1)(# de Filas-1)]
G.L= 6

(fi-fe)^2 [(fi-fe)^2]/fe
9
1,8
100 8,333333333
441 20,04545455
1156 33,02857143
289 13,13636364
1 0,083333333
7056
1411,2
1487,627056
^
Valor Critico

1487,6>12,6.-->Se rechaza la hipotesis nula

f(Chisq) Chi-square distribution

0
Chisq

Chi-square distribution
df = 6
Chi-square distribution
df = 6

6
P(Value)
,05

Chi-square

10

11

12
12.59

13

14

15

16

1487>12.59

12,59

P(upper)

Chi-square

0,00E+00

1487,0000

Conclusiones:
Con un nivel de Confianza de 95%(=0,05), se concluye que la variable
analizada no sigue una distribucin normal bajo los anteriores preceptos con
la prueba Chi Cuadrado

29

Variable X5

Intervalos de clase X5
L.I ; L.S
[220 ; 11388,5714)
[11388,5714 ; 22557,1429)
[22557,1429 ; 33725,7143)
[33725,7143 ; 44894,2857)
[44894,2857 ; 56062,8571)
[56062,8571 ; 67231,4286)
[67231,4286 ; 78400]

fi
81
10
4
9
7
1
1
113

fe
5
12
22
35
22
12
5
113

fi-fe
76
-2
-18
-26
-15
-11
-4

(fi-fe)^2
5776
4
324
676
225
121
16

Nivel de Signicacion ()= 0,05


Grados de libertad (G.L)= [(# de Columnas-1)(# de Filas-1)]
G.L= 6

[(fi-fe)^2]/fe
1155,2
0,333333333
14,72727273
19,31428571
10,22727273
10,08333333
3,2
1213,085498
^
Valor Critico

1213,1>12,6.-->Se rechaza la hipotesis nula


Prueba de Cola Derecha
f(Chisq) Chi-square distribution

0
Chisq

Chi-square distribution
df = 6
Chi-square distribution
df = 6

6
P(Value)
,05

Chi-square

10

11

12
12.59

13

14

15

16

1213>12.59

12,59

P(upper)

Chi-square

7,35E-259

1213,0000

Conclusiones:
Con un nivel de Confianza de 95%(=0,05), se concluye que la variable
analizada no sigue una distribucin normal bajo los anteriores preceptos con
la prueba Chi Cuadrado

30

Variable X6
Intervalos de clase X6
L.I ; L.S
[0,0142 ; 14,2979)
[14,2979 ; 28,5816)
[28,5816 ; 42,8653)
[42,8653 ; 57,1489)
[57,1489 ; 71,4326)
[71,4326 ; 85,7163)
[85,7163 ; 100]

fi
93
7
6
1
2
1
3
113

fe
5
12
22
35
22
12
5
113

fi-fe
88
-5
-16
-34
-20
-11
-2

(fi-fe)^2
7744
25
256
1156
400
121
4

Nivel de Signicacion ()= 0,05


Grados de libertad (G.L)= [(# de Columnas-1)(# de Filas-1)]
G.L= 6

[(fi-fe)^2]/fe
1548,8
2,083333333
11,63636364
33,02857143
18,18181818
10,08333333
0,8
1624,61342
^
Valor Critico

1624,6>12,6.-->Se rechaza la hipotesis nula


Prueba de Cola Derecha
f(Chisq) Chi-square distribution

0
Chisq

Chi-square distribution
df = 6
Chi-square distribution
df = 6

6
P(Value)
,05

Chi-square

10

11

12
12.59

13

14

15

16

1624>12.59

12,59

P(upper)

Chi-square

0,00E+00

1624,0000

Conclusiones:
Con un nivel de Confianza de 95%(=0,05), se concluye que la variable
analizada no sigue una distribucin normal bajo los anteriores preceptos con
la prueba Chi Cuadrado

31

Variable X7
Intervalos de claseX7
L.I ; L.S
[12,466 ; 21,602)
[21,602 ; 30,738)
[30,738 ; 39,874)
[39,874 ; 49,0101)
[49,0101 ; 58,1461)
[58,1461 ; 67,2821)
[67,2821 ; 76,4181]

fi
17
43
29
14
3
4
3
113

fe
5
12
22
35
22
12
5
113

fi-fe
12
31
7
-21
-19
-8
-2

(fi-fe)^2
144
961
49
441
361
64
4

Nivel de Signicacion ()= 0,05


Grados de libertad (G.L)= [(# de Columnas-1)(# de Filas-1)]
G.L= 6

[(fi-fe)^2]/fe
28,8
80,08333333
2,227272727
12,6
16,40909091
5,333333333
0,8
146,2530303
^
Valor Critico

146,3>12,6.-->Se rechaza la hipotesis nula


Prueba de Cola Derecha
f(Chisq) Chi-square distribution

0
Chisq

Chi-square distribution
df = 6
Chi-square distribution
df = 6

6
P(Value)
,05

Chi-square

10

11

12
12.59

13

14

15

16

146>12.59

12,59

P(upper)

Chi-square

5,42E-29

146,0000

Conclusiones:
Con un nivel de Confianza de 95%(=0,05), se concluye que la variable
analizada no sigue una distribucin normal bajo los anteriores preceptos con
la prueba Chi Cuadrado

32

Variable X8
Intervalos de clase X8
L.I ; L.S
[1,7651 ; 4,0568)
[4,0568 ; 6,3484)
[6,3484 ; 8,6401)
[8,6401 ; 10,9317)
[10,9317 ; 13,2234)
[13,2234 ; 15,515)
[15,515 ; 17,8067]

fi
11
22
31
27
13
7
2
113

fe
5
12
22
35
22
12
5
113

fi-fe
6
10
9
-8
-9
-5
-3

(fi-fe)^2
36
100
81
64
81
25
9

Nivel de Signicacion ()= 0,05


Grados de libertad (G.L)= [(# de Columnas-1)(# de Filas-1)]
G.L= 6

[(fi-fe)^2]/fe
7,2
8,333333333
3,681818182
1,828571429
3,681818182
2,083333333
1,8
28,60887446
^
Valor Critico

28,6>12,6.-->Se rechaza la hipotesis nula


Prueba de Cola Derecha
f(Chisq) Chi-square distribution

0
Chisq

Chi-square distribution
df = 6
Chi-square distribution
df = 6

6
P(Value)
,05

Chi-square

10

11

12
12.59

13

14

15

16

28>12.59

12,59

P(upper)

Chi-square

2,35E-24

124,0000

Conclusiones:
Con un nivel de Confianza de 95%(=0,05), se concluye que la variable
analizada no sigue una distribucin normal bajo los anteriores preceptos con
la prueba Chi Cuadrado

33

Variable X9
Intervalos de claseX9
L.I ; L.S
[51 ; 506,5714)
[506,5714 ; 962,1429)
[962,1429 ; 1417,7143)
[1417,7143 ; 1873,2857)
[1873,2857 ; 2328,8571)
[2328,8571 ; 2784,4286)
[2784,4286 ; 3240]

fi
21
36
24
17
8
3
4
113

fe
5
12
22
35
22
12
5
113

fi-fe
16
24
2
-18
-14
-9
-1

(fi-fe)^2
256
576
4
324
196
81
1

Nivel de Signicacion ()= 0,05


Grados de libertad (G.L)= [(# de Columnas-1)(# de Filas-1)]
G.L= 6

[(fi-fe)^2]/fe
51,2
48
0,181818182
9,257142857
8,909090909
6,75
0,2
124,4980519
^
Valor Critico

124,5>12,6.-->Se rechaza la hipotesis nula


Prueba de Cola Derecha
f(Chisq) Chi-square distribution

0
Chisq

Chi-square distribution
df = 6
Chi-square distribution
df = 6

6
P(Value)
,05

Chi-square

10

11

12
12.59

13

14

15

16

124.0000 >12.59

12,59

P(upper)

Chi-square

2,35E-24

124,0000

Conclusiones:
Con un nivel de Confianza de 95%(=0,05), se concluye que la variable
analizada no sigue una distribucin normal bajo los anteriores preceptos con
la prueba Chi Cuadrado

34

Variable X10
Intervalos de clase X10
L.I ; L.S
[163,5456 ; 2226,16)
[2226,16 ; 4288,7743)
[4288,7743 ; 6351,3887)
[6351,3887 ; 8414,003)
[8414,003 ; 10476,6174)
[10476,6174 ; 12539,2317)
[12539,2317 ; 14601,8461]

fi
70
29
9
4
0
0
1
113

fe
5
12
22
35
22
12
5
113

fi-fe
65
17
-13
-31
-22
-12
-4

(fi-fe)^2
4225
289
169
961
484
144
16

Nivel de Signicacion ()= 0,05


Grados de libertad (G.L)= [(# de Columnas-1)(# de Filas-1)]
G.L= 6

[(fi-fe)^2]/fe
845
24,08333333
7,681818182
27,45714286
22
12
3,2
941,4222944
^
Valor Critico

941,4>12,6.-->Se rechaza la hipotesis nula


Prueba de Cola Derecha
f(Chisq) Chi-square distribution

0
Chisq

Chi-square distribution
df = 6
Chi-square distribution
df = 6

6
P(Value)
,05

Chi-square

10

11

12
12.59

13

14

15

16

941>12.59

12,59

P(upper)

Chi-square

5,13E-200

941,0000

Conclusiones:
Con un nivel de Confianza de 95%(=0,05), se concluye que la variable
analizada no sigue una distribucin normal bajo los anteriores preceptos con
la prueba Chi Cuadrado

35

Variable X11
Intervalos de clase X11
L.I ; L.S
[0,0026 ; 10,4115)
[10,4115 ; 20,8205)
[20,8205 ; 31,2294)
[31,2294 ; 41,6384)
[41,6384 ; 52,0473)
[52,0473 ; 62,4563)
[62,4563 ; 72,8652]

fi
80
9
10
3
4
3
4
113

fe
5
12
22
35
22
12
5
113

fi-fe
75
-3
-12
-32
-18
-9
-1

(fi-fe)^2
5625
9
144
1024
324
81
1

Nivel de Signicacion ()= 0,05


Grados de libertad (G.L)= [(# de Columnas-1)(# de Filas-1)]
G.L= 6

[(fi-fe)^2]/fe
1125
0,75
6,545454545
29,25714286
14,72727273
6,75
0,2
1183,22987
^
Valor Critico

1183,2>12,6.-->Se rechaza la hipotesis nula


Prueba de Cola Derecha
f(Chisq) Chi-square distribution

0
Chisq

Chi-square distribution
df = 6
Chi-square distribution
df = 6

6
P(Value)
,05

Chi-square

10

11

12
12.59

13

14

15

16

1183>12.59

12,59

P(upper)

Chi-square

2,29E-252

1183,0000

Conclusiones:
Con un nivel de Confianza de 95%(=0,05), se concluye que la
variable analizada no sigue una distribucin normal bajo los anteriores
preceptos con la prueba Chi Cuadrado

36

Variable X12
Intervalos de clase X12
L.I ; L.S
[349 ; 1155884,8571)
[1155884,8571 ; 2311420,7143)
[2311420,7143 ; 3466956,5714)
[3466956,5714 ; 4622492,4286)
[4622492,4286 ; 5778028,2857)
[5778028,2857 ; 6933564,1429)
[6933564,1429 ; 8089100]

fi
106
3
2
0
1
0
1
113

fe
5
12
22
35
22
12
5
113

fi-fe
101
-9
-20
-35
-21
-12
-4

Nivel de Signicacion ()= 0,05


Grados de libertad (G.L)= [(# de Columnas-1)(# de Filas-1)]
G.L= 6

(fi-fe)^2 [(fi-fe)^2]/fe
10201
2040,2
81
6,75
400 18,18181818
1225
35
441 20,04545455
144
12
16
3,2
2135,377273
^
Valor Critico

2135,4>12,6.-->Se rechaza la hipotesis nula


Prueba de Cola Derecha
f(Chisq) Chi-square distribution

0
Chisq

Chi-square distribution
df = 6
Chi-square distribution
df = 6

6
P(Value)
,05

Chi-square

10

11

12
12.59

13

14

15

16

2135>12.59

12,59

P(upper)

Chi-square

0,00E+00

2135,0000

Conclusiones:
Con un nivel de Confianza de 95%(=0,05), se concluye que la variable
analizada no sigue una distribucin normal bajo los anteriores preceptos con
la prueba Chi Cuadrado

37

Ahora procederemos a desarrollar el Inciso 8,2


Para ellos atenderemos las solicitudes de categorizacin solicitada.

Y de esta manera evaluar los apartados:


8.2.a Determinar si las variables X3 y X9 son independientes.
8.2.b Determinar si las variables X2 y X11 son independientes.
Tomando en cuenta las indicaciones planteadas, las cuales son:

Establecer el cuerpo de hiptesis correspondiente.

Construir la respectiva tabla de contingencia.

Aplicar la prueba Chi-cuadrado con un nivel de significacin = 0,05

Por lo cual importaremos los clculos realizados en Excel, en donde se


tuvo que establecer tablas dinmicas, para a partir de ellas trabajar con las
variables correspondientes, y de esta manera poder establecer la tabla de
contingencia de cada solicitud y almacenar en dicho formato Excel los datos
arrogados por los diferentes herramientas computacionales abordando desde
Minitab, StatPlus, MegaStat y una prueba manual.

De esta manera comprobar el apartado 8.2.a.

38

Apartado 8.2.a.
Aclaracin:
o

La distribucin de Pearson Chi cuadrada, mide la

existencia de asociacin entre dos variables cualitativas nominales


dicotmicas
Pregunta de investigacin:
o

El Crecimiento poblacional "X3" guarda relacin con la

cantidad de precipitacin "X9"?


Variable principal:
o

ndice de crecimiento, (Bajo "X < 0", Medio "0 X 1",

Alto "X > 1)


Variable secundaria:
o

Nivel de Precipitacin (X>2000(Alto), 1000X2000

(Medio), X9<1000(Bajo))
Hiptesis nula. Ho:
o

Una mayor precipitacin anual, no se relaciona con un

mayor crecimiento poblacional


Hiptesis alternativa. Ha:
o

Una mayor precipitacin anual,

se relaciona con un

mayor crecimiento poblacional


Recordando que:
o

Por convencin, Ho es siempre hiptesis de igualdad.

Usualmente lo que se busca es evidencia para poder rechazar Ho,


Con un nivel de 95% de confianza, solo puede rechazar Ho si el valor
de p que resulte de la prueba es menor de 0,05.

39

Relacin X3 - X9
Prueba con StatPlus

Prueba Manual

RELACION ENTRE
Grupos X3 Y Grupos X9

RELACION ENTRE
Grupos X3 Y Grupos X9

Observados
Grupos X3
X3<0(Bajo)
0X1(Medio)
X>1(Alto)
Total

X9<1000(Bajo)
13
19
25
57

NIVEL DE PRECIPITACION
1000X2000(Medio)
X>2000(Alto)
3
0
13
2
28
10
44
12

Table Statistics
Observed Counts
X3<0(Bajo)
0X1(Medio)
X>1(Alto)

X9<1000(Bajo)
13
19
25

1000X2000(Medio)
3
13
28

X>2000(Alto)
0
2
10

Expected Counts
X3<0(Bajo)
0X1(Medio)
X>1(Alto)

X9<1000(Bajo)
8,07
17,15
31,78

1000X2000(Medio)
6,23
13,24
24,53

X>2000(Alto)
1,70
3,61
6,69

Std. Residuals
X3<0(Bajo)
0X1(Medio)
X>1(Alto)

X9<1000(Bajo)
1,74
0,45
-1,20

1000X2000(Medio)
-1,29
-0,07
0,70

X>2000(Alto)
-1,30
-0,85
1,28

Test Statistics
Pearson Chi-Square

Value
10,880

df
4,00

p-value
0,028

Total
16
34
63
113

Observados
Grupos X3
X3<0(Bajo)
0X1(Medio)
X>1(Alto)
Total
Probabilidad

X9<1000(Bajo)
13
19
25
57
0,5044

NIVEL DE PRECIPITACION
1000X2000(Medio)
X>2000(Alto)
3
0
13
2
28
10
44
12
0,3894
0,1062

Total
16
34
63
113
1,0000

Esperados
Grupos X3
X3<0(Bajo)
0X1(Medio)
X>1(Alto)
Total

X9<1000(Bajo)
8,070796
17,150442
31,778761
57

NIVEL DE PRECIPITACION
1000X2000(Medio)
X>2000(Alto)
6,230088
1,699115
13,238938
3,610619
24,530973
6,690265
44
12

Total
16
34
63
113

Cal.Formula
Grupos X3
X3<0(Bajo)
0X1(Medio)
X>1(Alto)
Total Pearson Chi-Square

X9<1000(Bajo)
3,0104894
0,1994621
1,4459847
4,6559362

NIVEL DE PRECIPITACION
1000X2000(Medio)
X>2000(Alto)
1,674691
1,699115
0,004312
0,718463
0,490569
1,637355
2,169573
4,054933
Grados de libertad df=
p=

Prueba con MegaStat

Prueba con Mintab

RELACION ENTRE
Grupos X3 Y Grupos X9

RELACION ENTRE
Grupos X3 Y Grupos X9

Total
Chi2
10,88044
4
0,02800

Chi-square Contingency Table Test for Independence

X9<1000(Bajo) 1000X2000(Medio) X>2000(Alto)


X3<0(Bajo)

0X1(Medio)

X>1(Alto)

Total

Observed

13

C2

C3

Todo

16

Expected

8,07

6,23

1,70

16,00

% of total

11,5%

2,7%

0,0%

14,2%

Observed

19

13

34

Expected

17,15

13,24

3,61

34,00

% of total

16,8%

11,5%

1,8%

30,1%

Observed

25

28

10

63

Expected

31,78

24,53

6,69

63,00

% of total

22,1%

24,8%

8,8%

55,8%

Observed

57

44

12

113

Expected

57,00

44,00

12,00

113,00

% of total

50,4%

38,9%

10,6%

100,0%

10,88

C1

Total
X3<0(Bajo)

13
8,071

3
6,23

0
1,699

16

0X1(Medio)

19
17,15

13
13,239

2
3,611

34

25
31,779

28
24,531

10
6,69

63

57

44

12

113

X>1(Alto)

Todo

chi-square

4 df
,0279 p-value

Chi-cuadrada de Pearson = 10,880; GL = 4; Valor p = 0,028


Chi-cuadrada de la tasa de verosimilitud = 12,514; DF = 4; Valor p = 0,014

Anlisis:
Con los cuatro mtodos anteriormente descritos pudimos encontrar
que p=0,028, por lo tanto p<0,05 .-> Se Rechaza la Ho
Conclusiones:
Con un nivel de Confianza de 95%(=0,05), se concluye que el
Crecimiento poblacional "X3" si guarda relacin con la cantidad de precipitacin "X9". Por lo cual son
dependientes.
40

Apartado 8.2.b.
Aclaracin:
o La distribucin de Pearson Chi cuadrada, mide la existencia de
asociacin entre dos variables

cualitativas nominales dicotmicas

Pregunta de investigacin:
o El Consumo de energa procedente de combustibles fsiles (%
del total) "X2" guarda relacin con la cantidad de Rentas totales de
los recursos naturales (% del PIB) "X11"?

Variable principal:
o Consumo de energa, (Bajo "X < 50, Alto "X >= 50" )
Variable secundaria:
o Rentas totales en niveles (Bajo "X < 50, Alto "X >= 50" )
Hiptesis nula. Ho:
o El consumo de energa "X2", no se relaciona con la cantidad de
Renta "X11
Hiptesis alternativa. Ha:
o El consumo de energa "X2", se relaciona con la cantidad de
Renta "X11
Recordando que:
o Por convencin, Ho es siempre hiptesis de igualdad.
Usualmente lo que se busca es evidencia para poder rechazar Ho,
Con un nivel de 95% de confianza, solo puede rechazar Ho si el
valor de p que resulte de la prueba es menor de 0,05.

41

Relacin X2 - X11
Prueba con StatPlus

Prueba Manual

RELACION ENTRE
Grupos X2 Y Grupos X11

RELACION ENTRE
Grupos X2 Y Grupos X11

Observados
Grupos X2
X2 < 50(Bajo)
X2 50(Alto)
Total

X11 < 50(Bajo)


27
79
113

NIVEL DE PRECIPITACION
X11 50(Alto)
2
5
7

Table Statistics
Observed Counts
X2 < 50(Bajo)
X2 50(Alto)

X11 < 50(Bajo)


27
79

X11 50(Alto)
2
5

Expected Counts
X2 < 50(Bajo)
X2 50(Alto)

X11 < 50(Bajo)


27,20
78,80

X11 50(Alto)
1,80
5,20

Std. Residuals
X2 < 50(Bajo)
X2 50(Alto)

X11 < 50(Bajo)


-0,04
0,02

X11 50(Alto)
0,15
-0,09

Test Statistics
Pearson Chi-Square

Value
0,033

df
1,00

Total
29
84
113

Observados
Grupos X2
X2 < 50(Bajo)
X2 50(Alto)
Total
Probabilidad

NIVEL DE PRECIPITACION
X11 < 50(Bajo)
X11 50(Alto)
27
2
79
5
106
7
0,9381
0,0619

Total
29
84
113
1,0000

Esperados
Grupos X2
X2 < 50(Bajo)
X2 50(Alto)
Total

NIVEL DE PRECIPITACION
X11 < 50(Bajo)
X11 50(Alto)
27,203540
1,796460
78,796460
5,203540
106
7

Total
29
84
113

NIVEL DE PRECIPITACION
X11 < 50(Bajo)
X11 50(Alto)
0,0015229
0,023061
0,0005258
0,007962
0,0020487
0,031023
Grados de libertad df=
p=

Cal.Formula
Grupos X2
X2 < 50(Bajo)
X2 50(Alto)
Total Pearson Chi-Square
p-value
0,856

Prueba con MegaStat

Prueba con Mintab

RELACION ENTRE
Grupos X2 Y Grupos X11

RELACION ENTRE
Grupos X2 Y Grupos X11

Total
Chi2
0,03307
4
0,856

Chi-square Contingency Table Test for Independence

X2 < 50(Bajo)

X2 50(Alto)

Total

Observed
Expected
% of total
Observed
Expected
% of total
Observed
Expected
% of total

X11 < 50(Bajo)


27
27,20
23,9%
79
78,80
69,9%
106
106,00
93,8%

X11 50(Alto)
2
1,80
1,8%
5
5,20
4,4%
7
7,00
6,2%

Total
29
29,00
25,7%
84
84,00
74,3%
113
113,00
100,0%

X11 < 50(Bajo)

Todo

X2 < 50(Bajo)

27
27,204

2
1,796

29

X2 50(Alto)

79
78,796

5
5,204

84

Todo

106

113

Contenido de la celda:
,03 chi-square
1 df
,8557 p-value

X11 50(Alto)

Conteo

Conteo esperado
Chi-cuadrada de Pearson = 0,033; GL = 1; Valor p = 0,856
Chi-cuadrada de la tasa de verosimilitud = 0,032; DF = 1; Valor p = 0,857

Anlisis:
Con los cuatro mtodos anteriormente descritos pudimos encontrar que
p=0,856, por lo tanto p>0,05.-> Se Acepta la Ho.
Conclusiones:
Con un nivel de Confianza de 95%(=0,05), se concluye que No existe
relacin entre el Consumo de energa procedente de combustibles fsiles (% del total) "X2" y la
cantidad de Rentas totales de los recursos naturales (% del PIB) "X11". Por lo cual son
independientes.
42

Desarrollo Objetivo 9
Exponiendo su enunciado el cual reza:
OBJETIVO 9
9.1 Obtener los siguientes modelos de regresin lineal mltiple,
Modelo 1:
Y1 = b0 + b1X1 + b2X2 + b3X4 + b4X5 + b5X7 + b6X8 + b7X10 +b8X11.

Modelo 2:
Y2 = b0 + b1X1 + b2X2 + b3X3 + b4X4 + b5X5 + b6X6 + b7X9 + b8X10 + b9X12.

9.2 Aplicar a los dos modelos, en caso de ser necesario, el procedimiento de


eliminacin hacia atrs, para encontrar el modelo que mejor se ajuste a las
variables consideradas. Recuerde interpretar en cada paso los resultados
arrojados por el programa; coeficientes, estadsticos, etc.
Tomar en cuenta las siguientes indicaciones:

Considerar un nivel de confianza de 95 %.

Justificar, usando argumentos estadsticos, cuando parar el proceso.

Interpretar los modelos obtenidos en relacin al caso de estudio.

9.3 Realizar, para los modelos finales, un anlisis de residuos. Para ello,
utilizar los grficos de residuales: grafica de probabilidad normal y estimados
vs errores.
9.4 Estudiar la posibilidad de colinealidad o multicolinealidad en los modelos
considerados. Si existe, corregir este problema y obtener nuevos modelos.

43

Solucin
Desarrollo Objetivo 9
Antes de proceder a los clculos respectivos, se deber de
exponer la implicancia de un modelo de regresin lineal mltiple, en
donde:

Es un Modelo: Ya que es una representacin simplificada de la


realidad.
Es de Regresin: Debido a que expresa la relacin entre una variable
llamada regresando y otras variables llamadas regresoras.
Es Lineal: En funcin a que la relacin que liga las variables del
modelo es de tipo lineal.
Es Mltiple: En relacin a que posee una nica ecuacin y varias
variables explicativas.
Regresando: Es la variable dependiente o Explicativa, llamada
tambin variable endgena corriente.(para nuestro modelo ser Y)
Regresores: Se dividen en:
o Regresor Ficticio: En nuestro sistema la encontramos como
X0 y se utiliza para efectos del clculo matemtico, y toma
siempre valor unitario.
o Regresor

Explicativo:

Son

las

variables

explicativas,

predeterminadas o independientes (X1, X2, X3)


Parmetros: Ponderan cada una de las variables regresoras, y para
nuestro modelo las hallaremos como b.
Subndices: Dan nombre al regresor.

44

Una vez expuesto lo anterior, abordaremos el procedimiento que


aplicaremos para la eleccin del modelo de regresin lineal mltiple.
En donde haremos uso del proceso de eliminacin hacia atrs; el cual
consiste en ir introduciendo todas las variables en la ecuacin y despus se
van excluyendo una tras otra. Aquella variable que tenga la menor
correlacin parcial con la variable dependiente ser la primera en ser
considerada para su exclusin. Si satisface el criterio de eliminacin, ser
eliminada. Tras haber excluido la primera variable, se pondr a prueba
aquella variable, de las que queden en la ecuacin, que presente una
correlacin parcial ms pequea. El procedimiento termina cuando ya no
quedan en la ecuacin variables que satisfagan el criterio de exclusin. Dicha
correlacin se fundamenta en

el Coeficiente de Correlacin, llamado

tambin coeficiente de correlacin de Pearson, es una medida que


representa el grado de asociacin entre dos variables cuantitativas X e Y.

Por lo cual procederemos a realizar dicho proceso por medio de las


distintas herramientas computacionales, a el:
Modelo 1:
Y1 = b0 + b1X1 + b2X2 + b3X4 + b4X5 + b5X7 + b6X8 + b7X10 +b8X11.

Y al
Modelo 2:
Y2 = b0 + b1X1 + b2X2 + b3X3 + b4X4 + b5X5 + b6X6 + b7X9 + b8X10 + b9X12.

45

Anlisis de regresin: Y1 vs. X1; X2; X4; X5; X7; X8; X10; X11
Eliminacin de trminos hacia atrs - Trminos Candidatos:
X1; X2; X4; X5; X7; X8; X10; X11
Coeficientes a

Modelo

Coeficientes no
es tandarizados

Coefici
entes
es tand
arizado
s

Sig.

Error
es tndar

(Cons tante)

53,642

17,166

3,125

,002

X1

,161

,172

,179

,938

X2

-,323

,162

-,354

-1,997

X4

,001

,018

,005

X5

,000

,000

-,069

X7

-,645

,244

-,327

X8

4,343

,624

X10

,000

X11
(Cons tante)

Beta

Es tads ticas de
colinealidad

Tolerancia

VIF

,351

,120

8,300

,048

,139

7,172

,042

,966

,263

3,806

-,575

,567

,300

3,328

-2,648

,009

,287

3,489

,597

6,966

,000

,595

1,679

,001

,040

,320

,750

,285

3,507

,283

,188

,200

1,505

,135

,247

4,052

53,826

16,531

3,256

,002

X1

,161

,171

,178

,941

,349

,121

8,280

X2

-,322

,160

-,353

-2,017

,046

,142

7,062

X5

,000

,000

-,071

-,634

,527

,344

2,909

X7

-,649

,219

-,330

-2,970

,004

,352

2,841

Analisis

Valor VIF cercano a 10


Valor VIF cercano a 10
1er Sacar la variable X4
Paso con significancia
0,966>0,001

Valor VIF cercano a 10


Valor VIF cercano a 10
2do
Paso

X8

4,338

,607

,597

7,152

,000

,623

1,604

X10

,000

,001

,041

,334

,739

,294

3,398

X11

,279

,159

,197

1,757

,082

,344

2,911

Sacar la variable X10


con significancia

(Cons tante)

54,654

16,275

3,358

,001

X1

,153

,169

,170

,909

,365

,123

8,138

Valor VIF cercano a 10

X2

-,319

,159

-,350

-2,011

,047

,142

7,044

X5

-6,352E-05

,000

-,044

-,572

,568

,732

1,366

X7

-,634

,213

-,322

-2,977

,004

,368

2,719

X8

4,227

,505

,581

8,364

,000

,890

1,123

X11

,282

,158

,200

1,789

,077

,345

2,899

(Cons tante)

51,155

15,035

3,402

,001

X1

,193

,153

,214

1,258

,211

,148

6,768

X2

-,292

,151

-,320

-1,934

,056

,156

6,400

X7

-,631

,212

-,320

-2,970

,004

,368

2,716

X8

4,202

,502

,578

8,371

,000

,897

1,115

X11

,286

,157

,202

1,817

,072

,345

2,896

(Cons tante)

68,253

6,457

10,571

,000

X2

-,464

,064

-,509

-7,271

,000

,879

1,138

X7

-,694

,207

-,352

-3,355

,001

,390

2,563

X8

4,202

,503

,578

8,348

,000

,897

1,115

X11

,362

,146

,256

2,486

,000

,405

2,467

3er
Paso Sacar la variable X5

con significancia
0,568>0,001

Sacar la variable X1
4to con significancia
Paso

0,211>0,001

5to
Paso

Se detiene el proceso
debido a que la
significacion de los
valores obtenidos no
supera el criterio de
exclusin.

a. Variable dependiente: Y1

46

Anlisis para los clculos anteriores:


Como podemos verificar se realizaron cinco pasos, hasta obtener un
modelo que satisface los criterios establecidos de exclusin de variable.
Indicador valor t y su Sig.:
Para los coeficientes del modelo de regresin las puntuaciones t
indican que las variables tenidas en cuenta aportan al modelos sin embargo
su significancia indicara si su aportacin es aprovechada para el modelo o
no.

Para la presentacin anterior podemos constatar en el ltimo

paso, que todas le aportan al modelo de prediccin, por lo cual los


valores obtenidos se pueden generalizar a la poblacin, t=(-7,27;-3,26;8,35;2,49; y como todas tienen un p<0,001; implica que todas le estn
aportando significativamente) lo cual significa que no existe ninguna
variable que sobre.
Estadsticas de Colinealidad:
VIF (Factor de Varianza Inflada), el cual nos indica si hay o no hay
multicolinealidad entre variables.

En donde para valores mayores que 10

nos indica existencia de multicolinealidad entre variables, lo ideal es tener


valores cercanos a 1, no obstante si en el conjunto hay valores de 7 y 8 muy
probablemente, tengamos un problema de multicolinealidad, el cual ocasiona
una reduccin del poder predictivo del modelo, debido a redundancia de
informacin incrementando el error estndar.

Luego de haber realizado la anteriores exclusiones podemos

constatar en el ltimo paso que se obtuvieron valores de VIF= (1318;


2,563; 1115; 2,467) los cuales son cercanos a 1 indicando baja
Multicolinealidad.
47

Coeficientes no Estandarizados Beta (B) para cada variable del ltimo paso:
Y1=b0+b1*X+E
Y1=b0+b1*+b2*X2+b3*X4+b4*X5+b5*X7+b6*X8+b7*X10+b8*X11+E
Y1 = 68,25+(-0,4637*X2)+(- 0,694*X7) +( 4,202*X8) + (0,362 X11)+E

Prueba de Correlacin:
Continuando

con

la

pruebas

procederemos

evaluar

las

correlaciones; para ello acudiremos a el coeficiente de correlacin de


Pearson, el cual con valores cercanos a 1 o -1 indica una relacin
dependiente alta, en cambio s se acerca a 0 es ms independiente.
A su vez tambin se debe evaluar su valor de significacin el cual:

48

De esta manera procederemos a evaluar las correlaciones siguientes:

Correlaciones
X1
X2

Y1
Correlacin de
Pearson

Sig. (unilateral)

Y1
X1
X2
X4
X5
X7
X8
X10
X11
Y1
X1
X2
X4
X5
X7
X8
X10
X11
Y1
X1
X2
X4
X5
X7
X8
X10
X11

1,000
,452
-,465
-,035
-,117
-,249
,414
-,402
-,109
,000
,000
,355
,110
,004
,000
,000
,126
113
113
113
113
113
113
113
113
113

,452
1,000
-,907
-,124
-,393
-,183
-,227
-,480
,099
,000
,000
,094
,000
,026
,008
,000
,149
113
113
113
113
113
113
113
113
113

-,465
-,907
1,000
,069
,224
,248
,205
,383
,047
,000
,000
,233
,008
,004
,015
,000
,309
113
113
113
113
113
113
113
113
113

X4

X5

X7

X8

X10

X11

-,035
-,124
,069
1,000
-,021
-,714
-,130
-,063
-,744
,355
,094
,233

-,117
-,393
,224
-,021
1,000
-,066
,167
,682
-,228
,110
,000
,008
,412

-,249
-,183
,248
-,714
-,066
1,000
,069
,217
,740
,004
,026
,004
,000
,245

,414
-,227
,205
-,130
,167
,069
1,000
-,197
-,139
,000
,008
,015
,085
,038
,235

-,402
-,480
,383
-,063
,682
,217
-,197
1,000
,079
,000
,000
,000
,255
,000
,010
,018

-,109
,099
,047
-,744
-,228
,740
-,139
,079
1,000
,126
,149
,309
,000
,007
,000
,071
,203

,412
,000
,085
,255
,000
113
113
113
113
113
113
113
113
113

,245
,038
,000
,007
113
113
113
113
113
113
113
113
113

,235
,010
,000
113
113
113
113
113
113
113
113
113

,018
,071
113
113
113
113
113
113
113
113
113

,203
113
113
113
113
113
113
113
113
113

Anlisis:
Existencia de correlacin significante para Las variables (X1; X2), para
(X5; X10), para (X4; X7) y para (X4; X11) lo cual se aprecia con valores de
Pearson cercano a 1 y con significancia menores que 0,05.

49

113
113
113
113
113
113
113
113
113

Anlisis de Varianzas ANOVA


Anlisis de ANOVA o bondad de ajuste del modelo. Significancias por
debajo de 0,05 implica que el modelo que estamos probando mejora
significativamente la prediccin de la variable dependiente, lo cual indica que
estamos teniendo un buen modelo de prediccin para la variable
dependiente
Realizando comprobacin tenemos:
ANOVAa
Suma de
cuadrados

gl

Media
cuadrtica

Sig.

Regresin

36682,601

4585,325

15,536

,000 b

Residuo

30694,122

104

295,136

Total

67376,723

112

Regresin

36682,069

5240,296

17,926

,000 c

Residuo

30694,654

105

292,330

Total

67376,723

112

Regresin

36649,383

6108,230

21,072

,000 d

Residuo

30727,340

106

289,881

Total

67376,723

112

Regresin

36554,438

7310,888

25,380

,000

Residuo

30822,285

107

288,059

Total

67376,723

112

Regresin

36098,246

9024,562

31,160

,000

Residuo

31278,477

108

289,616

Total

67376,723

112

Modelo

Predictores: (Constante), X11, X2, X8, X7


Anlisis:
Significancias por debajo de 0,05 implica que el modelo que estamos
probando mejora significativamente la prediccin de la variable dependiente

50

lo cual indica que estamos teniendo un buen modelo de prediccin para la


variable dependiente.

Diagnstico de colinealidad:
Para el anlisis de colinealidad, un ndice de condicin cercano o
superior al umbral de 30, muestra la presencia de colinealidad en el modelo.

Diagnsticos de colinealidad
Modelo

Autovalor

ndice de
condicin (Constante)

Proporciones de varianza
X1

X2

X4

X5

X7

X8

X10

X11

4,170

1,000

,00

,01

,00

,01

,01

,622

2,589

,00

,01

,00

,03

,33

,110

6,149

,00

,55

,00

,59

,02

,064

8,047

,38

,43

,12

,38

,16

,034

11,140

,61

,01

,88

,00

,48

a. Variable dependiente: Y1

Anlisis:
El mximo valor es 11,140 el cual es lejano a 30 mostrando no
colinealidad en el modelo.

Resumen del Modelo: Tabla que contiene la siguiente informacin:

R=( Coeficiente de Correlacin): valores cercanos a 0 indican

poca relacin, y valores de 1 indican alta relacin entre las variables

El R cuadrado: se aplica para una regresin lineal simple no

obstante para las regresiones lineales mltiples no se considera, debido a

51

que tiende a incrementarse, es decir subir hasta 1, a medida que se aaden


ms variables a modelo. Por lo cual se elegir el R^2 ajustado, ya que
amortigua el efecto de aumentar el R^2, cuando se tiene muchas variables,
e implica la varianza que podemos explicar a partir del modelo de la
variable dependiente.

Durbin-Watson: Establece un parmetro con el cual determinar

la dependencia de errores, en donde la idea es hallar una lnea a travs de


los mnimos cuadrados, para ello se han de retirar los casos que no sigan
ese comportamiento deseado. Por lo valores entre 1 y 3 indican
cumplimiento del supuesto de independencia de errores "mientras ms
cercano a 2 mejor.
Resumen del modelof
Estadsticas de cambios
Error
R cuadrado
estndar de
Cambio de
ajustado
la estimacin cuadrado de R

Pasos

R cuadrado

,738 a

,544

,509

17,1795165

,738 b

,544

,514

17,0976617

,738

,544

,518

,737

,543

,521

DurbinSig.
Cambio Watson
en F

Cambio en F

df1

df2

,544

15,536

104

,000

,000

,002

104

,966

17,0258793

,000

,112

105

,739

16,9722932

-,001

,328

106

,568

,536
,519
17,0180940
,732 e
1. Predictores: (Constante), X11, X2, X8, X5, X7, X10, X4, X1

-,007

1,584

107

,211

2. Predictores: (Constante), X11, X2, X8, X5, X7, X10, X1


3. Predictores: (Constante), X11, X2, X8, X5, X7, X1
4. Predictores: (Constante), X11, X2, X8, X7, X1
5. Predictores: (Constante), X11, X2, X8, X7
f. Variable dependiente: Y1

Anlisis:

R=( Coeficiente de Correlacin):


o

0,732 de Correlacin para los predictores obtenidos en el

paso 5, el cual indica posible dependencia, sin embargo est a 0,268


de 1.

52

2,210

R^2 ajustado:
o

Para el modelo de regresin analizado obtuvimos un

valor de 0,519 lo cual implica que el modelo explica un 51,6% de la


varianza de la variable dependiente.

Durbin-Watson:
o

El puntaje de la prueba de Durbin-Watson dio 2,210 cercano a

2; Indicando independencia de errores.


Estudio de Residuos
El

anlisis

de

normalidad

de

los

residuos

lo

realizaremos

analticamente (Contraste de Kolmogorov-Smirnov la cual aplica para


muestra superiores a 50 elementos) y grficamente (Histograma y grfico de
probabilidad normal).
Kolmogorov-Smirnov:
o La usaremos para establecer normalidad a aquellas
variables con un valor de significancia superiores a 0,05.
Prueba de Kolmogorov-Smirnov Residuos No
Estandarizados Y1
Unstandardize
d Residual
N
Parmetros normales

113
a,b

Mximas diferencias extremas

Media
Desviacin
estndar
Absoluta

,0000000

Prueba de Kolmogorov-Smirnov Residuos Estandarizados


Y1
Standardized
Residual
N
Parmetros normales

113
a,b

16,71143655

Positivo
Negativo
Estadstico de prueba
Sig. asinttica (bilateral)

,071

Mximas diferencias extremas

Media
Desviacin
estndar
Absoluta

,0000000
,98198051
,071

,071

Positivo

,071

-,067

Negativo

-,067

,071
c,d

,200

Estadstico de prueba

,071

Sig. asinttica (bilateral)

,200c,d

a. La distribucin de prueba es normal.

a. La distribucin de prueba es normal.

b. Se calcula a partir de datos.

b. Se calcula a partir de datos.

c. Correccin de significacin de Lilliefors.

c. Correccin de significacin de Lilliefors.

d. Esto es un lmite inferior de la significacin verdadera.

d. Esto es un lmite inferior de la significacin verdadera.

53

Anlisis:
Los valores de Significacin obtenidos por medio de la prueba
Kolmogorov-Smirnov para los residuos estandarizados y no estandarizado
del modelo Y1, arrojaron valores de 0,2 para ambos clculos y como
0,2>0,05. Por lo cual se acepta la normalidad para los residuos
estandarizados y no estandarizados para el modelo Y1.
Grficamente realizaremos:
En el grfico Q-Q normal:
o Cuando una muestra procede de una poblacin normal,
los puntos correspondientes a cada par se encuentran agrupados en
torno a la diagonal representada en el diagrama. Las desviaciones de
la diagonal indican desviaciones de la normalidad.

Anlisis:
Los puntos estn situados casi sobre la lnea recta lo cual es un indicio
de normalidad de la poblacin de origen. Este resultado es compatible con el
del contraste de Kolmogorov-Smirnov.
54

Un grfico Q-Q normal sin tendencia:


o Muestra las diferencias existentes entre la puntuacin
tpica observada de cada valor, y su correspondiente puntuacin tpica
normal. Es decir, muestra las distancias verticales existentes entre
cada punto del grafico Q-Q normal y la recta diagonal. En el eje de
abscisas estn representados los valores observados, y en el de
ordenadas, el tamao de las diferencias entre las puntuaciones tpicas
observadas y las esperadas. Si la muestra procede de una poblacin
normal, esas diferencias deben oscilar de forma aleatoria en torno al
valor cero. En donde la presencia de pautas de tendencias de
variacin no aleatorias indica desviaciones de la normalidad.

Anlisis:
Los valores observados no presentan una tendencia clara, lo cual
grficamente implica no desviacin de la normalidad.
Ahora procederemos a realizar los clculos para el Modelo 2.

55

Anlisis de regresin: Y2 vs. X1; X2; X3; X4; X5; X6; X9; X10; X12
Eliminacin de trminos hacia atrs - Trminos candidatos:
X1; X2; X3; X4; X5; X6; X9; X10; X12
Coeficientesa
Coeficientes no estandarizados
Modelo
B
(Constante)
X1
X2
X3
X4
1
X5
X6
X9
X10
X12
(Constante)
X1
X2
X3
2
X5
X6
X9
X10
X12
(Constante)
X1
X2
X3
3
X5
X6
X10
X12
(Constante)
X1
X2
4
X3
X5
X6
X10
(Constante)
X1
X2
5
X3
X5
X10
a. Variable dependiente: Y2

-4,524
,030
,058
,154
,000
-3,748E-05
,015
,000
,003
-2,077E-07
-4,491
,030
,058
,148
-3,753E-05
,015
,000
,003
-2,103E-07
-4,894
,031
,060
,154
-3,687E-05
,012
,003
-1,722E-07
-4,896
,030
,060
,162
-3,560E-05
,007
,002
-4,910
,031
,061
,161
-3,571E-05
,002

Error
estndar
1,080
,012
,011
,079
,001
,000
,008
,000
,000
,000
1,071
,012
,011
,076
,000
,008
,000
,000
,000
1,024
,012
,011
,076
,000
,007
,000
,000
1,026
,012
,011
,076
,000
,006
,000
1,027
,012
,011
,076
,000
,000

Coeficie
ntes
estandar
izados

Sig.

Beta
,149
,279
,046
,007
-,114
,053
-,027
,998
-,038
,147
,278
,044
-,114
,053
-,028
,998
-,038
,151
,289
,046
-,112
,042
,998
-,031
,149
,291
,049
-,108
,023
,990
,152
,295
,048
-,109
,992

-4,187
2,492
5,135
1,959
,320
-3,844
1,968
-1,224
32,826
-1,413
-4,194
2,485
5,147
1,951
-3,866
1,981
-1,249
33,014
-1,439
-4,781
2,540
5,406
2,030
-3,794
1,650
32,963
-1,202
-4,773
2,501
5,436
2,147
-3,677
1,158
33,565
-4,779
2,559
5,522
2,129
-3,683
33,613

,000
,014
,000
,053
,749
,000
,052
,224
,000
,161
,000
,015
,000
,054
,000
,050
,214
,000
,153
,000
,013
,000
,045
,000
,102
,000
,232
,000
,014
,000
,034
,000
,249
,000
,000
,012
,000
,036
,000
,000

Estadsticas de
colinealidad
Tolerancia

VIF

,114
,138
,726
,883
,461
,557
,807
,440
,575

8,760
7,272
1,378
1,133
2,168
1,797
1,239
2,274
1,738

,115
,138
,777
,461
,557
,810
,442
,577

8,707
7,242
1,286
2,168
1,796
1,235
2,265
1,732

,115
,142
,781
,463
,630
,442
,603

8,688
7,053
1,281
2,161
1,588
2,264
1,657

,115
,142
,788
,468
,989
,468

8,680
7,046
1,270
2,136
1,011
2,137

,116
,143
,788
,468
,469

8,658
7,011
1,270
2,135
2,131

Analisis
Valor VIF cercano a 10
Valor VIF cercano a 10
1er Sacar la variable X4 con
Paso significancia 0,749>0,001

Valor VIF cercano a 10


Valor VIF cercano a 10
2do
Paso
Sacar la variable X9 con
significancia 0,214>0,001

Valor VIF cercano a 10


Valor VIF cercano a 10
3er
Paso
Sacar la variable X12 con
significancia 0,232>0,001

4to
Paso

Valor VIF cercano a 10


Valor VIF cercano a 10
Sacar la variable X6 con
significancia 0,249>0,001

Valor VIF 8,658 proximo


a 10 implica cercana
5to multicolinealidad
Paso Valor VIF 7,011 proximo
a 10 implica cercana
multicolinealidad

56

Anlisis para los clculos anteriores:


El anterior modelo de regresin lineal mltiple obtenido por el proceso
de eliminacin hacia atrs, a travs del programa SPSS establece como
podemos verificar, 5 pasos de eliminacin, encontrables de igual manera al
realizar dicho proceso por medio de Minitab. No obstante en ese ltimo
modelo se aprecian valores de variables que no cumplen los criterios
establecidos de exclusin. Profundizando tenemos:
Indicador valor t y su Sig.:
Para los coeficientes del modelo de regresin las puntuaciones t
indican que las variables tenidas en cuenta aportan al modelos sin embargo
su significancia indicara si su aportacin es aprovechada para el modelo o
no.

Para los coeficientes del modelo de regresin las puntuaciones

t indican que las variables tenidas en cuenta aportan al modelo, sin


embargo en el ltimo modelo sigue persistiendo valores con significancia
mayores a 0,001, por lo cual lo valores no se pueden generalizar a la
poblacin, teniendo t= [(5,522; -3,683; 33,613 con p<0,001) y (2,559;
2,129 con p>0,001)],

lo cual implica que dos variables no le estn

aportando al modelo. Lo cual nos hace pensar que el modelo no cumple


los criterios de exclusin.
Estadsticas de Colinealidad:
VIF (Factor de Varianza Inflada), el cual nos indica si hay o no hay
multicolinealidad entre variables.

En donde para valores mayores que 10

nos indica existencia de multicolinealidad entre variables, lo ideal es tener


valores cercanos a 1, no obstante si en el conjunto hay valores de 7 y 8 muy

57

probablemente, tengamos un problema de multicolinealidad, el cual ocasiona


una reduccin del poder predictivo del modelo, debido a redundancia de
informacin incrementando el error estndar.

Para ambos procesos tanto en SPSS y Minitab hallamos valores de


VIF, con puntajes de VIF 8,658 prximo a 10, implicando cercana
multicolinealidad y a su vez valores de VIF 7,011 prximo a 10 implicando de
igual manera cercana multicolinealidad.
Coeficientes no Estandarizados Beta (B) para cada variable del ltimo paso:
Y2=b0+b1*X+E
Y2=(b0)+(b1*X2)+(b2*X3)+(b3*X5)+(b4*X10)+E
Y2= -4,910 + (0,31X1)+(0,61 X2) + (0,161 X3) + (-0,00003571 X5)+(0,002*x10)+(E)

Prueba de Correlacin:
Continuando

con

la

pruebas

procederemos

evaluar

las

correlaciones; para ello acudiremos a el coeficiente de correlacin de


Pearson, el cual con valores cercanos a 1 o -1 indica una relacin
dependiente alta, en cambio s se acerca a 0 es ms independiente.

58

A su vez tambin se debe evaluar su valor de

De esta manera procederemos a evaluar las correlaciones siguientes:

59

Correlacin de
Pearson

Sig. (unilateral)

Y2
X1
X2
X3
X4
X5
X6
X9
X10
X12
Y2
X1
X2
X3
X4
X5
X6
X9
X10
X12
Y2
X1
X2
X3
X4
X5
X6
X9
X10
X12

Y2
1,000
-,533
,502
,041
-,066
,573
,099
-,225
,957
,162
,000
,000
,333
,244
,000
,150
,008
,000
,043
113
113
113
113
113
113
113
113
113
113

X2
,502
-,907
1,000
-,210
,069
,224
,078
-,265
,383
,016
,000
,000
,013
,233
,008
,206
,002
,000
,433
113
113
113
113
113
113
113
113
113
113

Correlaciones
X3
X4
,041
-,066
,332
-,124
-,210
,069
1,000
-,317
-,317
1,000
-,026
-,021
-,003
-,042
-,013
-,038
,001
-,063
-,045
-,059
,333
,244
,000
,094
,013
,233
,000
,000
,391
,412
,486
,330
,445
,343
,495
,255
,317
,268
113
113
113
113
113
113
113
113
113
113
113
113
113
113
113
113
113
113
113
113

X5
,573
-,393
,224
-,026
-,021
1,000
,019
-,131
,682
,037
,000
,000
,008
,391
,412
,420
,083
,000
,347
113
113
113
113
113
113
113
113
113
113

X6
,099
-,054
,078
-,003
-,042
,019
1,000
,237
,063
,597
,150
,287
,206
,486
,330
,420
,006
,253
,000
113
113
113
113
113
113
113
113
113
113

X9
-,225
,234
-,265
-,013
-,038
-,131
,237
1,000
-,186
-,011
,008
,006
,002
,445
,343
,083
,006
,024
,455
113
113
113
113
113
113
113
113
113
113

X10
,957
-,480
,383
,001
-,063
,682
,063
-,186
1,000
,172
,000
,000
,000
,495
,255
,000
,253
,024
,034
113
113
113
113
113
113
113
113
113
113

X12
,162
-,018
,016
-,045
-,059
,037
,597
-,011
,172
1,000
,043
,426
,433
,317
,268
,347
,000
,455
,034
113
113
113
113
113
113
113
113
113
113

Anlisis:
Existencia de correlacin significante para Las variables (X10; Y2); lo
cual se aprecia con valores de Pearson de 0,957 cercano a 1 y con
significancia menores que 0,05 y correlacin no significativa para (X10; X6)
con valor de significancia de 0.253>0,05.

Anlisis de Varianzas ANOVA


Anlisis de ANOVA o bondad de ajuste del modelo. Significancias por
debajo de 0,05 implica que el modelo que estamos probando mejora
significativamente la prediccin de la variable dependiente, lo cual indica que
estamos teniendo un buen modelo de prediccin para la variable
dependiente

60

Realizando comprobacin tenemos:


ANOVAa
Suma de
cuadrados

Modelo

Media
cuadrtica

Sig.

261,773

,000 b

297,045

,000

337,454

,000

391,815

,000

468,416

,000

Regresin

3321,884

369,098

Residuo

145,229

1,410

Total

3467,113

Regresin

3321,739

415,217

Residuo

145,374

1,398

Total

3467,113

Regresin

3319,557

474,222

Residuo

147,556

1,405

Total

3467,113

Regresin

3317,528

552,921

Residuo

149,585

1,411

Total

3467,113

Regresin

3315,635

663,127

Residuo

151,478

1,416

Total

3467,113

a. Variable dependiente: Y2

Predictores: (Constante), X3, X5, X2, X10, X1


Anlisis:
Significancias por debajo de 0,05 implica que el modelo que estamos
probando mejora significativamente la prediccin de la variable dependiente
lo cual indica que estamos teniendo un buen modelo de prediccin para la
variable dependiente.

61

Diagnstico de colinealidad:
Para el anlisis de colinealidad, un ndice de condicin cercano o
superior al umbral de 30, muestra la presencia de colinealidad en el modelo.
Diagnsticos de colinealidada

Proporciones de varianza

Autovalor

ndice de
condicin

(Constante)

X1

X2

X3

3,797

1,000

,00

,00

,00

,02

,01

,01

1,206

1,774

,00

,03

,00

,07

,05

,03

,468

2,849

,00

,00

,01

,54

,07

,01

,360

3,250

,00

,06

,01

,27

,23

,00

,163

4,831

,00

,01

,00

,02

,51

,94

,007

23,653

,99

,90

,97

,08

,13

,00

Modelo

X4

X5

X6

X9

X10

a. Variable dependiente: Y2

Anlisis:
El mximo valor es 23,653 cercano a 30 mostrando posible
colinealidad en el modelo.

Resumen del Modelo: Tabla que contiene la siguiente informacin:

R=( Coeficiente de Correlacin): valores cercanos a 0 indican

poca relacin, y valores de 1 indican alta relacin entre las variables

El R cuadrado: se aplica para una regresin lineal simple no

obstante para las regresiones lineales mltiples no se considera, debido a


que tiende a incrementarse, es decir subir hasta 1, a medida que se aaden
ms variables a modelo. Por lo cual se elegir el R^2 ajustado, ya que
amortigua el efecto de aumentar el R^2, cuando se tiene muchas variables,
e implica la varianza que podemos explicar a partir del modelo de la
variable dependiente.

62

X12

Durbin-Watson: Establece un parmetro con el cual determinar

la dependencia de errores, en donde la idea es hallar una lnea a travs de


los mnimos cuadrados, para ello se han de retirar los casos que no sigan
ese comportamiento deseado. Por lo valores entre 1 y 3 indican
cumplimiento del supuesto de independencia de errores "mientras ms
cercano a 2 mejor.
Resumen del modelof
Estadsticas de cambios
Error
estndar de Cambio de
la
cuadrado de Cambio en F
df1
df2
estimacin
R

Modelo

R cuadrado

R cuadrado
ajustado

,979a

,958

,954

1,1874322

,958

261,773

103

,000

,979b

,958

,955

1,1822981

,000

,103

103

,749

,978c

,957

,955

1,1854511

-,001

1,561

104

,214

,978d

,957

,954

1,1879310

-,001

1,444

105

,232

5
,956
,954
1,1898240
,978e
a. Predictores: (Constante), X12, X9, X3, X5, X4, X2, X6, X10, X1

-,001

1,341

106

,249

Sig. Cambio
en F

b. Predictores: (Constante), X12, X9, X3, X5, X2, X6, X10, X1


c. Predictores: (Constante), X12, X3, X5, X2, X6, X10, X1
d. Predictores: (Constante), X3, X5, X2, X6, X10, X1
e. Predictores: (Constante), X3, X5, X2, X10, X1
f. Variable dependiente: Y2

Anlisis:

R=( Coeficiente de Correlacin):


o

0,978 de Correlacin para los predictores obtenidos en el

paso 5, el cual indica dependencia, ya que est a 0,022 de 1.

R^2 ajustado:
o

Para el modelo de regresin analizado obtuvimos un

valor de 0,954 lo cual implica que el modelo explica un 95,4% de la


varianza de la variable dependiente.

Durbin-Watson:
o

El puntaje de la prueba de Durbin-Watson dio 1,810

cercano a 2; Indicando independencia de errores

63

DurbinWatson

1,810

Estudio de Residuos
El

anlisis

de

normalidad

de

los

residuos

lo

realizaremos

analticamente (Contraste de Kolomogorov-Smirnov la cual aplica para


muestra superiores a 50 elementos) y grficamente (Histograma y grfico de
probabilidad normal).
Kolmogorov-Smirnov:
o La usaremos para establecer normalidad a aquellas
variables con un valor de significancia superiores a 0,05.
Prueba de Kolmogorov-Smirnov Residuos No Estandarizados Y2

Prueba de Kolmogorov-Smirnov Residuos Estandarizados Y2

Unstandardiz
ed Residual
N

113

Parmetros normales

a,b

Media
Desviacin estndar

Mximas diferencias
extremas

Absoluta
Positivo
Negativo

Estadstico de prueba

,0000000

,140

b. Se calcula a partir de datos.


c. Correccin de significacin de Lilliefors.

Parmetros normales

113
a,b

Mximas diferencias
extremas

-,114
c

Media

,0000000

Desviacin estndar

,140

,000

a. La distribucin de prueba es normal.

1,16296218

,140

Sig. asinttica (bilateral)

Standardized
Residual

,97742373

Absoluta

,140

Positivo

,140

Negativo

-,114

Estadstico de prueba

,140

Sig. asinttica (bilateral)

,000

a. La distribucin de prueba es normal.


b. Se calcula a partir de datos.
c. Correccin de significacin de Lilliefors.

Anlisis:
Los valores de Significacin obtenidos por medio de la prueba
Kolmogorov-Smirnov para los residuos estandarizados y no estandarizado
del modelo Y2, arrojaron valores de 0,00 para ambos clculos y como
0,00<0,05. Por lo cual no se acepta la normalidad para los residuos
estandarizados y no estandarizados para el modelo Y2.

64

Grficamente realizaremos:
En el grfico Q-Q normal:
o Cuando una muestra procede de una poblacin normal,
los puntos correspondientes a cada par se encuentran agrupados en
torno a la diagonal representada en el diagrama. Las desviaciones de
la diagonal indican desviaciones de la normalidad.
Contrastes entre Modelos para la eleccin final:
Anlisis:
Los puntos oscilan en la lnea recta lo cual es un indicio de no
normalidad de la poblacin de origen. Este resultado es compatible con el del
contraste de Kolmogorov-Smirnov.
Un grfico Q-Q normal sin tendencia:
o Muestra las diferencias existentes entre la puntuacin
tpica observada de cada valor, y su correspondiente puntuacin tpica
normal. Es decir, muestra las distancias verticales existentes entre
cada punto del grafico Q-Q normal y la recta diagonal. En el eje de
abscisas estn representados los valores observados, y en el de
ordenadas, el tamao de las diferencias entre las puntuaciones tpicas
observadas y las esperadas. Si la muestra procede de una poblacin
normal, esas diferencias deben oscilar de forma aleatoria en torno al
valor cero. En donde la presencia de pautas de tendencias de
variacin no aleatorias indica desviaciones de la normalidad.

65

Anlisis:
Los valores observados no presentan una tendencia clara, lo cual
grficamente implica no desviacin de la normalidad.

66

Ahora procederemos a comparar el modelo 1 con el modelo 2 y definir as


cual modelo elegir:
Paso

VIF

Modelo: Y2

8,658
7,011
1,270
2,135
2,131
1,138

Modelo: Y1

2,563
1,115
2,467

Analisis VIF
Indice de Condicion
Analisis Indice
Kolmogorov
Analisis Indice
Valor VIF 8,658 proximo
1,000
a 10 implica cercana
Y2, presenta un valor
los residuos no son
1,774
5to multicolinealidad
mas
cercano
a
30
lo
cual
normales ya que la
2,849
Sig=
Paso Valor VIF 7,011 proximo
indica cercana
significancia es menor
3,250
0,00
colinealidad
de 0,05
a 10 implica cercana
4,831
multicolinealidad
23,653
1,000
Los residuos son
Valores VIF cercanos a 1
2,589
Sig=
normales ya que la
5to
lo cual indica baja
6,149
Y1, Baja colinealidad
0,20
Paso
significancia es mayor de
Multicolinealidad
8,047
0,05
11,140

Por lo cual se elegir el Modelo 1, tomndolo de esta manera como el


mejor modelo predictor, debido a que cumple en mayor grado con todos los
preceptos de aceptacin anteriormente expuestos. Y quedando:
Y1=b0+b1*X+E
Y1=b0+b1*+b2*X2+b3*X4+b4*X5+b5*X7+b6*X8+b7*X10+b8*X11+E
Y1 = 68,25+(-0,4637*X2)+(- 0,694*X7) +( 4,202*X8) + (0,362 X11)+E

67

Desarrollo Objetivo 10
Lo primero ser, exponer su enunciado el cual dice:
10.1 Efectuar un anlisis de varianza del comportamiento de (Y1) respecto a
la Presin (X3). Para esta ltima variable utilice la categorizacin planteada
en el objetivo 8.
Tomar en cuenta las siguientes indicaciones:

Establecer el cuerpo de hiptesis.

Considerar muestras de tamao 5.

Explicar en detalle el procedimiento seguido para tomar las muestras.

Considerar un nivel de confianza de 95 %.

Realizar un anlisis de los resultados.

10.2 Realizar un anlisis de varianza de YTotal = Y1 + Y2 respecto a X3 y a


X9. Para estas ltimas variables utilice la categorizacin plantada en el
objetivo 8.
Tomar en cuenta las siguientes indicaciones:

Establecer el cuerpo de hiptesis.

Considerar muestras de tamao 3.

Explicar en detalle el procedimiento seguido para tomar las muestras.

Considerar un nivel de confianza de 95 %.

Realizar un anlisis de los resultados.

68

Solucin
Desarrollo Objetivo 10

Se nos pide llevar a cabo una serie de anlisis de varianza, no


obstante, para poder aplicar el anlisis de varianza se deber verificar que
cumplan unos criterios por lo cual, el no cumplimiento de alguno de ellos
determinara la no aplicacin del anlisis de varianza.
Dichos criterios deben establecer que las variables a analizar deban ser:

Normales

Independientes

Con Varianza Homognea

Por lo cual procederemos a realizar la primera prueba de normalidad la


cual la estableceremos por medio de Kolmogrov-Smirnov, atendiendo un
valor muestral mayor de 50 elementos, haciendo uso del operador SPSS,
bajo la funcin pruebas no paramtricas. La normalidad se establecer para
valores de significacin superiores a 0,05.
Obteniendo los siguientes resultados:

69

Pruebas de normalidad
Kolmogorov-Smirnova

Shapiro-Wilk

Estadstico

gl

Sig.

Estadstico

gl

Sig.

Y1

,077

113

,093

,962

113

,003

Y2

,185

113

,000

,778

113

,000

X1

,218

113

,000

,778

113

,000

X2

,132

113

,000

,907

113

,000

X3

,146

113

,000

,646

113

,000

X4

,262

113

,000

,596

113

,000

X5

,266

113

,000

,713

113

,000

X6

,299

113

,000

,556

113

,000

X7

,142

113

,000

,897

113

,000

X8

,066

113

,200

,987

113

,320

X9

,132

113

,000

,931

113

,000

X10

,184

113

,000

,770

113

,000

X11

,261

113

,000

,705

113

,000

X12

,370

113

,000

,337

113

,000

Como se aprecia por medio de Kolmogorov-Smirnov, solo Y1 es normal


ya que su significancia es 0,093>0,05
Sin embargo Y2; X3; X9 no son normales ya que su Sig. es 0,00<0,05.
A su vez lo verificaremos grficamente de la siguiente manera:
Cuando una muestra procede de una poblacin normal, los puntos
correspondientes a cada par se encuentran agrupados en torno a la diagonal
representada en el diagrama. Las desviaciones de la diagonal indican
desviaciones de la normalidad

70

Anlisis de Normalidad grficamente

Anlisis

Como se aprecia Y1, es la nica variable que muestra un


comportamiento normal.
Las dems variables no siguen una distribucin normal. Por lo cual no
cumple el criterio para el anlisis. Sin embargo realizaremos otra prueba para
definir bajo otra condicin la no posibilidad de realizar el anlisis de varianza.

71

Prueba de independencia para la relacin Y1-X3.


Aclaracin:
o

La distribucin de Pearson Chi cuadrada, mide la

existencia de asociacin entre dos variables cualitativas nominales


dicotmicas
Pregunta de investigacin:
o

El Crecimiento poblacional "X3" guarda relacin

con la cantidad de emisiones de C02 derivadas del consumo


de combustibles lquido (% del Total)?
Variable principal:
o

ndice de crecimiento, (Bajo "X < 0", Medio "0 X 1",

Alto "X > 1)


Variable secundaria:
o

Emisiones (Bajo "X < 50, Alto "X >= 50" )

Hiptesis nula. Ho:


o

Una mayor precipitacin anual, no se relaciona con un

mayor crecimiento poblacional


Hiptesis alternativa. Ha:
o

Una mayor precipitacin anual,

se relaciona con un

mayor crecimiento poblacional


Recordando que:
o

Por convencin, Ho es siempre hiptesis de igualdad.

Usualmente lo que se busca es evidencia para poder rechazar Ho,


Con un nivel de 95% de confianza, solo puede rechazar Ho si el
valor de p que resulte de la prueba es menor de 0,05.

72

Relacin Y1 X3
Prueba con StatPlus

Prueba Manual
Prueba con
MegaStat

RELACION ENTRE
Grupos Y1 Y Grupos X3

RELACION ENTRE

NIVEL DE PRECIPITACION
0X1(Medio)
X>1(Alto)
5
5
3
8
11
6
7
12
2
12
2
9
4
11

Observados
Grupos X4
[10,0214 ; 22,6997)
(22,6997 ; 35,3780)
( 35,3780 ; 48,0563)
( 48,0563 ; 60,7347)
(60,7347 ; 73,4130)
(73,4130 ; 86,0913)
(86,0913 ; 98,7696)

X3<0(Bajo)
5
5
3
2
0
0
1

Table Statistics
Observed Counts
[10,0214 ; 22,6997)
(22,6997 ; 35,3780)
( 35,3780 ; 48,0563)
( 48,0563 ; 60,7347)
(60,7347 ; 73,4130)
(73,4130 ; 86,0913)
(86,0913 ; 98,7696)

X3<0(Bajo)
5
5
3
2,00
0,00
0,00
1

0X1(Medio)
5
3
11
7,00
2,00
2,00
4

X>1(Alto)
5
8
6
12,00
12,00
9,00
11

Expected Counts
[10,0214 ; 22,6997)
(22,6997 ; 35,3780)
( 35,3780 ; 48,0563)
( 48,0563 ; 60,7347)
(60,7347 ; 73,4130)
(73,4130 ; 86,0913)
(86,0913 ; 98,7696)

X3<0(Bajo)
2,12
2,27
2,83
2,97
1,98
1,56
2,27

0X1(Medio)
4,51
4,81
6,02
6,32
4,21
3,31
4,81

X>1(Alto)
8,36
8,92
11,15
11,71
7,81
6,13
8,92

Std. Residuals
[10,0214 ; 22,6997)
(22,6997 ; 35,3780)
( 35,3780 ; 48,0563)
( 48,0563 ; 60,7347)
(60,7347 ; 73,4130)
(73,4130 ; 86,0913)
(86,0913 ; 98,7696)

X3<0(Bajo)
1,97
1,82
0,10
-0,56
-1,41
-1,25
-0,84

0X1(Medio)
0,23
-0,83
2,03
0,27
-1,08
-0,72
-0,37

X>1(Alto)
-1,16
-0,31
-1,54
0,09
1,50
1,16
0,70

Test Statistics
Pearson Chi-Square
Continuity Adjusted Chi-Square
Likelihood Ratio Chi-Square

Value
26,437
17,522
28,122

df
12
12
12

p-value
0,009
0,131
0,005

Grupos
Y1 Y Grupos X3
RELACION
ENTRE
Grupos
Y1
Y
Grupos
X3 NIVEL DE PRECIPITACION
Observados
Total
15
16
20
21
14
11
16
113

Grupos X4
X3<0(Bajo)
0X1(Medio)
X>1(Alto)
Total
5
15
(22,6997 ; 35,3780)
5
3
8
16
X3<0(Bajo)
0X1(Medio)
X>1(Alto)
Total
( 35,3780 ; 48,0563)
3
11
6
20
; 60,7347)
2
7
12
[10,0214 ; 22,6997)( 48,0563
Observed
5
5
5
15 21
(60,7347 ; 73,4130)
0
2
12
Expected
2,12
4,51
8,36
15,00 14
(73,4130 ; 86,0913)
0
2
9
11
%
of
total
4,4%
4,4%
4,4%
13,3%
(86,0913 ; 98,7696)
1
4
11
16
TOTAL
16
34
63
(22,6997 ; 35,3780) Observed
5
3
8
16 113
PROBABILIDAD
0,14159292
0,300884956
0,557522124
1
[10,0214 ; 22,6997)
5
5
Chi-square
Contingency Table Test
for Independence

Expected

2,27

4,81

8,92

16,00

% of total

4,4%

2,7%

7,1%

14,2%

( 35,3780 ; 48,0563)Observed

11

20

Expected

2,83

6,02

11,15

20,00

%Observados
of total
( 48,0563 ; 60,7347)Observed
Grupos X4
[10,0214 ; 22,6997)
Expected
(22,6997 ; 35,3780)
% of total
( 35,3780
; 48,0563)
; 60,7347)
(60,7347 ; 73,4130)( 48,0563
Observed
(60,7347
; 73,4130)
Expected
(73,4130 ; 86,0913)
% of total
(86,0913 ; 98,7696)
(73,4130 ; 86,0913) Observed
TOTAL

2,7%

9,7%NIVEL DE PRECIPITACION
5,3%
17,7%

2X3<0(Bajo)

70X1(Medio)12 X>1(Alto) 21 Total


2,123893805
2,97
6,32 4,513274336
11,71 8,362831858
21,00 15
2,265486726

4,814159292

8,920353982

1,8%2,831858407
6,2% 6,017699115
10,6% 11,15044248
18,6%
2,973451327
0
2 6,318584071 12 11,7079646 14
1,9823008854,21 4,212389381
1,98
7,81 7,805309735
14,00
1,557522124

3,309734513

6,132743363

0,0%2,265486726
1,8% 4,814159292
10,6% 8,920353982
12,4%
0
2
9
11
16
34
63

Expected

1,56

3,31

6,13

11,00

% of total

0,0%

1,8%

8,0%

9,7%

(86,0913 ; 98,7696) Observed

11

16

Expected

2,27

4,81

8,92

16,00

%Observados
of total
Total

Grupos X4
Observed

0,9%

16
20
21
14
11
16
113

3,5%NIVEL DE PRECIPITACION
9,7%
14,2%

16X3<0(Bajo)

340X1(Medio)63
[10,0214
; 22,6997)
3,894727139
Expected
16,00
34,00 0,052490023
63,00
(22,6997 ; 35,3780)
3,300642976
0,683644586
% of total
14,2%0,009983407
30,1% 4,125052056
55,8%
( 35,3780
; 48,0563)
( 48,0563 ; 60,7347)
0,318689423
0,073486032
(60,7347 ; 73,4130)
1,982300885
26,44
chi-square 1,161969212
(73,4130 ; 86,0913)
1,557522124
0,518290663
12
df
(86,0913 ; 98,7696)
0,706892976
0,137688704
,0093
p-value
Total Pearson Chi-Square
11,77075893
6,752621276

X>1(Alto) 113 Total


1,352249848
113,005,29946701
0,094957157 4,07924472
100,0%6,51404937
2,379013906
0,00728433 0,39945978
2,254289326 5,39855942
1,340535571 3,41634836
0,484838109 1,32941979
7,913168247 26,4365485

Anlisis:
Con los cuatro mtodos anteriormente descritos pudimos encontrar que p=0,0093, por lo tanto p<0,05
.-> Se Rechaza la Ho
Conclusiones:
Con un nivel de Confianza de 95%(=0,05), se concluye que Si existe relacin entre Las emisiones de CO2 derivadas del consumo de
combustible lquidos (% del Total) "Y1" y el Crecimiento de la Poblacin "X3".

As tenemos que las pruebas solicitadas no se pueden hacer debido a


que no cumplen los requisitos para el cumplimiento de los parmetros para el
clculo del anlisis de varianza, ya que no cumple los criterios de normalidad
y de independencia.

73

Conclusin:

La

aplicacin de los distintos modelos realizados, nos permitieron

adquirir valiosas herramientas, las cuales formaran la base para el devenir en


la pronosticacin de futuros modelos en distintos mbitos incluyendo en el
empresarial como nivel relevante.
De igual manera este proceso involucr una respectiva investigacin
en relacin a los diversos preceptos y condiciones, los cuales por uso
meramente metafrico fungieron cuales llaves, aperturando las posibilidades
de entender lo que aconteca en cada etapa, y el como la influencia de
ciertos valores actuaban para la aceptacin de un modelo.
Al igual poder determinar si las condiciones de ciertas variables
guardan relacin o no guardan relacin, como pudimos apreciar bajo las
verificaciones por los mtodos realizados.
Obteniendo de esta manera una mayor comprensin a nivel
estadstico de los distintos comportamientos y as poder tener distintos
indicativos que nos permitirn establecer una mejor prediccin en relacin a
lo que deseemos evaluar.

74

Das könnte Ihnen auch gefallen