Beruflich Dokumente
Kultur Dokumente
AUTOR
COAUTORES:
SALOMN ACOSTA RAL EYZAGUIRRE SEGUNDO JARAMILLO GILBER PIA JAIME PORRAS
FECHA
AGOSTO 2007
LNEA
ESTADSTICA
REA
CIENCIAS
CICLO
2007 - 2
MATRIZ DE CORRELACIONES El primer paso que daremos consiste en analizar la matriz de correlaciones. Analizando dicha matriz se podr determinar cul de las variables independientes esta ms correlacionada con la variable dependiente. La secuencia de pasos es: Analizar, Correlaciones, Bivariadas:
Ventas (mills $)
Nro distribuidoras
Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N
**. La correlacin es significativa al nivel 0,01 (bilateral). *. La correlacin es significante al nivel 0,05 (bilateral).
Se observa que la variable ventas est ms correlacionada con la variable Nmero de distribuidoras (correlacin 0.739) por lo que un primer paso ser realizar un anlisis de regresin lineal simple con esta variable independiente. REGRESION LINEAL SIMPLE ENTRE LA VARIABLE INDEPENDIENTE MS CORRELACIONADA CON Y La secuencia es: Analizar, Regresin, Lineal, se mostrar el siguiente cuadro de dilogo:
Por el momento slo se proceder a obtener la ecuacin del modelo as como algunos valores representativos para la validacin de dicho modelo. Un anlisis ms riguroso del modelo y su validacin se har para el caso de regresin lineal mltiple.
Resultados obtenidos:
Resumen del modelo Modelo 1 R .739a R cuadrado .546 R cuadrado corregida .496 Error tp. de la estimacin 9.7718
El coeficiente de determinacin, denotado por R2 (0.546) implica que el 54.6% de variacin en las ventas pueden ser explicadas por el modelo de regresin.
ANOVAb Modelo 1 Suma de cuadrados 1033.836 859.393 1893.229 gl 1 9 10 Media cuadrtica 1033.836 95.488 F 10.827 Sig. .009a
La tabla de Anlisis de Varianza permite realizar la prueba de significacin global del modelo, se propone las siguientes hiptesis: H o : 0 = 1 = 0 En forma conjunta las variables no contribuyen al modelo H1 : i 0 Al menos una variable es significativa para el modelo
Analizando el P-Valor (0.009), el cual es inferior al 5% (nivel de significacin propuesto usualmente para la prueba), se decide que se debe rechazar la hiptesis nula con lo cual concluimos que la variable Nmero de distribuidoras s contribuye al modelo.
Coeficientesa Coeficientes no estandarizados B Error tp. 10.881 6.409 .012 .004 Coeficientes estandarizad os Beta .739
Modelo 1
t 1.698 3.290
El modelo estimado para el presente caso ser: Ventas = 10.881 + 0.012( Nro de distribuidoras) Adems de la prueba de verificacin global se puede realizar la prueba de verificacin individual de cada variable independiente. H o : i = 0 La variable no es significativa para el modelo H 1 : i 0 La variable es significativa para el modelo Para el caso desarrollado (regresin lineal simple), esta prueba es anloga a la prueba de verificacin global.
Una forma grfica de verificar la relacin lineal entre Y con X es realizar un grfico de dispersin, el cul muestra la posible tendencia y/o relacin posible entre variable dependiente e independiente. La secuencia para obtener dicho grfico es la siguiente:
Ventas (mills $)
35.0 33.1 30.0 26.0 25.2 20.2 16.0 3.5 125 480 650 1233 1694 1699 1840 2011 2214 2302 2850
Nro distribuidoras
REGRESIN CURVILINEAL
Analizaremos los diferentes modelos curvilneos que puedan formarse para determinar cul de ellos es el mejor. Los datos se muestran en la siguiente grfica: La secuencia para realizar una regresin curvilnea es la siguiente: Analizar, Regresin, Estimacin Curvilnea
Como se muestra, tenemos la posibilidad de elegir entre varios modelos. Para desarrollar nuestro ejemplo hallaremos los coeficientes estimados y la tabla de anlisis de varianza de los modelos: Lineal, Logartmico, Cuadrtico, Cbico y Exponencial. Los resultados que obtenemos son los siguientes:
LINEAL
Resumen del modelo R cuadrado corregida .920 Error tpico de la estimacin 9.017
R .966
R cuadrado .933
La variable independiente esMillas. ANOVA Suma de cuadrados Regresin Residual Total 5675.152 406.557 6081.709 Media cuadrtica 5675.152 81.311
gl 1 5
F 69.795
Sig. .000
Millas (Constante)
LOGARTMICO
Resumen del modelo R cuadrado corregida Error tpico de la estimacin 8.071
R .973
R cuadrado
gl 1 5
F 88.368
Sig. .000
Coeficientes no estandarizados B ln(Millas) (Constante) -22.189 106.754 Error tpico 2.360 5.818
CUADRTICO
Resumen del modelo R cuadrado corregida Error tpico de la estimacin 4.584
R .993
R cuadrado
gl 2 4
F 142.721
Sig. .000
6 La variable independiente esMillas. Coeficientes Coeficientes estandarizados Beta -1.858 .922 t -7.900 3.918 29.998 Sig. .001 .017 .000
Coeficientes no estandarizados B Millas Millas ** 2 (Constante) -3.924 .048 99.897 Error tpico .497 .012 3.330
CBICO
Resumen del modelo R cuadrado corregida Error tpico de la estimacin 3.559
R .997
R cuadrado
gl 3 3
F 159.047
Sig. .001
Coeficientes no estandarizados B Millas Millas ** 2 Millas ** 3 (Constante) -5.626 .160 -.002 103.925 Error tpico .972 .059 .001 3.339
Coeficientes estandarizados Beta -2.664 3.055 -1.371 t -5.786 2.695 -1.907 31.124 Sig. .010 .074 .153 .000
EXPONENCIAL
Resumen del modelo R cuadrado corregida .974 Error tpico de la estimacin .104
R .989
R cuadrado .979
La variable independiente esMillas. ANOVA Suma de cuadrados Regresin Residual Total 2.496 .054 2.550 Media cuadrtica 2.496 .011
gl 1 5
F 229.924
Sig. .000
Millas (Constante)
Porcentaje
Observada Lineal Logartmico Cuadrtico Cbico Exponencial
100,00
80,00
60,00
40,00
20,00
Millas
Ventas (mills)
Activos (mills)
Inversion de accionistas
Utilidades %
Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N
*. La correlacin es significante al nivel 0,05 (bilateral). **. La correlacin es significativa al nivel 0,01 (bilateral).
Como se observa, existe una baja correlacin entre la variable dependiente y las posibles predictoras. Adems, existe una alta correlacin entre las variables independientes. MULTICOLINEALIDAD: El problema de multicolinealidad se presenta cuando existe una alta correlacin entre variables independientes, como es el caso: correlacin entre Ventas y Activos (0.994); correlacin entre Ventas e Inversin (0.978). Adems se comprueba la multicolinealidad siguiendo el criterio propuesto en clase: Menor correlacin entre Y y las Xs 0.316 Existe correlaciones entre Xs mayor que 0.316 An en la presencia detectada de multicolinealidad estimaremos el modelo para determinar lo adecuado que puede ser su uso para la prediccin: Seguimos la siguiente secuencia: Analizar, Regresin, Lineal En el cuadro mostrado se selecciona la variable dependiente y las independientes segn se indica:
10
a. Variables predictoras: (Constante), Utilidades %, Inversion de accionistas, Ventas (mills), Activos (mills)
El porcentaje de variacin que es explicado por la ecuacin de regresin es bajo, slo 36%.
ANOVAb Modelo 1 Suma de cuadrados 102.660 182.812 285.472 gl 4 25 29 Media cuadrtica 25.665 7.312 F 3.510 Sig. .021a
a. Variables predictoras: (Constante), Utilidades %, Inversion de accionistas, Ventas (mills), Activos (mills) b. Variable dependiente: Ganancias por accin
En forma conjunta las variables son significativas para el modelo, considerando un nivel de significacin del 5% (P-Valor = 0.021). Las hiptesis que se proponen son las siguientes: H o : 0 = 1 = ... = 4 = 0 En forma conjunta las variables no contribuyen al modelo H1 : i 0 Al menos una variable es significativa para el modelo
El siguiente cuadro permite analizar la contribucin individual de cada variable regresora al modelo propuesto:
11
Coeficientesa Coeficientes no estandarizados B Error tp. -.039 1.313 .000 .001 .000 .001 .001 .001 .186 .065 Coeficientes estandarizad os Beta .457 -1.444 1.364 .470
Modelo 1
En forma individual, slo la variable Utilidades es significativa para el modelo pues su P-Valor (0.008) es menor al nivel de significacin usual (5%), sin embargo las otras variable no contribuyen de manera individual al modelo. H o : i = 0 La variable i no es significativa para el modelo H 1 : i 0 La variable es significativa para el modelo
MTODO DE SELECCIN DE VARIABLES: HACIA ADELANTE Se ha determinado hasta el momento que el modelo presenta deficiencias puesto que el porcentaje de variacin explicado es bajo, se ha detectado la presencia de multicolinealidad y de manera individual existe variables que no contribuyen al modelo. El siguiente paso consiste en retirar las variables que presentan multicolinealidad y analizar el nuevo modelo resultante. Lo propuesto se puede realizar en la opcin: Mtodo. Al seleccionar Introducir, el programa ir ingresando variables al modelo y a la vez verificar su contribucin.
12
Resumen del modelo Modelo 1 2 R R cuadrado .451a .204 .589b .347 R cuadrado corregida .175 .298 Error tp. de la estimacin 2.84917 2.62787
a. Variables predictoras: (Constante), Utilidades % b. Variables predictoras: (Constante), Utilidades %, Inversion de accionistas
ANOVAc Modelo 1 Suma de cuadrados 58.175 227.297 285.472 99.018 186.454 285.472 gl 1 28 29 2 27 29 Media cuadrtica 58.175 8.118 49.509 6.906 F 7.166 Sig. .012a
7.169
.003b
a. Variables predictoras: (Constante), Utilidades % b. Variables predictoras: (Constante), Utilidades %, Inversion de accionistas c. Variable dependiente: Ganancias por accin
Coeficientes a Coeficientes no estandarizados B Error tp. .493 1.243 .179 .067 -.054 1.168 .186 .062 .000 .000 Coeficientes estandarizad os Beta .451 .471 .379
Modelo 1 2
Variables excluidas c Estadsticos de colinealidad Tolerancia .993 .996 .997 .041 .017
Modelo 1
Ventas (mills) Activos (mills) Inversion de accionistas Ventas (mills) Activos (mills)
a. Variables predictoras en el modelo: (Constante), Utilidades % b. Variables predictoras en el modelo: (Constante), Utilidades %, Inversion de accionistas c. Variable dependiente: Ganancias por accin
MODELO FINAL: Luego, el programa nos entrega el mejor modelo. En este caso las variables de prediccin seleccionadas son Ventas y Activos. A continuacin se muestra el resumen para este modelo:
13
Resumen del modelo Modelo 1 R .589a R cuadrado .347 R cuadrado corregida .298 Error tp. de la estimacin 2.62787
a. Variables predictoras: (Constante), Utilidades %, Inversion de accionistas b. Variable dependiente: Ganancias por accin
Coeficientes a Coeficientes no estandarizados B Error tp. -.054 1.168 .000 .000 .186 .062 Coeficientes estandarizad os Beta .379 .471
Modelo 1
SUPUESTO DE NORMALIDAD: Otro supuesto del modelo es la normalidad que presentan los errores. Para verificar este supuesto podemos realizar el grfico de probabilidad normal. Lo primero que se debe hacer es seleccionar la opcin guardar y en el cuadro de dilogo que se muestra marcar las pociones: Residuos: No tipificados y Valores Pronosticados: No tipificados. Los valores de los residuos se generaran automticamente y se guardaran en dos columnas adicionales en nuestra base de datos.
14
El siguiente paso es ingresar a la opcin grficos y marcar la opcin de grfico de probabilidad normal.
Primero generar los valores de residuales
1,0
0,8
0,6
0,4
0,2
15