Sie sind auf Seite 1von 15

TTULO

GUA DE USO DE SPSS

AUTOR

ENIT HUAMN COTRINA

COAUTORES:

SALOMN ACOSTA RAL EYZAGUIRRE SEGUNDO JARAMILLO GILBER PIA JAIME PORRAS

FECHA

AGOSTO 2007

LNEA

ESTADSTICA

REA

CIENCIAS

CICLO

2007 - 2

Gua de la laboratorio SPSS

SESIN 7: REGRESIN LINEAL SIMPLE


A continuacin se muestra la base de datos con la que se explicar los procedimientos involucrados al realizar un anlisis de regresin lineal simple. Los datos corresponden a las ventas totales por ao de cada una de 11 regiones en las que una compaa opera. Dicha compaa se dedica a la venta de repuestos para automviles. Se pretende estimar el valor de las ventas futuras conociendo el nmero de distribuidoras establecidas en cada regin y el nmero de automviles registrados para cada regin.

MATRIZ DE CORRELACIONES El primer paso que daremos consiste en analizar la matriz de correlaciones. Analizando dicha matriz se podr determinar cul de las variables independientes esta ms correlacionada con la variable dependiente. La secuencia de pasos es: Analizar, Correlaciones, Bivariadas:

Gua de la laboratorio SPSS

Obtenemos el siguiente resultado:


Correlaciones Ventas (mills $) 1 Nro Nro Autos distribuidoras (mills) .739** .548 .009 .081 11 11 11 .739** 1 .670* .009 .024 11 11 11 .548 .670* 1 .081 .024 11 11 11

Ventas (mills $)

Nro distribuidoras

Nro Autos (mills)

Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N

**. La correlacin es significativa al nivel 0,01 (bilateral). *. La correlacin es significante al nivel 0,05 (bilateral).

Se observa que la variable ventas est ms correlacionada con la variable Nmero de distribuidoras (correlacin 0.739) por lo que un primer paso ser realizar un anlisis de regresin lineal simple con esta variable independiente. REGRESION LINEAL SIMPLE ENTRE LA VARIABLE INDEPENDIENTE MS CORRELACIONADA CON Y La secuencia es: Analizar, Regresin, Lineal, se mostrar el siguiente cuadro de dilogo:

Por el momento slo se proceder a obtener la ecuacin del modelo as como algunos valores representativos para la validacin de dicho modelo. Un anlisis ms riguroso del modelo y su validacin se har para el caso de regresin lineal mltiple.

Gua de la laboratorio SPSS

Resultados obtenidos:
Resumen del modelo Modelo 1 R .739a R cuadrado .546 R cuadrado corregida .496 Error tp. de la estimacin 9.7718

a. Variables predictoras: (Constante), Nro distribuidoras

El coeficiente de determinacin, denotado por R2 (0.546) implica que el 54.6% de variacin en las ventas pueden ser explicadas por el modelo de regresin.
ANOVAb Modelo 1 Suma de cuadrados 1033.836 859.393 1893.229 gl 1 9 10 Media cuadrtica 1033.836 95.488 F 10.827 Sig. .009a

Regresin Residual Total

a. Variables predictoras: (Constante), Nro distribuidoras b. Variable dependiente: Ventas (mills $)

La tabla de Anlisis de Varianza permite realizar la prueba de significacin global del modelo, se propone las siguientes hiptesis: H o : 0 = 1 = 0 En forma conjunta las variables no contribuyen al modelo H1 : i 0 Al menos una variable es significativa para el modelo

Analizando el P-Valor (0.009), el cual es inferior al 5% (nivel de significacin propuesto usualmente para la prueba), se decide que se debe rechazar la hiptesis nula con lo cual concluimos que la variable Nmero de distribuidoras s contribuye al modelo.
Coeficientesa Coeficientes no estandarizados B Error tp. 10.881 6.409 .012 .004 Coeficientes estandarizad os Beta .739

Modelo 1

(Constante) Nro distribuidoras

t 1.698 3.290

Sig. .124 .009

a. Variable dependiente: Ventas (mills $)

El modelo estimado para el presente caso ser: Ventas = 10.881 + 0.012( Nro de distribuidoras) Adems de la prueba de verificacin global se puede realizar la prueba de verificacin individual de cada variable independiente. H o : i = 0 La variable no es significativa para el modelo H 1 : i 0 La variable es significativa para el modelo Para el caso desarrollado (regresin lineal simple), esta prueba es anloga a la prueba de verificacin global.

Gua de la laboratorio SPSS

Una forma grfica de verificar la relacin lineal entre Y con X es realizar un grfico de dispersin, el cul muestra la posible tendencia y/o relacin posible entre variable dependiente e independiente. La secuencia para obtener dicho grfico es la siguiente:

En el cuadro de dilogo se ingresar la informacin de la siguiente manera:

El resultado que se obtiene es el siguiente:

Gua de la laboratorio SPSS

52.3 46.2 38.2

Ventas (mills $)

35.0 33.1 30.0 26.0 25.2 20.2 16.0 3.5 125 480 650 1233 1694 1699 1840 2011 2214 2302 2850

Nro distribuidoras

REGRESIN CURVILINEAL
Analizaremos los diferentes modelos curvilneos que puedan formarse para determinar cul de ellos es el mejor. Los datos se muestran en la siguiente grfica: La secuencia para realizar una regresin curvilnea es la siguiente: Analizar, Regresin, Estimacin Curvilnea

Como se muestra, tenemos la posibilidad de elegir entre varios modelos. Para desarrollar nuestro ejemplo hallaremos los coeficientes estimados y la tabla de anlisis de varianza de los modelos: Lineal, Logartmico, Cuadrtico, Cbico y Exponencial. Los resultados que obtenemos son los siguientes:

Gua de la laboratorio SPSS

LINEAL
Resumen del modelo R cuadrado corregida .920 Error tpico de la estimacin 9.017

R .966

R cuadrado .933

La variable independiente esMillas. ANOVA Suma de cuadrados Regresin Residual Total 5675.152 406.557 6081.709 Media cuadrtica 5675.152 81.311

gl 1 5

F 69.795

Sig. .000

6 La variable independiente esMillas. Coeficientes

Coeficientes no estandarizados B -2.040 91.660 Error tpico .244 5.080

Coeficientes estandarizados Beta -.966 t -8.354 18.042 Sig. .000 .000

Millas (Constante)

LOGARTMICO
Resumen del modelo R cuadrado corregida Error tpico de la estimacin 8.071

R .973

R cuadrado

.946 .936 La variable independiente esMillas. ANOVA

Suma de cuadrados Regresin Residual Total 5756.025 325.683 6081.709

gl 1 5

Media cuadrtica 5756.025 65.137

F 88.368

Sig. .000

6 La variable independiente esMillas. Coeficientes

Coeficientes no estandarizados B ln(Millas) (Constante) -22.189 106.754 Error tpico 2.360 5.818

Coeficientes estandarizados Beta -.973 t -9.400 18.350 Sig. .000 .000

Gua de la laboratorio SPSS

CUADRTICO
Resumen del modelo R cuadrado corregida Error tpico de la estimacin 4.584

R .993

R cuadrado

.986 .979 La variable independiente esMillas. ANOVA

Regresin Residual Total

Suma de cuadrados 5997.661 84.048 6081.709

gl 2 4

Media cuadrtica 2998.830 21.012

F 142.721

Sig. .000

6 La variable independiente esMillas. Coeficientes Coeficientes estandarizados Beta -1.858 .922 t -7.900 3.918 29.998 Sig. .001 .017 .000

Coeficientes no estandarizados B Millas Millas ** 2 (Constante) -3.924 .048 99.897 Error tpico .497 .012 3.330

CBICO
Resumen del modelo R cuadrado corregida Error tpico de la estimacin 3.559

R .997

R cuadrado

.994 .988 La variable independiente esMillas. ANOVA

Regresin Residual Total

Suma de cuadrados 6043.709 38.000 6081.709

gl 3 3

Media cuadrtica 2014.570 12.667

F 159.047

Sig. .001

6 La variable independiente esMillas. Coeficientes

Coeficientes no estandarizados B Millas Millas ** 2 Millas ** 3 (Constante) -5.626 .160 -.002 103.925 Error tpico .972 .059 .001 3.339

Coeficientes estandarizados Beta -2.664 3.055 -1.371 t -5.786 2.695 -1.907 31.124 Sig. .010 .074 .153 .000

Gua de la laboratorio SPSS

EXPONENCIAL
Resumen del modelo R cuadrado corregida .974 Error tpico de la estimacin .104

R .989

R cuadrado .979

La variable independiente esMillas. ANOVA Suma de cuadrados Regresin Residual Total 2.496 .054 2.550 Media cuadrtica 2.496 .011

gl 1 5

F 229.924

Sig. .000

6 La variable independiente esMillas. Coeficientes

Coeficientes no estandarizados B -.043 99.496 Error tpico .003 5.840

Coeficientes estandarizados Beta -.989 t -15.163 17.036 Sig. .000 .000

Millas (Constante)

La variable dependiente es ln(Porcentaje).

Porcentaje
Observada Lineal Logartmico Cuadrtico Cbico Exponencial

100,00

80,00

60,00

40,00

20,00

0,00 0,00 20,00 40,00

Millas

Gua de la laboratorio SPSS

REGRESIN LINEAL MLTIPLE


Para la explicacin de los procedimientos relacionados con el anlisis de regresin mltiple, se usar el siguiente caso: Un analista realiza una investigacin de las ganancias por accin de grandes corporaciones. Las variables de prediccin que estima le sern tiles son las siguientes: ventas en millones de dlares, utilidades como porcentaje de inversin, activos en millones de dlares e inversin de los accionistas millones de dlares. Como primer paso de anlisis veremos las correlaciones entre las variables involucradas en el anlisis. Analizar, Correlaciones, Bivariadas, se obtiene los siguientes resultados:
Correlaciones Ganancias por accin 1 30 .316 .089 30 .333 .072 30 .355 .054 30 .451* .012 30 Ventas (mills) .316 .089 30 1 Inversion de Activos (mills) accionistas Utilidades % .333 .355 .451* .072 .054 .012 30 30 30 .994** .978** -.085 .000 .000 .653 30 30 30 30 .994** 1 .992** -.062 .000 .000 .744 30 30 30 30 .978** .992** 1 -.051 .000 .000 .790 30 30 30 30 -.085 -.062 -.051 1 .653 .744 .790 30 30 30 30

Ganancias por accin

Ventas (mills)

Activos (mills)

Inversion de accionistas

Utilidades %

Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N Correlacin de Pearson Sig. (bilateral) N

*. La correlacin es significante al nivel 0,05 (bilateral). **. La correlacin es significativa al nivel 0,01 (bilateral).

Como se observa, existe una baja correlacin entre la variable dependiente y las posibles predictoras. Adems, existe una alta correlacin entre las variables independientes. MULTICOLINEALIDAD: El problema de multicolinealidad se presenta cuando existe una alta correlacin entre variables independientes, como es el caso: correlacin entre Ventas y Activos (0.994); correlacin entre Ventas e Inversin (0.978). Adems se comprueba la multicolinealidad siguiendo el criterio propuesto en clase: Menor correlacin entre Y y las Xs 0.316 Existe correlaciones entre Xs mayor que 0.316 An en la presencia detectada de multicolinealidad estimaremos el modelo para determinar lo adecuado que puede ser su uso para la prediccin: Seguimos la siguiente secuencia: Analizar, Regresin, Lineal En el cuadro mostrado se selecciona la variable dependiente y las independientes segn se indica:

10

Gua de la laboratorio SPSS

Ingresar aqu la variable dependiente

Ingresar aqu las variables independientes

Los resultados obtenidos son los siguientes:


Resumen del modelo Modelo 1 R R cuadrado .600a .360 R cuadrado corregida .257 Error tp. de la estimacin 2.70416

a. Variables predictoras: (Constante), Utilidades %, Inversion de accionistas, Ventas (mills), Activos (mills)

El porcentaje de variacin que es explicado por la ecuacin de regresin es bajo, slo 36%.
ANOVAb Modelo 1 Suma de cuadrados 102.660 182.812 285.472 gl 4 25 29 Media cuadrtica 25.665 7.312 F 3.510 Sig. .021a

Regresin Residual Total

a. Variables predictoras: (Constante), Utilidades %, Inversion de accionistas, Ventas (mills), Activos (mills) b. Variable dependiente: Ganancias por accin

En forma conjunta las variables son significativas para el modelo, considerando un nivel de significacin del 5% (P-Valor = 0.021). Las hiptesis que se proponen son las siguientes: H o : 0 = 1 = ... = 4 = 0 En forma conjunta las variables no contribuyen al modelo H1 : i 0 Al menos una variable es significativa para el modelo

El siguiente cuadro permite analizar la contribucin individual de cada variable regresora al modelo propuesto:

11

Gua de la laboratorio SPSS

Coeficientesa Coeficientes no estandarizados B Error tp. -.039 1.313 .000 .001 .000 .001 .001 .001 .186 .065 Coeficientes estandarizad os Beta .457 -1.444 1.364 .470

Modelo 1

(Constante) Ventas (mills) Activos (mills) Inversion de accionistas Utilidades %

t -.029 .275 -.549 .966 2.862

Sig. .977 .786 .588 .343 .008

a. Variable dependiente: Ganancias por accin

En forma individual, slo la variable Utilidades es significativa para el modelo pues su P-Valor (0.008) es menor al nivel de significacin usual (5%), sin embargo las otras variable no contribuyen de manera individual al modelo. H o : i = 0 La variable i no es significativa para el modelo H 1 : i 0 La variable es significativa para el modelo

MTODO DE SELECCIN DE VARIABLES: HACIA ADELANTE Se ha determinado hasta el momento que el modelo presenta deficiencias puesto que el porcentaje de variacin explicado es bajo, se ha detectado la presencia de multicolinealidad y de manera individual existe variables que no contribuyen al modelo. El siguiente paso consiste en retirar las variables que presentan multicolinealidad y analizar el nuevo modelo resultante. Lo propuesto se puede realizar en la opcin: Mtodo. Al seleccionar Introducir, el programa ir ingresando variables al modelo y a la vez verificar su contribucin.

Aqu se debe seleccionar el mtodo par seleccionar variables

Los resultados obtenidos son los siguientes:

12

Gua de la laboratorio SPSS

Resumen del modelo Modelo 1 2 R R cuadrado .451a .204 .589b .347 R cuadrado corregida .175 .298 Error tp. de la estimacin 2.84917 2.62787

a. Variables predictoras: (Constante), Utilidades % b. Variables predictoras: (Constante), Utilidades %, Inversion de accionistas
ANOVAc Modelo 1 Suma de cuadrados 58.175 227.297 285.472 99.018 186.454 285.472 gl 1 28 29 2 27 29 Media cuadrtica 58.175 8.118 49.509 6.906 F 7.166 Sig. .012a

Regresin Residual Total Regresin Residual Total

7.169

.003b

a. Variables predictoras: (Constante), Utilidades % b. Variables predictoras: (Constante), Utilidades %, Inversion de accionistas c. Variable dependiente: Ganancias por accin

Coeficientes a Coeficientes no estandarizados B Error tp. .493 1.243 .179 .067 -.054 1.168 .186 .062 .000 .000 Coeficientes estandarizad os Beta .451 .471 .379

Modelo 1 2

t .397 2.677 -.047 3.022 2.432

(Constante) Utilidades % (Constante) Utilidades % Inversion de accionistas

Sig. .695 .012 .963 .005 .022

a. Variable dependiente: Ganancias por accin

Variables excluidas c Estadsticos de colinealidad Tolerancia .993 .996 .997 .041 .017

Modelo 1

Ventas (mills) Activos (mills) Inversion de accionistas Ventas (mills) Activos (mills)

Beta dentro .357a .362a .379a -.349b -.808b

t 2.259 2.304 2.432 -.449 -.662

Sig. .032 .029 .022 .657 .514

Correlacin parcial .399 .405 .424 -.088 -.129

a. Variables predictoras en el modelo: (Constante), Utilidades % b. Variables predictoras en el modelo: (Constante), Utilidades %, Inversion de accionistas c. Variable dependiente: Ganancias por accin

MODELO FINAL: Luego, el programa nos entrega el mejor modelo. En este caso las variables de prediccin seleccionadas son Ventas y Activos. A continuacin se muestra el resumen para este modelo:

13

Gua de la laboratorio SPSS

Resumen del modelo Modelo 1 R .589a R cuadrado .347 R cuadrado corregida .298 Error tp. de la estimacin 2.62787

a. Variables predictoras: (Constante), Utilidades %, Inversion de accionistas


ANOVAb Modelo 1 Suma de cuadrados 99.018 186.454 285.472 gl 2 27 29 Media cuadrtica 49.509 6.906 F 7.169 Sig. .003a

Regresin Residual Total

a. Variables predictoras: (Constante), Utilidades %, Inversion de accionistas b. Variable dependiente: Ganancias por accin
Coeficientes a Coeficientes no estandarizados B Error tp. -.054 1.168 .000 .000 .186 .062 Coeficientes estandarizad os Beta .379 .471

Modelo 1

(Constante) Inversion de accionistas Utilidades %

t -.047 2.432 3.022

Sig. .963 .022 .005

a. Variable dependiente: Ganancias por accin

SUPUESTO DE NORMALIDAD: Otro supuesto del modelo es la normalidad que presentan los errores. Para verificar este supuesto podemos realizar el grfico de probabilidad normal. Lo primero que se debe hacer es seleccionar la opcin guardar y en el cuadro de dilogo que se muestra marcar las pociones: Residuos: No tipificados y Valores Pronosticados: No tipificados. Los valores de los residuos se generaran automticamente y se guardaran en dos columnas adicionales en nuestra base de datos.

14

Gua de la laboratorio SPSS

El siguiente paso es ingresar a la opcin grficos y marcar la opcin de grfico de probabilidad normal.
Primero generar los valores de residuales

Luego generar el grfico con los residuales ya calculados en el paso anterior

El resultado que se obtiene es el que se muestra:


Grfico P-P normal de regresin Residuo tipificado

Variable dependiente: Ganancias por accin

1,0

Prob acum esperada

0,8

0,6

0,4

0,2

0,0 0,0 0,2 0,4 0,6 0,8 1,0

Prob acum observada

15

Das könnte Ihnen auch gefallen