Sie sind auf Seite 1von 19

REGRESION LINEAL SIMPLE, MULTIPLE Y

CORRELACION

17/06/2014

M. Carme Ruiz de Villa, lex Snchez

Departamento Estadstica, Facultad de Biologa

REGRESION LINEAL SIMPLE

17/06/2014

M. Carme Ruiz de Villa, lex Snchez

Departamento Estadstica, Facultad de Biologa

Introduccin
La regresin y los anlisis de correlacin nos muestran como
determinar tanto la naturaleza como la fuerza de una relacin
entre dos variables
En el anlisis de regresin desarrollaremos una ecuacin de
estimacin, esto es, una formula matemtica que relaciona las
variables conocidas con la variable desconocida. Tambin
podemos aplicar el anlisis de correlacin para determinar el
grado de en el que estn relacionadas las variables. Por lo
tanto, nos dice que tan bien la ecuacin obtenidarealmente
describe la relacin.

Anlisis de Modelos Estadsticos y su aplicacin a Estudios Experimentales y Observacionales

17/06/2014

M. Carme Ruiz de Villa, lex Snchez

Departamento Estadstica, Facultad de Biologa

Modelo

En el estudio de la relacin funcional entre dos


variables poblacionales, una variable X, llamada
independiente, explicativa o de prediccin y una
variable Y, llamada dependiente o variable
respuesta, presenta la siguiente notacin:
yY=aa +bbXx+

Donde:

17/06/2014

a es el valor de la ordenada donde la lnea de regresin


se intercepta con el eje Y.
b es el coeficiente de regresin poblacional (pendiente
de la lnea recta)
es el error
M. Carme Ruiz de Villa, lex Snchez

Departamento Estadstica, Facultad de Biologa

Suposiciones

Los valores de la variable independiente X son fijos,


medidos sin error.
La variable Y es aleatoria
Para cada valor de X, existe una distribucin normal de
valores de Y (subpoblaciones Y)
Las variancias de las subpoblaciones Y son todas iguales.
Todas las medias de las subpoblaciones de Y estn sobre la
recta.
Los valores de Y estn normalmente distribuidos y son
estadsticamente independientes

17/06/2014

M. Carme Ruiz de Villa, lex Snchez

Departamento Estadstica, Facultad de Biologa

Estimacin
Consiste en determinar los valores de a y b a partir de la muestra,
es decir, encontrar los valores de a y b con los datos observados de
la muestra. El mtodo de estimacin es el de Mnimos Cuadrados,
mediante el cual se obtiene:

y a bx
( y y )( x x )

cov
n

Donde sx se calcula
con denominador n
17/06/2014

M. Carme Ruiz de Villa, lex Snchez

a a y bx
Cov

b b
s2
x
Departamento Estadstica, Facultad de Biologa

Coeficiente de correlacin
Mide la intensidad de la asociacin lineal entre dos variables aleatorias

xy / x y
covarianza poblacional

coeficiente de
determinacin:
proporcin de
varianza de la
Y explicada
por la X

17/06/2014

Estimacin del coeficiente de correlacin

Cov
s s
x y

M. Carme Ruiz de Villa, lex Snchez

Departamento Estadstica, Facultad de Biologa

Ejemplos correlacin
10 = 0.134
20 X + 2.122
30
Y

40

50

60

70

80

90

Y =4 X

8X

10

12

14

16

4
6
8

6
8

10

-1 r 0

12

10

r=-1

12

14

14

16

16

0 r +1

14
12

14

r=+1

12
10

10

Y=X

16

Y = 0.134 X + 2.122

16

0
0

10

20

30

40

50

60

70

80

90

17/06/2014

10

12

14

16

M. Carme Ruiz de Villa, lex Snchez

Departamento Estadstica, Facultad de Biologa

Ausencia correlacin
Y = 0.093 X + 4.335

16

Y=4

14
7

12
6
5

10

160

20

#DIV/0!

25

30

35

40

45

50

55

20

60

25

30

35

45

50

55

60

14

40

12

10

r=0

8
6
4
2
0
0

17/06/2014

M. Carme Ruiz de Villa, lex Snchez

Departamento Estadstica, Facultad de Biologa

Precauciones en la interpretacin de r
r significativo NO implica relacin de causalidad entre las variables
t

x
y

r = 0 NO implica ausencia de asociacin entre las variables

17/06/2014

M. Carme Ruiz de Villa, lex Snchez

Departamento Estadstica, Facultad de Biologa

10

Descomposicin de la variabilidad y tabla ANOVA

yi Y yi y i y i Y
n

i 1

i 1

i 1

Variabilidad no
Explicada
(error)=SSE

Variabilidad
total= SST

Variabilidad
Explicada=SSReg

Fuentes
Variacin
Regresin

Sumas
Cuadrados
SCReg.

g.l
1

Cuadrados
Medios
SCReg/ g.l (I)

Error

SCE

n-2

SCE/ g.l (II)

Total

SCT

n1

17/06/2014

M. Carme Ruiz de Villa, lex Snchez

F
Fo=I/II

Departamento Estadstica, Facultad de Biologa

11

Ejemplo
Los datos de la siguiente tabla representan las
estaturas (X, cm) y los pesos (Y, kg) de una muestra
de 12 hombres adultos. Para cada estatura fijada
previamente se observ el peso de una persona
seleccionada de entre el grupo con dicha estatura,
resultando:

17/06/2014

152

155

152

155

157

152

157

165

162

178

183

178

50

61.5

54.5

57.5

63.5

59

61

72

66

72

84

82

M. Carme Ruiz de Villa, lex Snchez

Departamento Estadstica, Facultad de Biologa

12

Anlisis con Rcmdr


Statistics

Genera un modelo
con un nombre
por defecto
RegModel.1

Fit models
Linear Model
Name Y
Name X

Models
Fit models
Hypothesis tests
Anova table: Genera la tabla ANOVA
Graphics: grficos de diagnstico
17/06/2014

M. Carme Ruiz de Villa, lex Snchez

Departamento Estadstica, Facultad de Biologa

13

Resultados
RegModel.1 <- lm(Y~X, data=EjRegresion)
> summary(RegModel.1)
Call:
lm(formula = Y ~ X, data = EjRegresion)
Residuals:
Min 1Q Median 3Q Max
-6.987 -1.632 0.785 2.611 4.292
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -75.4427 16.4950 -4.574 0.00102 **
X
0.8676 0.1015 8.548 6.56e-06 ***
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3.81 on 10 degrees of freedom
Multiple R-squared: 0.8796,
Adjusted R-squared: 0.8676
F-statistic: 73.08 on 1 and 10 DF, p-value: 6.557e-06

17/06/2014

M. Carme Ruiz de Villa, lex Snchez

Departamento Estadstica, Facultad de Biologa

14

Resultados tabla ANOVA


> anova(RegModel.1)
Analysis of Variance Table
Response: Y
Df Sum Sq Mean Sq F value Pr(>F)
X
1 1061.0 1061.05 73.076 6.557e-06 ***
Residuals 10 145.2 14.52
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

17/06/2014

M. Carme Ruiz de Villa, lex Snchez

Departamento Estadstica, Facultad de Biologa

15

Resultados: grficos de diagnstico


lm(Y ~ X)
Residuals vs Fitted

Normal Q-Q

10

60

65

70

75

0.0

1.0

-1.0
-2.0

Standardized residuals

0
-8 -6 -4 -2

Residuals

80

1
10

-1.5

Fitted values

1.5

1.0

1.5

Residuals vs Leverage
10

1
0
-1

0.5

1.0

0.5
12

0.5
1

-2

Standardized residuals

Cook's distance 10

0.0

Standardized residuals

0.5

Theoretical Quantiles

Scale-Location

60

65

70

75

80

Fitted values

17/06/2014

-0.5 0.0

M. Carme Ruiz de Villa, lex Snchez

0.0

0.1

0.2

0.3

0.4

Leverage

Departamento Estadstica, Facultad de Biologa

16

REGRESION LINEAL MULTIPLE

17/06/2014

M. Carme Ruiz de Villa, lex Snchez

Departamento Estadstica, Facultad de Biologa

17

Modelo
yi = b0 + b1x1i + b2x2i + . . . bkxki + i
b0 es el intercepto
b1 a bk son k parmetros de pendiente
es el trmino de error o residual

17/06/2014

M. Carme Ruiz de Villa, lex Snchez

Departamento Estadstica, Facultad de Biologa

18

Bondad de ajuste

2
R

Para saber qu tan bueno es el ajuste entre la


regresin y los datos de la muestra:
Podemos calcular la proporcin de la Suma de
cuadrados totales (SST) que es explicada por el
modelo.
Esto es la llamada R-cuadrada de una regresin:
R2 = SSReg/SST = 1 SSE/SST

17/06/2014

M. Carme Ruiz de Villa, lex Snchez

Departamento Estadstica, Facultad de Biologa

19

Das könnte Ihnen auch gefallen