Sie sind auf Seite 1von 11

Captulo 5

Anlisis de regresin
INTRODUCCIN
OBJETIVO DE LA REGRESIN
Determinar una funcin matemtica sencilla
que describa el comportamiento de una variable
dados los valores de otra u otras variables.
DIAGRAMA DE DISPERSIN

Figura1

Figura1: Diagrama de dispersin que relaciona la variable longitud (y) con una
variable altura (x) de la concha Patelloida Pygmatea
47

48

Anlisis de regresin

Investigador

Especificacin de la forma funcional de la funcin de regresin

REGRESIN LINEAL SIMPLE


Suponemos un modelo en la forma
yi = 0 + 1xi + i ; i = 1, . . . , n

yi : v.a. que representa la observacin isima de la variable respuesta,


correspondiente al isimo valor xi de la variable predictiva X

i : Error aleatorio no observable asociado a yi .

EJEMPLOS DE MODELOS DE REGRESIN SIMPLE

1) El consumo de gasolina de un vehculo, cuya variacin puede ser explicada


por la velocidad media del mismo. Podemos incluir en el trmino del error
aleatorio el efecto del conductor, del tipo de carretera, las condiciones
ambientales, etc.
2) El presupuesto de una universidad, cuya variacin puede ser predicha por
la variable explicativa nmero de alumnos. En el trmino del error aleatorio
pueden incluirse el efecto del nmero de profesores, del nmero de laboratorios, de la superficie disponible de instalaciones, del nmero de personal
de administracin, etc.

Anlisis de regresin

49

ESTIMACIN POR MNIMOS CUADRADOS

b1 =
b1 =

Cov(x, y)
Sx2

b0 = y b1x
b0 =

RECTA DE REGRESIN ESTIMADA

b0 +
b1 xi
ybi =

b1 (xi x)
ybi = y +

b1 : la variacin que se produce en yb por cada unidad de incremento en x

COEFICIENTE DE CORRELACIN LINEAL


Es una medida de la asociacin lineal de las variables x e y
r=

Cov(x, y)
,
Sx Sy

1 r 1

Si r = 1 relacin lineal negativa perfecta entre x e y

Si r = 1 asociacin lineal positiva perfecta entre x e y

Si r = 0 no existe ninguna relacin lineal entre x e y

50

Anlisis de regresin

ANLISIS DE LA VARIANZA

Si ybi son estimadores de yi

yi y = (yi ybi ) + (b
yi y)
ECUACIN BSICA DEL NLISIS DE LA VARIANZA
X

(yi y) =

(yi ybi ) +

(b
yi y)2

SCT = SCE + SCReg


SCT : Suma de cuadrados total
SCE : Suma de cuadrados residual
SCReg : Suma de cuadrados de la regresin

Fuentes de
Variacin
Regresin
Error
Total

Tabla ANOVA
Sumas de Cuadrados Grados de
libertad
P
SCReg = (b
yi y)2
1
P
SCE = (yi ybi)2
n2
P
SCT = (yi y)2
n1

Cuadrados
medios
MCReg
SCE
M CE =
n2
SCT
n1

F
M CReg
M CE

Anlisis de regresin

51

COEFICIENTE DE DETERMINACIN
Estadstico que representa la proporcin de variacin
explicada por la regresin
Es una medida relativa del grado de asociacin lineal entre x e y

R2 =

SCReg
SCE
=1
; 0 R2 1
SCT
SCT

Si R2 = 0 SCReg = 0 El modelo no explica nada de y a partir de x.

Si R2 = 1 SCReg = SCT Ajuste perfecto: y depende funcionalmente


de x .

Un valor de R2 cercano a 0 Baja capacidad explicativa de la recta.

Un valor de R2 prximo a 1 Alta capacidad explicativa de la recta.


EL CONTRASTE DE REGRESIN

H0 : 1 = 0
H1 : 1 6= 0

Fijado un nivel de significacin , se rechaza H0 si Fexp > F,1,n2

52

Anlisis de regresin

EJEMPLO

La Patelloida Pygmatea es una lapa pegada a las rocas y conchas a lo largo de


las costas protegidas en el rea Indo-Pacfica. Se realiza un experimento para
estudiar la influencia de la altura (x) de la Patelloida Pygmatea en su longitud
(y ) medidas ambas en milmetros. Se tienen los siguientes datos:
x
0.9
1.5
1.6
1.7
1.7
1.8
1.8

y
3.1
3.6
4.3
4.7
5.5
5.7
5.2

x
1.9
1.9
1.9
2.0
2.0
2.0
2.1

y
5.0
5.3
5.7
4.4
5.2
5.3
5.4

x
2.1
2.1
2.1
2.2
2.2
2.2
2.2

y
5.6
5.7
5.8
5.2
5.3
5.6
5.8

x
2.3
2.3
2.3
2.3
2.4
2.4
2.7

y
5.8
6.2
6.3
6.4
6.4
6.3
6.3

SOLUCIN

Figura1

Figura1: Diagrama de dispersin que relaciona la variable longitud (y) con una
variable altura (x) de la concha Patelloida Pygmatea

Anlisis de regresin

53

Recta de regresin estimada


yb = 1.36 + 1.99 x

Coeficiente de correlacin lineal


r = 0.8636
Coeficiente de determinacin
r2 = R2 = 0.74

El 74 % de la variabilidad de y puede atribuirse a una relacin lineal con x


Contraste de regresin

H0 : 1 = 0
H1 : 1 6= 0

A un nivel de significacin del 5 %,


Fexp = 76.42 > F,1,n2 = F0.05;1.26 = 4.23
Ntese adems que el valor p < .
Rechazamos la hiptesis nula de no linealidad del modelo

54

Anlisis de regresin

REGRESIN LINEAL MLTIPLE


La v.a. y se relaciona con k variables explicativas x1 , . . . , xk

y = 0 + 1x1 + 2 x2 + . . . + k xk +

Los parmetros 0 , 1 , . . . , k son estimados por mnimos cuadrados.


Para n observaciones podemos escribir:
y1 = 0 + 1 x11 + 2x12 + . . . + k x1k + 1
..
..
..
..
..
..
.
.
.
.
.
.
yn = 0 + 1xn1 + 2 xn2 + . . . + k xnk + n
En notacin matricial
Y = X +

donde

X=

1 x11 . . . x1k
1 x21 . . . x2k
.
..
..
1 ..
.
.
..
1 xn1 . xnk

1
= ...
n

0
= ...
k

y1
Y = ...
yn

Anlisis de regresin

55

El vector de coeficientes es estimado por mnimos cuadrados por:


B = (X t X)

X tY

La ecuacin ajustada de regresin resultante es:


Yb = XB

ANLISIS DE LA VARIANZA
yi y = (yi ybi ) + (b
yi y)

ECUACIN BSICA DEL NLISIS DE LA VARIANZA


X

(yi y)2 =

(yi ybi )2 +

(b
yi y)2

SCT = SCE + SCReg


SCT : Suma de cuadrados total
SCE : Suma de cuadrados residual
SCReg : Suma de cuadrados de la regresin

Fuentes de
Variacin
Regresin
Error
Total

Tabla ANOVA
Sumas de
Grados de
Cuadrados
Fexp
Cuadrados
libertad
Medios
P
1
SCReg CM Reg
B t X t Y t ( yi )2
k
CMReg =
n
k
CM E
SCE
t
t t
Y Y B X Y
n k 1 CM E =
nk1
P
1
2
Y t Y ( yi )
n1
n

56

Anlisis de regresin

COEFICIENTE DE DETERMINACIN MLTIPLE

R2 =

SCReg
SCE
=1
SCT
SCT

0 R2 1.

Representa la proporcin de variacin de y explicada por la regresin

Si R2 = 0 SCReg = 0 El modelo no explica nada de la variacin


de y a partir de su relacin lineal con x1 , . . . , xk .

Si R2 = 1 SCReg = SCT Toda la variacin de y es explicada por


los trminos presentes en el modelo.

Un valor de R2 cercano a 1 Mayor cantidad de variacin total es explicada por el modelo de regresin.

COEFICIENTE DE DETERMINACIN CORREGIDO

e2i

2
nk1
R =1 X
(yi y)2

n1

ei = yi ybi

Anlisis de regresin

57

EL CONTRASTE DE REGRESIN

H0 : 1 = 2 = . . . = k = 0
H1 : j 6= 0 para algn j = 1, . . . , k

Fijado un nivel de significacin , se rechaza H0 si

Fexp > F,k,nk1

Bibliografa utilizada:
F Canavos, George C. (1988). "Probabilidad y Estadstica. Aplicaciones y Mtodos".
Ed.: Mc Graw Hill.
F Lara Porras A.M. (2002). "Estadstica para Ciencias Biolgicas y Ciencias Ambientales. Problemas y Exmenes Resueltos". Ed.: Proyecto Sur.
F Milton, Susan (2002). "Estadstica para Biologa y Ciencias de la Salud". Ed.: Mc
Graw-Hill.
F Pea, Daniel (2002). Regresin y diseo de experimentos". Ed.:Alianza Editorial.
Temporalizacin: Dos horas

Das könnte Ihnen auch gefallen