Sie sind auf Seite 1von 103

Mejorar: Anlisis de Regresin

Contenido
I. ANLISIS DE REGRESIN

II. REGRESIN LINEAL SIMPLE

III. REGRESIN LINEAL MLTIPLE

IV. REGRESIN POLINOMIAL

V. MTODO DE SELECCIN DE VARIABLES

EJEMPLOS

EJERCICIOS

2
I. Anlisis de Regresin
Tcnica usada para relacionar a travs de un modelo, una o ms variables
independientes con una variable dependiente (respuesta).
Usos de la Regresin:
1. Descripcin. Representar el comportamiento de un proceso.

2. Prediccin y estimacin. Prediccin es en base a un valor x


desconocido. Estimacin es en base a un valor conocido de x.

3. Control. Para obtener cierta respuesta deseada del proceso.

3
II. Regresin Lineal Simple

y 0 1x

y = variable dependiente a modelar (respuesta).


x = variable independiente (predictor de y).
= componente de error (medicin + natural). Variable aleatoria.
0 = interseccin. Si lo datos incluyen el cero representa la media de la
distribucin de y cuando x = 0. No tiene sentido si los datos no incluyen
el cero.
1 = pendiente. Es el cambio en la media de y por cada cambio unitario
de x.
4
1. Estimacin de los parmetros del modelo
Por medio del mtodo de mnimos cuadrados, que consiste en minimizar el
error de modelo, se obtienen:

Sxy
1
Sxx
( x)( y)
Sxy xy
n
y x
0 1
( x)2
Sxx x 2
n
y
x
0 1

5
Ejemplo
En el caso de la Dureza vs. la Temperatura de templado (*):
Dureza (y) = 75,27 0,2684x.
Grfica de lnea ajustada
Dureza (y) = 75,27 - 0,2684 Temp (x)
50 S 1,48229
R-cuad. 85,5%
48 R-cuad.(ajustado) 84,4%

46
Dureza (y)
44

42

40

38

36
100 110 120 130 140
Temp (x)

(*) Es importante realizar todas las pruebas estadsticas al modelo resultante.


6
7
( x)( y) 1.818 641
Sxy xy 77.062 627,2
n 15
( x)2 1.8182
Sxx x 2 222.678 2.336,4
n 15
Sxy 627,2
1 0,2684
Sxx 2.336,4
y
x 641 (0,2684) 1.818 75,27
0 1
15 15

y x
0 1

Dureza = 75,27 - 0,2684 temperatura de templado

Por cada unidad de aumento en la temperatura de templado, la dureza disminuir en 0,2684


unidades. Como el rango de los datos no incluye x = 0, el valor de 75,27 no tiene un significado
en particular.
8
Ejercicio
Construir el modelo de regresin para el Avance vs. el Acabado e
interpretar los coeficientes del mismo.

9
10
2. Prueba del significado de la regresin

Ho: 1 = 0 No existe relacin lineal entre x e y. La regresin NO


tiene sentido.

Ha: 1 0 x es valiosa para explicar la variacin de y.

y y

11
Elementos necesarios para obtener un estadstico de prueba:

12
Considerando todos los puntos:
i
(y y)2
i
(y y)2
i i
(y y )2

SCT = Syy = SCR + SCE


SCT = Syy = Variacin total de los datos
SCR = Variacin representada por el modelo de regresin
SCE = Variacin residual no representada por la regresin

( y i )2 Sxy
SCR
SCT Syy y i
2 1

n SCE SCT SCR

13
TABLA ANOVA

Se rechaza Ho si F > F (tablas) = F;1;n-2

14
Resultado grfico de la prueba:

1 = 0. La regresin NO tiene sentido.

15
1 0. La regresin S tiene sentido.

16
Ejemplo
Para el caso de la Dureza vs. la Temperatura de precalentamiento.

17
( y i )2 (641)2
SCT Syy y i
2
27.589 196,933
n 15
Sxy 0 ,2684 (627,2) 168,370
SCR 1

SCE Syy SCR 196,93 168,37 28,563

F;gl (R); gl (E)= F0,05;1;13 = 4,67.


Como 76,63 > 4,67, la regresin S tiene sentido.
18
Ejercicio
Realizar la prueba de significacin de la regresin para el Avance vs. el
Acabado.

19
3. Pruebas a los parmetros de la regresin 1 y 0
Otras formas de probar la significacin de los parmetros del modelo son:
a) Pruebas t
Ho: 1 = 0 Ha: 1 0


0,2684
EP : t 1
1
8,75

se(1 ) MSE 2,197
Sxx 2.336,4

t/2;n-2= t0,025;13 = 2,16


Se rechaza Ho si, t t /2;n-2
En este caso el modelo S es significativo (merece la pena hacer la
regresin).
20
Ho: 0 = 0 Ha: 0 0



Ep : t 0
0

se( 0 ) 1 (x )2
MSE
n Sxx
75,27
20,14
1 (121,2) 2
2,197
15 2.336,4

t/2;n-2= t0,025;13 = 2,16


Se rechaza Ho si, t t /2;n-2
En este caso el trmino de la interseccin S debe formar parte del
modelo.
21
Regresin a travs del origen
Si no se rechaza que la interseccin es cero, indica que el ajuste puede
mejorarse usando el modelo sin dicho trmino (regresin "a travs del
origen").
Se debe comparar MCE de ambos modelos para ver cul es menor, y
considerar adems si es factible que el modelo pase por el punto (0,0).
Los residuos representan al trmino del error en el modelo ():

y 1x

xy x
y
x
1 2 1

MCE
2 1 xy
y 2
t
IC(1 )
MCE

1 / 2 ;n1 2
n1 x

22
b) Intervalos de confianza
MCE
1 (t / 2;n2 )se(1 ) 1 (t / 2;n2 )
Sxx
2,197
0 ,2684 2,16 0 ,3347; 0 ,2022
2.336,4

(t 1 ( x )2

0 / 2 ;n2 )se( 0 ) 0 (t / 2 ;n2 ) MCE
n Sxx


1 (121,2)2
75,27 2,16 2,197
15 2.336,4

67,20; 83,34
Los resultados coinciden con las pruebas t (el valor cero NO est en
ninguno de los intervalos).
23
Ejercicio
Realizar la prueba de significancia de la regresin usando la prueba t, y los
intervalos de confianza, para el caso del Avance vs. el Acabado.

24
Prediccin de nuevas observaciones
En el caso de querer "predecir" el resultado de una nueva observacin
(diferente valor de x dentro del rango o un valor de los datos originales)
se tienen dos intervalos de confianza: uno es para observaciones
individuales y el otro es para la prediccin promedio.
x 0 y 0

Intervalo de prediccin (IP)


1 (x 0 x )2
y 0 t / 2;n2 MCE(1 )
n Sxx

Intervalo de confianza de la prediccin (IC)


1 (x 0 x )2
y 0 t / 2;n2 MCE( )
n Sxx
25
Ejemplo
Se tiene la siguiente informacin sobre la dureza de
ejes en funcin del tratamiento trmico (temperatura
de templado).

26
27
Se desea saber el valor de dureza a una temperatura de 112 grados:
y 0 75,27 0,2684 112 45,2030
x 0 112 y 0 45,2030 t /2;n-2 t 0 ,025;13 2,16

Intervalo de prediccin individual:


1 (112 121,2)2
45,2030 2,16 2,197(1 )
15 2.336,4
41,8400; 48,5660

Ejercicio
Obtener la prediccin individual en el caso del Acabado (1,8) vs. el Avance.

28
4. Coeficiente de determinacin
SCR 168,370
R r
2 2
0R 1
2
R
2
0 ,855
SCT 196,933

Es la proporcin de la variacin explicada (representada por el modelo de


regresin.
Para el caso del tratamiento trmico: el 85,50% de la variacin en la dureza
es explicada por la temperatura.
Ejercicio
Obtener el coeficiente de determinacin en el caso del Acabado vs. el
Avance.

29
Coeficiente de correlacin
Sxy n xy - x y
r R2
Syy Sxx n x 2

( x)2 n y 2 ( y)2
-1 r 1
Representa una medida del grado de asociacin lineal entre "x" e "y". Para
el caso del tratamiento trmico:
627,2
r 0 ,925
(196,933) (2.336,4)

Ejercicio
Obtener el coeficiente de correlacin en el caso del Acabado vs. el Avance.

30
Pruebas sobre el significado de r
a) Muestras pequeas (n < 50)
Ho: = 0 Ha: 0
r n2 Se rechaza Ho si, t t /2;n-2
EP : t
1 r2

b) Muestras grandes (n 50)


EP : z r n 1 Se rechaza Ho si, z z /2

31
En el caso del tratamiento trmico:
Ho: = 0 Ha: 0
r n2 0,925 15 2
EP : t 8,75
1r 2
1 (0,925)2

t/2;n-2 t0 ,025;13 2,16

Por tanto, la correlacin es estadsticamente significativa.


Nota:
Un valor relativamente bajo de r puede ser estadsticamente significativo sin que esto
implique que dicha relacin sea til desde el punto de vista prctico.
Una correlacin til deber ser de por lo menos 0,8 0,9 (Wheeler, 1995).

32
Suposiciones del modelo
El modelo a considerar incluye el trmino del error, y se supone que dichos
errores siguen una distribucin normal con varianza constante y que son
independientes entre s.
El incumplimiento de las suposiciones pueden generar un modelo inestable
desde el punto de vista de que diferentes muestras pueden producir
modelos diferentes con conclusiones opuestas.
Los residuos representan al trmino del error en el modelo ():
ei
Regular ei y i y i Estandarizado di
MCE
ei
Eliminado estudentizado ri
1 (x i x )2
MCE 1 (
n Sxx

33
5. Prueba de normalidad
1. Obtener los residuos.
2. Elaborar la siguiente tabla:
i F = 100 (i - 0,5)/N Residuos ordenados
1
2

N

(N = nmero de residuos)

3. Graficar en papel probabilstico normal.


4. Si los residuos siguen una trayectoria aproximadamente lineal, se
acepta su normalidad.
34
Ejemplo
Datos del tratamiento trmico:

y 75,27 0,2684x

35
Ejemplo
Datos del tratamiento trmico:

36
La normalidad NO se rechaza
37
Ejemplo de no-normalidad

38
Ejercicio
Obtener los residuos en el caso del Acabado vs. el Avance y probar su
normalidad.

39
40
6. Prueba de varianza constante
1. Graficar residuos vs. y.
2. Se acepta que la varianza es constante si la dispersin de los puntos es
aproximadamente la misma.

Para el
tratamiento
trmico se
considera la
varianza
constante.

41
Interpretacin general de los residuos
Banda aleatoria Box y Bisgaard (1996)

42
Interpretacin de los residuos vs. estimados
(y vs. niveles de un factor) Box y Bisgaard 1996)

La varianza depende de la media. Tal vez sea necesario un trmino de


Transformar datos. Cuando es la segundo orden (en el modelo o
grfica de un factor, ese factor para un factor especfico), o
afecta a la variacin transformar datos.
43
Interpretacin de los residuos vs. estimados
(y vs. niveles de un factor) Box y Bisgaard 1996)

Error en el anlisis. Tal vez se omiti


0 en el modelo (o ese factor en el
modelo).

44
Ejercicio
Realizar la prueba de varianza constante en el caso del Acabado vs. el
Avance .

45
7. Prueba de independencia
Al efectuar experimentos, se deber registrar en el orden en el que
fueron realizados.
La prueba de independencia consiste en graficar los residuos vs. el
orden de cada experimento.
Si se observan fluctuaciones aleatorias en una banda horizontal, la
independencia se acepta.
En caso contrario se deber repetir el experimento teniendo cuidado
con la aleatorizacin de las pruebas.
En caso de que el estudio no sea experimental es importante buscar el
orden en que se obtuvieron las observaciones.

46
Ejemplo
Probar la independencia del tratamiento trmico.

No se rechaza la independencia. Se supone que el orden de los datos es en


el que quedaron en la tabla.
47
Ejemplo de no-independencia

48
Ejemplo de no-independencia

49
Ejercicio
Probar la independencia en el caso del Acabado vs. el Avance.

50
8. Prueba de falta de ajuste del modelo (lack-of-fit)
La prueba de falta de ajuste asume que se cumplen las suposiciones del
modelo.
Se quiere probar:
Ho: y = 0 + 1x + Ha: y 0 + 1x +
(El modelo lineal es el adecuado) (El modelo lineal no es el adecuado)
Para realizar esta prueba se requiere tener observaciones repetidas de "y"
para algunos valores de "x".

51
Ejemplo
Hacer la prueba de falta de ajuste del tratamiento trmico.

52
Procedimiento:
El desarrollo de la prueba es el siguiente:
Sea m el nmero de niveles totales de x (m = 11)
Sea ni el nmero de observaciones en xi (i = 1m)
Sea yij la j-sima observacin de xi (j = 1n
m i )
n = nmero total de observaciones n ni
1
El principio bsico es la particin del error en dos componentes:
Falta de ajuste (LOF)
Error puro (PE)

53
y

(y ij y i ) eij

54
SCE SC(LOF) SC(PE)

SC(LOF)/(m 2) MC(LOF)
EP : F
SC(PE)/(n m) MC(PE)

Rechazar Ho si, F F;m2;nm


yi (y
ij - yi )2

55
MC(LOF) 1,766
EP : F 0 ,56
MC(PE) 3,167

Rechazar Ho si, F F;m2;nm (F0 ,05;9;4 6)


Como 0,56 no es mayor que 6, NO se rechaza que el modelo lineal
propuesto sea el adecuado.
56
Ejercicio
Completar la siguiente tabla ANOVA basado en los siguientes datos:

57
Otras medidas de diagnostico y problemas
9. Distancia D de Cook
Detecta observaciones influyentes.
En la prctica, considerar D significativa si es mayor que 1. En este caso
se deber estudiar la observacin para ver si es real. Si no es real,
borrarla. Si es real, ver causas en el proceso.
10.PRESS (Predicted SSE)
Evala la capacidad de prediccin del modelo.
Se compara PRESS contra SCE, y de manera emprica, si la relacin es
menor a 2, se considera que el modelo es bueno para predecir.

58
11.Prueba de Durbin-Watson
Detecta autocorrelacin entre los errores (falta de independencia de
manera analtica).
Esta prueba supone que los errores siguen una distribucin normal:
Ho: No existe correlacin positiva, = 0
Ha: Existe correlacin positiva, > 0
Tambin se puede probar:
Ho: No existe correlacin negativa, = 0
Ha: Existe correlacin negativa, < 0
n

(e t e t 1 )2
El estadstico de prueba es: EP : d t 2
n

e
t 1
2
t

59
Buscar dL y dU en las tablas de Durbin-Watson y llegar a una conclusin en
base a la siguiente figura:

Se puede sospechar de autocorrelacion cuando una de la variables es el


tiempo.
60
Para usar las tablas de Durbin-Watson (DW) es necesario tener n mayor o
igual a 15, definir p 1 (p = nmero de parmetros, s) y el nivel de (5%
1%).
Ejemplo
En el caso del tratamiento trmico, de Minitab se obtiene d = 1,75396.

Con n = 15, p 1 = 1, y usando = 5% se obtiene de la tabla DW: dL = 1,08


y dU = 1,36 y se concluye que NO existe autocorrelacin entre los errores.

61
La autocorrelacin est en general provocada cuando no se incluyen una o
ms variables importantes en el modelo, por ejemplo al relacionar las
ventas anuales de refresco contra los gastos en publicidad, la variables
crecimiento poblacional (en el tiempo) debera estar incluida.
Los efectos de la autocorrelacin son:
estimadores ineficientes del modelo,
se subestima el error,
y los resultados de pruebas de hiptesis e intervalos de confianza
pueden ser errneos.

62
La autocorrelacin tambin puede detectarse al graficar los residuos contra
el orden (prueba de independencia) y observar grupos de puntos de un
solo lado de la lnea central.

Ejercicio
Realizar en el caso del Acabado vs. el Avance las siguientes pruebas:
Distancia D de Cook, PRESS y Durbin-Watson.

63
III. Regresin Lineal Mltiple
Consiste en generar modelos de regresin con ms de una variable
independiente (Xs).
y 0 1x1 2x 2 k xk
n = nmero de datos
p = nmero de parmetros (s)
k = nmero de variables (Xs)
= componente de error (medicin + natural). Variable aleatoria.
La relacin entre el nmero de parmetros y el nmero de variables es:
p = k + 1.

64
i (i = 1k) representa el cambio esperado en la respuesta "y" cuando xi
cambia una unidad, manteniendo constantes las dems Xs.
A las s se les llama coeficientes de correlacin parcial.
0 representa la interseccin del hiperplano de regresin.
Si el rango de los datos Xs incluye x1 = x2 = = xk = 0, 0 representa la
media de "y" cuando x1 = x2 = = xk = 0.
El modelo en forma matricial es:

y X

65
Donde:
y1 1 x 11 x 12 x 1k 0 1

y 2

1 x 21 x 22 x 2k 1
2
y x


y n 1 x n1 x n2 x nk k n

La solucin matricial es:


' 1 '
(X X) X y

Para obtener el modelo:


y x

66
Ejemplo
Se supone que en el tratamiento trmico se introduce una variable ms
que es la temperatura de la pieza:
X1 (Temp) X2 (Tempza) Y (Dureza)
101 848 49
115 845 44
115 847 46
140 837 38
123 844 43
107 847 47 Estadsticas de la regresin
135 840 41
135 838 38
105 846 47
110 845 45
110 844 43
135 836 37
125 845 44
132 840 40
130 839 39

67
Donde:

49 1 101 848
845
0
44 1 120
y x 1



39 1 130 839
k



y x

Y (Dureza) = -574 0,0606 X1 (Temp) + 0,741 X2 (Tempza)

68
Para estimar la varianza 2 es necesario obtener:

' ' ' SCE
SCE y y X y MCE
np

2 MCE

Donde:
n = nmero de datos
p = nmero de parmetros (s)
k = nmero de variables (Xs)
p=k+1

69
Pruebas de hiptesis
a) Prueba de significacin de la regresin
Ho: 1 = 2 = = k = 0
Ha: j 0 para al menos una j
El estadstico de prueba es:
SCR / k MCR
EP : F
SCE /(n k 1) MCE

p = nmero de parmetros (s)


k = nmero de variables (Xs)
p=k+1 n k -1 = n p k=p-1
Rechazar Ho si, F F;k;nk1
70
b) Pruebas sobre coeficientes individuales
Ho: j = 0
Ha: j 0
El estadstico de prueba es:



EP : t j
j

se( j )
2c jj

' 1
Cjj son los elementos de la diagonal de la matriz (X X)
Rechazar Ho si, t t / 2;nk 1

71
Resultados e interpretacin usando Minitab:

72
El modelo es significativo y tiene buena capacidad de prediccin pues
SCE = 7,037 no es muy diferente a PRESS = 11, 0332. La diferencia es
menos del doble (1,5106).
El modelo explica el 96,43% de la variacin de la dureza, sin embargo la
variable Temperatura no es significativa. Se eliminar del modelo, se
generar otro y se compararn ambos.
Con respecto a la prueba de autocorrelacin, estadstico de Durbin-
Watson = 2,33858.
Con = 0,05, se obtiene de las tablas DW: dL = 0,95, dU = 1,54, 4dU =
2,46, por lo que no existe autocorrelacin.

73
NO se rechaza la Normalidad
74
No se rechaza la Varianza constante
75
No se rechaza la Independencia
76 Se supone que el orden de los datos es en el que quedaron en la tabla
Ajustando el modelo de regresin sin la variable temperatura:

77
Durbin-Watson es 2,39601 (no existe autocorrelacin).
Las suposiciones de normalidad, varianza constante e independencia
se cumplen.
La S (medida del error) del modelo completo (2 factores) es 0,765780
mientras que la del modelo reducido es 0,810823 (6% mayor).
Los coeficientes de determinacin son 96,43% y 95,66%
respectivamente, y ambos modelos tienen buena capacidad de
prediccin (comparar PRESS vs. SCE).
En conclusin, aunque el modelo completo es ligeramente mejor que
el modelo reducido, es preferible usar el reducido pues contiene una
variable menos.

78
Ejercicio
Considerar que al caso del Acabado se le agrega una variable ms: posicin.
Construir un modelo de regresin e interpretarlo:

79
Mtodo de las sumas de los cuadrados extras
Mtodo usado para medir la contribucin de factores adicionales en un
modelo de regresin.
Por ejemplo, si se desea saber la contribucin de una segunda variable (X2)
en el modelo, dado que ya se tiene a X1.
Modelo Completo y = 0 + 1x1 + 2x2 + SCR (1, 2)
Modelo Reducido y = 0 + 1x1 + SCR (1)
La SCR condicional es:
SCR (21) = SCR (1, 2) - SCR (1)
Y representa la contribucin de agregar X2 al modelo, dado que ya tiene a
X1.

80
SCR (1)
SCR (2 1)
SCR (Anova) = SCR (1, 2) = 189,896
Ho: 2 = 0 Ha: 2 0
El estadstico de prueba es:
SCR(2 1 ) / 1 21,526 / 1
EP : F 36,708
MCE 0 ,5864
Rechazar Ho si, F F0 ,05;GLR1;GLE F0 ,05;21;12 4,75
A pesar de que la Temperatura de la pieza (X2) contribuye poco dado que ya
se incluy a la variable Temperatura, la primera es significativa (ver tambin
prueba t).
81
SCR (2)
SCR (1 2)
Se observa que la variable Temp (dado que ya se incluy a la variable
Tempza) contribuye an menos que la Tempza (dado que se incluye Temp,
ver prueba anterior).
Ho: 1 = 0 Ha: 1 0
El estadstico de prueba es:
SCR(1 2 ) / 1 1,510 / 1
EP : F 2,575
MCE 0 ,5864

Rechazar Ho si, F F0 ,05;GLR1;GLE F0 ,05;21;12 4,75


como 2,575 < que 4,75, se confirma que Temp NO es necesaria en el modelo.
82
12. Coeficiente de determinacin mltiple ajustado
Se define por:
MCE n1
R adj 1
2
1 (1 R2 )
MCT np
Siendo:
n = nmero de observaciones.
p = nmero de parmetros (s).
R2 = SCR/SCT.
Si los dos valores R2adj y R2 son muy diferentes significa que el modelo est
sobre ajustado.
R2adj penaliza al agregar variables que no son importantes en el modelo.

83
13. Multicolinealidad
Significa que algunas variables (Xs) pueden estar correlacionadas entres s.
Indicaciones de Multicolinealidad son las siguientes:
1. Correlaciones significativas entre pares de Xs.
2. Que los signos de algunos parmetros del modelo sean contrarios a lo
esperado.
3. VIFi (Variance Inflation Factor) > 10.
1
VIFi i 1...k Ri2 del modelo sin incluir xi
1 R2i

84
Soluciones a la multicolinealidad:
1. Eliminar una o ms variables del modelo (se puede usar el
procedimiento stepwise paso a paso).
2. Si se decide dejar todas las variables, evitar establecer relaciones causa-
efecto entre "y" y las Xs.
En el ejemplo anterior, VIF = 5,69 para las dos variables de temperatura, lo
cual indica que no existe multicolinealidad.

85
IV. Regresin Polinomial
Es un caso particular del modelo lineal en el cual los parmetros (s) son
lineales.
El modelo polinomial de 2 orden y una variable es:
y 0 1x 2 x 2
El modelo polinomial de 2 orden y dos variables es:

y 0 1x1 2x 2 11x12 22x 22 12x1x 2

86
y 0 1x 2 x
2

0 = Valor de E(y) cuando y si x = 0.


1 = parmetro de traslacin de la parbola (derecha, izquierda).
2 = razn de curvatura (hacia arriba o hacia abajo).
Notas:
Mantener el orden del polinomio lo ms bajo posible (probar
transformaciones en primer lugar - parsimonia)
La extrapolacin puede ser muy riesgosa.
Conviene usar la forma corregida del modelo para aumentar la
precisin de los estimadores y evitar posible multicolinealidad.
87
Ejemplo
Considerar la relacin existente entre el contenido de
carbn y la resistencia a la tensin de un metal.

88
89
Este modelo con variables originales presenta multicolinealidad.
90
k = 3 (p + 1 = 2 + 1) n = 15 = 0,05 dL = 0,95 dU= 1,54
El modelo presenta autocorrelacin positiva.

91
Se observa falta de independencia
92
Se prueba el modelo cbico:

93
Aumenta R2, disminuye s y la prueba de Durbin-Watson es inconclusa.
k = 4 (p + 1 = 3 + 1) n = 15 = 0,05 dL = 0,81 dU= 1,75
Al aplicar la prueba de independencia no se observa problema alguno.
94
Posible
outlier

No se observa autocorrelacin o falta de independencia


95
Ejercicio
Analizar la relacin entre la presin de un gas en base a
la temperatura del mismo.

96
V. Mtodos de Seleccin de Variables
1. Regresin por pasos (stepwise regression)
Se inicia con un modelo vaco, excepto por 0, y empieza a agregar variables
de una en una, tomando la variable que tenga la mayor correlacin con "y".
Esta variable se incluye si su F es mayor que cierto valor preseleccionado (F
a entrar).
La segunda variable seleccionada es la que tenga mayor correlacin parcial
con "y".
A cada paso que se agrega una variable, todas las que ya se haban incluido
anteriormente son reevaluadas por medio de pruebas F parciales para ver si
vale la pena que sigan estando en el modelo a la luz de la incorporacin de
otras variables.
As tambin se tienen un valor F a retirar.

97
2. Regresin de mejores subconjuntos (best subsets)
Desarrolla modelos de regresin de las mejores combinaciones de las
variables y calcula las siguientes medidas de desempeo:
R2, R2adj, Cp (Mallows)

SCE
Cp n 2p
MCE

p = nmero de parmetros del subconjunto particular.


SCE del modelo basado en el subconjunto particular.
MCE del modelo completo (todas las variables).

98
Ejemplo
Aplicar los dos mtodos anteriores a
los siguientes datos (no son los
mismos que en el ejemplo de
regresin mltiple de Dureza vs. Temp
y Tempza).

99
100
El procedimiento de regresin por pasos recomienda incluir a las variables
Temperatura y Temperatura de la pieza.

101
El procedimiento de regresin de mejores subconjuntos pasos recomienda
incluir a las variables Temperatura y Temperatura de la pieza.
102
Ejercicio
Aplicar los dos mtodos de
seleccin de variables a la
siguiente informacin.

103