Sie sind auf Seite 1von 13

REGRESIÓN LINEAL

MÚLTIPLE
REGRESIÓN LINEAL MÚLTIPLE
Modelo
𝑦 = 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 … + 𝛽𝑘 𝑥𝑘 + 𝑒
Supuestos
1. El valor esperado del error aleatorio e es:
E (e)  0
2. La varianza del error aleatorio e es:
var(e)  σ 2  var( y)
3. La covarianza entre cualquier par de errores aleatorios, ei y ej es:
cov( ei , e j )  cov( yi , y j )  0

4. La variable x no es aleatoria y debe tener al menos dos valores diferentes.


5. los valores e se distribuyen normalmente sobre su media si los valores de y se
distribuyen normalmente
Notación Matricial
1 𝑋11 𝑋21 ⋯ 𝑋𝑘1 𝑦1
1 𝑋12 𝑋22 ⋯ 𝑋𝑘2 𝑦2
𝑋= 1 𝑋13 𝑋23 ⋯ 𝑋𝑘3 𝑦= 𝑦3
⋮ ⋮ ⋮ ⋮ ⋮ ⋮
1 𝑋1𝑛 𝑋2𝑛 ⋯ 𝑋𝑘𝑛 𝑦𝑛

Estimadores de los coeficientes del modelo


෡ = 𝑿′ 𝑿
𝜷 −𝟏 𝑿′ 𝒚

Suma de Cuadrados

𝑺𝒚𝒚 = 𝑦 ′ 𝑦 − 𝑛𝑦ത 2 = ෍ 𝑦𝑖2 − 𝑛𝑦ത 2


෡ ′ 𝑋´𝑦
𝑺𝑺𝑬 = 𝑦 ′ 𝑦 − 𝜷
෡ ′ 𝑋´𝑦 ′ − 𝑛𝑦ത 2
𝑺𝑺𝑹 = 𝜷
3
Varianzas

෡ ′ 𝑋´𝑦
𝑦′𝑦 − 𝜷 𝑆𝑆𝐸
𝜎ො 2 = =
𝑛−𝑝 𝑛−𝑝

෡ = 𝝈𝟐 𝑿′ 𝑿
𝑪𝒐𝒗(𝜷) −𝟏

෡𝑱 = 𝝈
𝑽 𝜷 ෝ 𝟐 𝑪(𝒋+𝟏)(𝒋+𝟏)

𝑪𝟏𝟏 𝑪𝟏𝟐 ⋯ 𝑪𝟏𝒑


𝑪𝟐𝟏 𝑪𝟐𝟐 ⋯ 𝑪𝟐𝒑
𝐶 = 𝑿′ 𝑿 −𝟏 =
⋮ ⋮ ⋯ ⋮
𝑪𝒑𝟏 𝑪𝒑𝟐 ⋯ 𝑪𝒑𝒑
Ejemplo: Regresión Lineal Múltiple
El presidente de una gran cadena de restaurantes de comida rápida ha seleccionado de
forma aleatoria 10 franquicias y registrado en cada una la siguiente información sobre la
utilidad y las ventas netas (millones $) del último año.
Ventas de mostrador Ventas de servicio
N° Utilidad Neta (y) (X1) (millones $ ) al auto (X1)
Franquicia (millones $ )
1 1.5 8.4 7.7
2 0.8 3.3 4.5
3 1.2 5.8 8.4
4 1.4 10 7.8
5 0.2 4.7 2.4
6 0.8 7.7 4.8
7 0.6 4.5 2.5
8 1.3 8.6 3.4
9 0.4 5.9 2.0
10 0.6 6.3 4.1
1 8.4 7.7 1.5
1 3.3 4.5 0.8
1 5.8 8.4 1.2
𝑋= 1 10 7.8 𝑦= 1.4
1 4.7 2.4 0.2
⋮ ⋮ ⋮ ⋮
1 6.3 4.1 0.6

10 65.2 47.6
𝑋 ′ 𝑋 = 65.2 465.18 332.61
47.6 332.61 278.36

1.193643079 −0.146646604 −0.028888071


′ −1
𝑋𝑋 = −0.146646604 0.03277723 −0.01408844
−0.028888071 −0.01408844 0.02536653

8.8
𝑋 ′𝑦 = 63.32
49.65
6
Estimadores de los coeficientes del modelo
෡ = 𝑿′ 𝑿
𝜷 −𝟏
𝑿′ 𝒚

1.193643079 −0.146646604 −0.028888071 8.8


෡ = −0.146646604
𝜷 0.03277723 −0.01408844 63.32
−0.028888071 −0.01408844 0.02536653 49.65

−0.21589662
෡ = 0.08547343
𝜷
0.11315334

𝑦 = −0.2159 + 0.0855𝑥1 + 0.1132𝑥2

7
8.8
መ′ ′
𝛽 𝑋 𝑦 = −0.21589662 0.08547343 0.11315334 63.32 = 9.13035026
49.65
𝑦′𝑦 = 9.54
𝑦ത = 0.88

𝑺𝒚𝒚 = 𝑦 ′ 𝑦 − 𝑛𝑦ത 2 = 9.54 − 10 ∗ 0.88 2 =1.796

𝑺𝑺𝑬 = 𝑦 ′ 𝑦 − 𝛽መ ′ 𝑋 ′ 𝑦 = 9.54 − 9.1303 = 0.4097

𝑺𝑺𝑹 = 𝛽መ ′ 𝑋´𝑦 ′ − 𝑛𝑦ത 2 = 9.1303 − 10 ∗ 0.88 2 =1.3863

0.4097
𝜎ො 2 = =0.05853
7

8
Prueba de Hipótesis: Análisis de Varianza
1. Planteamiento de Hipótesis
𝐻0: 𝛽1 = 𝛽2 = ⋯ = 𝛽𝑘 = 0
𝐻1: 𝛽𝑗 ≠ 0 Al menos para una j
2. Nivel de Significancia: 
3. Estadístico para la Prueba ANALISIS DE VARIANZA
Fuente de Suma de Grados de Cuadrados Fc Valor p
Variación Cuadrados Libertad Medios
Regresión SSR k MSR MSR/MSE p
Residuales SSE n-p MSE
Total Syy n-1

4. Regla de Decisión
Si p es menor a valor α, la hipótesis nula se rechaza.
5. Conclusión
Si la hipótesis nula se rechaza se concluye que al menos una variables explicativa Xi se
encuentra asociada o no con Y.

9
Prueba de Hipótesis: Análisis de Varianza
1. Planteamiento de Hipótesis
𝐻0: 𝛽1 = 𝛽2 = 0
𝐻1: 𝛽𝑗 ≠ 0 Al menos para una j
2. Nivel de Significancia:   0.05
3. Estadístico para la Prueba ANALISIS DE VARIANZA
Fuente de Suma de Grados de Cuadrados Fc Valor p
Variación Cuadrados Libertad Medios
Regresión 1.3863 2 0.69315 11.8426 0.0057
Residuales 0.4097 7 0.05853
Total 1.796 9

4. Regla de Decisión
Dado que 0.0057 es menor al nivel de significancia la hipótesis nula se rechaza.

5. Conclusión
Al menos una variables explicativa Xi se encuentra asociada o no con Y.

10
Prueba de Hipótesis: Pruebas Individuales
1. Planteamiento de Hipótesis
𝐻0: 𝛽𝑗 = 0
𝐻1: 𝛽𝑗 ≠ 0
2. Nivel de Significancia: 
3. Estadístico para la Prueba
𝛽መ𝑗
𝑡= ~ 𝑡𝑛−𝑝
𝐷𝑆(𝛽መ𝑗 )
4. Regla de Decisión
Si el valor p asociado a t es menor que α la hipótesis nula se rechaza
5. Conclusión
Si la hipótesis nula se rechaza se concluye que la variable Xi se encuentra asociada
a Y.

11
Prueba de Hipótesis: Pruebas Individuales
1. Planteamiento de Hipótesis
𝐻0: 𝛽1 = 0 La variable ventas de mostrador No se encuentra asociada a la utilidad.
𝐻1: 𝛽1 ≠ 0 La variable ventas de mostrador se encuentra asociada a la utilidad.

2. Nivel de Significancia:   0.05


3. Estadístico para la Prueba
𝑉 𝛽መ1 = 𝜎ො 2 𝐶22 =0.05853*0.03277723=0.0019184513
0.0855
𝑡= = 1.952 𝐷𝑆 𝛽መ = 0.0019184513 = 0.04380013
0.04380013 1

4. Regla de Decisión
Dado que el valor p asociado a 1.952 con 7 grados de libertad es 0.092 el cual es
mayor a 0.05, entonces la hipótesis nula no se rechaza
5. Conclusión
La variable ventas de mostrador No se encuentra asociada a la utilidad.

12
Prueba de Hipótesis: Pruebas Individuales
1. Planteamiento de Hipótesis
𝐻0: 𝛽2 = 0 La variable ventas de servicio al auto No se encuentra asociada a la utilidad.
𝐻1: 𝛽2 ≠ 0 La variable ventas de servicio al auto se encuentra asociada a la utilidad.

2. Nivel de Significancia:   0.05


3. Estadístico para la Prueba
𝑉 𝛽መ2 = 𝜎ො 2 𝐶22 =0.05853*0.02536653=0.001484703
0.1132
𝑡= = 2.938 𝐷𝑆 𝛽መ2 = 0.001484703 = 0.038531844
0.038531844

4. Regla de Decisión
Dado que el valor p asociado a 2.938 con 7 grados de libertad es 0.0218 el cual es
menor a 0.05, entonces la hipótesis nula se rechaza
5. Conclusión
La variable ventas de servicio al auto se encuentra asociada a la utilidad.

13

Das könnte Ihnen auch gefallen