Sie sind auf Seite 1von 3

Universidad de las Fuerzas Armadas ESPE

Departamento CEAC
Estadística Inferencial
Nombre Integrantes: Jennifer Pepinó, Andres Pillajo, Domenica Padilla, Ismael Ortiz
Fecha: 2018/07/14
NRC: 3939
Análisis de correlación y Regresión Múltiple
Análisis de Regresión Múltiple
Es una técnica de inferencia para la toma de decisiones representada por la siguiente fórmula.

𝑌̂ = 𝑎 + 𝑏1 𝑋1 + 𝑏2 𝑋2 + 𝑏3 𝑋3 + … … … + 𝑏𝐾 𝑋𝐾
Para interpretar a la fórmula se entiende que
a= Es la intersección, el valor de Y cuando todas las X son 0
𝑏𝑗 =es la cantidad en que Y cambia cuando 𝑋𝑗 aumenta una unidad, con los valores de todas las demás
variables independientes mantenidas constantes.
El subíndice j es un identificador para cada variable independiente; no se emplea en cálculos.

La relación cuando hay dos variables independientes respecto a una dependiente 𝑌̂, se puede representar
de forma gráfica mediante una recta.

𝑌̂ = 𝑎 + 𝑏1 𝑋1 + 𝑏2 𝑋2
La formula expresada anteriormente muestra la presencia de dos variables independientes estas son 𝑋1 y
𝑋2 . A continuación se presenta el gráfico de dicha ecuación.
+

(Lind Marshal, )

Además los residuos se representan como la diferencia entre Y real y 𝑌̂.


Si un análisis de regresión múltiple incluye más de dos variables independientes, no se puede
representar gráficamente puesto que las graficas pueden representar hasta 3 dimensiones las cuales son
Y largo, X ancho, Z profundidad.
Para comprobar la eficacia de que una variable dependiente está sujeta a dos independientes se emplean
métodos para verificar que este bien expresada.
Error estándar de estimación múltiple
Expresada mediante.
𝑆
∑(𝑌−𝑌̂)2
𝑌123...𝑘=√
𝑛−(𝑘+1)

Y =es la observación actual.


𝑌̂= es el valor estimado calculado de la ecuación de regresión.
n =es el número de observaciones en la muestra.
k =es el número de variables independientes.
Para una mejor compresión de lo que esta formula indica se presentara el siguiente cuadro.

Partiendo de lo antes mencionado n= 20, k= 3 variables independientes, (𝑌 − 𝑌̂) es la diferencia entre


la variable dependiente y la de mejor ajuste “Y capuchón”, ∑(𝑌 − 𝑌̂)2 es la suma década una de estas
diferencias elevadas al cuadrado.
Tabla ANOVA
Es muy parecida a la tabla que ya hemos venido viendo. En regresión múltiple la variación se dividió en
dos componentes: los tratamientos y la variación al error aleatorio. Aquí la variación total también se
separa en dos componentes:
• La variación en la variable dependiente explicada por el modelo de regresión (las variables
independientes).
• El residuo o variación del error. Es el error aleatorio debido al muestreo
Para su cálculo y poder expresarlo a través de la tabla ANOVA se requiere que.

Variación total = SS Total = ∑(𝑌̂ − 𝑌̅)2


̂ )2
Error residual o varianza del error = SSE = ∑(𝑌 − 𝑌
Variación de regresión = SSR = SS total –SSE
Para los grados de libertad se tiene que
K= numero de variables dependientes y n = Observaciones
Entonces finalmente para realizar la tabla ANOVA tenemos que
Fuente Gl SS MS F
Regresión K SSR MSR= SSR/k 𝑀𝑆𝑅
Residuo o error n-(k+1) SSE 𝑆𝑆𝐸 𝑀𝑆𝐸
𝑀𝑆𝐸 =
𝑛 − (𝑘 + 1)
Total n-1 SS Total
La tabla de regresión de ANOVA es importante puesto que √𝑀𝑆𝐸 = 𝐸𝑟𝑟𝑜𝑟 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟 𝑑𝑒 𝑒𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛
Coeficiente de determinación múltiple
Porcentaje de variación en la variable dependiente, Y, explicada por el conjunto de variables
independientes.

 No adopta valores negativos


 Puede variar de 0 a 1
Está representada por la fórmula.
𝑆𝑆𝑅
𝑅2 =
𝑆𝑆𝑇𝑜𝑡𝑎𝑙
Como los valores varían entre 0 y 1 , se interpreta que entre más cercano a 0 habrá poca asociación
entre la variable dependiente respecto a las variables independientes. Por el contrario entre más cerca
sea el coeficiente de determinación múltiple a 1 , se interpreta que es una asociación fuerte.
Conclusiones:

 El análisis de regresión múltiple es muy similar a las regresiones lineales, sin embargo en
regresión múltiple la variable dependiente es afectada por mas de una variable independiente.
Aquí radica la importancia de estudiarlas puesto que en mundo empresarial nos toparemos con
más de una variable para hacer nuestras predicciones.
Recomendaciones:

 Antes de empezar el proceso de análisis de regresiones múltiples se debe empezar por la lógica
verificando que realmente las variables que se van a estudiar tienen relación o no.
Bibliografía:
Lind, Marchal, Wathen. (2008). “Estadística aplicada a los negocios y la economía”. Rescatado de URL
https://es.scribd.com/document/363795957/285320909-Estadistica-para-la-administracion-y-Economia-
Lind-Marchal-11-edicion-pdf-pdf

Das könnte Ihnen auch gefallen