Sie sind auf Seite 1von 39

Análisis de Regresión y

Análisis factorial
El concepto de análisis de regresión tiene que ver con encontrar la mejor
relación entre Y (variable dependiente ) y x (variable independiente), al
cuantificar la intensidad de dicha relación y emplear métodos que permitan
predecir los valores de la respuesta ante valores dados de la variable x.

En muchas aplicaciones, habrá más de una variable


independiente que ayude a explicar la variable
dependiente.

Y= 𝛼 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯

Relación lineal

Walpole, R., Myers, R., Myers, S. y Ye, K. (2007). Estadística y probabilidad para ingeniería y ciencias. (8ª. ed.) México: Pearson educación
Y= 𝛼 + βx + 𝜖

La recta de regresión ajustada, o estimada, está dada por:

𝑦ො = 𝑎 + bx n XY  ( X )( Y )
b
n X 2  ( X ) 2
Coeficientes de regresión

a
 Y
b
 X
n n
Walpole, R., Myers, R., Myers, S. y Ye, K. (2007). Estadística y probabilidad para ingeniería y ciencias. (8ª. ed.) México: Pearson educación
𝐻0 : 𝛽 = 𝛽0

Es una medida de la proporción de la variabilidad


𝑏 − 𝛽0
𝑡=𝑠 𝑡𝑛−2 explicada por el modelo ajustado.
ൗ 𝑆
𝑥𝑥

𝐻0 : 𝛼 = 𝛼0

𝑎 − 𝛼0
𝑡= 𝑡𝑛−2
σ𝑛𝑖=1 𝑥𝑖2
𝑠 ൘
𝑛𝑆𝑥𝑥
Walpole, R., Myers, R., Myers, S. y Ye, K. (2007). Estadística y probabilidad para ingeniería y ciencias. (8ª. ed.) México: Pearson educación
Ejemplo

Se piensa que el número de libras de vapor consumidas mensualmente por una planta química se
relaciona con la temperatura ambiente promedio (en °F) de ese mes. En la tabla siguiente se
muestran la temperatura y el consumo:

Mes Temperatura Consumo a. Ajuste los datos a un modelo de regresión lineal


Ene. 21 185.79 simple.
Feb. 24 214.47

Mar. 32 288.03 b. ¿Cuál es la estimación del consumo esperado de


Abr. 47 424.84
vapor cuando la temperatura promedio es 55°F?
May. 50 454.58
c. ¿Qué cambio se espera en el consumo de valor
Jun. 59 539.03
promedio cuando la temperatura mensual promedio
Jul. 68 621.55 cambia 1°F?
Ago. 74 675.06

Set. 62 562.03 d. Suponga que la temperatura mensual promedio es


Oct. 50 452.93 47°F. Calcule el valor ajustado de “y” y el residual
Nov. 41 369.95
correspondiente.
Dic. 30 273.98
Clic en Gráficos/Cuadros de diálogos antiguos/Dispersión de puntos
1

Clic en Gráficos/Cuadros de
diálogos antiguos/Dispersión
de puntos
2
Clic en Analizar/Regresión/Lineales
Es cuando la función de regresión es no lineal, está se puede
determinar mediante inspección visual del diagrama de dispersión, y
algunas veces se sabe de antemano, como resultado de experiencias
previas o de la teoría implícita que el modelo es no lineal.
Un estudio consistió en medir en una reacción química, la concentración química de
un substrato en un determinado tiempo.

Clic en Analizar/Regresión/Estimación curvilínea


1

Clic en Analizar/Regresión/Estimación curvilínea


1

Clic en Analizar/Regresión/Estimación curvilínea


Un estudio consistió en medir en una reacción química, la concentración química de un
substrato en un determinado tiempo.

𝑦 = 𝐴𝑡 𝐵 𝑒 −𝐶𝑡

Clic en Analizar/Regresión/No Lineal


𝐵 −𝐶𝑡 1
𝑦 = 𝐴𝑡 𝑒
3

Clic en Analizar/Regresión/No Lineal


𝐵 −𝐶𝑡
𝑦 = 𝐴𝑡 𝑒

Clic en Analizar/Regresión/No Lineal


Coeficientes de regresión

Y= 𝛽0 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + ⋯ 𝛽𝑘 𝑥𝑘 + 𝜖 Error

Variable dependiente Variables independientes

Montgomery, D., y Runger, G. (2012). Probabilidad y Estadística aplicadas a la Ingeniería (2a. ed.). México: Limusa Wiley.
Se piensa que la energía eléctrica consumida mensualmente por una planta química se
relaciona con la temperatura ambiente promedio (𝑥1 ), el número de días laborales del mes
(𝑥2 ),la pureza promedio del producto (𝑥3 ) y las toneladas del producto producidas (𝑥4 ). Se
cuenta con los datos del último año, los cuales se presentan en la tabla siguiente:

Ajustar un modelo de regresión lineal


múltiple con estos datos.

Montgomery, D., y Runger, G. (2012). Probabilidad y Estadística aplicadas a la Ingeniería (2a. ed.). México: Limusa Wiley.
Clic en
Analizar/Regresión/
Lineales
1 3

Clic en
Analizar/Regresión/Lineales
Clic en
Analizar/Regresión/Lineales
Clic en
Analizar/Regresión/Lineales
Cuando hay dependencias casi lineales entre las variables independientes, se dice que existe el
problema de multicolinealidad. La presencia de multicolinealidad tiene una gran cantidad de efectos
graves sobre los estimados de coeficientes de regresión por mínimos cuadrados.

El VIF para cada término del modelo mide el efecto Uno o más autovalores pequeños implican que hay
combinado que tienen las dependencias entre las dependencias casi lineales entre las variables
variables independientes sobre la varianza de ese independientes.
término. Si hay uno o más VIF mayores que 5 o 10, es
indicio de que los coeficientes asociados de regresión
están mal estimados debido a la multicolinealidad.

𝜆𝑚á𝑥 Las cantidad de índices de condición que son


𝑘= grandes (digamos, ≥1000) es una medida útil de la
𝜆𝑚í𝑛
cantidad de dependencia casi lineales en las
Si 𝑘 es menor que 100, no hay problema grave de multicolinealidad, variables independientes
si está entre 100 a 1000 implican multicolinealidad de moderada a
fuerte, y si K es mayor a 1000, es indicio de una fuerte
multicolinealidad.

Montgomery, D., Peck, E. y Vining, G. (2004). Introducción al Análisis de Regresión Lineal Simple. (3ª. ed.) México: Grupo Patria Cultural
Es un método alternativo para transformar datos, cuando no se satisfacen las hipótesis
acostumbradas de normalidad y varianza constante. Aquí la variable respuesta sólo necesita
ser un miembro de la familia exponencial que comprende las distribuciones normal, de
Poisson, binomial, exponencial y gamma.

Se caracteriza porque la variable dependiente es dicotómica o politómica y la(s) variable(s)


independiente(s) pueden ser de cualquier naturaleza, cualitativas o cuantitativas.
Lo que se pretende mediante la RL es expresar la probabilidad de que ocurra el evento en cuestión como
función de ciertas variables, que se presumen relevantes o influyentes. Si ese hecho que queremos modelizar
o predecir lo representamos por Y (la variable dependiente), y las k variables explicativas (independientes y de
control) se designan por X1, X2, X3,…,Xk, la ecuación general (o función logística) es:

Montgomery, D., Peck, E. y Vining, G. (2004). Introducción al Análisis de Regresión Lineal Simple. (3ª. ed.) México: Grupo Patria Cultural
La variable dependiente es dicotómica y la(s) variable(s) independiente(s) pueden ser de
cualquier naturaleza, cualitativas o cuantitativas.

Se desea saber cual es la probabilidad de tener o no silicosis, en relación a los años trabajando
expuestos a polvo de sílice. Los datos se dan a continuación:

Montgomery, D., Peck, E. y Vining, G. (2004). Introducción al Análisis de Regresión Lineal Simple. (3ª. ed.) México: Grupo Patria Cultural
Montgomery, D., Peck, E. y Vining, G. (2004). Introducción al Análisis de Regresión Lineal Simple. (3ª. ed.) México: Grupo Patria Cultural
Se requiere establecer una relación entre el hecho de tener anticuerpos a determinado virus
con la zona de residencia (norte, sur, este y oeste) y el factor RH:
Montgomery, D., Peck, E. y Vining, G. (2004). Introducción al Análisis de Regresión Lineal Simple. (3ª. ed.) México: Grupo Patria Cultural
Montgomery, D., Peck, E. y Vining, G. (2004). Introducción al Análisis de Regresión Lineal Simple. (3ª. ed.) México: Grupo Patria Cultural
Montgomery, D., Peck, E. y Vining, G. (2004). Introducción al Análisis de Regresión Lineal Simple. (3ª. ed.) México: Grupo Patria Cultural
Montgomery, D., Peck, E. y Vining, G. (2004). Introducción al Análisis de Regresión Lineal Simple. (3ª. ed.) México: Grupo Patria Cultural
Es una técnica de reducción de datos que examina la
interdependencia de variables y proporciona conocimiento de
la estructura subyacente de los datos.

Pérez, C. (2004). Técnicas de Análisis Multivariante de datos. Madrid: Pearson Educación

Das könnte Ihnen auch gefallen