Sie sind auf Seite 1von 21

Regresin de una

variable

Que es?

Es un medio matemtico
para describir la relacin
entre la Y y las X generando as un modelo
del proceso.

Para que usarla


Encontrar las X vitales
Optimizar las Y
Pronosticar la Y

Y = b0 + b1x + error
Donde: b0 es la
interseccin
b1 es la
pendiente de la

lnea

Cuando usarla
Para seleccionar por
eliminacin datos pasivos
)datos histricos de lnea
base) para las X
potenciales

Regresin de una variable


Podemos estar interesados en la relacin entre una variable independiente (X) y una variable de| respuesta (Y).
| de dispersin de la relacin puede
* ser :
Una grfica
+
Suponga que la relacin verdadera es:
Y |
|
*
*
|
Y i = a + b * X i+ e i
+
*
|
|
*
*
|
|
*
+
|
*
| *
|
+---------+---------+---------+---------+---------+-----X
*

Existe relacin lineal


a (la constante) y b (el coeficiente) sern parmetros fijos, pero
desconocidos
Las X son las variables independientes
Las Y son las respuestas observadas
Las e son los errores. Los supuestos usuales sobre errores son:

- el promedio es 0.0
- no estn correlacionadas
- distribuidos normalmente
- la desviacin estndar de errores es la misma
para todos los niveles de la variable X

Preguntas a cerca de las


ecuaciones
Cual es la mejor forma de recolectar los datos?
Cuales son los valores estimados de a y b ?
Esta es la forma funcional correcta?
La relacin es estadsticamente significativa?

De que tamao son los errores?

Recoleccin de datos
Es mejor recolectar datos en un orden aleatorio en lugar de
iniciar con una en el valor bajo y luego incrementarla , ya que
otra variable podra estar cambiando a travs del tiempo lo
que puede afectar el proceso (RUIDO NEGRO)

Ejemplo:
Intenta optimizar el rendimiento de un horno para curar la pintura.
Una teora dice que la velocidad del abanico extractor afecta la evaporacin del
solvente en la pintura. T intentas probar que tal relacin existe mediante el
anlisis de los datos de abajo.

Siempre graficar los datos


primero

A simple viste muestra


un comportamiento
lineal

REGRESION

Ventana data
FITS son los valores
predichos de la variable
de salida de la ecuacin
de regresin para cada
valor de X.
RESI1 son los errores de
la respuesta actual
menos la respuesta
predicha.

Ventana sesin

Grficas Residuales
Grfica de normalidad

Los datos deben de


estar normalmente
distribuidos.
Prueba de Normalidad

Grafica de residuales
Los residuales deben estar
distribuidos al azar.
Un patrn en los residuales puede
indicar que la forma de modelo es
incorrecta.

Algunas formas de mejorar ajustes


(Fits) pobres.
Investigar datos interesantes. Podra
ser incorrecto, o podra ser la
informacin ms importante en tu
estudio
Ajustar una ecuacin diferente (podra
ser una relacin no lineal )
Transformar
Y
(logaritmo,
raz
cuadrada, recproco, yk . . . )
Transformar las variables X (logaritmo,
raz cuadrada, recproco. . .)

Grfica de residuales vs errores a travs del


tiempo

El promedio de los
Residuales
siempre
debera ser 0.0
Los errores deberan
estar distribuidos al azar
por arriba y por abajo
del valor promedio de 0.
Si un patrn es notorio, el modelo de una variable lineal puede no ser
el mejor ajuste para los datos o puede que existan ms X Vitales

Ventana Sesin
Valor p de la Constante
Ho: La lnea pasa a travs
del origen (0,0). (0
velocidad = 0 evaporacin)
Ha: La lnea no pasa a
travs del origen (0,0). (0
velocidad = 0 evaporacin)

Valor p de la variable X
Velocidad
Ho: Pendiente = 0
Ha: Pendiente = 0
Ho: La X no es
significativa
Ha: La X es significativa

s: La desviacin estndar de los residuales

(errores). Los errores son valores


observados - valores esperados. En otras
palabras, la distancia desde los puntos
observados hasta la lnea ajustada descrita
por la ecuacin de regresin. (Debera ser
pequea, para un buen modelo)

s = MS(error)1/2

R-Sq: El porcentaje de la variacin total

explicada por la lnea ajustada. La


variacin explicada por las X. (Debera
ser grande, para un buen modelo)

R-Sq(adj): Ajuste para una condicin de


sobreajuste (cuando se consideran
demasiadas variables dentro de la
ecuacin) que incorpora el nmero de
trminos en el modelo comparado con el
nmero de observaciones. Donde:

n = nmero de observaciones
p = nmero total de trminos en el modelo

Los trminos de Regresin


(SC y MS) deberan ser
grande relativo a los trminos
de Error (SC y MS)
El trmino de Error debera ser
pequeo relativo al Total

El valor p debera ser < 0.05 para


demostrar la significancia
estadstica.

Anlisis de Regresin Grfico


Stat>Regression>Fitted Line Plot

Banda de
Prediccin

Banda de
Confianza

I.C. = Intervalo de Confianza (95% de confianza de que las medias de todos los
datos caern dentro de esta banda)
I.P. = Intervalo de Prediccin (95% de confianza de que los puntos de datos
individuales caern dentro de esta banda)

Ventana Session

No rechazar Ho:

Aceptar Ha:

Conclusiones
Hemos encontrado una X Vital potential - Velocidad (porque
p < 0.05) .
El modelo lineal parece ser un buen ajuste, ya que no se
encontraron patrones en los residuales.
No pudimos probar que los Residuales fueron no-normales, lo
cual es consistente con nuestros supuestos (valor p = 0.092, de
la Prueba de Normalidad)
El modelo debera ser aceptable para nuestro propsito:
predecir las tasas de evaporacin dada una velocidad (basada
en: el pequeo trmino de error, R2 = 90.5%, valor p < 0.05)

Si el proceso es crtico, deben tomarse ms datos. Entonces


debe desarrollarse un modelo de regresin con errores que
estn distribuidos ms cerca de la normal, y un valor R2 ms
alto.

EJERCICIO
T crees que la cantidad de espacio que ocupan nuestros electrodomsticos
en los lugares de exhibicin tiene impacto sobre el volumen de ventas. Has
reunido datos del volumen de ventas y el espacio total de los lugares de
exhibicin utilizados durante los ltimos 12 meses tomndolos de cierto
nmero de centros de distribucin. Ahora quieres analizar los datos para
ver si la cantidad de espacio efectivamente tiene una relacin con el
volumen anual de ventas.

Divirtete poniendo en prctica lo que has aprendido acerca de la regresin


de una variable. Debes estar preparado para explicar tus respuestas y el
trabajo que apoya tu conclusin.

Das könnte Ihnen auch gefallen