Beruflich Dokumente
Kultur Dokumente
Partimos de:
: variable independiente
: variable dependiente
Y teniendo en cuenta:
Hipótesis de partida (o hipótesis teórica): : Las dos variables en estudio son
independientes
Hipótesis Alternativa: : Las dos variables de estudio están relacionadas
. Si el $p-valor < 0.05$ existe relación lineal significativa entre las variables.
Análisis de regresión:
Consiste en encontrar la recta que mejor describe la relación entre las dos
variables, que tiene la forma: . Y a la cual llamaremos Modelo de
Regresión.
Paso 1
Identifica y separa los valores de x y de y de tus puntos. Si estás usando una
hoja de cálculo, ingrésalos en columnas adyacentes. Debería haber el mismo
número de valores de x y de y. Si no es así, el cálculo será inexacto o la función
de la hoja de cálculo dará error. x = (6, 5, 11, 7, 5, 4, 4) y = (2, 3, 9, 1, 8, 7, 5)
Paso 2
Calcula el valor medio de los valores de x y de y dividiendo la suma de todos los
valores por el número de valores total en el juego. Estos promedios se llamarán
"x_avg" y y_avg". x_avg = (6 + 5 + 11 + 7 + 5 + 4 + 4) / 7 = 6 y_avg = (2 + 3 + 9 +
1 + 8 + 7 + 5) / 7 = 5
Paso 3
Crea dos nuevos juegos de datos restando el valor de x_avg de cada valor de x y
el valor de y_avg de cada valor de y. x1 = (6 - 6, 5 - 6, 11 - 6, 7 - 6 ... ) x1 = (0, -
1, 5, 1, -1, -2, -2) y1 = (2 - 5, 3 - 5, 9 - 5, 1 - 5, ... ) y1 = (-3, -2, 4, -4, 3, 2, 0)
Paso 4
Multiplica cada valor de x1 por cada valor de y1, en orden. x1y1 = (0 * -3, -1 * -2,
5 * 4, ... ) x1y1 = (0, 2, 20, -4, -3, -4, 0)
Paso 5
Eleva al cuadrado cada valor x1. x1^2 = (0^2, 1^2, -5^2, ... ) x1^2 = (0, 1, 25, 1,
1, 4, 4)
Paso 6
Calcula las sumas de los valores x1y1 y x1^2. sum_x1y1 = 0 + 2 + 20 - 4 - 3 - 4 +
0 = 11 sum_x1^2 = 0 + 1+ 25 + 1 + 1 + 4 + 4 = 36
Paso 7
Divide "sum_x1y1" por "sum_x1^2" para conseguir el coeficiente de regresión.
sum_x1y1 / sum_x1^2 = 11 / 36 = 0.306
Coeficientes
Un coeficiente de regresión describe el tamaño de la relación entre un predictor y la
variable de respuesta. Los coeficientes son los números por los cuales se multiplican
los valores del término en una ecuación de regresión.
Interpretación
El coeficiente para un término representa el cambio en la respuesta media asociada
con un cambio en el término, en tanto que los otros términos en el modelo se
mantienen constantes. El signo del coeficiente indica la dirección de la relación entre el
término y la respuesta. El tamaño del coeficiente es generalmente una buena manera
de evaluar la significancia práctica del efecto que un término tiene en la variable de
respuesta. Sin embargo, el tamaño del coeficiente no indica si un término es
estadísticamente significativo porque los cálculos de significancia también consideran
la variación en los datos de respuesta. Para determinar la significancia estadística,
examine el valor p del término.
Variable continua
Variable categórica
Coeficientes codificados
Minitab puede ajustar los modelos lineales utilizando una variedad de esquemas
de codificación para variables continuas en el modelo. Estos esquemas de
codificación pueden mejorar el proceso de estimación y la interpretación de los
resultados. Además, las unidades codificadas pueden cambiar los resultados de
las pruebas estadísticas utilizadas para determinar si cada término es un predictor
significativo de la respuesta. Cuando un modelo utiliza unidades codificadas, el
análisis produce coeficientes codificados.
Interpretación
Este método centra y escala las variables. Minitab utiliza este método en el
diseño de experimentos (DOE). Los coeficientes representan el cambio medio
en la respuesta asociada con los valores altos y bajos que se han especificado.
Restar la media
Este método centra las variables. Cada coeficiente representa el cambio
esperado en la respuesta ante un cambio de unidad en la variable, utilizando la
escala de medición original. Cuando se resta la media, el coeficiente constante
está estimando la respuesta media cuando todos los predictores se encuentran
en sus valores medios.
EE Coef
El error estándar del coeficiente estima la variabilidad entre las
estimaciones del coeficiente que se obtendrían si se tomara las
muestras de la misma población una y otra vez. El cálculo asume que
el tamaño de la muestra y los coeficientes a estimar se mantendrían
iguales si se tomara la muestra una y otra vez.
Interpretación
Utilice el error estándar del coeficiente para medir la precisión de la
estimación del coeficiente. Cuanto menor sea el error estándar, más
precisa será la estimación. Al dividir el coeficiente entre su error
estándar, se calcula un valor t.. Si el valor p asociado con este
estadístico t es menor que el nivel de significancia, se concluye que el
coeficiente es estadísticamente significativo.
Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV
Estimación de punto
Margen de error
El margen de error define el ancho del intervalo de confianza y es determinado
por la variabilidad observada en la muestra, el tamaño de la muestra y el nivel
de confianza. Para calcular el límite superior del intervalo de confianza, el
margen de error se suma a la estimación de punto. Para calcular el límite
inferior del intervalo de confianza, el margen de error se resta de la estimación
de punto.
Interpretación
Utilice el intervalo de confianza para evaluar la estimación del
coeficiente de la población para cada término en el modelo.
Valor t
El valor t mide la relación entre el coeficiente y su error estándar.
Interpretación
Minitab utiliza el valor t para calcular el valor p, que se utiliza para
comprobar si el coeficiente es significativamente diferente de 0.
Valor p – Coeficiente
El valor p es una probabilidad que mide la evidencia en contra de
la hipótesis nula. Las probabilidades más bajas proporcionan una
evidencia más fuerte en contra de la hipótesis nula.
Interpretación
FIV
El factor de inflación de la varianza (FIV) indica cuánto se
infla la varianza de un coeficiente debido a las
correlaciones entre los predictores incluidos en el modelo.
Interpretación
Utilice los FIV para describir cuánta multicolinealidad (que
es la correlación entre los predictores) existe en un análisis
de regresión. La multicolinealidad es problemática porque
puede aumentar la varianza de los coeficientes de
regresión, lo que hace difícil evaluar el impacto individual
que cada uno de los predictores correlacionados tiene
sobre la respuesta.
FIV = 1 No correlacionados