Sie sind auf Seite 1von 8

OBTENCIN DE PREDICCIONES Y ANLISIS DE RESIDUOS

El modelo permite generar predicciones para el valor esperado o para un valor individual de la variable

dependiente (Y) asociado a un valor dado de la variable independiente (X). En ambos casos la prediccin
puntual es la misma y se obtiene sustituyendo en el modelo estimado el valor X0 para el cual se desea
realizar la prediccin.

Para obtener el intervalo de confianza de los pronsticos y/o contrastar si puede aceptarse un determinado

valor de Y condicionado a un valor X0 es necesario calcular el error estndar de la prediccin, el cual


depender del valor pronosticado:

Prediccin del valor esperado de Y para X=X0,

Prediccin del valor individual de Y para X=X0,

Para obtener las predicciones se debe acceder al cuadro de dilogo Regresin Lineal: Guardar nuevas
variables con el botn Guardar:
El bloque Valores pronosticados presenta una serie de opciones que permiten guardar en el
archivo activo las predicciones No tipificadas y Tipificadas correspondientes a los casos incluidos

en la estimacin y las predicciones correspondientes a los casos no incluidos obtenidas a partir


del modelo estimado. Con la opcin Corregidos se obtienen los valores ajustados para cada caso
calculados a partir de la recta estimada exluyendo el caso (por lo tanto, se realizan tantas
estimaciones de la recta como casos incluidos en la muestra). La opcin E.T. del pronstico
promedio proporciona el error tpico de las predicciones del valor esperado.

El bloque Residuos permite guardar en el archivo activo los residuos correspondientes a los casos
incluidos en la estimacin No tipificados, Tipificados y Estudentizados. Con las opciones

Eliminados y Eliminados estudentizados se guardan los residuos correspondientes a las


regresiones obtenidas excluyendo el caso correspondiente.

El bloque Intervalos de pronstico calcula intervalos de confianza para las predicciones de la


Media y/o los Individuos para el nivel de confianza deseado (95% de confianza por defecto).

Si se desea guardar estos resultados en un archivo nuevo se activa la opcin Estadsticos de los

coeficientes y se indica el nombre del archivo.

EJEMPLOS

Ejemplo 1.
Con las variables Peso y Est (estatura) del archivo Encinf.sav analizadas en el ltimo ejemplo del captulo
3* estime el modelo de regresin lineal simple que explica el comportamiento del Peso (variable

dependiente) en funcin de la Est (variable independiente). Realice la estimacin con los 100 primeros
casos.

Con la secuencia Analizar > Regresin > Lineal aparece el correspondiente cuadro de dilogo en el que se

seleccionan la variable Peso como Dependiente y la variable Est como Independiente. En el recuadro
Variable de seleccin se introduce la variable Enc (nmero de encuesta) y con el botn Regla se abre el
cuadro de dilogo Regresin Lineal: Establecer regla donde se introduce la condicin 'menor o igual que

100'.

Los resultados que se obtienen son:

En el cuadro resumen del modelo se observa que: r=0,883, R2=0,78 (obsrvese que R2 es igual a r al
cuadrado) y Su=6,0638. El coeficiente de determinacin indica que el 78% de la variacin total del peso

en la muestra queda explicada por el modelo estimado y, por lo tanto, el modelo proporciona un buen
ajuste.
El cuadro Coeficientes presenta los siguientes resultados:

- Modelo estimado: =-132,783 + 1,148Est.

- Errores tpicos (errores estndar) de las estimaciones de los parmetros y : Sa=10,613 y Sb=0,062.

- Coeficientes beta, que se obtienen estimando la regresin a partir de las observaciones estandarizadas.
En la regresin simple este coeficiente coincide con el coeficiente de correlacin lineal simple, r.

- Estadsticos t de los contrastes de significacin de las estimaciones y sus correspondientes niveles de

significacin crticos: =-12,511 y =18,662. En este caso las estimaciones son


significativamente distintas decero para cualquier nivel de significacin.

Ejemplo 2.

Compruebe si existen valores extremos y analice el comportamiento de los residuos del modelo de

regresin lineal estimado en el apartado anterior.

Con la secuencia Analizar > Regresin > Lineal aparece el correspondiente cuadro de dilogo en el que se
mantienen seleccionadas la variable Peso como Dependiente y la variable Est como Independiente. Con el
botn Estadsticos se accede al cuadro de dilogo que presenta las opciones correspondientes al

diagnstico de residuos. Se activa Diagnstico por caso y Valores atpicos a ms de 2 desviaciones tpicas.
- Se observa que nicamente un caso presenta un resduo estandarizado, igual a 2,046, superior a 2 veces
la desviacin estndar. Esto nos indica que no existe ningn caso atpico.

- En el cuadro Estadsticos sobre los residuos se comprueba que efectivamente no hay valores atpicos ya
que los valores mximo y mnimo de los residuos tipificados son inferiores a 3 en valor absoluto.

Con el botn Grficos se abre el cuadro de dilogo donde se deben activar las opciones correspondientes

a los Grficos de residuos tipificados.

El histograma de los residuos permite comprobar grficamente la hiptesis de normalidad; aspecto que

deber tenerse en cuenta para la interpretacin de los resultados de la inferencia estadstica. En este caso
vemos que la distribucin es campaniforme pero presenta una laguna en el centro que puede ser, en parte,
consecuencia de los intervalos definidos.
El diagrama P-P compara la frecuencia acumulada por los residuos tipificados con la probabilidad esperada
bajo la hiptesis de normalidad. Se observa que estas diferencias podran ser significativas en alguna zona

del grfico; lo cual, de ser cierto, pondra en duda la validez de la hiptesis de normalidad de los residuos.
No obstante, el criterio para decidir si se puede rechazar la hiptesis de normalidad ser el que proporcione
alguno de los contrastes de normalidad.

Adems, en el mismo cuadro de dilogo se puede pedir que elabore los diagramas de dispersin de, por

ejemplo, los residuos estandarizados en funcin de la variable dependiente (ZRESID y DEPENDNT).


En el grfico vemos que no existe ningn patrn de comportamiento de los residuos respecto a Y. Por lo
tanto, podemos mantener que estas variables aleatorias estn incorrelacionadas.

Ejemplo 3.

Obtenga las predicciones y los residuos correspondientes a los 100 casos incluidos en la estimacin y a

los 14 casos excluidos.

Con la secuencia Analizar > Regresin > Lineal aparece el correspondiente cuadro de dilogo en el que se
mantienen seleccionadas la variable Peso como Dependiente y la variable Est como Independiente. Con el
botn Guardar se abre el cuadro de dilogo donde se deben activar las opciones:

Valores Pronosticados > No tipificados y Tipificados para obtener las predicciones a partir del
modelo estimado.

Residuos > No tipificados y Tipificados para obtener los residuos de todos los casos.

Intervalos de Pronstico > Media e Individuos para obtener los lmites de los intervalos.

Los resultados de estas opciones quedan almacenados en el archivo de datos activo, y estn disponibles
para anlisis posteriores. Por defecto los nombres de las variables que crea son: Pre_1 (predicciones no
estandarizadas), Res_1 (residuos no estandarizados), Zpr_1, Zre_1(predicciones y residuos

estandarizados, respectivamente), Sep_1 (error estndar de las predicciones), Imci_1, Unci_1 (Lmite
inferior y superior del intervalo de confianza para la prediccin del valor esperado de Y), Lici_1, Uici_1
(Lmite inferior y superior del intervalo de confianza para la prediccin individual de Y).
Por ejemplo, para el caso 101, que presenta una estatura de 168 y un pesoigual a 56, los resultados son:

- Prediccin del peso sin tipificar 60,04886 Kg. y tipificada -0,43094.

- Residuos, no tipificados y tipificados, -4,04886 y -0,66771, respectivamente.

- Error estndar de la prediccin 0,66081.

- Intervalo de confianza para el valor esperado de Y para los individuos con estatura 168 (58,73751 ;

61,36022).

- Intervalo de confianza para el valor individual (47,94423 ; 72,15350).

Das könnte Ihnen auch gefallen