Regresion

MAESTRA EN INGENIERA APLICADA CON
ORIENTACIN EN RECURSOS HIDRULICOS

Mtodos
Estadsticos
Manual del SPSS.
Dr. Julin Gonzlez Trinidad
Zacatecas, Zac. Septiembre 2014
Ing. Sergei Hernndez Guerrero

1. Regresin

El submen Regresin del men Analizar proporciona tcnicas de regresin.

1.1. Regresin lineal

La regresin lineal estima los coeficientes de la ecuacin lineal, con una o ms
variables independientes, que mejor prediga el valor de la variable dependiente.
Por ejemplo, puede intentar predecir el total de ventas anuales de un vendedor (la
variable dependiente) a partir de variables independientes tales como la edad, la
formacin y los aos de experiencia.

Estadsticos. Para cada variable: nmero de casos vlidos, media y desviacin
tpica. Para cada modelo: coeficientes de regresin, matriz de correlaciones,
correlaciones parciales y semiparciales, R multiple, Rcuadrado, Rcuadrado
corregida, cambio en Rcuadrado, error tpico de la estimacin, tabla de anlisis de
varianza, valores pronosticados y residuos. Adems, intervalos de confianza al
95% para cada coeficiente de regresin, matriz de varianzas-covarianzas, factor
de inflacin de la varianza, tolerancia, prueba de Durbin-Watson, medidas de
distancia (Mahalanobis, Cook y valores de influencia), DfBeta, DfAjuste, intervalos
de pronstico y diagnsticos por caso. Grficos: diagramas de dispersin, grficos
parciales, histogramas y grficos de probabilidad normal.

Datos. Las variables dependiente e independientes deben ser cuantitativas. Las
variables categricas, como la religin, estudios principales o el lugar de
residencia, han de recodificarse como variables binarias (dummy) o como otros
tipos de variables de contraste.

Supuestos. Para cada valor de la variable independiente, la distribucin de la
variable dependiente debe ser normal. La varianza de distribucin de la variable

dependiente debe ser constante para todos los valores de la variable
independiente. La relacin entre la variable dependiente y cada variable
independiente debe ser lineal y todas las observaciones deben ser
independientes.

Para utilizar correlaciones bivariadas. En los mens, seleccionar: Analyze,
Regression , Linear

Ruta de seleccin Regresin Lineal.

Cuadro de dialogo Regresin Lineal.

En el cuadro de dilogo Regresin lineal, seleccione una variable numrica
dependiente.

Seleccione una o ms variables numricas independientes.

Si lo desea, puede:

Agrupar variables independientes en bloques y especificar distintos
mtodos de entrada para diferentes subconjuntos de variables.

Elegir una variable de seleccin para limitar el anlisis a un subconjunto de
casos que tengan valores particulares para esta variable.

Seleccionar una variable de identificacin de casos para identificar los
puntos en los diagramas.

Seleccione una variable numrica de Ponderacin MCP para el anlisis de
mnimos cuadrados ponderados.

MCP. Permite obtener un modelo de mnimos cuadrados ponderados. Los puntos
de los datos se ponderan por los inversos de sus varianzas. Esto significa que las
observaciones con varianzas grandes tienen menor impacto en el anlisis que las
observaciones asociadas a varianzas pequeas. Si el valor de la variable de
ponderacin es cero, negativo o perdido, el caso queda excluido del anlisis.

La seleccin del mtodo permite especificar cmo se introducen las variables
independientes en el anlisis. Utilizando distintos mtodos se pueden construir
diversos modelos de regresin a partir del mismo conjunto de variables.

Introducir (Regresin). Procedimiento para la seleccin de variables en el
que todas las variables de un bloque se introducen en un solo paso.

Por pasos. En cada paso se introduce la variable independiente que no se
encuentre ya en la ecuacin y que tenga la probabilidad para F ms
pequea, si esa probabilidad es suficientemente pequea. Las variables ya
introducidas en la ecuacin de regresin se eliminan de ella si su
probabilidad para F llega a ser suficientemente grande. El mtodo termina
cuando ya no hay ms variables candidatas a ser incluidas o eliminadas.

Eliminar. Procedimiento para la seleccin de variables en el que las
variables de un bloque se eliminan en un solo paso.

Eliminacin hacia atrs. Procedimiento de seleccin de variables en el
que se ntroducen todas las variables en la ecuacin y despus se van

excluyendo una tras otra. Aquella variable que tenga la menor correlacin
parcial con la variable dependiente ser la primera en ser considerada para
su exclusin. Si satisface el criterio de eliminacin, se eliminar. Tras haber
excluido la primera variable, se pondr a prueba aquella variable, de las
que queden en la ecuacin, que presente una correlacin parcial ms
pequea. El procedimiento termina cuando ya no quedan en la ecuacin
variables que satisfagan el criterio de exclusin.

Seleccin hacia adelante. Procedimiento de seleccin de variables por
pasos en el que las variables se introducen secuencialmente en el modelo.
La primera variable que se considerar introducir en la ecuacin ser la que
tenga mayor correlacin, positiva o negativa, con la variable dependiente.
Dicha variable se introducir en la ecuacin slo si cumple el criterio de
entrada. Si se introduce la primera variable, a continuacin se considerar
la variable independiente cuya correlacin parcial sea la mayor y que no
est en la ecuacin. El procedimiento termina cuando ya no quedan
variables que cumplan el criterio de entrada.

Cuadro de dialogo Regresin Lineal: Establecer regla.

Los casos definidos por la regla de seleccin se incluyen en el anlisis. Por
ejemplo, si selecciona una variable, elija igual que y escriba 5 para el valor; de
este modo, solamente se incluirn en el anlisis los casos para los cuales la
variable seleccionada tenga un valor igual a 5. Tambin se permite un valor de
cadena.

Cuadro de dialogo Regresin Lineal: Grficos.

Los grficos pueden ayudar a validar los supuestos de normalidad, linealidad e
igualdad de las varianzas. Tambin son tiles para detectar valores atpicos,
observaciones poco usuales y casos de influencia. Tras guardarlos como nuevas
variables, dispondr en el Editor de datos de los valores pronosticados, los
residuos y otros valores diagnsticos, con los cuales podr poder crear grficos
respecto a las variables independientes. Se encuentran disponibles los siguientes
grficos:

Diagramas de dispersin. Puede representar cualquier combinacin por
parejas de la lista siguiente: la variable dependiente, los valores
pronosticados tipificados, los residuos tipificados, los residuos eliminados,
los valores pronosticados corregidos, los residuos estudentizados o los
residuos eliminados estudentizados. Represente los residuos tipificados
frente a los valores pronosticados tipificados para contrastar la linealidad y
la igualdad de las varianzas.

Lista de variables de origen. Muestra una lista con la variable
dependiente (DEPENDNT) y las siguientes variables pronosticadas y
residuales: Valores pronosticados tipificados (*ZPRED), Residuos
tipificados (*ZRESID), Residuos eliminados (*DRESID), Valores
pronosticados corregidos (*ADJPRED), Residuos estudentizados
(*SRESID) y Residuos estudentizados eliminados (*SDRESID).

Generar todos los grficos parciales. Muestra los diagramas de
dispersin de los residuos de cada variable independiente y los residuos de
la variable dependiente cuando se regresan ambas variables por separado
sobre las restantes variables independientes. En la ecuacin debe haber al
menos dos variables independientes para que se generen los grficos
parciales.

Grficos de residuos tipificados. Puede obtener histogramas de los
residuos tipificados y grficos de probabilidad normal que comparen la
distribucin de los residuos tipificados con una distribucin normal.

Cuadro de dialogo Regresin Lineal: Guardar.

Puede guardar los valores pronosticados, los residuos y otros estadsticos tiles
para los diagnsticos. Cada seleccin aade una o ms variables nuevas a su
archivo de datos activo.

Valores pronosticados. Son los valores que el modelo de regresin pronostica
para cada caso.

No tipificados. Valor pronosticado por el modelo para la variable
dependiente.

Tipificados. Transformacin de cada valor pronosticado a su forma
tipificada. Es decir, se sustrae el valor pronosticado medio al valor
pronosticado y el resultado se divide por la desviacin tpica de los valores
pronosticados. Los valores pronosticados tipificados tienen una media de 0
y una desviacin tpica de 1.

Corregidos. Valor pronosticado para un caso cuando dicho caso no se
incluye en los clculos de los coeficientes de regresin.

E.T. del pronstico promedio. Error tpico de los valores pronosticados.
Estimacin de la desviacin tpica del valor promedio de la variable
dependiente para los casos que tengan los mismos valores en las variables
independientes.

Distancias. Son medidas para identificar casos con combinaciones poco usuales
de valores para las variables independientes y casos que puedan tener un gran
impacto en el modelo.

Mahalanobis. Medida de cunto difieren del promedio para todos los casos
los valores en las variables independientes de un caso dado. Una distancia
de Mahalanobis grande identifica un caso que tenga valores extremos en
una o ms de las variables independientes.

Cooks. Una medida de cunto cambiaran los residuos de todos los casos
si un caso particular se excluyera del clculo de los coeficientes de
regresin. Una Distancia de Cook grande indica que la exclusin de ese
caso del clculo de los estadsticos de regresin har variar
substancialmente los coeficientes.

Valores de influencia. Mide la influencia de un punto en el ajuste de la
regresin. Influencia centrada vara entre 0 (no influye en el ajuste) a (N-
1)/N.

Intervalos de pronstico. Los lmites superior e inferior para los intervalos de
pronstico individual y promedio.

Media. Lmites inferior y superior (dos variables) para el intervalo de
prediccin de la respuesta pronosticada promedio.

Individual. Lmites superior e inferior (dos variables) del intervalo de
prediccin para la variable dependiente para un caso individual.

Intervalo de confianza. Introduzca un valor entre 1 y 99,99 para
especificar el nivel de confianza para los dos intervalos de prediccin. Debe
seleccionar Media o Individuos antes de introducir este valor. Los valores
habituales de los intervalos de confianza son 90, 95 y 99.

Residuos. El valor actual de la variable dependiente menos el valor pronosticado
por la ecuacin de regresin.

No tipificados. Diferencia entre un valor observado y el valor pronosticado
por el modelo.

Tipificados. El residuo dividido por una estimacin de su error tpico. Los
residuos tipificados, que son conocidos tambin como los residuos de
Pearson o residuos estandarizados, tienen una media de 0 y una
desviacin tpica de 1.

Mtodo de Student. Residuo dividido por una estimacin de su desviacin
tpica que vara de caso en caso, dependiendo de la distancia de los
valores de cada caso en las variables independientes respecto a las medias
en las variables independientes.

Eliminados. Residuo para un caso cuando ste se excluye del clculo de
los coeficientes de la regresin. Es igual a la diferencia entre el valor de la
variable dependiente y el valor pronosticado corregido.

Eliminados estudentizados. Residuo eliminado para un caso dividido por
su error tpico. La diferencia entre un residuo eliminado estudentizado y su
residuo estudentizado asociado indica la diferencia que implica el eliminar
un caso sobre su propia prediccin.

Estadsticos de influencia. El cambio en los coeficientes de regresin (DfBeta) y
en los valores pronosticados (DfAjuste) que resulta de la exclusin de un caso
particular. Tambin estn disponibles los valores tipificados para las DfBeta y para
las DfAjuste, junto con la razn entre covarianzas.

DfBeta(s). La diferencia en el valor de beta es el cambio en el valor de un
coeficiente de regresin que resulta de la exclusin de un caso particular.
Se calcula un valor para cada trmino del modelo, incluyendo la constante.

DfBeta tipificada. Valor de la diferencia en beta tipificada. El cambio
tipificado en un coeficiente de regresin cuando se elimina del anlisis un
caso particular. Puede interesarle examinar aquellos casos cuyos valores
absolutos sean mayores que 2 dividido por la raz cuadrada de N, donde N
es el nmero de casos. Se calcula un valor para cada trmino del modelo,
incluyendo la constante.

DfAjuste. La diferencia en el valor ajustado es el cambio en el valor
pronosticado que resulta de la exclusin de un caso particular.

DfAjuste tipificado. Diferencia tipificada en el valor ajustado. El cambio,
tipificado, en el valor pronosticado que resulta de la exclusin de un caso
particular. Puede interesarle examinaraquellos valores tipificados cuyo
valor absoluto sea mayor que 2 dividido por la raz cuadrada de p/N, donde
p es el nmero de variables independientes en la ecuacin y N es el
nmero de casos.

Razn entre covarianzas. Razn del determinante de la matriz de
covarianza con un caso particular excluido del clculo de los coeficientes de
regresin, respecto al determinante de la matriz de covarianza con todos
los casos incluidos. Si la razn se aproxima a 1, el caso no altera
significativamente la matriz de covarianza.

Estadsticos de los coeficientes. Almacena los coeficientes de regresin en un
conjunto de datos o en un archivo de datos. Los conjuntos de datos estn
disponibles para su uso posterior durante la misma sesin, pero no se guardarn
como archivos a menos que se hayan guardado explcitamente antes de que
finalice la sesin. El nombre de un conjunto de datos debe cumplir las normas de
denominacin de variables.

Exportar informacin del modelo a un archivo XML. Las estimaciones de los
parmetros y (si lo desea) sus covarianzas se exportan al archivo especificado en
formato XML (PMML). SmartScore y SPSS Statistics Server (un producto
independiente) pueden utilizar este archivo del modelo para aplicar la informacin
del modelo en otros archivos de datos con fines de puntuacin.

Cuadro de dialogo Regresin Lineal: Estadsticos.

Se encuentran disponibles los siguientes estadsticos:

Coeficientes de regresin. La opcin Estimaciones muestra el coeficiente
de regresinB, el error tpico de B, el coeficiente beta tipificado, el valor de t para B
y el nivel de significacin bilateral t. Intervalos de confianza muestra intervalos de
confianza con el nivel de confianza especificado para cada coeficiente de
regresin o una matriz de covarianzas. Matriz de covarianzas muestra una matriz
de varianzas-covarianzas de los coeficientes de regresin, con las covarianzas
fuera de la diagonal y las varianzas en la diagonal. Tambin se muestra una matriz
de correlaciones.

Ajuste del modelo. Presenta una lista de las variables introducidas y eliminadas
del modelo y muestra los siguientes estadsticos de bondad de ajuste: R mltiple,
R
cuadrado
y R
cuadrado
corregida, error tpico de la estimacin y tabla de anlisis de la
varianza.

Cambio en R cuadrado. Cambio en el estadstico Rcuadrado que se produce al
aadir o eliminar una variable independiente. Si es grande el cambio en
Rcuadrado asociado a una variable, esto significa que esa variable es un buen
predictor de la variable dependiente.

Descriptivos. Proporciona el nmero de casos vlidos, la media y la desviacin
tpica para cada variable en el anlisis. Tambin muestra una matriz de
correlaciones con el nivel de significacin unilateral y el nmero de casos para
cada correlacin.

Correlacin parcial. La correlacin remanente entre dos variables despus de
haber eliminado la correlacin debida a su asociacin mutua con otras variables.
La correlacin entre una variable dependiente y una variable independiente
cuando se han eliminado de ambas los efectos lineales de las otras variables
independientes del modelo.

Correlacin semiparcial. La correlacin entre la variable dependiente y una
variable independiente cuando se han eliminado de la variable independiente los
efectos lineales de las otras variables independientes del modelo. Est
relacionada con el cambio en R cuadrado cuando una variable se aade a una
ecuacin. En ocasiones e denomina correlacin semiparcial.

Diagnsticos de colinealidad. La colinealidad (o multicolinealidad) es una
situacin no deseable en la que una de las variables independientes es una
funcin lineal de otras variables independientes. Muestra los autovalores de la

matriz de productos cruzados no centrada y escalada, los ndices de condicin y
las proporciones de la descomposicin de la varianza junto con los factores de
inflacin de la varianza (FIV) y las tolerancias para las variables individuales.

Residuos. Presenta la prueba de Durbin-Watson sobre la correlacin serial de los
residuos y los diagnsticos por casos para los casos que cumplan el criterio de
seleccin (los valores atpicos por encima de n desviaciones tpicas).

Cuadro de dialogo Regresin Lineal: Opciones.

Se encuentran disponibles las siguientes opciones:

Criterios del mtodo por pasos. Estas opciones son aplicables si se ha
especificado el mtodo de seleccin de variables hacia adelante, hacia atrs o por
pasos. Las variables se pueden introducir o eliminar del modelo dependiendo de la
significacin (probabilidad) del valor de F o del propio valor de F.

Usar la probabilidad de F. Una variable se introduce en el modelo si el
nivel de significacin de su valor de F es menor que el valor de entrada, y

se elimina si el nivel de significacin de su valor de F es mayor que el valor
de salida. La entrada debe ser menor que la salida y ambos valores deben
ser positivos. Para introducir ms variables en el modelo, aumente el valor
de entrada. Para eliminar ms variables del modelo, disminuya el valor de
salida.

Usar valor de F. Una variable se introduce en el modelo si su valor de F es
mayor que el valor de entrada, y se elimina si su valor de F es menor que el
valor de salida. La entrada debe ser mayor que la salida y ambos valores
deben ser positivos. Para introducir ms variables en el modelo, disminuya
el valor de entrada. Para eliminar ms variables del modelo, eleve el valor
de salida.

Incluir la constante en la ecuacin. Por defecto, el modelo de regresin incluye
un trmino constante. Si se anula la seleccin de esta opcin se obtiene la
regresin que pasan por el origen, lo cual se hace raramente. Algunos resultados
de la regresin que pasan por el origen no son comparables con los resultados de
la regresin que s incluyen una constante. Por ejemplo, R
2
no puede interpretarse
de la manera usual.

Valores perdidos. Puede elegir uno de los siguientes:

Excluir casos segn lista. Slo se incluirn en el anlisis los casos con
valores vlidos para todas las variables.
Excluir casos segn pareja. Los casos con datos completos para la pareja
de variables correlacionadas se utilizan para calcular el coeficiente de
correlacin en el cual se basa el anlisis de regresin. Los grados de
libertad se basan en el N mnimo de las parejas.

Reemplazar por la media. Se emplean todos los casos en los

1.2. Estimacin curvilnea

El procedimiento Estimacin Curvilnea genera estadsticos de estimacin
curvilnea por regresin y grficos relacionados para 11 modelos diferentes de
estimacin curvilnea por regresin. Se produce un modelo diferente para cada
variable dependiente. Tambin se pueden guardar valores pronosticados, residuos
e intervalos pronosticados como nuevas variables.

Estadsticos. Para cada modelo: coeficientes de regresin, R mltiple, R
2
, R
2

corregida, error tpico de la estimacin, tabla de anlisis de varianza, valores
pronosticados, residuos e intervalos de pronstico. Modelos: lineal, logartmico,
inverso, cuadrtico, cbico, de potencia, compuesto, curva-S, logstico, de
crecimiento y exponencial.

Datos. Las variables dependientes e independientes deben ser cuantitativas. Si
selecciona Tiempo del conjunto de datos activo como variable independiente (en
lugar de una variable), el procedimiento Estimacin curvilnea generar una
variable de tiempo en la que la distancia temporal entre los casos es uniforme. Si
se selecciona Tiempo, la variable dependiente debe ser una medida de serie
temporal. El anlisis de series temporales requiere una estructura particular para
los archivos de datos, de manera que cada caso (cada fila) represente un conjunto
de observaciones en un momento determinado del tiempo y que la distancia
temporal entre los casos sea uniforme.

Supuestos. Represente los datos grficamente para determinar cmo se
relacionan las variables dependientes e independiente (linealmente,
exponencialmente, etc.). Los residuos de un buen modelo deben distribuirse de
forma aleatoria y normal. Si se utiliza un modelo lineal, se deben cumplir los
siguientes supuestos: Para cada valor de la variable independiente, la distribucin

de la variable dependiente debe ser normal. La varianza de distribucin de la
variable dependiente debe ser constante para todos los valores de la variable
independiente. La relacin entre la variable dependiente y la variable
independiente debe ser lineal y todas las observaciones deben ser
independientes.

Regression , Curve Estimation

Ruta de seleccin Estimacin curvilnea.

Cuadro de dialogo Estimacin Curvilnea.

Seleccione una o ms variables dependientes. Se produce un modelo diferente
para cada variable dependiente.

Seleccione una variable independiente (seleccione una variable del conjunto de
datos activo o Tiempo).

Si lo desea:

Seleccionar una variable para etiquetar los casos en los diagramas de
dispersin. Para cada punto en el diagrama de dispersin, se puede utilizar
la herramienta de Identificacin de puntos para mostrar el valor de la
variable utilizada en Etiquetas de caso.

Pulsar en Guardar para guardar los valores pronosticados, los residuos y
los intervalos de pronstico como nuevas variables.

Tambin se encuentran disponibles las siguientes opciones:

Incluir la constante en la ecuacin. Estima un trmino constante en la
ecuacin de regresin. La constante se incluye por defecto.

Representar los modelos. Representa los valores de la variable
dependiente y cada modelo seleccionado frente a la variable independiente.
Se genera un grfico distinto para cada variable dependiente.

Ver tabla de ANOVA. Muestra una tabla de anlisis de varianza de
resumen para cada modelo seleccionado.

Modelos del procedimiento Estimacin curvilnea.

Se puede seleccionar uno o ms modelos de estimacin curvilnea por regresin.
Para determinar qu modelo utilizar, represente los datos. Si las variables parecen
estar relacionadas linealmente, utilice un modelo de regresin lineal simple.
Cuando las variables no estn relacionadas linealmente, intente transformar los
datos. Cuando la transformacin no resulte til, puede necesitar un modelo ms
complicado. Inspeccione un diagrama de dispersin de los datos; si el diagrama se
parece a una funcin matemtica reconocible, ajuste los datos a ese tipo de
modelo.
Por ejemplo, si los datos se parecen a una funcin exponencial, utilice un modelo
exponencial.

Lineal. Modelo cuya ecuacin es Y = b0 + (b1 * t). Los valores de la serie
se modelan como una funcin lineal del tiempo.

Logartmica. Modelo cuya ecuacin es Y = b0 + (b1 * ln(t)).

Inversa. Modelo cuya ecuacin es Y = b0 + (b1 / t).

Cuadrtico. Modelo cuya ecuacin es Y = b0 + (b1 * t) + (b2 * t**2). El
modelo cuadrtico puede utilizarse para modelar una serie que "despega" o
una serie que se amortigua.

Cbico. Modelo definido por la ecuacin Y = b0 + (b1 * t) + (b2 * t**2) + (b3
* t**3).

Potencia. Modelo cuya ecuacin es Y = b0 * (t**b1) ln(Y) = ln(b0) + (b1 *
ln(t)).

Compuesto. Modelo cuya ecuacin es Y = b0 * (b1**t) ln(Y) = ln(b0) +
(ln(b1) * t).

Curva-S. Modelo cuya ecuacin es Y = e**(b0 + (b1/t)) o ln(Y) = b0 + (b1/t).

Logstica. Modelo cuya ecuacin es Y = 1 / (1/u + (b0 * (b1**t))) o ln(1/y-
1/u) = ln (b0) + (ln(b1) * t) donde u es el valor del lmite superior. Despus
de seleccionar Logstico, especifique un valor para el lmite superior que se
utilizar en la ecuacin de regresin. El valor debe ser un nmero positivo
mayor que el valor mximo de la variable dependiente.

Crecimiento. Modelo cuya ecuacin es Y = e**(b0 + (b1 * t)) ln(Y) = b0 +
(b1 * t).

Exponencial. Modelo cuya ecuacin es Y = b0 * (e**(b1 * t)) ln(Y) = ln(b0)
+ (b1 *t).

Cuadro de dialogo Estimacin Curvilnea: Guardar.

Guardar variables. Para cada modelo seleccionado se pueden guardar los
valores pronosticados, los residuos (el valor observado de la variable dependiente
menos el valor pronosticado por el modelo) y los intervalos de pronstico (sus
lmites superior e inferior). En la ventana de resultados, se muestran en una tabla
los nombres de las nuevas variables y las etiquetas descriptivas.

Pronosticar casos. En el conjunto de datos activo, si se selecciona Tiempo como
variable independiente en lugar de una variable, se puede especificar un perodo
de prediccin que vaya ms all del final de la serie temporal. Puede elegir una de
las siguientes alternativas:

Desde el perodo de estimacin hasta el ltimo caso. Pronostica los
valores para todos los casos del archivo, basndose en los casos del
perodo de estimacin. El perodo de estimacin, que se muestra en la
parte inferior del cuadro de dilogo, se define con el subcuadro de dilogo
Rango de la opcin Seleccionar casos en el men Datos. Si no se ha
definido un perodo de estimacin, se utilizan todos los casos para
pronosticar los valores.

Predecir hasta. Predice los valores hasta la fecha especificada, hora o
nmero de observacin, basndose en los casos del perodo de estimacin.
Esta caracterstica se puede utilizar para predecir valores ms all del
ltimo caso de la serie temporal. Las variables definidas actualmente
determinan los cuadros de texto disponibles para especificar el final del
perodo de prediccin. Si no existen variables de fecha definidas, se puede
especificar el nmero de la observacin (caso) final.

Utilice la opcin de Definir fechas en el men Datos para crear las variables de
fecha.

1.3. Regresin Logstica Binaria

La regresin logstica resulta til para los casos en los que se desea predecir la
presencia o ausencia de una caracterstica o resultado segn los valores de un
conjunto de predictores. Es similar a un modelo de regresin lineal pero est
adaptado para modelos en los que la variable dependiente es dicotmica. Los
coeficientes de regresin logstica pueden utilizarse para estimar la razn de las
ventajas de cada variable independiente del modelo. La regresin logstica se
puede aplicar a un rango ms amplio de situaciones de investigacin que el
anlisis discriminante.

Estadsticos. Para cada anlisis: Casos totales, Casos seleccionados, Casos
vlidos. Para cada variable categrica: codificacin de los parmetros. Para cada
paso: variables introducidas o eliminadas, historial de iteraciones, 2 log de la
verosimilitud, bondad de ajuste, estadstico de bondad de ajuste de Hosmer-
Lemeshow, chi-cuadrado del modelo , chi-cuadrado de la mejora, tabla de
clasificacin, correlaciones entre las variables, grfico de las probabilidades
pronosticadas y los grupos observados, chi-cuadrado residual. Para cada variable
de la ecuacin: coeficiente (B), error tpico de B, Estadstico de Wald, razn de las
ventajas estimada (exp(B)), intervalo de confianza para exp(B), log de la

verosimilitud si el trmino se ha eliminado del modelo. Para cada variable que no
est en la ecuacin: estadstico de puntuacin. Para cada caso: grupo observado,
probabilidad pronosticada, grupo pronosticado, residuo, residuo tipificado.

Mtodos. Puede estimar modelos utilizando la entrada en bloque de las variables
o cualquiera de los siguientes mtodos por pasos: Condicional hacia adelante, LR
hacia adelante, Wald hacia adelante, Condicional hacia atrs, LR hacia atrs o
Wald hacia atrs.

Regression , Binary Logistic

Ruta de seleccin Regresin Logstica Binaria.

Cuadro de dialogo Regresin Logstica Binaria.

Los casos definidos por la regla de seleccin se incluyen en la estimacin del
modelo. Por ejemplo, si ha seleccionado una variable y la opcin igual que y ha
especificado 5 como valor, slo se incluirn en el anlisis aquellos casos para los
cuales la variable seleccionada tenga un valor igual a 5.

Tanto para los casos seleccionados como para los no seleccionados se generan
resultados de clasificaciones y estadsticos. De esta manera, se ofrece un
mecanismo para clasificar los nuevos casos basndose en datos ya existentes; o
tambin para realizar la particin de los datos en dos subconjuntos, uno de
entrenamiento y otro de prueba, que permiten la validacin del modelo generado.

Cuadro de dialogo Regresin Logstica Binaria: Definir variables categricas

Puede especificar los detalles sobre cmo el procedimiento Regresin logstica
manipular las variables categricas:

Covariables. Contiene una lista de todas las covariables especificadas en el
cuadro de dilogo principal para cualquier capa, bien por ellas mismas o como
parte de una interaccin. Si alguna de stas son variables de cadena o son
categricas, slo puede utilizarlas como covariables categricas.

Covariables categricas. Lista las variables identificadas como categricas.
Cada variable incluye una notacin entre parntesis indicando el esquema de
codificacin de contraste que va a utilizarse. Las variables de cadena (sealadas
con el smbolo < a continuacin del nombre) estarn presentes ya en la lista
Covariables categricas. Seleccione cualquier otra covariable categrica de la lista
Covariables y muvala a la lista Covariables categricas.

Cambiar el contraste. Le permite cambiar el mtodo de contraste. Los mtodos
de contraste disponibles son:

Indicador. Los contrastes indican la presencia o ausencia de la pertenencia
a una categora. La categora de referencia se representa en la matriz de
contraste como una fila de ceros.

Simple. Cada categora del predictor (excepto la propia categora de
referencia) se compara con la categora de referencia.

Diferencia. Cada categora del predictor, excepto la primera categora, se
compara con el efecto promedio de las categoras anteriores. Tambin se
conoce como contrastes de Helmert inversos.

Helmert. Cada categora del predictor, excepto la ltima categora, se
compara con el efecto promedio de las categoras subsiguientes.

Repetidas. Cada categora del predictor, excepto la primera categora, se
compara con la categora que la precede.

Polinmico. Contrastes polinmicos ortogonales. Se supone que las
categoras estn espaciadas equidistantemente. Los contrastes polinmicos
slo estn disponibles para variables numricas.

Desviacin. Cada categora del predictor, excepto la categora de
referencia, se compara con el efecto global.

Si selecciona Desviacin, Simple o Indicador, elija Primera o ltima como
categora de referencia. Observe que el mtodo no cambia realmente hasta que
se pulsa en Cambiar.

Las covariables de cadena deben ser covariables categricas. Para eliminar una
variable de cadena de la lista Covariables categricas, debe eliminar de la lista

Covariables del cuadro de dilogo principal todos los trminos que contengan la
variable.

Cuadro de dialogo Regresin Logstica Binaria: Guardar.

Puede guardar los resultados de la regresin logstica como nuevas variables en
el conjunto de datos activo:

Valores pronosticados. Guarda los valores pronosticados por el modelo. Las
opciones disponibles son Probabilidades y Grupo de pertenencia.

Probabilidades. Para cada caso, guarda la probabilidad pronosticada de
aparicin del evento. En los resultados, una tabla muestra el nombre y el
contenido de cualquier variable nueva. El "evento" es la categora de la
variable dependiente con el valor ms alto; por ejemplo, si la variable
dependiente toma los valores 0 y 1, se guarda la probabilidad pronosticada
de categora 1.

Grupo de pertenencia pronosticado. Grupo con la mayor probabilidad
posterior, basado en puntuaciones discriminantes. El grupo pronosticado
por el modelo al cual pertenece el caso.

Influencia. Guarda los valores de estadsticos que miden la influencia de los
casos sobre los valores pronosticados. Las opciones disponibles son De Cook,
Valores de influencia y DfBeta(s).

Cooks. El anlogo, en la regresin logstica, al estadstico de influencia de
Cook. Una medida de cunto cambiaran los residuos de todos los casos si
un caso particular se excluyera del clculo de los coeficientes de regresin.

Valor de influencia. La influencia relativa de una observacin en el ajuste
del modelo.

DfBeta(s). La diferencia en el valor de beta es el cambio en el valor de un
coeficiente de regresin que resulta de la exclusin de un caso particular.
Se calcula un valor para cada trmino del modelo, incluyendo la constante.

Residuos. Guarda los residuos. Las opciones disponibles son No tipificados,
Logit, Mtodo de Student, Tipificados y Desviacin.

Residuos no tipificados. Diferencia entre un valor observado y el valor
pronosticado por el modelo.

Residuo logit. El residuo del caso si se pronostica en la escala logit. El
residuo logit es el residuo dividido por la probabilidad pronosticada
multiplicada por 1 menos la probabilidad pronosticada.

Residuo estudentizado. El cambio en la desvianza del modelo si se
excluye el caso.

Residuos tipificados. El residuo dividido por una estimacin de su error
tpico. Los residuos tipificados, que son conocidos tambin como los
residuos de Pearson o residuos estandarizados, tienen una media de 0 y
una desviacin tpica de 1.

Desvianza. Los residuos basados en la desviacin del modelo.

Exportar informacin del modelo a un archivo XML. Las estimaciones de los
parmetros y (si lo desea) sus covarianzas se exportan al archivo especificado en
formato XML (PMML). Puede utilizar este archivo de modelo para aplicar la
informacin del modelo a otros archivos de datos para puntuarlo.

1.4. Regresin logstica multinomial

La opcin Regresin logstica multinomial resulta til en aquellas situaciones en
las que desee poder clasificar a los sujetos segn los valores de un conjunto de
variables predictoras. Este tipo de regresin es similar a la regresin logstica,
pero ms general, ya que la variable dependiente no est restringida a dos
categoras.

Estadsticos. Historial de iteraciones, coeficientes de los parmetros, covarianza
asinttica y matrices de correlacin, pruebas de la razn de verosimilitud para los
efectos del modelo y los parciales, 2 log de la verosimilitud. Chi-cuadrado de la
bondad de ajuste de Pearson y de la desviacin. R2 de Cox y Snell, de
Nagelkerke y de McFadden. Clasificacin: frecuencias observadas respecto a las
frecuencias pronosticadas, por cada categora de respuesta. Tablas de
contingencia: frecuencias observadas y pronosticadas (con los residuos) y
proporciones por patrn en las covariables y por categora de respuesta.

Mtodos. Se ajusta un modelo logit multinomial para el modelo factorial completo
o para un modelo especificado por el usuario. La estimacin de los parmetros se
realiza a travs de un algoritmo iterativo de mxima verosimilitud.

Datos. La variable dependiente debe ser categrica. Las variables independientes
pueden ser factores o covariables. En general, los factores deben ser variables
categricas y las covariables deben ser variables continuas.

Supuestos. Se asume que la razn de ventajas de cualquier par de categoras es
independiente de las dems categoras de respuesta. Segn esta suposicin, por
ejemplo, si se introduce un nuevo producto en un mercado, las cuotas de mercado
de todos los dems productos se vern afectadas de manera igualmente
proporcional. De igual manera, dado un patrn en las covariables, se asume que
las respuestas son variables multinomiales independientes.

Regression, Multinomial Logistic

Ruta de seleccin Regresin logstica multinomial.

Cuadro de dialogo Regresin Logstica Multinomial.

Por defecto, el procedimiento Regresin logstica multinomial hace de la ltima
categora la categora de referencia. Este cuadro de dilogo le otorga el control
sobre la categora de referencia y sobre la forma de ordenar las categoras.

Categora de referencia. Especifique la primera, la ltima o una categora
personalizada.

Orden de categoras. En orden ascendente, el valor mnimo define la primera
categora, y el valor ms alto la ltima. En orden descendente, el valor mximo
define la primera categora y el valor inferior define la ltima.

Cuadro de dialogo Regresin Logstica Multinomial: Estadisticos.

Puede especificar los siguientes estadsticos para una regresin logstica
multinomial:

Resumen de procesamiento de casos. Esta tabla contiene informacin sobre las
variables categricas especificadas.

Modelo. Estadsticos del modelo global.

Pseudo R cuadrado. Imprime el estadstico de Cox y Snell, de Nagelkerke
y el R2 McFadden.

Resumen de pasos. Esta tabla resume los efectos introducidos o
eliminados en cada paso, mediante un mtodo por pasos. No se genera si
no se especifica un modelo por pasos en el cuadro de dilogo Modelo.

Informacin de ajuste de los modelos. Esta tabla compara los modelos
ajustado y de slo interseccin o nulo.

Criterios de informacin. Esta tabla imprime tanto el criterio de
informacin de Akaike (AIC) como el criterio de informacin bayesiano
(BIC).

Probabilidades de casilla. Imprime una tabla de las frecuencias
observadas y esperadas (con los residuos) y las proporciones por patrn en
las covariables y por categora de respuesta.

Tabla de clasificacin. Imprime una tabla de las respuestas observadas
respecto a las respuestas pronosticadas.

Estadsticos de bondad de ajuste de chi-cuadrado. Imprime los
estadsticos de chi-cuadrado de Pearson y de chi-cuadrado de la razn de
verosimilitud. Los estadsticos se calculan para los patrones en las
covariables determinados por todos los factores y las covariables o por un
subconjunto de los factores y las covariables definido por el usuario.

Medidas de monoticidad. Muestra una tabla con informacin sobre el
nmero de pares concordantes, pares discordantes y empates. La D de
Somers, la gamma de Goodman y Kruskal, la tau-a de Kendall y el ndice
de concordancia C tambin se muestran en esta tabla.

Parmetros. Estadsticos relativos a los parmetros del modelo.

Estimaciones. Imprime las estimaciones de los parmetros del modelo con
un nivel de confianza especificado por el usuario.

Contraste de la razn de verosimilitud. Imprime los contrastes de la
razn de verosimilitud para los efectos parciales del modelo. El contraste
para el modelo global se imprime de manera automtica.

Correlaciones asintticas. Imprime la matriz de las correlaciones entre las
estimaciones de los parmetros.

Covarianzas asintticas. Imprime la matriz de las covarianzas de las
estimaciones de los parmetros.

Definir subpoblaciones. Le permite seleccionar un subconjunto de factores y
covariables de manera que pueda definir los patrones en las covariables utilizados
por las probabilidades de casilla y las pruebas de bondad de ajuste.

Cuadro de dialogo Regresin Logstica Multinomial: Criterios.

Puede especificar los siguientes criterios para una regresin logstica multinomial:

Iteraciones. Le permite especificar el nmero mximo de veces que desea
recorrer el algoritmo, el nmero mximo de pasos en la subdivisin por pasos, las
tolerancias de convergencia para los cambios en el log de la verosimilitud y los
parmetros, la frecuencia con que se imprime el progreso del algoritmo iterativo y
en qu iteracin el procedimiento debe comenzar a comprobar la separacin
completa o casi completa de los datos.

Convergencia del logaritmo de la verosimilitud. Se asume la
convergencia si el cambio absoluto en la funcin log-verosimilitud es menor
que el valor especificado. Este criterio no se aplica si el valor es igual a 0.
Especifique un valor no negativo.

Convergencia de los parmetros. Se asume la convergencia si el cambio
absoluto en las estimaciones de los parmetros es menor que este valor.
Este criterio no se aplica si el valor es igual a 0.

Delta. Le permite especificar un valor no negativo inferior a 1. Este valor se aade
a cada casilla vaca de la tabla de contingencia de las categoras de respuesta por
patrones de covariables. Se ayuda as a estabilizar el algoritmo y evitar sesgos en
las estimaciones.

Tolerancia para la singularidad. Le permite especificar la tolerancia empleada en
la comprobacin de la singularidad.

Cuadro de dialogo Regresin Logstica Multinomial: Opciones.

Puede especificar las siguientes opciones para una regresin logstica multinomial:

Escala de dispersin. Le permite especificar el valor de escalamiento de la
dispersin que se va a utilizar para corregir la estimacin de la matriz de
covarianzas de los parmetros. Desviacin estima el valor de escalamiento
mediante el estadstico de la funcin de desviacin (chi-cuadrado de la razn de
verosimilitud. Pearson estima el valor de escalamiento mediante el estadstico chi-
cuadrado de Pearson. Tambin puede especificar su propio valor de escalamiento.
Debe ser un valor numrico positivo.

Opciones por pasos. Estas opciones le ofrecen el control de los criterios
estadsticos cuando se utilizan mtodos por pasos para generar un modelo.Se

ignoran salvo que se especifique un modelo por pasos en el cuadro de dilogo
Modelo.

Probabilidad de entrada. Se trata de la probabilidad del estadstico de la
razn de verosimilitud para la entrada de variables. Cuanto mayor sea la
probabilidad especificada, ms fcil resultar que una variable entre en el
modelo. Este criterio se ignora a menos que se seleccione uno de los
mtodos siguientes: hacia delante, pasos sucesivos hacia adelante o pasos
sucesivos hacia atrs.

Prueba de entrada. ste es el mtodo para introducir los trminos en los
mtodos por pasos. Escoja entre la prueba de la razn de verosimilitud y la
prueba de puntuacin. Este criterio se ignora a menos que se seleccione
uno de los mtodos siguientes: hacia delante, pasos sucesivos hacia
adelante o pasos sucesivos hacia atrs.

Probabilidad de eliminacin. Se trata de la probabilidad del estadstico de
la razn de verosimilitud para la eliminacin de variables. Cuanto mayor sea
la probabilidad especificada, ms fcil resultar que una variable
permanezca en el modelo. Este criterio se ignora a no ser que se
seleccione el mtodo de eliminacin hacia atrs, pasos sucesivos hacia

Prueba de eliminacin. ste es el mtodo utilizado para eliminar trminos
en los mtodos por pasos. Puede elegir entre la prueba de la razn de
verosimilitud o la prueba de Wald. Este criterio se ignora a no ser que se
seleccione el mtodo de eliminacin hacia atrs, pasos sucesivos hacia

Efectos por pasos mnimos en el modelo. Al utilizar los mtodos de
eliminacin hacia atrs o pasos sucesivos hacia atrs, se especifica el

mnimo nmero de trminos que puede incluirse en el modelo. La
interseccin no se cuenta como trmino de modelo.

Efectos por pasos mximos en el modelo. Al utilizar los mtodos de
entrada hacia delante o pasos sucesivos hacia adelante, se especifica el
mximo nmero de trminos que puede incluirse en el modelo. La
interseccin no se cuenta como trmino de modelo.

Restringir jerrquicamente la entrada y la eliminacin de trminos.
Esta opcin permite elegir si se desea aplicar restricciones a la inclusin de
trminos de modelo. La jerarqua precisa que para que se incluya un
trmino, todos los inferiores que formen parte del que se desea incluir se
encuentren antes en el modelo. Por ejemplo, si el requisito de jerarqua est
activado, los factores Estado civil y Sexo deben estar en el modelo antes de
poder aadir la interaccin Estado civil*Sexo. Las tres opciones en forma de
botn radial determinan el papel de las covariables a la hora de determinar
la jerarqua.

1.5. Regresin ordinal

La regresin ordinal permite dar forma a la dependencia de una respuesta ordinal
politmica sobre un conjunto de predictores, que pueden ser factores o
covariables. El diseo de la regresin ordinal se basa en la metodologa de
McCullagh (1980, 1998) y en la sintaxis se hace referencia al procedimiento como
PLUM.

El anlisis de regresin lineal ordinario implica minimizar las diferencias de la
suma de los cuadrados entre una variable de respuesta (la dependiente) y una
combinacin ponderada de las variables predictoras (las independientes). Los
coeficientes estimados reflejan cmo los cambios en los predictores afectan a la
respuesta. Se considera que la respuesta es numrica, en el sentido en que los

cambios en el nivel de la respuesta son equivalentes en todo el rango de la
respuesta. Por ejemplo, la diferencia de altura entre una persona que mide 150 cm
y una que mide 140 cm es de 10 cm, que tiene el mismo significado que la
diferencia de altura entre una persona que mide 210 cm y una que mide 200 cm.
Estas relaciones no se mantienen necesariamente con las variables ordinales, en
las que la eleccin y el nmero de categoras de respuesta pueden ser bastante
arbitrarios.

Estadsticos y grficos. Frecuencias observadas y esperadas y frecuencias
acumuladas, residuos de Pearson para las frecuencias y las frecuencias
acumuladas, probabilidades observadas y esperadas, probabilidades acumuladas
observadas y esperadas para cada categora de respuesta por patrn en las
covariables, matrices de correlaciones asintticas y de covarianzas entre las
estimaciones de los parmetros, chi-cuadrado de Pearson y chi-cuadrado de la
razn de verosimilitud, estadsticos de bondad de ajuste, historial de iteraciones,
contraste del supuesto de lneas paralelas, estimaciones de los parmetros,
errores tpicos, intervalos de confianza y estadsticos R2 de Cox y Snell, de
Nagelkerke y de McFadden.

Datos. Se asume que la variable dependiente es ordinal y puede ser numrica o
de cadena. El orden se determina al clasificar los valores de la variable
dependiente en orden ascendente. El valor inferior define la primera categora. Se
asume que las variables de factor son categricas. Las covariables deben ser
numricas. Observe que al usar ms de una covariable continua, se puede llegar a
crear una tabla de probabilidades de casilla muy grande.

Supuestos. Slo se permite una variable de respuesta y debe especificarse.
Adems, para cada patrn distinto de valores en las variables independientes, se
supone que las respuestas son variables multinomiales independientes.

Procedimientos relacionados. La regresin logstica nominal utiliza modelos
similares para las variables dependientes nominales.

Regression, Ordinal

Ruta de seleccin Regresin Ordinal.

Cuadro de dialogo Regresin Ordinal.

Cuadro de dialogo Regresin Ordinal: Opciones.

El cuadro de dilogo Opciones le permite ajustar los parmetros utilizados en el
algoritmo de estimacin iterativo, seleccionar un nivel de confianza para las
estimaciones de los parmetros y seleccionar una funcin de enlace.

Iteraciones. El algoritmo iterativo puede personalizarse.

Iteraciones mximas. Especifique un nmero entero no negativo. Si se
especifica el 0, el procedimiento devolver las estimaciones iniciales.

Mxima subdivisin por pasos. Especifique un nmero entero positivo.

Convergencia del logaritmo de la verosimilitud. El algoritmo se detiene
si el cambio absoluto o relativo en el logaritmo de la verosimilitud es inferior
a este valor. Si se especifica 0, no se utiliza el criterio.

Convergencia de los parmetros. El algoritmo se detiene si el cambio
absoluto o relativo en cada una de las estimaciones de los parmetros es
inferior a este valor. Si se especifica 0, no se utiliza el criterio.
Intervalo de confianza. Especifique un valor mayor o igual a 0 e inferior a 100.

Delta. El valor aadido a las frecuencias de casilla de cero. Especifique un valor
no negativo inferior a 1.

Tolerancia para la singularidad. Utilizada para comprobar los predictores con
alta dependencia. Seleccione un valor en la lista de opciones.

Funcin de enlace. La funcin de enlace es una transformacin de las
probabilidades acumuladas que permiten la estimacin del modelo.

Cuadro de dialogo Regresin Ordinal: Opciones.

El cuadro de dilogo Resultados le permite generar tablas que se pueden
visualizar en el Visor y guardar variables en el archivo de trabajo.

Mostrar. Genera tablas correspondientes a:

Imprimir el historial de iteraciones. El logaritmo de la verosimilitud y las
estimaciones de los parmetros se imprimen con la frecuencia de
iteraciones a imprimir especificada. Siempre se imprimen la primera y la
ltima iteracin.

Estadsticos de bondad de ajuste. Estadsticos chi-cuadrado de Pearson
y chi-cuadrado de la razn de verosimilitud. Estos estadsticos se calculan
segn la clasificacin especificada en la lista de variables.

Estadsticos de resumen. R2 de Cox y Snell, de Nagelkerke y de
McFadden.

Estimaciones de los parmetros. Estimaciones de los parmetros,
errores tpicos e intervalos de confianza.

Correlacin asinttica de las estimaciones de los parmetros. Matriz de
las correlaciones entre las estimaciones de los parmetros.

Covarianza asinttica de las estimaciones de los parmetros. Matriz de
las covarianzas entre las estimaciones de los parmetros.

Informacin de casilla. Frecuencias esperadas y observadas y
frecuencias acumuladas, residuos de Pearson para las frecuencias y las
frecuencias acumuladas, probabilidades esperadas y observadas y
probabilidades esperadas y observadas de cada categora de respuesta
segn el patrn en las covariables. Tenga en cuenta que en el caso de
modelos con muchos patrones de covariables (por ejemplo, modelos con
covariables continuas), esta opcin puede generar una tabla grande y poco
manejable.

Prueba de lneas paralelas. Prueba correspondiente a la hiptesis de que
los parmetros de ubicacin son equivalentes en todos los niveles de la
variable dependiente. Esta prueba est disponible nicamente para el
modelo de slo ubicacin.

Variables guardadas. Guarda las siguientes variables en el archivo de trabajo:

Probabilidades de respuesta estimadas. Probabilidades estimadas por el
modelo para la clasificacin de un patrn de factor/covariable en las
categoras de respuesta. El nmero de probabilidades es igual al nmero
de categoras de respuesta.

Categora pronosticada. La categora de respuesta con la mayor
probabilidad estimada para un patrn de factor/covariable.

Probabilidad de la categora pronosticada. Probabilidades estimada de
la clasificacin de un patrn factor/covariable en la categora pronosticada.
Esta probabilidad tambin es el mximo de las probabilidades estimadas
para el patrn de factor/covariable.

Probabilidad de la categora real. Probabilidad estimada de la
clasificacin de un patrn factor/covariable en la categora real.

Imprimir log-verosimilitud. Controla la representacin del logaritmo de la
verosimilitud. Incluir constante multinomial ofrece el valor completo de la
verosimilitud. Para comparar los resultados con los productos que no incluyan la
constante, puede seleccionar la opcin de excluirla.

Cuadro de dialogo Regresin Ordinal: Ubicacin.

El cuadro de dilogo Ubicacin le permite especificar el modelo de ubicacin para
el anlisis.

Especificar modelo. Un modelo de efectos principales contiene los efectos
principales de las covariables y los factores, pero no contiene efectos de
interaccin. Puede crear un modelo personalizado para especificar subconjuntos
de interacciones entre los factores o bien interacciones entre las covariables.

Factores y covariables. Muestra una lista de los factores y las covariables.

Modelo de ubicacin. El modelo depende de los efectos principales y de los de
interaccin que seleccione.

Cuadro de dialogo Regresin Ordinal: Escala.

El cuadro de dilogo Escala le permite especificar el modelo de escala para el
anlisis.

Factores y covariables. Muestra una lista de los factores y las covariables.

Modelo de escala. El modelo depende de los efectos principales y de los de
interaccin que seleccione.

1.6. Anlisis probit

Este procedimiento mide la relacin entre la intensidad de un estmulo y la
proporcin de casos que presentan una cierta respuesta a dicho estmulo. Es til
para las situaciones en las que se dispone de una respuesta dicotmica que se
piensa puede estar influenciada o causada por los niveles de alguna o algunas
variables independientes, y es particularmente adecuada para datos
experimentales. Este procedimiento le permitir estimar la intensidad necesaria
para que un estmulo llegue a inducir una determinada proporcin de respuestas,
como la dosis efectiva para la mediana.

Estadsticos. Coeficientes de regresin y errores tpicos, interseccin y su error
tpico, chi-cuadrado de Pearson de la bondad de ajuste, frecuencias observadas y
esperadas e intervalos de confianza para los niveles efectivos de la variable o
variables independientes. Grficos: grficos de respuestas transformadas.

Datos. Para cada valor de la variable independiente (o para cada combinacin de
valores para mltiples variables independientes), la variable de respuesta debe
contener el recuento del nmero de casos que presenta la respuesta de inters y
que toma dichos valores de la variable independiente, y la variable del total
observado debe ser el recuento del nmero total de casos con dichos valores para
la variable independiente. La variable de factor debe ser categrica, codificada
como enteros.

Supuestos. Las observaciones deben ser independientes. Si dispone de un gran
nmero de valores diferentes para las variables independientes respecto al

nmero de observaciones, como es probable que suceda en un estudio
observacional, puede que no sean vlidos los estadsticos de chi-cuadrado y de
bondad de ajuste.

Procedimientos relacionados. El anlisis probit est estrechamente relacionado
con la regresin logstica; de hecho, si elige la transformacin logit, este
procedimiento calcular esencialmente una regresin logstica. En general, el
anlisis probit es apropiado para los diseos experimentales, mientras que la
regresin logstica es ms adecuada para los estudios observacionales. Las
diferencias en los resultados reflejan estas diferencias de nfasis. El
procedimiento Anlisis probit informa de las estimaciones de los valores efectivos
para las diferentes tasas de respuesta (incluyendo la dosis efectiva para la
mediana), mientras que la Regresin logstica informa de las estimaciones de las
razones de las ventajas (odds ratios) para las variables independientes.

Regression, Probit

Ruta de seleccin Anlisis Probit.

Cuadro de dialogo Anlisis Probit.
Permite especificar los niveles de la variable de factor que sern analizados. Los
niveles de factor deben codificarse como enteros consecutivos; se analizarn
todos los niveles del rango que especifique.

Cuadro de dialogo Anlisis Probit: Opciones.

Puede especificar opciones para el anlisis probit:

Estadsticos. Permite solicitar los siguientes estadsticos opcionales: Frecuencias,
Potencia relativa de la mediana, Prueba de paralelismo e Intervalos de confianza
fiduciaria.

Potencia relativa de la mediana. Muestra la razn de las potencias de las
medianas para cada pareja de los niveles del factor. Tambin muestra los
lmites de confianza al 95% para cada potencia relativa de la mediana. Las
potencias relativas de la mediana no estn disponibles si no dispone de una
variable de factor, o si dispone de ms de una covariable.

Prueba de paralelismo. Contraste sobre la hiptesis de que todos los
niveles del factor tienen una pendiente comn.

Intervalos de confianza fiduciaria. Intervalos de confianza para la dosis
del gente requerida para producir una cierta probabilidad de respuesta.

Intervalos de confianza fiduciaria y Potencia relativa de la mediana no estn
disponibles si se ha seleccionado ms de una covariable. Potencia relativa de la
mediana y Prueba de paralelismo slo estn disponibles si se ha seleccionado una
variable de factor.

Tasa de respuesta natural. Permite indicar una tasa de respuesta natural incluso
en la ausencia del estmulo. Ninguna, Calcular a partir de los datos o Valor.

Calcular a partir de los datos. Estima la tasa de respuesta natural a partir
de los datos de la muestra. Los datos deben contener un caso que
represente el nivel de control, para el cual el valor de las covariables sea 0.
Probit estima la tasa de respuesta natural utilizando como valor inicial la
proporcin de respuestas para el nivel de control.

Valor. Establece la tasa de respuesta natural del modelo (seleccione este
elemento cuando conozca de antemano la tasa de respuesta natural).
Introduzca la proporcin de respuesta natural (la proporcin debe ser menor
que 1). Por ejemplo, si la respuesta ocurre el 10% de las veces cuando el
estmulo es 0, introduzca 0,10.

Criterios. Permite controlar los parmetros del algoritmo iterativo de estimacin de
los parmetros. Puede anular las opciones por defecto para N mximo de
iteraciones, Lmite para los pasos y Tolerancia de la optimalidad.

1.7. Estimacin ponderada

Los modelos de regresin lineal tpicos asumen que la varianza es constante en la
poblacin objeto de estudio. Cuando ste no es el caso (por ejemplo cuando los
casos con puntuaciones mayores en un atributo muestran ms variabilidad que los
casos con puntuaciones menores en ese atributo), la regresin lineal mediante
mnimos cuadrados ordinarios (MCO, OLS) deja de proporcionar estimaciones
ptimas para el modelo. Si las diferencias de variabilidad se pueden pronosticar a
partir de otra variable, el procedimiento Estimacin ponderada permite calcular los
coeficientes de un modelo de regresin lineal mediante mnimos cuadrados
ponderados (MCP, WLS), de forma que se les d mayor ponderacin a las
observaciones ms precisas (es decir, aqullas con menos variabilidad) al
determinar los coeficientes de regresin. El procedimiento Estimacin ponderada
contrasta un rango de transformaciones de ponderacin e indica cul se ajustar
mejor a los datos.

Estadsticos. Valores de la log-verosimilitud para cada potencia de la variable de
ponderacin puesta a prueba,R mltiple, R-cuadrado, R cuadrado corregida, tabla
de ANOVA para el modelo MCP, estimaciones de los parmetros tipificados y no
tipificados y log-verosimilitud para el modelo MCP.

variables categricas, como la religin, la mayora de edad o el lugar de
residencia, han de recodificarse como variables binarias (dummy) o como otro de
los tipos de variables de contraste. La variable de ponderacin deber ser
cuantitativa y estar relacionada con la variabilidad de la variable dependiente.

variable dependiente debe ser normal. La relacin entre la variable dependiente y
cada variable independiente debe ser lineal y todas las observaciones deben ser
independientes. La varianza de la variable dependiente puede cambiar segn los

niveles de la variable o variables independientes, pero las diferencias se deben
poder pronosticar en funcin de la variable de ponderacin.

Regression, Weight Estimation

Ruta de seleccin Estimacin Ponderada.

Cuadro de dialogo Estimacin Ponderada.

Cuadro de dialogo Estimacin Ponderada: Opciones.

Puede especificar las opciones para el anlisis de estimacin ponderada:

Guardar la mejor ponderacin como nueva variable. Aade la variable de
ponderacin al archivo activo. Esta variable se denomina WGT_n, siendo n un
nmero elegido para proporcionar a la variable un nombre exclusivo.

Mostrar ANOVA y estimaciones. Permite controlar cmo se muestran los
estadsticos en los resultados. Las alternativas disponibles son Para la mejor
potencia y Para cada valor de potencia.

1.8. Regresin por mnimos cuadrados en dos fases

Los modelos de regresin lineal tpica asumen que los errores de la variable
dependiente no estn correlacionados con la variable o variables independientes.
Cuando ste no es el caso (por ejemplo, cuando las relaciones entre las variables
son bidireccionales), la regresin lineal mediante mnimos cuadrados ordinarios
(OLS) deja de proporcionar estimaciones ptimas del modelo. La regresin por
mnimos cuadrados en dos fases utiliza variables instrumentales que no estn
correlacionadas con los trminos de error para calcular los valores estimados de
los predictores problemticos (en la primera fase) y despus utiliza dichos valores
calculados para estimar un modelo de regresin lineal para la variable
dependiente (la segunda fase). Dado que los valores calculados se basan en
variables que no estn correlacionadas con los errores, los resultados del modelo
en dos fases son ptimos.

Estadsticos. Para cada modelo: coeficientes de regresin tipificados y no
tipificados, R mltiple, Rcuadrado, Rcuadrado corregida, error tpico de la
estimacin, tabla de anlisis de varianza, valores pronosticados y residuos.
Adems, los intervalos de confianza al 95% para cada coeficiente de regresin y
las matrices de correlacin y covarianza para las estimaciones de los parmetros.

variables categricas, como la religin, la mayora de edad o el lugar de
residencia, han de recodificarse como variables binarias (dummy) o como otro de
los tipos de variables de contraste. Las variables explicativas endgenas deben
ser cuantitativas (no categricas).

variable dependiente debe ser normal. La varianza de distribucin de la variable
dependiente debe ser constante para todos los valores de la variable
independiente. La relacin entre la variable dependiente y cada variable
independiente debe ser lineal.

Regression, 2-Stage Least Squares

Ruta de seleccin Regresin por mnimos cuadrados en dos fases.

Cuadro de dialogo Regresin por mnimos cuadrados en dos fases.

Cuadro de dialogo Regresin por mnimos cuadrados en dos fases: Opciones.

Puede seleccionar las opciones siguientes para su anlisis:

Guardar variables nuevas. Permite aadir nuevas variables al archivo activo. Las
opciones disponibles son Pronsticos y Residuos.

Mostrar covarianza de parmetros. Permite imprimir la matriz de covarianzas de
las estimaciones de los parmetros.

Regresion

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Regresion

Hochgeladen von

Copyright:

Verfügbare Formate

MAESTRA EN INGENIERA APLICADA CON

ORIENTACIN EN RECURSOS HIDRULICOS

Das könnte Ihnen auch gefallen