Mtodos Estadsticos Manual del SPSS. Dr. Julin Gonzlez Trinidad Zacatecas, Zac. Septiembre 2014 Ing. Sergei Hernndez Guerrero
1. Regresin
El submen Regresin del men Analizar proporciona tcnicas de regresin.
1.1. Regresin lineal
La regresin lineal estima los coeficientes de la ecuacin lineal, con una o ms variables independientes, que mejor prediga el valor de la variable dependiente. Por ejemplo, puede intentar predecir el total de ventas anuales de un vendedor (la variable dependiente) a partir de variables independientes tales como la edad, la formacin y los aos de experiencia.
Estadsticos. Para cada variable: nmero de casos vlidos, media y desviacin tpica. Para cada modelo: coeficientes de regresin, matriz de correlaciones, correlaciones parciales y semiparciales, R multiple, Rcuadrado, Rcuadrado corregida, cambio en Rcuadrado, error tpico de la estimacin, tabla de anlisis de varianza, valores pronosticados y residuos. Adems, intervalos de confianza al 95% para cada coeficiente de regresin, matriz de varianzas-covarianzas, factor de inflacin de la varianza, tolerancia, prueba de Durbin-Watson, medidas de distancia (Mahalanobis, Cook y valores de influencia), DfBeta, DfAjuste, intervalos de pronstico y diagnsticos por caso. Grficos: diagramas de dispersin, grficos parciales, histogramas y grficos de probabilidad normal.
Datos. Las variables dependiente e independientes deben ser cuantitativas. Las variables categricas, como la religin, estudios principales o el lugar de residencia, han de recodificarse como variables binarias (dummy) o como otros tipos de variables de contraste.
Supuestos. Para cada valor de la variable independiente, la distribucin de la variable dependiente debe ser normal. La varianza de distribucin de la variable
dependiente debe ser constante para todos los valores de la variable independiente. La relacin entre la variable dependiente y cada variable independiente debe ser lineal y todas las observaciones deben ser independientes.
Para utilizar correlaciones bivariadas. En los mens, seleccionar: Analyze, Regression , Linear
Ruta de seleccin Regresin Lineal.
Cuadro de dialogo Regresin Lineal.
En el cuadro de dilogo Regresin lineal, seleccione una variable numrica dependiente.
Seleccione una o ms variables numricas independientes.
Si lo desea, puede:
Agrupar variables independientes en bloques y especificar distintos mtodos de entrada para diferentes subconjuntos de variables.
Elegir una variable de seleccin para limitar el anlisis a un subconjunto de casos que tengan valores particulares para esta variable.
Seleccionar una variable de identificacin de casos para identificar los puntos en los diagramas.
Seleccione una variable numrica de Ponderacin MCP para el anlisis de mnimos cuadrados ponderados.
MCP. Permite obtener un modelo de mnimos cuadrados ponderados. Los puntos de los datos se ponderan por los inversos de sus varianzas. Esto significa que las observaciones con varianzas grandes tienen menor impacto en el anlisis que las observaciones asociadas a varianzas pequeas. Si el valor de la variable de ponderacin es cero, negativo o perdido, el caso queda excluido del anlisis.
La seleccin del mtodo permite especificar cmo se introducen las variables independientes en el anlisis. Utilizando distintos mtodos se pueden construir diversos modelos de regresin a partir del mismo conjunto de variables.
Introducir (Regresin). Procedimiento para la seleccin de variables en el que todas las variables de un bloque se introducen en un solo paso.
Por pasos. En cada paso se introduce la variable independiente que no se encuentre ya en la ecuacin y que tenga la probabilidad para F ms pequea, si esa probabilidad es suficientemente pequea. Las variables ya introducidas en la ecuacin de regresin se eliminan de ella si su probabilidad para F llega a ser suficientemente grande. El mtodo termina cuando ya no hay ms variables candidatas a ser incluidas o eliminadas.
Eliminar. Procedimiento para la seleccin de variables en el que las variables de un bloque se eliminan en un solo paso.
Eliminacin hacia atrs. Procedimiento de seleccin de variables en el que se ntroducen todas las variables en la ecuacin y despus se van
excluyendo una tras otra. Aquella variable que tenga la menor correlacin parcial con la variable dependiente ser la primera en ser considerada para su exclusin. Si satisface el criterio de eliminacin, se eliminar. Tras haber excluido la primera variable, se pondr a prueba aquella variable, de las que queden en la ecuacin, que presente una correlacin parcial ms pequea. El procedimiento termina cuando ya no quedan en la ecuacin variables que satisfagan el criterio de exclusin.
Seleccin hacia adelante. Procedimiento de seleccin de variables por pasos en el que las variables se introducen secuencialmente en el modelo. La primera variable que se considerar introducir en la ecuacin ser la que tenga mayor correlacin, positiva o negativa, con la variable dependiente. Dicha variable se introducir en la ecuacin slo si cumple el criterio de entrada. Si se introduce la primera variable, a continuacin se considerar la variable independiente cuya correlacin parcial sea la mayor y que no est en la ecuacin. El procedimiento termina cuando ya no quedan variables que cumplan el criterio de entrada.
Cuadro de dialogo Regresin Lineal: Establecer regla.
Los casos definidos por la regla de seleccin se incluyen en el anlisis. Por ejemplo, si selecciona una variable, elija igual que y escriba 5 para el valor; de este modo, solamente se incluirn en el anlisis los casos para los cuales la variable seleccionada tenga un valor igual a 5. Tambin se permite un valor de cadena.
Cuadro de dialogo Regresin Lineal: Grficos.
Los grficos pueden ayudar a validar los supuestos de normalidad, linealidad e igualdad de las varianzas. Tambin son tiles para detectar valores atpicos, observaciones poco usuales y casos de influencia. Tras guardarlos como nuevas variables, dispondr en el Editor de datos de los valores pronosticados, los residuos y otros valores diagnsticos, con los cuales podr poder crear grficos respecto a las variables independientes. Se encuentran disponibles los siguientes grficos:
Diagramas de dispersin. Puede representar cualquier combinacin por parejas de la lista siguiente: la variable dependiente, los valores pronosticados tipificados, los residuos tipificados, los residuos eliminados, los valores pronosticados corregidos, los residuos estudentizados o los residuos eliminados estudentizados. Represente los residuos tipificados frente a los valores pronosticados tipificados para contrastar la linealidad y la igualdad de las varianzas.
Lista de variables de origen. Muestra una lista con la variable dependiente (DEPENDNT) y las siguientes variables pronosticadas y residuales: Valores pronosticados tipificados (*ZPRED), Residuos tipificados (*ZRESID), Residuos eliminados (*DRESID), Valores pronosticados corregidos (*ADJPRED), Residuos estudentizados (*SRESID) y Residuos estudentizados eliminados (*SDRESID).
Generar todos los grficos parciales. Muestra los diagramas de dispersin de los residuos de cada variable independiente y los residuos de la variable dependiente cuando se regresan ambas variables por separado sobre las restantes variables independientes. En la ecuacin debe haber al menos dos variables independientes para que se generen los grficos parciales.
Grficos de residuos tipificados. Puede obtener histogramas de los residuos tipificados y grficos de probabilidad normal que comparen la distribucin de los residuos tipificados con una distribucin normal.
Cuadro de dialogo Regresin Lineal: Guardar.
Puede guardar los valores pronosticados, los residuos y otros estadsticos tiles para los diagnsticos. Cada seleccin aade una o ms variables nuevas a su archivo de datos activo.
Valores pronosticados. Son los valores que el modelo de regresin pronostica para cada caso.
No tipificados. Valor pronosticado por el modelo para la variable dependiente.
Tipificados. Transformacin de cada valor pronosticado a su forma tipificada. Es decir, se sustrae el valor pronosticado medio al valor pronosticado y el resultado se divide por la desviacin tpica de los valores pronosticados. Los valores pronosticados tipificados tienen una media de 0 y una desviacin tpica de 1.
Corregidos. Valor pronosticado para un caso cuando dicho caso no se incluye en los clculos de los coeficientes de regresin.
E.T. del pronstico promedio. Error tpico de los valores pronosticados. Estimacin de la desviacin tpica del valor promedio de la variable dependiente para los casos que tengan los mismos valores en las variables independientes.
Distancias. Son medidas para identificar casos con combinaciones poco usuales de valores para las variables independientes y casos que puedan tener un gran impacto en el modelo.
Mahalanobis. Medida de cunto difieren del promedio para todos los casos los valores en las variables independientes de un caso dado. Una distancia de Mahalanobis grande identifica un caso que tenga valores extremos en una o ms de las variables independientes.
Cooks. Una medida de cunto cambiaran los residuos de todos los casos si un caso particular se excluyera del clculo de los coeficientes de regresin. Una Distancia de Cook grande indica que la exclusin de ese caso del clculo de los estadsticos de regresin har variar substancialmente los coeficientes.
Valores de influencia. Mide la influencia de un punto en el ajuste de la regresin. Influencia centrada vara entre 0 (no influye en el ajuste) a (N- 1)/N.
Intervalos de pronstico. Los lmites superior e inferior para los intervalos de pronstico individual y promedio.
Media. Lmites inferior y superior (dos variables) para el intervalo de prediccin de la respuesta pronosticada promedio.
Individual. Lmites superior e inferior (dos variables) del intervalo de prediccin para la variable dependiente para un caso individual.
Intervalo de confianza. Introduzca un valor entre 1 y 99,99 para especificar el nivel de confianza para los dos intervalos de prediccin. Debe seleccionar Media o Individuos antes de introducir este valor. Los valores habituales de los intervalos de confianza son 90, 95 y 99.
Residuos. El valor actual de la variable dependiente menos el valor pronosticado por la ecuacin de regresin.
No tipificados. Diferencia entre un valor observado y el valor pronosticado por el modelo.
Tipificados. El residuo dividido por una estimacin de su error tpico. Los residuos tipificados, que son conocidos tambin como los residuos de Pearson o residuos estandarizados, tienen una media de 0 y una desviacin tpica de 1.
Mtodo de Student. Residuo dividido por una estimacin de su desviacin tpica que vara de caso en caso, dependiendo de la distancia de los valores de cada caso en las variables independientes respecto a las medias en las variables independientes.
Eliminados. Residuo para un caso cuando ste se excluye del clculo de los coeficientes de la regresin. Es igual a la diferencia entre el valor de la variable dependiente y el valor pronosticado corregido.
Eliminados estudentizados. Residuo eliminado para un caso dividido por su error tpico. La diferencia entre un residuo eliminado estudentizado y su residuo estudentizado asociado indica la diferencia que implica el eliminar un caso sobre su propia prediccin.
Estadsticos de influencia. El cambio en los coeficientes de regresin (DfBeta) y en los valores pronosticados (DfAjuste) que resulta de la exclusin de un caso particular. Tambin estn disponibles los valores tipificados para las DfBeta y para las DfAjuste, junto con la razn entre covarianzas.
DfBeta(s). La diferencia en el valor de beta es el cambio en el valor de un coeficiente de regresin que resulta de la exclusin de un caso particular. Se calcula un valor para cada trmino del modelo, incluyendo la constante.
DfBeta tipificada. Valor de la diferencia en beta tipificada. El cambio tipificado en un coeficiente de regresin cuando se elimina del anlisis un caso particular. Puede interesarle examinar aquellos casos cuyos valores absolutos sean mayores que 2 dividido por la raz cuadrada de N, donde N es el nmero de casos. Se calcula un valor para cada trmino del modelo, incluyendo la constante.
DfAjuste. La diferencia en el valor ajustado es el cambio en el valor pronosticado que resulta de la exclusin de un caso particular.
DfAjuste tipificado. Diferencia tipificada en el valor ajustado. El cambio, tipificado, en el valor pronosticado que resulta de la exclusin de un caso particular. Puede interesarle examinaraquellos valores tipificados cuyo valor absoluto sea mayor que 2 dividido por la raz cuadrada de p/N, donde p es el nmero de variables independientes en la ecuacin y N es el nmero de casos.
Razn entre covarianzas. Razn del determinante de la matriz de covarianza con un caso particular excluido del clculo de los coeficientes de regresin, respecto al determinante de la matriz de covarianza con todos los casos incluidos. Si la razn se aproxima a 1, el caso no altera significativamente la matriz de covarianza.
Estadsticos de los coeficientes. Almacena los coeficientes de regresin en un conjunto de datos o en un archivo de datos. Los conjuntos de datos estn disponibles para su uso posterior durante la misma sesin, pero no se guardarn como archivos a menos que se hayan guardado explcitamente antes de que finalice la sesin. El nombre de un conjunto de datos debe cumplir las normas de denominacin de variables.
Exportar informacin del modelo a un archivo XML. Las estimaciones de los parmetros y (si lo desea) sus covarianzas se exportan al archivo especificado en formato XML (PMML). SmartScore y SPSS Statistics Server (un producto independiente) pueden utilizar este archivo del modelo para aplicar la informacin del modelo en otros archivos de datos con fines de puntuacin.
Cuadro de dialogo Regresin Lineal: Estadsticos.
Se encuentran disponibles los siguientes estadsticos:
Coeficientes de regresin. La opcin Estimaciones muestra el coeficiente de regresinB, el error tpico de B, el coeficiente beta tipificado, el valor de t para B y el nivel de significacin bilateral t. Intervalos de confianza muestra intervalos de confianza con el nivel de confianza especificado para cada coeficiente de regresin o una matriz de covarianzas. Matriz de covarianzas muestra una matriz de varianzas-covarianzas de los coeficientes de regresin, con las covarianzas fuera de la diagonal y las varianzas en la diagonal. Tambin se muestra una matriz de correlaciones.
Ajuste del modelo. Presenta una lista de las variables introducidas y eliminadas del modelo y muestra los siguientes estadsticos de bondad de ajuste: R mltiple, R cuadrado y R cuadrado corregida, error tpico de la estimacin y tabla de anlisis de la varianza.
Cambio en R cuadrado. Cambio en el estadstico Rcuadrado que se produce al aadir o eliminar una variable independiente. Si es grande el cambio en Rcuadrado asociado a una variable, esto significa que esa variable es un buen predictor de la variable dependiente.
Descriptivos. Proporciona el nmero de casos vlidos, la media y la desviacin tpica para cada variable en el anlisis. Tambin muestra una matriz de correlaciones con el nivel de significacin unilateral y el nmero de casos para cada correlacin.
Correlacin parcial. La correlacin remanente entre dos variables despus de haber eliminado la correlacin debida a su asociacin mutua con otras variables. La correlacin entre una variable dependiente y una variable independiente cuando se han eliminado de ambas los efectos lineales de las otras variables independientes del modelo.
Correlacin semiparcial. La correlacin entre la variable dependiente y una variable independiente cuando se han eliminado de la variable independiente los efectos lineales de las otras variables independientes del modelo. Est relacionada con el cambio en R cuadrado cuando una variable se aade a una ecuacin. En ocasiones e denomina correlacin semiparcial.
Diagnsticos de colinealidad. La colinealidad (o multicolinealidad) es una situacin no deseable en la que una de las variables independientes es una funcin lineal de otras variables independientes. Muestra los autovalores de la
matriz de productos cruzados no centrada y escalada, los ndices de condicin y las proporciones de la descomposicin de la varianza junto con los factores de inflacin de la varianza (FIV) y las tolerancias para las variables individuales.
Residuos. Presenta la prueba de Durbin-Watson sobre la correlacin serial de los residuos y los diagnsticos por casos para los casos que cumplan el criterio de seleccin (los valores atpicos por encima de n desviaciones tpicas).
Cuadro de dialogo Regresin Lineal: Opciones.
Se encuentran disponibles las siguientes opciones:
Criterios del mtodo por pasos. Estas opciones son aplicables si se ha especificado el mtodo de seleccin de variables hacia adelante, hacia atrs o por pasos. Las variables se pueden introducir o eliminar del modelo dependiendo de la significacin (probabilidad) del valor de F o del propio valor de F.
Usar la probabilidad de F. Una variable se introduce en el modelo si el nivel de significacin de su valor de F es menor que el valor de entrada, y
se elimina si el nivel de significacin de su valor de F es mayor que el valor de salida. La entrada debe ser menor que la salida y ambos valores deben ser positivos. Para introducir ms variables en el modelo, aumente el valor de entrada. Para eliminar ms variables del modelo, disminuya el valor de salida.
Usar valor de F. Una variable se introduce en el modelo si su valor de F es mayor que el valor de entrada, y se elimina si su valor de F es menor que el valor de salida. La entrada debe ser mayor que la salida y ambos valores deben ser positivos. Para introducir ms variables en el modelo, disminuya el valor de entrada. Para eliminar ms variables del modelo, eleve el valor de salida.
Incluir la constante en la ecuacin. Por defecto, el modelo de regresin incluye un trmino constante. Si se anula la seleccin de esta opcin se obtiene la regresin que pasan por el origen, lo cual se hace raramente. Algunos resultados de la regresin que pasan por el origen no son comparables con los resultados de la regresin que s incluyen una constante. Por ejemplo, R 2 no puede interpretarse de la manera usual.
Valores perdidos. Puede elegir uno de los siguientes:
Excluir casos segn lista. Slo se incluirn en el anlisis los casos con valores vlidos para todas las variables. Excluir casos segn pareja. Los casos con datos completos para la pareja de variables correlacionadas se utilizan para calcular el coeficiente de correlacin en el cual se basa el anlisis de regresin. Los grados de libertad se basan en el N mnimo de las parejas.
Reemplazar por la media. Se emplean todos los casos en los
1.2. Estimacin curvilnea
El procedimiento Estimacin Curvilnea genera estadsticos de estimacin curvilnea por regresin y grficos relacionados para 11 modelos diferentes de estimacin curvilnea por regresin. Se produce un modelo diferente para cada variable dependiente. Tambin se pueden guardar valores pronosticados, residuos e intervalos pronosticados como nuevas variables.
Estadsticos. Para cada modelo: coeficientes de regresin, R mltiple, R 2 , R 2
corregida, error tpico de la estimacin, tabla de anlisis de varianza, valores pronosticados, residuos e intervalos de pronstico. Modelos: lineal, logartmico, inverso, cuadrtico, cbico, de potencia, compuesto, curva-S, logstico, de crecimiento y exponencial.
Datos. Las variables dependientes e independientes deben ser cuantitativas. Si selecciona Tiempo del conjunto de datos activo como variable independiente (en lugar de una variable), el procedimiento Estimacin curvilnea generar una variable de tiempo en la que la distancia temporal entre los casos es uniforme. Si se selecciona Tiempo, la variable dependiente debe ser una medida de serie temporal. El anlisis de series temporales requiere una estructura particular para los archivos de datos, de manera que cada caso (cada fila) represente un conjunto de observaciones en un momento determinado del tiempo y que la distancia temporal entre los casos sea uniforme.
Supuestos. Represente los datos grficamente para determinar cmo se relacionan las variables dependientes e independiente (linealmente, exponencialmente, etc.). Los residuos de un buen modelo deben distribuirse de forma aleatoria y normal. Si se utiliza un modelo lineal, se deben cumplir los siguientes supuestos: Para cada valor de la variable independiente, la distribucin
de la variable dependiente debe ser normal. La varianza de distribucin de la variable dependiente debe ser constante para todos los valores de la variable independiente. La relacin entre la variable dependiente y la variable independiente debe ser lineal y todas las observaciones deben ser independientes.
Para utilizar correlaciones bivariadas. En los mens, seleccionar: Analyze, Regression , Curve Estimation
Ruta de seleccin Estimacin curvilnea.
Cuadro de dialogo Estimacin Curvilnea.
Seleccione una o ms variables dependientes. Se produce un modelo diferente para cada variable dependiente.
Seleccione una variable independiente (seleccione una variable del conjunto de datos activo o Tiempo).
Si lo desea:
Seleccionar una variable para etiquetar los casos en los diagramas de dispersin. Para cada punto en el diagrama de dispersin, se puede utilizar la herramienta de Identificacin de puntos para mostrar el valor de la variable utilizada en Etiquetas de caso.
Pulsar en Guardar para guardar los valores pronosticados, los residuos y los intervalos de pronstico como nuevas variables.
Tambin se encuentran disponibles las siguientes opciones:
Incluir la constante en la ecuacin. Estima un trmino constante en la ecuacin de regresin. La constante se incluye por defecto.
Representar los modelos. Representa los valores de la variable dependiente y cada modelo seleccionado frente a la variable independiente. Se genera un grfico distinto para cada variable dependiente.
Ver tabla de ANOVA. Muestra una tabla de anlisis de varianza de resumen para cada modelo seleccionado.
Modelos del procedimiento Estimacin curvilnea.
Se puede seleccionar uno o ms modelos de estimacin curvilnea por regresin. Para determinar qu modelo utilizar, represente los datos. Si las variables parecen estar relacionadas linealmente, utilice un modelo de regresin lineal simple. Cuando las variables no estn relacionadas linealmente, intente transformar los datos. Cuando la transformacin no resulte til, puede necesitar un modelo ms complicado. Inspeccione un diagrama de dispersin de los datos; si el diagrama se parece a una funcin matemtica reconocible, ajuste los datos a ese tipo de modelo. Por ejemplo, si los datos se parecen a una funcin exponencial, utilice un modelo exponencial.
Lineal. Modelo cuya ecuacin es Y = b0 + (b1 * t). Los valores de la serie se modelan como una funcin lineal del tiempo.
Logartmica. Modelo cuya ecuacin es Y = b0 + (b1 * ln(t)).
Inversa. Modelo cuya ecuacin es Y = b0 + (b1 / t).
Cuadrtico. Modelo cuya ecuacin es Y = b0 + (b1 * t) + (b2 * t**2). El modelo cuadrtico puede utilizarse para modelar una serie que "despega" o una serie que se amortigua.
Cbico. Modelo definido por la ecuacin Y = b0 + (b1 * t) + (b2 * t**2) + (b3 * t**3).
Potencia. Modelo cuya ecuacin es Y = b0 * (t**b1) ln(Y) = ln(b0) + (b1 * ln(t)).
Compuesto. Modelo cuya ecuacin es Y = b0 * (b1**t) ln(Y) = ln(b0) + (ln(b1) * t).
Curva-S. Modelo cuya ecuacin es Y = e**(b0 + (b1/t)) o ln(Y) = b0 + (b1/t).
Logstica. Modelo cuya ecuacin es Y = 1 / (1/u + (b0 * (b1**t))) o ln(1/y- 1/u) = ln (b0) + (ln(b1) * t) donde u es el valor del lmite superior. Despus de seleccionar Logstico, especifique un valor para el lmite superior que se utilizar en la ecuacin de regresin. El valor debe ser un nmero positivo mayor que el valor mximo de la variable dependiente.
Crecimiento. Modelo cuya ecuacin es Y = e**(b0 + (b1 * t)) ln(Y) = b0 + (b1 * t).
Exponencial. Modelo cuya ecuacin es Y = b0 * (e**(b1 * t)) ln(Y) = ln(b0) + (b1 *t).
Cuadro de dialogo Estimacin Curvilnea: Guardar.
Guardar variables. Para cada modelo seleccionado se pueden guardar los valores pronosticados, los residuos (el valor observado de la variable dependiente menos el valor pronosticado por el modelo) y los intervalos de pronstico (sus lmites superior e inferior). En la ventana de resultados, se muestran en una tabla los nombres de las nuevas variables y las etiquetas descriptivas.
Pronosticar casos. En el conjunto de datos activo, si se selecciona Tiempo como variable independiente en lugar de una variable, se puede especificar un perodo de prediccin que vaya ms all del final de la serie temporal. Puede elegir una de las siguientes alternativas:
Desde el perodo de estimacin hasta el ltimo caso. Pronostica los valores para todos los casos del archivo, basndose en los casos del perodo de estimacin. El perodo de estimacin, que se muestra en la parte inferior del cuadro de dilogo, se define con el subcuadro de dilogo Rango de la opcin Seleccionar casos en el men Datos. Si no se ha definido un perodo de estimacin, se utilizan todos los casos para pronosticar los valores.
Predecir hasta. Predice los valores hasta la fecha especificada, hora o nmero de observacin, basndose en los casos del perodo de estimacin. Esta caracterstica se puede utilizar para predecir valores ms all del ltimo caso de la serie temporal. Las variables definidas actualmente determinan los cuadros de texto disponibles para especificar el final del perodo de prediccin. Si no existen variables de fecha definidas, se puede especificar el nmero de la observacin (caso) final.
Utilice la opcin de Definir fechas en el men Datos para crear las variables de fecha.
1.3. Regresin Logstica Binaria
La regresin logstica resulta til para los casos en los que se desea predecir la presencia o ausencia de una caracterstica o resultado segn los valores de un conjunto de predictores. Es similar a un modelo de regresin lineal pero est adaptado para modelos en los que la variable dependiente es dicotmica. Los coeficientes de regresin logstica pueden utilizarse para estimar la razn de las ventajas de cada variable independiente del modelo. La regresin logstica se puede aplicar a un rango ms amplio de situaciones de investigacin que el anlisis discriminante.
Estadsticos. Para cada anlisis: Casos totales, Casos seleccionados, Casos vlidos. Para cada variable categrica: codificacin de los parmetros. Para cada paso: variables introducidas o eliminadas, historial de iteraciones, 2 log de la verosimilitud, bondad de ajuste, estadstico de bondad de ajuste de Hosmer- Lemeshow, chi-cuadrado del modelo , chi-cuadrado de la mejora, tabla de clasificacin, correlaciones entre las variables, grfico de las probabilidades pronosticadas y los grupos observados, chi-cuadrado residual. Para cada variable de la ecuacin: coeficiente (B), error tpico de B, Estadstico de Wald, razn de las ventajas estimada (exp(B)), intervalo de confianza para exp(B), log de la
verosimilitud si el trmino se ha eliminado del modelo. Para cada variable que no est en la ecuacin: estadstico de puntuacin. Para cada caso: grupo observado, probabilidad pronosticada, grupo pronosticado, residuo, residuo tipificado.
Mtodos. Puede estimar modelos utilizando la entrada en bloque de las variables o cualquiera de los siguientes mtodos por pasos: Condicional hacia adelante, LR hacia adelante, Wald hacia adelante, Condicional hacia atrs, LR hacia atrs o Wald hacia atrs.
Para utilizar correlaciones bivariadas. En los mens, seleccionar: Analyze, Regression , Binary Logistic
Ruta de seleccin Regresin Logstica Binaria.
Cuadro de dialogo Regresin Logstica Binaria.
Los casos definidos por la regla de seleccin se incluyen en la estimacin del modelo. Por ejemplo, si ha seleccionado una variable y la opcin igual que y ha especificado 5 como valor, slo se incluirn en el anlisis aquellos casos para los cuales la variable seleccionada tenga un valor igual a 5.
Tanto para los casos seleccionados como para los no seleccionados se generan resultados de clasificaciones y estadsticos. De esta manera, se ofrece un mecanismo para clasificar los nuevos casos basndose en datos ya existentes; o tambin para realizar la particin de los datos en dos subconjuntos, uno de entrenamiento y otro de prueba, que permiten la validacin del modelo generado.
Cuadro de dialogo Regresin Logstica Binaria: Definir variables categricas
Puede especificar los detalles sobre cmo el procedimiento Regresin logstica manipular las variables categricas:
Covariables. Contiene una lista de todas las covariables especificadas en el cuadro de dilogo principal para cualquier capa, bien por ellas mismas o como parte de una interaccin. Si alguna de stas son variables de cadena o son categricas, slo puede utilizarlas como covariables categricas.
Covariables categricas. Lista las variables identificadas como categricas. Cada variable incluye una notacin entre parntesis indicando el esquema de codificacin de contraste que va a utilizarse. Las variables de cadena (sealadas con el smbolo < a continuacin del nombre) estarn presentes ya en la lista Covariables categricas. Seleccione cualquier otra covariable categrica de la lista Covariables y muvala a la lista Covariables categricas.
Cambiar el contraste. Le permite cambiar el mtodo de contraste. Los mtodos de contraste disponibles son:
Indicador. Los contrastes indican la presencia o ausencia de la pertenencia a una categora. La categora de referencia se representa en la matriz de contraste como una fila de ceros.
Simple. Cada categora del predictor (excepto la propia categora de referencia) se compara con la categora de referencia.
Diferencia. Cada categora del predictor, excepto la primera categora, se compara con el efecto promedio de las categoras anteriores. Tambin se conoce como contrastes de Helmert inversos.
Helmert. Cada categora del predictor, excepto la ltima categora, se compara con el efecto promedio de las categoras subsiguientes.
Repetidas. Cada categora del predictor, excepto la primera categora, se compara con la categora que la precede.
Polinmico. Contrastes polinmicos ortogonales. Se supone que las categoras estn espaciadas equidistantemente. Los contrastes polinmicos slo estn disponibles para variables numricas.
Desviacin. Cada categora del predictor, excepto la categora de referencia, se compara con el efecto global.
Si selecciona Desviacin, Simple o Indicador, elija Primera o ltima como categora de referencia. Observe que el mtodo no cambia realmente hasta que se pulsa en Cambiar.
Las covariables de cadena deben ser covariables categricas. Para eliminar una variable de cadena de la lista Covariables categricas, debe eliminar de la lista
Covariables del cuadro de dilogo principal todos los trminos que contengan la variable.
Cuadro de dialogo Regresin Logstica Binaria: Guardar.
Puede guardar los resultados de la regresin logstica como nuevas variables en el conjunto de datos activo:
Valores pronosticados. Guarda los valores pronosticados por el modelo. Las opciones disponibles son Probabilidades y Grupo de pertenencia.
Probabilidades. Para cada caso, guarda la probabilidad pronosticada de aparicin del evento. En los resultados, una tabla muestra el nombre y el contenido de cualquier variable nueva. El "evento" es la categora de la variable dependiente con el valor ms alto; por ejemplo, si la variable dependiente toma los valores 0 y 1, se guarda la probabilidad pronosticada de categora 1.
Grupo de pertenencia pronosticado. Grupo con la mayor probabilidad posterior, basado en puntuaciones discriminantes. El grupo pronosticado por el modelo al cual pertenece el caso.
Influencia. Guarda los valores de estadsticos que miden la influencia de los casos sobre los valores pronosticados. Las opciones disponibles son De Cook, Valores de influencia y DfBeta(s).
Cooks. El anlogo, en la regresin logstica, al estadstico de influencia de Cook. Una medida de cunto cambiaran los residuos de todos los casos si un caso particular se excluyera del clculo de los coeficientes de regresin.
Valor de influencia. La influencia relativa de una observacin en el ajuste del modelo.
DfBeta(s). La diferencia en el valor de beta es el cambio en el valor de un coeficiente de regresin que resulta de la exclusin de un caso particular. Se calcula un valor para cada trmino del modelo, incluyendo la constante.
Residuos. Guarda los residuos. Las opciones disponibles son No tipificados, Logit, Mtodo de Student, Tipificados y Desviacin.
Residuos no tipificados. Diferencia entre un valor observado y el valor pronosticado por el modelo.
Residuo logit. El residuo del caso si se pronostica en la escala logit. El residuo logit es el residuo dividido por la probabilidad pronosticada multiplicada por 1 menos la probabilidad pronosticada.
Residuo estudentizado. El cambio en la desvianza del modelo si se excluye el caso.
Residuos tipificados. El residuo dividido por una estimacin de su error tpico. Los residuos tipificados, que son conocidos tambin como los residuos de Pearson o residuos estandarizados, tienen una media de 0 y una desviacin tpica de 1.
Desvianza. Los residuos basados en la desviacin del modelo.
Exportar informacin del modelo a un archivo XML. Las estimaciones de los parmetros y (si lo desea) sus covarianzas se exportan al archivo especificado en formato XML (PMML). Puede utilizar este archivo de modelo para aplicar la informacin del modelo a otros archivos de datos para puntuarlo.
1.4. Regresin logstica multinomial
La opcin Regresin logstica multinomial resulta til en aquellas situaciones en las que desee poder clasificar a los sujetos segn los valores de un conjunto de variables predictoras. Este tipo de regresin es similar a la regresin logstica, pero ms general, ya que la variable dependiente no est restringida a dos categoras.
Estadsticos. Historial de iteraciones, coeficientes de los parmetros, covarianza asinttica y matrices de correlacin, pruebas de la razn de verosimilitud para los efectos del modelo y los parciales, 2 log de la verosimilitud. Chi-cuadrado de la bondad de ajuste de Pearson y de la desviacin. R2 de Cox y Snell, de Nagelkerke y de McFadden. Clasificacin: frecuencias observadas respecto a las frecuencias pronosticadas, por cada categora de respuesta. Tablas de contingencia: frecuencias observadas y pronosticadas (con los residuos) y proporciones por patrn en las covariables y por categora de respuesta.
Mtodos. Se ajusta un modelo logit multinomial para el modelo factorial completo o para un modelo especificado por el usuario. La estimacin de los parmetros se realiza a travs de un algoritmo iterativo de mxima verosimilitud.
Datos. La variable dependiente debe ser categrica. Las variables independientes pueden ser factores o covariables. En general, los factores deben ser variables categricas y las covariables deben ser variables continuas.
Supuestos. Se asume que la razn de ventajas de cualquier par de categoras es independiente de las dems categoras de respuesta. Segn esta suposicin, por ejemplo, si se introduce un nuevo producto en un mercado, las cuotas de mercado de todos los dems productos se vern afectadas de manera igualmente proporcional. De igual manera, dado un patrn en las covariables, se asume que las respuestas son variables multinomiales independientes.
Para utilizar correlaciones bivariadas. En los mens, seleccionar: Analyze, Regression, Multinomial Logistic
Ruta de seleccin Regresin logstica multinomial.
Cuadro de dialogo Regresin Logstica Multinomial.
Por defecto, el procedimiento Regresin logstica multinomial hace de la ltima categora la categora de referencia. Este cuadro de dilogo le otorga el control sobre la categora de referencia y sobre la forma de ordenar las categoras.
Categora de referencia. Especifique la primera, la ltima o una categora personalizada.
Orden de categoras. En orden ascendente, el valor mnimo define la primera categora, y el valor ms alto la ltima. En orden descendente, el valor mximo define la primera categora y el valor inferior define la ltima.
Cuadro de dialogo Regresin Logstica Multinomial: Estadisticos.
Puede especificar los siguientes estadsticos para una regresin logstica multinomial:
Resumen de procesamiento de casos. Esta tabla contiene informacin sobre las variables categricas especificadas.
Modelo. Estadsticos del modelo global.
Pseudo R cuadrado. Imprime el estadstico de Cox y Snell, de Nagelkerke y el R2 McFadden.
Resumen de pasos. Esta tabla resume los efectos introducidos o eliminados en cada paso, mediante un mtodo por pasos. No se genera si no se especifica un modelo por pasos en el cuadro de dilogo Modelo.
Informacin de ajuste de los modelos. Esta tabla compara los modelos ajustado y de slo interseccin o nulo.
Criterios de informacin. Esta tabla imprime tanto el criterio de informacin de Akaike (AIC) como el criterio de informacin bayesiano (BIC).
Probabilidades de casilla. Imprime una tabla de las frecuencias observadas y esperadas (con los residuos) y las proporciones por patrn en las covariables y por categora de respuesta.
Tabla de clasificacin. Imprime una tabla de las respuestas observadas respecto a las respuestas pronosticadas.
Estadsticos de bondad de ajuste de chi-cuadrado. Imprime los estadsticos de chi-cuadrado de Pearson y de chi-cuadrado de la razn de verosimilitud. Los estadsticos se calculan para los patrones en las covariables determinados por todos los factores y las covariables o por un subconjunto de los factores y las covariables definido por el usuario.
Medidas de monoticidad. Muestra una tabla con informacin sobre el nmero de pares concordantes, pares discordantes y empates. La D de Somers, la gamma de Goodman y Kruskal, la tau-a de Kendall y el ndice de concordancia C tambin se muestran en esta tabla.
Parmetros. Estadsticos relativos a los parmetros del modelo.
Estimaciones. Imprime las estimaciones de los parmetros del modelo con un nivel de confianza especificado por el usuario.
Contraste de la razn de verosimilitud. Imprime los contrastes de la razn de verosimilitud para los efectos parciales del modelo. El contraste para el modelo global se imprime de manera automtica.
Correlaciones asintticas. Imprime la matriz de las correlaciones entre las estimaciones de los parmetros.
Covarianzas asintticas. Imprime la matriz de las covarianzas de las estimaciones de los parmetros.
Definir subpoblaciones. Le permite seleccionar un subconjunto de factores y covariables de manera que pueda definir los patrones en las covariables utilizados por las probabilidades de casilla y las pruebas de bondad de ajuste.
Cuadro de dialogo Regresin Logstica Multinomial: Criterios.
Puede especificar los siguientes criterios para una regresin logstica multinomial:
Iteraciones. Le permite especificar el nmero mximo de veces que desea recorrer el algoritmo, el nmero mximo de pasos en la subdivisin por pasos, las tolerancias de convergencia para los cambios en el log de la verosimilitud y los parmetros, la frecuencia con que se imprime el progreso del algoritmo iterativo y en qu iteracin el procedimiento debe comenzar a comprobar la separacin completa o casi completa de los datos.
Convergencia del logaritmo de la verosimilitud. Se asume la convergencia si el cambio absoluto en la funcin log-verosimilitud es menor que el valor especificado. Este criterio no se aplica si el valor es igual a 0. Especifique un valor no negativo.
Convergencia de los parmetros. Se asume la convergencia si el cambio absoluto en las estimaciones de los parmetros es menor que este valor. Este criterio no se aplica si el valor es igual a 0.
Delta. Le permite especificar un valor no negativo inferior a 1. Este valor se aade a cada casilla vaca de la tabla de contingencia de las categoras de respuesta por patrones de covariables. Se ayuda as a estabilizar el algoritmo y evitar sesgos en las estimaciones.
Tolerancia para la singularidad. Le permite especificar la tolerancia empleada en la comprobacin de la singularidad.
Cuadro de dialogo Regresin Logstica Multinomial: Opciones.
Puede especificar las siguientes opciones para una regresin logstica multinomial:
Escala de dispersin. Le permite especificar el valor de escalamiento de la dispersin que se va a utilizar para corregir la estimacin de la matriz de covarianzas de los parmetros. Desviacin estima el valor de escalamiento mediante el estadstico de la funcin de desviacin (chi-cuadrado de la razn de verosimilitud. Pearson estima el valor de escalamiento mediante el estadstico chi- cuadrado de Pearson. Tambin puede especificar su propio valor de escalamiento. Debe ser un valor numrico positivo.
Opciones por pasos. Estas opciones le ofrecen el control de los criterios estadsticos cuando se utilizan mtodos por pasos para generar un modelo.Se
ignoran salvo que se especifique un modelo por pasos en el cuadro de dilogo Modelo.
Probabilidad de entrada. Se trata de la probabilidad del estadstico de la razn de verosimilitud para la entrada de variables. Cuanto mayor sea la probabilidad especificada, ms fcil resultar que una variable entre en el modelo. Este criterio se ignora a menos que se seleccione uno de los mtodos siguientes: hacia delante, pasos sucesivos hacia adelante o pasos sucesivos hacia atrs.
Prueba de entrada. ste es el mtodo para introducir los trminos en los mtodos por pasos. Escoja entre la prueba de la razn de verosimilitud y la prueba de puntuacin. Este criterio se ignora a menos que se seleccione uno de los mtodos siguientes: hacia delante, pasos sucesivos hacia adelante o pasos sucesivos hacia atrs.
Probabilidad de eliminacin. Se trata de la probabilidad del estadstico de la razn de verosimilitud para la eliminacin de variables. Cuanto mayor sea la probabilidad especificada, ms fcil resultar que una variable permanezca en el modelo. Este criterio se ignora a no ser que se seleccione el mtodo de eliminacin hacia atrs, pasos sucesivos hacia adelante o pasos sucesivos hacia atrs.
Prueba de eliminacin. ste es el mtodo utilizado para eliminar trminos en los mtodos por pasos. Puede elegir entre la prueba de la razn de verosimilitud o la prueba de Wald. Este criterio se ignora a no ser que se seleccione el mtodo de eliminacin hacia atrs, pasos sucesivos hacia adelante o pasos sucesivos hacia atrs.
Efectos por pasos mnimos en el modelo. Al utilizar los mtodos de eliminacin hacia atrs o pasos sucesivos hacia atrs, se especifica el
mnimo nmero de trminos que puede incluirse en el modelo. La interseccin no se cuenta como trmino de modelo.
Efectos por pasos mximos en el modelo. Al utilizar los mtodos de entrada hacia delante o pasos sucesivos hacia adelante, se especifica el mximo nmero de trminos que puede incluirse en el modelo. La interseccin no se cuenta como trmino de modelo.
Restringir jerrquicamente la entrada y la eliminacin de trminos. Esta opcin permite elegir si se desea aplicar restricciones a la inclusin de trminos de modelo. La jerarqua precisa que para que se incluya un trmino, todos los inferiores que formen parte del que se desea incluir se encuentren antes en el modelo. Por ejemplo, si el requisito de jerarqua est activado, los factores Estado civil y Sexo deben estar en el modelo antes de poder aadir la interaccin Estado civil*Sexo. Las tres opciones en forma de botn radial determinan el papel de las covariables a la hora de determinar la jerarqua.
1.5. Regresin ordinal
La regresin ordinal permite dar forma a la dependencia de una respuesta ordinal politmica sobre un conjunto de predictores, que pueden ser factores o covariables. El diseo de la regresin ordinal se basa en la metodologa de McCullagh (1980, 1998) y en la sintaxis se hace referencia al procedimiento como PLUM.
El anlisis de regresin lineal ordinario implica minimizar las diferencias de la suma de los cuadrados entre una variable de respuesta (la dependiente) y una combinacin ponderada de las variables predictoras (las independientes). Los coeficientes estimados reflejan cmo los cambios en los predictores afectan a la respuesta. Se considera que la respuesta es numrica, en el sentido en que los
cambios en el nivel de la respuesta son equivalentes en todo el rango de la respuesta. Por ejemplo, la diferencia de altura entre una persona que mide 150 cm y una que mide 140 cm es de 10 cm, que tiene el mismo significado que la diferencia de altura entre una persona que mide 210 cm y una que mide 200 cm. Estas relaciones no se mantienen necesariamente con las variables ordinales, en las que la eleccin y el nmero de categoras de respuesta pueden ser bastante arbitrarios.
Estadsticos y grficos. Frecuencias observadas y esperadas y frecuencias acumuladas, residuos de Pearson para las frecuencias y las frecuencias acumuladas, probabilidades observadas y esperadas, probabilidades acumuladas observadas y esperadas para cada categora de respuesta por patrn en las covariables, matrices de correlaciones asintticas y de covarianzas entre las estimaciones de los parmetros, chi-cuadrado de Pearson y chi-cuadrado de la razn de verosimilitud, estadsticos de bondad de ajuste, historial de iteraciones, contraste del supuesto de lneas paralelas, estimaciones de los parmetros, errores tpicos, intervalos de confianza y estadsticos R2 de Cox y Snell, de Nagelkerke y de McFadden.
Datos. Se asume que la variable dependiente es ordinal y puede ser numrica o de cadena. El orden se determina al clasificar los valores de la variable dependiente en orden ascendente. El valor inferior define la primera categora. Se asume que las variables de factor son categricas. Las covariables deben ser numricas. Observe que al usar ms de una covariable continua, se puede llegar a crear una tabla de probabilidades de casilla muy grande.
Supuestos. Slo se permite una variable de respuesta y debe especificarse. Adems, para cada patrn distinto de valores en las variables independientes, se supone que las respuestas son variables multinomiales independientes.
Procedimientos relacionados. La regresin logstica nominal utiliza modelos similares para las variables dependientes nominales.
Para utilizar correlaciones bivariadas. En los mens, seleccionar: Analyze, Regression, Ordinal
Ruta de seleccin Regresin Ordinal.
Cuadro de dialogo Regresin Ordinal.
Cuadro de dialogo Regresin Ordinal: Opciones.
El cuadro de dilogo Opciones le permite ajustar los parmetros utilizados en el algoritmo de estimacin iterativo, seleccionar un nivel de confianza para las estimaciones de los parmetros y seleccionar una funcin de enlace.
Iteraciones. El algoritmo iterativo puede personalizarse.
Iteraciones mximas. Especifique un nmero entero no negativo. Si se especifica el 0, el procedimiento devolver las estimaciones iniciales.
Mxima subdivisin por pasos. Especifique un nmero entero positivo.
Convergencia del logaritmo de la verosimilitud. El algoritmo se detiene si el cambio absoluto o relativo en el logaritmo de la verosimilitud es inferior a este valor. Si se especifica 0, no se utiliza el criterio.
Convergencia de los parmetros. El algoritmo se detiene si el cambio absoluto o relativo en cada una de las estimaciones de los parmetros es inferior a este valor. Si se especifica 0, no se utiliza el criterio. Intervalo de confianza. Especifique un valor mayor o igual a 0 e inferior a 100.
Delta. El valor aadido a las frecuencias de casilla de cero. Especifique un valor no negativo inferior a 1.
Tolerancia para la singularidad. Utilizada para comprobar los predictores con alta dependencia. Seleccione un valor en la lista de opciones.
Funcin de enlace. La funcin de enlace es una transformacin de las probabilidades acumuladas que permiten la estimacin del modelo.
Cuadro de dialogo Regresin Ordinal: Opciones.
El cuadro de dilogo Resultados le permite generar tablas que se pueden visualizar en el Visor y guardar variables en el archivo de trabajo.
Mostrar. Genera tablas correspondientes a:
Imprimir el historial de iteraciones. El logaritmo de la verosimilitud y las estimaciones de los parmetros se imprimen con la frecuencia de iteraciones a imprimir especificada. Siempre se imprimen la primera y la ltima iteracin.
Estadsticos de bondad de ajuste. Estadsticos chi-cuadrado de Pearson y chi-cuadrado de la razn de verosimilitud. Estos estadsticos se calculan segn la clasificacin especificada en la lista de variables.
Estadsticos de resumen. R2 de Cox y Snell, de Nagelkerke y de McFadden.
Estimaciones de los parmetros. Estimaciones de los parmetros, errores tpicos e intervalos de confianza.
Correlacin asinttica de las estimaciones de los parmetros. Matriz de las correlaciones entre las estimaciones de los parmetros.
Covarianza asinttica de las estimaciones de los parmetros. Matriz de las covarianzas entre las estimaciones de los parmetros.
Informacin de casilla. Frecuencias esperadas y observadas y frecuencias acumuladas, residuos de Pearson para las frecuencias y las frecuencias acumuladas, probabilidades esperadas y observadas y probabilidades esperadas y observadas de cada categora de respuesta segn el patrn en las covariables. Tenga en cuenta que en el caso de modelos con muchos patrones de covariables (por ejemplo, modelos con covariables continuas), esta opcin puede generar una tabla grande y poco manejable.
Prueba de lneas paralelas. Prueba correspondiente a la hiptesis de que los parmetros de ubicacin son equivalentes en todos los niveles de la variable dependiente. Esta prueba est disponible nicamente para el modelo de slo ubicacin.
Variables guardadas. Guarda las siguientes variables en el archivo de trabajo:
Probabilidades de respuesta estimadas. Probabilidades estimadas por el modelo para la clasificacin de un patrn de factor/covariable en las categoras de respuesta. El nmero de probabilidades es igual al nmero de categoras de respuesta.
Categora pronosticada. La categora de respuesta con la mayor probabilidad estimada para un patrn de factor/covariable.
Probabilidad de la categora pronosticada. Probabilidades estimada de la clasificacin de un patrn factor/covariable en la categora pronosticada. Esta probabilidad tambin es el mximo de las probabilidades estimadas para el patrn de factor/covariable.
Probabilidad de la categora real. Probabilidad estimada de la clasificacin de un patrn factor/covariable en la categora real.
Imprimir log-verosimilitud. Controla la representacin del logaritmo de la verosimilitud. Incluir constante multinomial ofrece el valor completo de la verosimilitud. Para comparar los resultados con los productos que no incluyan la constante, puede seleccionar la opcin de excluirla.
Cuadro de dialogo Regresin Ordinal: Ubicacin.
El cuadro de dilogo Ubicacin le permite especificar el modelo de ubicacin para el anlisis.
Especificar modelo. Un modelo de efectos principales contiene los efectos principales de las covariables y los factores, pero no contiene efectos de interaccin. Puede crear un modelo personalizado para especificar subconjuntos de interacciones entre los factores o bien interacciones entre las covariables.
Factores y covariables. Muestra una lista de los factores y las covariables.
Modelo de ubicacin. El modelo depende de los efectos principales y de los de interaccin que seleccione.
Cuadro de dialogo Regresin Ordinal: Escala.
El cuadro de dilogo Escala le permite especificar el modelo de escala para el anlisis.
Factores y covariables. Muestra una lista de los factores y las covariables.
Modelo de escala. El modelo depende de los efectos principales y de los de interaccin que seleccione.
1.6. Anlisis probit
Este procedimiento mide la relacin entre la intensidad de un estmulo y la proporcin de casos que presentan una cierta respuesta a dicho estmulo. Es til para las situaciones en las que se dispone de una respuesta dicotmica que se piensa puede estar influenciada o causada por los niveles de alguna o algunas variables independientes, y es particularmente adecuada para datos experimentales. Este procedimiento le permitir estimar la intensidad necesaria para que un estmulo llegue a inducir una determinada proporcin de respuestas, como la dosis efectiva para la mediana.
Estadsticos. Coeficientes de regresin y errores tpicos, interseccin y su error tpico, chi-cuadrado de Pearson de la bondad de ajuste, frecuencias observadas y esperadas e intervalos de confianza para los niveles efectivos de la variable o variables independientes. Grficos: grficos de respuestas transformadas.
Datos. Para cada valor de la variable independiente (o para cada combinacin de valores para mltiples variables independientes), la variable de respuesta debe contener el recuento del nmero de casos que presenta la respuesta de inters y que toma dichos valores de la variable independiente, y la variable del total observado debe ser el recuento del nmero total de casos con dichos valores para la variable independiente. La variable de factor debe ser categrica, codificada como enteros.
Supuestos. Las observaciones deben ser independientes. Si dispone de un gran nmero de valores diferentes para las variables independientes respecto al
nmero de observaciones, como es probable que suceda en un estudio observacional, puede que no sean vlidos los estadsticos de chi-cuadrado y de bondad de ajuste.
Procedimientos relacionados. El anlisis probit est estrechamente relacionado con la regresin logstica; de hecho, si elige la transformacin logit, este procedimiento calcular esencialmente una regresin logstica. En general, el anlisis probit es apropiado para los diseos experimentales, mientras que la regresin logstica es ms adecuada para los estudios observacionales. Las diferencias en los resultados reflejan estas diferencias de nfasis. El procedimiento Anlisis probit informa de las estimaciones de los valores efectivos para las diferentes tasas de respuesta (incluyendo la dosis efectiva para la mediana), mientras que la Regresin logstica informa de las estimaciones de las razones de las ventajas (odds ratios) para las variables independientes.
Para utilizar correlaciones bivariadas. En los mens, seleccionar: Analyze, Regression, Probit
Ruta de seleccin Anlisis Probit.
Cuadro de dialogo Anlisis Probit. Permite especificar los niveles de la variable de factor que sern analizados. Los niveles de factor deben codificarse como enteros consecutivos; se analizarn todos los niveles del rango que especifique.
Cuadro de dialogo Anlisis Probit: Opciones.
Puede especificar opciones para el anlisis probit:
Estadsticos. Permite solicitar los siguientes estadsticos opcionales: Frecuencias, Potencia relativa de la mediana, Prueba de paralelismo e Intervalos de confianza fiduciaria.
Potencia relativa de la mediana. Muestra la razn de las potencias de las medianas para cada pareja de los niveles del factor. Tambin muestra los lmites de confianza al 95% para cada potencia relativa de la mediana. Las potencias relativas de la mediana no estn disponibles si no dispone de una variable de factor, o si dispone de ms de una covariable.
Prueba de paralelismo. Contraste sobre la hiptesis de que todos los niveles del factor tienen una pendiente comn.
Intervalos de confianza fiduciaria. Intervalos de confianza para la dosis del gente requerida para producir una cierta probabilidad de respuesta.
Intervalos de confianza fiduciaria y Potencia relativa de la mediana no estn disponibles si se ha seleccionado ms de una covariable. Potencia relativa de la mediana y Prueba de paralelismo slo estn disponibles si se ha seleccionado una variable de factor.
Tasa de respuesta natural. Permite indicar una tasa de respuesta natural incluso en la ausencia del estmulo. Ninguna, Calcular a partir de los datos o Valor.
Calcular a partir de los datos. Estima la tasa de respuesta natural a partir de los datos de la muestra. Los datos deben contener un caso que represente el nivel de control, para el cual el valor de las covariables sea 0. Probit estima la tasa de respuesta natural utilizando como valor inicial la proporcin de respuestas para el nivel de control.
Valor. Establece la tasa de respuesta natural del modelo (seleccione este elemento cuando conozca de antemano la tasa de respuesta natural). Introduzca la proporcin de respuesta natural (la proporcin debe ser menor que 1). Por ejemplo, si la respuesta ocurre el 10% de las veces cuando el estmulo es 0, introduzca 0,10.
Criterios. Permite controlar los parmetros del algoritmo iterativo de estimacin de los parmetros. Puede anular las opciones por defecto para N mximo de iteraciones, Lmite para los pasos y Tolerancia de la optimalidad.
1.7. Estimacin ponderada
Los modelos de regresin lineal tpicos asumen que la varianza es constante en la poblacin objeto de estudio. Cuando ste no es el caso (por ejemplo cuando los casos con puntuaciones mayores en un atributo muestran ms variabilidad que los casos con puntuaciones menores en ese atributo), la regresin lineal mediante mnimos cuadrados ordinarios (MCO, OLS) deja de proporcionar estimaciones ptimas para el modelo. Si las diferencias de variabilidad se pueden pronosticar a partir de otra variable, el procedimiento Estimacin ponderada permite calcular los coeficientes de un modelo de regresin lineal mediante mnimos cuadrados ponderados (MCP, WLS), de forma que se les d mayor ponderacin a las observaciones ms precisas (es decir, aqullas con menos variabilidad) al determinar los coeficientes de regresin. El procedimiento Estimacin ponderada contrasta un rango de transformaciones de ponderacin e indica cul se ajustar mejor a los datos.
Estadsticos. Valores de la log-verosimilitud para cada potencia de la variable de ponderacin puesta a prueba,R mltiple, R-cuadrado, R cuadrado corregida, tabla de ANOVA para el modelo MCP, estimaciones de los parmetros tipificados y no tipificados y log-verosimilitud para el modelo MCP.
Datos. Las variables dependiente e independientes deben ser cuantitativas. Las variables categricas, como la religin, la mayora de edad o el lugar de residencia, han de recodificarse como variables binarias (dummy) o como otro de los tipos de variables de contraste. La variable de ponderacin deber ser cuantitativa y estar relacionada con la variabilidad de la variable dependiente.
Supuestos. Para cada valor de la variable independiente, la distribucin de la variable dependiente debe ser normal. La relacin entre la variable dependiente y cada variable independiente debe ser lineal y todas las observaciones deben ser independientes. La varianza de la variable dependiente puede cambiar segn los
niveles de la variable o variables independientes, pero las diferencias se deben poder pronosticar en funcin de la variable de ponderacin.
Para utilizar correlaciones bivariadas. En los mens, seleccionar: Analyze, Regression, Weight Estimation
Ruta de seleccin Estimacin Ponderada.
Cuadro de dialogo Estimacin Ponderada.
Cuadro de dialogo Estimacin Ponderada: Opciones.
Puede especificar las opciones para el anlisis de estimacin ponderada:
Guardar la mejor ponderacin como nueva variable. Aade la variable de ponderacin al archivo activo. Esta variable se denomina WGT_n, siendo n un nmero elegido para proporcionar a la variable un nombre exclusivo.
Mostrar ANOVA y estimaciones. Permite controlar cmo se muestran los estadsticos en los resultados. Las alternativas disponibles son Para la mejor potencia y Para cada valor de potencia.
1.8. Regresin por mnimos cuadrados en dos fases
Los modelos de regresin lineal tpica asumen que los errores de la variable dependiente no estn correlacionados con la variable o variables independientes. Cuando ste no es el caso (por ejemplo, cuando las relaciones entre las variables son bidireccionales), la regresin lineal mediante mnimos cuadrados ordinarios (OLS) deja de proporcionar estimaciones ptimas del modelo. La regresin por mnimos cuadrados en dos fases utiliza variables instrumentales que no estn correlacionadas con los trminos de error para calcular los valores estimados de los predictores problemticos (en la primera fase) y despus utiliza dichos valores calculados para estimar un modelo de regresin lineal para la variable dependiente (la segunda fase). Dado que los valores calculados se basan en variables que no estn correlacionadas con los errores, los resultados del modelo en dos fases son ptimos.
Estadsticos. Para cada modelo: coeficientes de regresin tipificados y no tipificados, R mltiple, Rcuadrado, Rcuadrado corregida, error tpico de la estimacin, tabla de anlisis de varianza, valores pronosticados y residuos. Adems, los intervalos de confianza al 95% para cada coeficiente de regresin y las matrices de correlacin y covarianza para las estimaciones de los parmetros.
Datos. Las variables dependiente e independientes deben ser cuantitativas. Las variables categricas, como la religin, la mayora de edad o el lugar de residencia, han de recodificarse como variables binarias (dummy) o como otro de los tipos de variables de contraste. Las variables explicativas endgenas deben ser cuantitativas (no categricas).
Supuestos. Para cada valor de la variable independiente, la distribucin de la variable dependiente debe ser normal. La varianza de distribucin de la variable dependiente debe ser constante para todos los valores de la variable independiente. La relacin entre la variable dependiente y cada variable independiente debe ser lineal.
Para utilizar correlaciones bivariadas. En los mens, seleccionar: Analyze, Regression, 2-Stage Least Squares
Ruta de seleccin Regresin por mnimos cuadrados en dos fases.
Cuadro de dialogo Regresin por mnimos cuadrados en dos fases.
Cuadro de dialogo Regresin por mnimos cuadrados en dos fases: Opciones.
Puede seleccionar las opciones siguientes para su anlisis:
Guardar variables nuevas. Permite aadir nuevas variables al archivo activo. Las opciones disponibles son Pronsticos y Residuos.
Mostrar covarianza de parmetros. Permite imprimir la matriz de covarianzas de las estimaciones de los parmetros.