Sie sind auf Seite 1von 30

SPSS

Descripcin de SPSS....................................................................................................................... 3
Sintaxis de comandos.................................................................................................................. 3
Estructura interna de SPSS ......................................................................................................... 4
Mdulo Base de SPSS ................................................................................................................ 5
Frecuencias ............................................................................................................................. 5
Descriptivos ............................................................................................................................ 5
Explorar................................................................................................................................... 5
Tablas de contingencia............................................................................................................ 5
Resumir ................................................................................................................................... 6
Medias..................................................................................................................................... 6
Prueba T para muestras independientes .................................................................................. 6
Prueba T para muestras relacionadas...................................................................................... 6
Prueba T una muestra.............................................................................................................. 6
ANOVA de un factor .............................................................................................................. 6
MLG Univariante.................................................................................................................... 7
Correlaciones bivariadas ......................................................................................................... 7
Correlaciones parciales ........................................................................................................... 7
Distancias................................................................................................................................ 7
Regresin lineal ...................................................................................................................... 7
Estimacin curvilnea.............................................................................................................. 7
Anlisis discriminante............................................................................................................. 8
Anlisis factorial ..................................................................................................................... 8
Anlisis de conglomerados ..................................................................................................... 8
Prueba de chi-cuadrado........................................................................................................... 9
Prueba binomial ...................................................................................................................... 9
Prueba de rachas ..................................................................................................................... 9
Prueba de Kolmogorov-Smirnov para una muestra................................................................ 9
Pruebas para dos muestras independientes ............................................................................. 9
Pruebas para dos muestras relacionadas ............................................................................... 10
Pruebas para varias muestras independientes ....................................................................... 10
Pruebas para varias muestras relacionadas ........................................................................... 10
Frecuencias de respuestas mltiples ..................................................................................... 10
Tablas de contingencia de respuestas mltiples.................................................................... 10
Anlisis de fiabilidad ............................................................................................................ 10
Escalamiento multidimensional ............................................................................................ 10
Estadsticos de la razn......................................................................................................... 11
Mdulo Modelos Avanzados ........................................................................................................ 11
Anlisis MLG multivariante. ................................................................................................ 11
Anlisis de Componentes de la Varianza.............................................................................. 11
Modelos lineales mixtos ....................................................................................................... 11
Anlisis LogLineal................................................................................................................ 11
Anlisis loglineal general...................................................................................................... 12
Anlisis loglineal logit .......................................................................................................... 12

Introduccin al SPSS
Regresin ordinal .................................................................................................................. 12
Tablas de mortalidad............................................................................................................. 12
Anlisis de supervivencia de Kaplan-Meier ......................................................................... 13
Regresin de Cox.................................................................................................................. 13
Mdulo Modelos de Regresin..................................................................................................... 13
Regresin logstica................................................................................................................ 13
Regresin logstica multinomial ........................................................................................... 14
Anlisis probit....................................................................................................................... 14
Estimacin ponderada ........................................................................................................... 14
Regresin por mnimos cuadrados en dos fases ................................................................... 14
Mdulo Categoras........................................................................................................................ 15
Escalamiento ptimo mediante mnimos cuadrados alternantes .......................................... 15
Regresin categrica ............................................................................................................. 15
Anlisis de componentes principales categrico (CATPCA)............................................... 16
Anlisis de correlacin cannica no lineal............................................................................ 16
Anlisis de correspondencias................................................................................................ 17
Anlisis de homogeneidad .................................................................................................... 17
Escalamiento multidimensional (PROXSCAL) ................................................................... 18
Mdulo Tablas .............................................................................................................................. 18
Generacin de tablas ............................................................................................................. 18
Conjuntos de respuestas mltiples ........................................................................................ 19
Reglas bsicas y limitaciones para generar una tabla ........................................................... 19
Caractersticas generales del mdulo BASE de SPSS.................................................................. 19
Ventana del editor de datos de SPSS ........................................................................................ 20
Tipos de ficheros....................................................................................................................... 21
Tipos de ventanas...................................................................................................................... 22
Iniciar una sesin con SPSS...................................................................................................... 23
Ficheros de datos en SPSS........................................................................................................ 24

Introduccin al SPSS

Descripcin de SPSS
SPSS para Windows proporciona un poderoso sistema de anlisis estadstico y de
gestin de datos en un entorno grfico, utilizando mens descriptivos y cuadros de
dilogo sencillos que realizan la mayor parte del trabajo. La mayora de las tareas se
pueden llevar a cabo simplemente situando el puntero del ratn en el lugar deseado y
pulsando en el botn, aunque siempre es posible tambin la utilizacin de la sintaxis de
SPSS que permite la programacin de las rdenes que se desea que repita el
programa.
Adems de la interfaz de los anlisis estadsticos, SPSS para Windows proporciona:

Editor de datos. Ventana similar a una hoja de clculo, que permite definir,
introducir, editar y presentar datos.
Visor. Ventana mediante la cual es posible examinar los resultados,
mostrarlos y ocultarlos de forma selectiva, modificar el orden de presentacin
y desplazar tablas y grficos entre SPSS y otras aplicaciones.
Tablas pivote multidimensionales. Gran parte de los resultados que
proporciona SPSS vienen dados en forma de tabla. Las tablas pivote
multidimensionales de SPSS permiten reorganizar filas, columnas y capas.
Las capas en las tablas permiten la fcil comparacin de resultados entre los
diferentes grupos que se analicen.
Grficos de alta resolucin. Como funciones bsicas de SPSS se incluyen
grficos de sectores, grficos de barras, histogramas, diagramas de
dispersin y grficos 3-D de alta resolucin.
Acceso a bases de datos. SPSS permite el acceso a cualquier base de
datos. La utilizacin de esta importante caracterstica del programa es
inmediata gracias al Asistente para bases de datos implementado.
Transformaciones de los datos. Las funciones de transformacin permiten
preparar los datos para el anlisis. Estas funciones permiten crear
subgrupos de datos, combinar categoras, aadir, agregar, fusionar,
segmentar y transponer archivos, entre muchas otras posibilidades.
Distribucin electrnica. Se pueden enviar informes por correo electrnico
pulsando en un botn o exportar tablas y grficos en formato HTML para
distribuirlos por Internet o dentro de una Intranet.
Ayuda en pantalla. SPSS dispone de un importante sistema de ayuda.
Durante la ejecucin del programa la ayuda muestra una serie de cuadros de
dilogo que permiten la ejecucin de tareas especficas. Se dispone tambin
de informacin referente a los resultados de las tablas pivote explicando
trminos estadsticos. Adems, SPSS muestra una serie de ejemplos sobre
el modo de utilizar los procedimientos estadsticos e interpretar los
resultados.

Sintaxis de comandos
Como ya hemos indicado, es posible acceder a la mayora de los comando desde los
mens y cuadros de dilogo. No obstante, algunas rdenes slo estn disponibles
mediante el uso del lenguaje de comandos. El lenguaje de comandos tambin permite
guardar los trabajos en un archivo de sintaxis, con lo que es posible repetir los anlisis

Introduccin al SPSS
en otro momento o ejecutarlos en un trabajo automatizado con la Unidad de
produccin.
Un archivo de sintaxis es simplemente un archivo de texto que contiene comandos.
Aunque es posible abrir una ventana de sintaxis y escribir comandos, es ms sencillo
permitir que el programa ayude a construir un archivo de sintaxis mediante uno de los
siguientes mtodos:
Pegando la sintaxis de comandos desde los cuadros de dilogo (opcin pegar)
Creando un archivo de sintaxis
En los ficheros de ayuda en pantalla de un procedimiento determinado, siempre
aparece el vnculo sintaxis de comandos en la lista de Temas relacionados. Esta opcin
permite acceder al diagrama de sintaxis correspondiente al comando en uso. Tambin
se dispone de una completa informacin sobre el lenguaje de comandos en el manual
de referencia de sintaxis (SPSS Base Syntax Reference Guide).

Estructura interna de SPSS


SPSS est formado por cinco bloques, que reciben el nombre de mdulos, cada uno
de ellos especializado en una rama de la estadstica:
Mdulo base, permite la generacin y manipulacin de datos y ficheros y la
generacin de grficos de alta resolucin. Con este mdulo se llevan a cabo
los anlisis estadsticos elementales
Mdulo Modelos de Regresin, donde se consideran una gran parte de
tcnicas estadsticas de regresin
Mdulo Modelos Avanzados, se estudian los diferentes modelos de anlisis
de la varianza y diseo de experimentos as como tablas de mortalidad y
anlisis de supervivencia
Mdulo Categoras, dedicado a los anlisis de componentes principales, de
correlacin cannica, de correspondencias, de homogeneidad y tcnicas de
Multidimensional Scaling
Mdulo Tablas, permite la generacin de tablas
Mdulo Tendencias, utilizado para el anlisis de series temporales
Mdulo Anlisis Conjunto, para el diseo de experimentos

Procedemos a continuacin a describir brevemente los anlisis implementados en los


primeros 5 mdulos:

Introduccin al SPSS

Mdulo Base de SPSS


Frecuencias
El procedimiento Frecuencias proporciona estadsticos y representaciones grficas que
resultan tiles para describir muchos tipos de variables. Es un buen procedimiento para
una inspeccin inicial de los datos.

Descriptivos
El procedimiento Descriptivos muestra estadsticos descriptivos univariantes para el
grupo de variables especificado en una nica tabla y calcula valores tipificados
(puntuaciones z).

Explorar
El procedimiento Explorar genera estadsticos de resumen y representaciones grficas,
bien para todos los casos o bien de forma separada para grupos de casos. En general,
el Anlisis Exploratorio de Datos permite para inspeccionar los datos, identificar valores
atpicos, obtener descripciones, comprobar supuestos y caracterizar diferencias entre
subpoblaciones (grupos de casos). La inspeccin de los datos puede mostrar que
existen valores inusuales, valores extremos, discontinuidades en los datos u otras
peculiaridades. Adems, la aplicacin de estas tcnicas puede ayudar a determinar si
son adecuadas los procedimentos estadsticos que se van a aplicar. La exploracin
puede indicar que necesita transformar los datos si la tcnica necesita una distribucin
normal. O bien, el usuario puede decidir que necesita utilizar pruebas no paramtricas.

Tablas de contingencia
El procedimiento Tablas de contingencia crea tablas de clasificacin doble y mltiple y
proporciona una serie de pruebas y medidas de asociacin para las tablas de doble va.
La estructura de la tabla y el hecho de que las categoras estn ordenadas o no,
determinan las pruebas o medidas que se utilizan.
Los estadsticos de tablas de contingencia y las medidas de asociacin slo se calculan
para las tablas de doble va. Si se especifica una fila, una columna y un factor de capa
(variable de control), el procedimiento Tablas de contingencia crea un panel de
medidas y estadsticos asociados a cada valor del factor de capa (o una combinacin
de valores para dos o ms variables de control). Por ejemplo, si sexo es un factor de
capa para una tabla de casado (s, no) en funcin de vida (vida emocionante, rutinaria o
aburrida), los resultados para una tabla de doble clasificacin para las mujeres se
calculan de forma independiente de los resultados de los hombres y se imprimen en
paneles uno detrs del otro.

Introduccin al SPSS

Resumir
El procedimiento Resumir calcula estadsticos de subgrupo para las variables dentro de
las categoras de una o ms variables de agrupacin, cruzando todos los niveles de las
variables de agrupacin. Es posible definir el orden en el que se mostrarn los
estadsticos. Tambin se muestran estadsticos de resumen para cada variable a travs
de todas las

Medias
El procedimiento Medias calcula medias de subgrupo y estadsticos para variables
dependientes dentro de las categoras de una o ms variables independientes.

Prueba T para muestras independientes


El procedimiento Prueba T para muestras independientes compara las medias de dos
grupos de casos. Para esta prueba, idealmente los sujetos deben asignarse
aleatoriamente a dos grupos, de forma que cualquier diferencia en la respuesta sea
debida al tratamiento (o falta de tratamiento) y no a otros factores.

Prueba T para muestras relacionadas


El procedimiento Prueba T para muestras relacionadas compara las medias de dos
variables de un solo grupo. Calcula las diferencias entre los valores de las dos
variables de cada caso y contrasta si la media difiere de 0.

Prueba T una muestra


El procedimiento Prueba T para una muestra contrasta si la media de una sola variable
difiere de una constante especificada.

ANOVA de un factor
El procedimiento ANOVA de un factor genera un anlisis de varianza de un factor para
una variable dependiente cuantitativa respecto a una nica variable de factor (la
variable independiente). El anlisis de varianza se utiliza para contrastar la hiptesis de
que varias medias son iguales. Esta tcnica es una extensin de la prueba t para dos
muestras.
Adems de determinar que existen diferencias entre las medias, es posible que desee
saber qu medias difieren. Existen dos tipos de contrastes para comparar medias: a
priori y post hoc. Los contrastes a priori se plantean antes de ejecutar el experimento y
los contrastes post hoc se realizan despus de haber llevado a cabo el experimento.
Tambin puede contrastar las tendencias existentes a travs de las categoras.

Introduccin al SPSS

MLG Univariante
El procedimiento MLG Univariante proporciona un anlisis de regresin y un anlisis de
varianza para una variable dependiente mediante uno o ms factores o variables. Las
variables de factor dividen la poblacin en grupos. Con el procedimiento Modelo lineal
general se pueden contrastar hiptesis nulas sobre los efectos de otras variables en las
medias de varias agrupaciones de una nica variable dependiente. Se pueden
investigar las interacciones entre los factores as como los efectos de los factores
individuales, algunos de los cuales pueden ser aleatorios. Adems, se pueden incluir
los efectos de las covariables y las interacciones de covariables con los factores. Para
el anlisis de regresin, las variables independientes (predictoras) se especifican como
covariables.

Correlaciones bivariadas
El procedimiento Correlaciones bivariadas calcula el coeficiente de correlacin de
Pearson, la rho de Spearman y la tau-b de Kendall con sus niveles de significacin. Las
correlaciones miden cmo estn relacionadas las variables o los rdenes de los
rangos.

Correlaciones parciales
El procedimiento Correlaciones parciales calcula los coeficientes de correlacin parcial,
los cuales describen la relacin lineal existente entre dos variables mientras se
controlan los efectos de una o ms variables adicionales.

Distancias
Este procedimiento calcula una variedad de estadsticos que miden las similaridades o
disimilaridades (distancias), entre pares de variables o entre pares de casos. Estas
medidas de similaridad o distancia se pueden utilizar despus con otros
procedimientos, como anlisis factorial, anlisis de conglomerados o escalamiento
multidimensional, para ayudar en el anlisis de conjuntos de datos complejos.

Regresin lineal
La regresin lineal estima los coeficientes de la ecuacin lineal, con una o ms
variables independientes, que mejor prediga el valor de la variable dependiente.

Estimacin curvilnea
El procedimiento Estimacin Curvilnea genera estadsticos de estimacin curvilnea
por regresin y grficos relacionados para 11 modelos diferentes de estimacin
curvilnea por regresin. Se produce un modelo diferente para cada variable
dependiente. Tambin se pueden guardar valores pronosticados, residuos e intervalos
pronosticados como nuevas variables.

Introduccin al SPSS

Anlisis discriminante
El anlisis discriminante resulta til para las situaciones en las que se desea construir
un modelo predictivo para pronosticar el grupo de pertenencia de un caso a partir de
las caractersticas observadas de cada caso. El procedimiento genera una funcin
discriminante (o, para ms de dos grupos, un conjunto de funciones discriminantes)
basada en combinaciones lineales de las variables predictoras que proporcionan la
mejor discriminacin posible entre los grupos. Las funciones se generan a partir de una
muestra de casos para los que se conoce el grupo de pertenencia; posteriormente, las
funciones pueden ser aplicadas a nuevos casos que dispongan de medidas para las
variables predictoras pero de los que se desconozca el grupo de pertenencia .

Anlisis factorial
El anlisis factorial intenta identificar variables subyacentes, o factores, que expliquen
la configuracin de las correlaciones dentro de un conjunto de variables observadas. El
anlisis factorial se suele utilizar en la reduccin de los datos para identificar un
pequeo nmero de factores que explique la mayora de la varianza observada en un
nmero mayor de variables manifiestas. Tambin puede utilizarse para generar
hiptesis relacionadas con los mecanismos causales o para inspeccionar las variables
para anlisis subsiguientes (por ejemplo, para identificar la colinealidad antes de
realizar un anlisis de regresin lineal).

Anlisis de conglomerados
Anlisis de conglomerados jerrquico
Este procedimiento intenta identificar grupos relativamente homogneos de casos (o de
variables) basndose en las caractersticas seleccionadas, mediante un algoritmo que
comienza con cada caso (o cada variable) en un conglomerado diferente y combina los
conglomerados hasta que slo queda uno. Es posible analizar las variables brutas o
elegir de entre una variedad de transformaciones de estandarizacin. Las medidas de
distancia o similaridad se generan mediante el procedimiento Proximidades. Los
estadsticos se muestran en cada etapa para ayudar a seleccionar la mejor solucin.
Anlisis de conglomerados de K-medias
Este procedimiento intenta identificar grupos de casos relativamente homogneos
basndose en las caractersticas seleccionadas y utilizando un algoritmo que puede
gestionar un gran nmero de casos. Sin embargo, el algoritmo requiere que el usuario
especifique el nmero de conglomerados. Puede especificar los centros iniciales de los
conglomerados si conoce de antemano dicha informacin. Se puede elegir uno de los
dos mtodos disponibles para clasificar los casos: la actualizacin de los centros de los
conglomerado de forma iterativa o slo la clasificacin. Asimismo, se puede guardar la
informacin relativa a la pertenencia a los conglomerados, la distancia y los centros de
los conglomerados finales. Es posible etiquetar los resultados por casos mediante una
variable. Adems se pueden solicitar los estadsticos F de los anlisis de varianza.

Introduccin al SPSS
Seleccin de procedimientos para la conglomeracin
Los anlisis de conglomerados se pueden realizar mediante los procedimientos de
anlisis de conglomerados en dos fases, jerrquico o de K-medias. Cada uno de estos
procedimientos emplea un algoritmo distinto en la creacin de conglomerados y
contiene opciones que no estn disponibles en los otros.

Prueba de chi-cuadrado
El procedimiento Prueba de chi-cuadrado tabula una variable en categoras y calcula
un estadstico chi-cuadrado. Esta prueba de bondad de ajuste compara las frecuencias
observadas y esperadas en cada categora para contrastar si todas las categoras
contienen la misma proporcin de valores o si cada categora contiene una proporcin
de valores especificada por el usuario.

Prueba binomial
El procedimiento Prueba binomial compara las frecuencias observadas de dos
categoras de una variable dicotmica con las frecuencias esperadas en una
distribucin binomial con un parmetro de probabilidad especificado. Por defecto, el
parmetro de probabilidad para ambos grupos es 0,5. Para cambiar las probabilidades,
puede introducirse una proporcin de prueba para el primer grupo. La probabilidad del
segundo grupo ser 1 menos la probabilidad especificada para el primer grupo.

Prueba de rachas
El procedimiento Prueba de rachas contrasta si es aleatorio el orden de aparicin de
dos valores de una variable. Una racha es una secuencia de observaciones similares.
Una muestra con un nmero excesivamente grande o excesivamente pequeo de
rachas sugiere que la muestra no es aleatoria.

Prueba de Kolmogorov-Smirnov para una muestra


El procedimiento Prueba de Kolmogorov-Smirnov para una muestra compara la funcin
de distribucin acumulada observada de una variable con una distribucin terica
determinada, que puede ser la normal, la uniforme, la de Poisson o la exponencial. La
Z de Kolmogorov-Smirnov se calcula a partir de la diferencia mayor (en valor absoluto)
entre las funciones de distribucin acumuladas terica y observada. Esta prueba de
bondad de ajuste contrasta si las observaciones podran razonablemente proceder de
la distribucin especificada.

Pruebas para dos muestras independientes


El procedimiento Pruebas para dos muestras independientes compara dos grupos de
casos existentes en una variable.

Introduccin al SPSS

Pruebas para dos muestras relacionadas


El procedimiento Pruebas para dos muestras relacionadas compara la igualdad entre
las distribuciones de dos variables.

Pruebas para varias muestras independientes


El procedimiento Pruebas para varias muestras independientes compara dos o ms
grupos de casos respecto a una variable.

Pruebas para varias muestras relacionadas


El procedimiento Pruebas para varias
distribuciones de dos o ms variables.

muestras

relacionadas

compara

las

Frecuencias de respuestas mltiples


El procedimiento Frecuencias de respuestas mltiples produce tablas de frecuencias
para conjuntos de respuestas mltiples.

Tablas de contingencia de respuestas mltiples


El procedimiento Tablas de contingencia de respuestas mltiples presenta en forma de
tabla de contingencia conjuntos de respuestas mltiples, variables elementales o una
combinacin. Tambin puede obtener porcentajes de casilla basados en casos o
respuestas, modificar la gestin de los valores perdidos u obtener tablas de
contingencia emparejadas.

Anlisis de fiabilidad
El anlisis de fiabilidad permite estudiar las propiedades de las escalas de medicin y
de los elementos que las constituyen. El procedimiento Anlisis de fiabilidad calcula
medidas de fiabilidad de escala utilizadas normalmente y proporciona informacin
sobre las relaciones entre elementos individuales de la escala.

Escalamiento multidimensional
El escalamiento multidimensional trata de encontrar la estructura de un conjunto de
medidas de distancia entre objetos o casos. Esto se logra asignando las observaciones
a posiciones especficas en un espacio multidimensional de modo que las distancias
entre los puntos en el espacio concuerden al mximo con las disimilaridades dadas. En
muchos casos, las dimensiones de este espacio conceptual son interpretables y se
pueden utilizar para comprender mejor de los datos.

10

Introduccin al SPSS

Estadsticos de la razn
El procedimiento Estadsticos de la razn proporciona una amplia lista de estadsticos
de resumen para describir la razn entre dos variables de escala.

Mdulo Modelos Avanzados


Anlisis MLG multivariante.
El procedimiento MLG Multivariante proporciona un anlisis de regresin y un anlisis
de varianza para variables dependientes mltiples por una o ms covariables o
variables de factor. Las variables de factor dividen la poblacin en grupos. Utilizando
este procedimiento del modelo lineal general, es posible contrastar hiptesis nulas
sobre los efectos de las variables de factor sobre las medias de varias agrupaciones de
una distribucin conjunta de variables dependientes. Asimismo, se pueden investigar
las interacciones entre los factores y tambin los efectos individuales de los factores.
Adems, se pueden incluir los efectos de las covariables y las interacciones de
covariables con los factores. Para el anlisis de regresin, las variables independientes
(predictoras) se especifican como covariables.

Anlisis de Componentes de la Varianza


El procedimiento Componentes de la varianza, para modelos de efectos mixtos, estima
la contribucin de cada efecto aleatorio a la varianza de la variable dependiente. Este
procedimiento resulta de particular inters para el anlisis de modelos mixtos, como los
diseos split-plot, los diseos de medidas repetidas univariados y los diseos de
bloques aleatorios. Al calcular las componentes de la varianza, se puede determinar
dnde centrar la atencin para reducir la varianza.

Modelos lineales mixtos


El procedimiento Modelos lineales mixtos expande el modelo lineal general de modo
que los datos puedan presentar variabilidad correlacionada y no constante. El modelo
lineal mixto proporciona, por tanto, la flexibilidad necesaria para modelar no slo las
medias sino tambin las varianzas y covarianzas de los datos.
El procedimiento Modelos lineales mixtos es asimismo una herramienta flexible para
ajustar otros modelos que puedan ser formulados como modelos lineales mixtos.
Dichos modelos incluyen los modelos multinivel, los modelos lineales jerrquicos y los
modelos con coeficientes aleatorios.

Anlisis LogLineal
El procedimiento de anlisis loglineal de seleccin de modelo analiza tablas de
contingencia de varios factores. Ajusta modelos loglineales jerrquicos a las tablas de
contingencia multidimensionales utilizando un algoritmo de ajuste proporcional. Este
procedimiento ayuda a encontrar qu variables categricas estn asociadas.

11

Introduccin al SPSS

Anlisis loglineal general


El procedimiento Anlisis loglineal general analiza las frecuencias de las observaciones
incluidas en cada categora de la clasificacin cruzada de una tabla de contingencia.
Cada una de las clasificaciones cruzadas de la tabla constituye una casilla y cada
variable categrica se denomina factor. La variable dependiente es el nmero de casos
(la frecuencia) en una casilla de la tabla de contingencia y las variables explicativas son
los factores y las covariables. Este procedimiento estima los parmetros de mxima
verosimilitud de modelos loglineales jerrquicos y no jerrquicos utilizando el mtodo
de Newton-Raphson. Es posible analizar una distribucin multinomial o de Poisson.

Anlisis loglineal logit


El procedimiento Anlisis loglineal logit analiza la relacin entre variables dependientes
(o de respuesta) y variables independientes (o explicativas). Las variables
dependientes siempre son categricas, mientras que las variables independientes
pueden ser categricas (factores). Otras variables independientes, las covariables de
casilla, pueden ser continuas pero no se aplican en forma de caso por caso. A una
casilla dada se le aplica la media ponderada de la covariable para los casos de esa
casilla. El logaritmo de las ventajas de las variables dependientes se expresa como una
combinacin lineal de parmetros. Se supone automticamente una distribucin
multinomial; estos modelos se denominan a veces modelos logit multinomiales. Este
procedimiento estima los parmetros de los modelos loglineales logit utilizando el
algoritmo de Newton-Raphson.

Regresin ordinal
La regresin ordinal permite dar forma a la dependencia de una respuesta ordinal
politmica sobre un conjunto de predictores, que pueden ser factores o covariables. El
diseo de la regresin ordinal se basa en la metodologa de McCullagh (1980, 1998) y
en la sintaxis se hace referencia al procedimiento como PLUM.
El anlisis de regresin lineal ordinario implica minimizar las diferencias de la suma de
los cuadrados entre una variable de respuesta (la dependiente) y una combinacin
ponderada de las variables predictoras (las independientes). Los coeficientes
estimados reflejan cmo los cambios en los predictores afectan a la respuesta. Se
considera que la respuesta es numrica, en el sentido en que los cambios en el nivel
de la respuesta son equivalentes en todo el rango de la respuesta. Por ejemplo, la
diferencia de altura entre una persona que mide 150 cm y una que mide 140 cm es de
10 cm, que tiene el mismo significado que la diferencia de altura entre una persona que
mide 210 cm y una que mide 200 cm. Estas relaciones no se mantienen
necesariamente con las variables ordinales, en las que la eleccin y el nmero de
categoras de respuesta pueden ser bastante arbitrarios.

Tablas de mortalidad
Existen muchas situaciones en las se desea examinar la distribucin de un perodo
entre dos eventos, como la duracin del empleo (tiempo transcurrido entre el contrato y
el abandono de la empresa). Sin embargo, este tipo de datos suele incluir algunos

12

Introduccin al SPSS
casos para los que no se registra el segundo evento; por ejemplo, la gente que todava
trabaja en la empresa al final del estudio. Las razones para que no se verifique el
segundo evento pueden ser muy variadas: en algunos casos, el evento simplemente no
tiene lugar antes de que finalice el estudio; en otros, el investigador puede haber
perdido el seguimiento de su estado en algn momento anterior a que finalice el
estudio; y existen adems casos que no pueden continuar por razones ajenas al
estudio (como el caso en que un empleado caiga enfermo y se acoja a una baja
laboral). Estos casos se conocen globalmente como casos censurados y hacen que el
uso de tcnicas tradicionales como las pruebas t o la regresin lineal sea inapropiado
para este tipo de estudio.
Existe una tcnica estadstica til para este tipo de datos llamada tabla de mortalidad
de "seguimiento". La idea bsica de la tabla de mortalidad es subdividir el perodo de
observacin en intervalos de tiempo ms pequeos. En cada intervalo, se utiliza toda la
gente que se ha observado como mnimo durante ese perodo de tiempo para calcular
la probabilidad de que un evento terminal tenga lugar dentro de ese intervalo. Las
probabilidades estimadas para cada intervalo se utilizan para estimar la probabilidad
global de que el evento tenga lugar en diferentes puntos temporales.

Anlisis de supervivencia de Kaplan-Meier


El procedimiento de Kaplan-Meier es un mtodo de estimacin de modelos hasta el
evento en presencia de casos censurados. El modelo de Kaplan-Meier se basa en la
estimacin de las probabilidades condicionales en cada punto temporal cuando tiene
lugar un evento y en tomar el lmite del producto de esas probabilidades para estimar la
tasa de supervivencia en cada punto temporal.

Regresin de Cox
Del mismo modo que las tablas de mortalidad y el anlisis de supervivencia de KaplanMeier, la regresin de Cox es un mtodo para crear modelos para datos de tiempos de
espera hasta un evento con casos censurados presentes. Sin embargo, la regresin de
Cox permite incluir en los modelos variables predictoras (covariables). Por ejemplo,
podr construir un modelo de la duracin en el empleo como funcin del nivel educativo
y de la categora laboral. La regresin de Cox gestionar los casos censurados
correctamente y proporcionar las estimaciones de los coeficientes para cada una de
las covariables, permitiendo evaluar el impacto de mltiples covariables en el mismo
modelo. Adems, es posible utilizar la regresin de Cox para examinar el efecto de
covariables continuas.

Mdulo Modelos de Regresin


Regresin logstica
La regresin logstica resulta til para los casos en los que se desea predecir la
presencia o ausencia de una caracterstica o resultado segn los valores de un
conjunto de variables predictoras. Es similar a un modelo de regresin lineal pero est
adaptado para modelos en los que la variable dependiente es dicotmica. Los
coeficientes de regresin logstica pueden utilizarse para estimar la razn de las
ventajas (odds ratio) de cada variable independiente del modelo. La regresin logstica
13

Introduccin al SPSS
se puede aplicar a un rango ms amplio de situaciones de investigacin que el anlisis
discriminante.

Regresin logstica multinomial


La opcin Regresin logstica multinomial resulta til en aquellas situaciones en las que
desee poder clasificar a los sujetos segn los valores de un conjunto de variables
predictoras. Este tipo de regresin es similar a la regresin logstica, pero ms general,
ya que la variable dependiente no est restringida a dos categoras.

Anlisis probit
Este procedimiento mide la relacin entre la intensidad de un estmulo y la proporcin
de casos que presentan una cierta respuesta a dicho estmulo. Es til para las
situaciones en las que se dispone de una respuesta dicotmica que se piensa puede
estar influenciada o causada por los niveles de alguna o algunas variables
independientes, y es particularmente adecuada para datos experimentales. Este
procedimiento permite estimar la intensidad necesaria para que un estmulo llegue a
inducir una determinada proporcin de respuestas, como la dosis efectiva para la
mediana.

Estimacin ponderada
Los modelos de regresin lineal tpicos asumen que la varianza es constante en la
poblacin objeto de estudio. Cuando ste no es el caso (por ejemplo cuando los casos
con puntuaciones mayores en un atributo muestran ms variabilidad que los casos con
puntuaciones menores en ese atributo), la regresin lineal mediante mnimos
cuadrados ordinarios (MCO, OLS) deja de proporcionar estimaciones ptimas para el
modelo. Si las diferencias de variabilidad se pueden pronosticar a partir de otra
variable, el procedimiento Estimacin ponderada permite calcular los coeficientes de un
modelo de regresin lineal mediante mnimos cuadrados ponderados (MCP, WLS), de
forma que se les d mayor ponderacin a las observaciones ms precisas (es decir,
aqullas con menos variabilidad) al determinar los coeficientes de regresin. El
procedimiento Estimacin ponderada contrasta un rango de transformaciones de
ponderacin e indica cul se ajustar mejor a los datos.

Regresin por mnimos cuadrados en dos fases


Los modelos de regresin lineal tpica asumen que los errores de la variable
dependiente no estn correlacionados con la variable o variables independientes.
Cuando ste no es el caso (por ejemplo, cuando las relaciones entre las variables son
bidireccionales), la regresin lineal mediante mnimos cuadrados ordinarios (OLS) deja
de proporcionar estimaciones ptimas del modelo. La regresin por mnimos cuadrados
en dos fases utiliza variables instrumentales que no estn correlacionadas con los
trminos de error para calcular los valores estimados de los predictores problemticos
(en la primera fase) y despus utiliza dichos valores calculados para estimar un modelo
de regresin lineal para la variable dependiente (la segunda fase). Dado que los
valores calculados se basan en variables que no estn correlacionadas con los errores,
los resultados del modelo en dos fases son ptimos.

14

Introduccin al SPSS

Mdulo Categoras
Escalamiento ptimo mediante mnimos cuadrados alternantes
La combinacin del nivel de medida y el nmero de conjunto seleccionado en este
cuadro de dilogo determina el procedimiento de escalamiento ptimo mediante
mnimos cuadrados alternantes que realiza.
Nivel de medida. Especifica el nivel para escalamiento ptimo correspondiente a las
variables utilizadas en el anlisis.

Todas las variables son nominales mltiples. Todas las variables del anlisis
tienen cuantificaciones de categoras que pueden diferir para cada dimensin.
Alguna variable no es nominal mltiple. Una o ms variables en el anlisis se
escalan a un nivel diferente del nominal mltiple. Otros niveles de escala
posibles son nominal simple, ordinal y numrica discreta.

Nmero de conjuntos de variables. Especifica cuntos grupos de variables se van a


comparar con otros grupos de variables.

Un conjunto. Los datos contienen un grupo de variables.


Mltiples conjuntos. Los datos contienen ms de un grupo de variables. Si se
selecciona esta opcin, se elijir Correlacin cannica no-lineal (OVERALS).

Anlisis seleccionado. La combinacin de opciones para Nivel de medida y Nmero de


conjuntos de variables proporciona un anlisis de homogeneidad, un anlisis de
componentes principales categricos o un anlisis de correlacin cannica no-lineal.
Las opciones para cada procedimiento son:

Anlisis de homogeneidad (HOMALS). Seleccione Todas las variables son


nominales mltiples y Un conjunto.
Anlisis de componentes principales categricos (CATPCA). Seleccione Alguna
variable no es nominal mltiple y Un conjunto.
Anlisis de correlacin cannica no lineal (OVERALS). Seleccione Mltiples
conjuntos.

Regresin categrica
La regresin categrica cuantifica los datos categricos mediante la asignacin de
valores numricos a las categoras, obtenindose una ecuacin de regresin lineal
ptima para las variables transformadas. La regresin categrica se conoce tambin
por el acrnimo CATREG, del ingls categorical regression (regresin categrica).
El anlisis de regresin lineal ordinario implica minimizar las diferencias de la suma de
los cuadrados entre una variable de respuesta (la dependiente) y una combinacin
ponderada de las variables predictoras (las independientes). Las variables son
normalmente cuantitativas, con los datos categricos (nominales) recodificados como
variables binarias o de contraste. Como resultado, las variables categricas sirven para
separar grupos de casos y la tcnica estima conjuntos separados de parmetros para
cada grupo. Los coeficientes estimados reflejan cmo los cambios en los predictores

15

Introduccin al SPSS
afectan a la respuesta. El pronstico de la respuesta es posible para cualquier
combinacin de los valores predictores.
Una aproximacin alternativa incluye la regresin de la respuesta respecto a los
propios valores predictores categricos. Como consecuencia, se estima un coeficiente
para cada variable. Sin embargo, para las variables categricas, los valores categricos
son arbitrarios. La codificacin de las categoras de diferentes maneras proporciona
diferentes coeficientes, dificultando las comparaciones entre los anlisis de las mismas
variables.
CATREG ampla la aproximacin tpica mediante un escalamiento de las variables
nominales, ordinales y numricas simultneamente. El procedimiento cuantifica las
variables categricas de manera que las cuantificaciones reflejen las caractersticas de
las categoras originales. El procedimiento trata a las variables categricas
cuantificadas como si fueran variables numricas. La utilizacin de transformaciones no
lineales permite a las variables ser analizadas en varios niveles para encontrar el
modelo que ms se ajusta.

Anlisis de componentes principales categrico (CATPCA)


Este procedimiento cuantifica simultneamente las variables categricas a la vez que
reduce la dimensionalidad de los datos. El anlisis de componentes principales
categrico se conoce tambin por el acrnimo CATPCA, del ingls CATegorical
Principal Components Analysis.
El objetivo de los anlisis de componentes principales es la reduccin de un conjunto
original de variables en un conjunto ms pequeo de componentes no correlacionados
que representen la mayor parte de la informacin encontrada en las variables
originales. La tcnica es ms til cuando un extenso nmero de variables impide una
interpretacin eficaz de las relaciones entre los objetos (sujetos y unidades). Al reducir
la dimensionalidad, se interpreta un pequeo nmero de componentes en lugar de un
extenso nmero de variables.
El anlisis tpico de componentes principales asume relaciones lineales entre las
variables numricas. Por otra parte, la aproximacin por escalamiento ptimo permite
escalar las variables a diferentes niveles. Las variables categricas se cuantifican de
forma ptima en la dimensionalidad especificada. Como resultado, se pueden modelar
relaciones no lineales entre las variables.

Anlisis de correlacin cannica no lineal


El anlisis de correlacin cannica no lineal coincide con el anlisis de correlacin
cannica categrico mediante escalamiento ptimo. El propsito de este procedimiento
es determinar la similitud entre los conjuntos de variables categricas. El anlisis de
correlacin cannica no lineal se conoce tambin por el acrnimo OVERALS.
El anlisis de correlacin cannica estndar es una extensin de la regresin mltiple,
en la que el segundo conjunto no contiene una nica variable de respuesta, sino varias.

16

Introduccin al SPSS
El objetivo es explicar el mximo posible de la varianza sobre las relaciones existentes
entre dos conjuntos de variables numricas en un espacio de pocas dimensiones.
Inicialmente, las variables de cada conjunto se combinan linealmente de forma que las
combinaciones lineales tengan una correlacin mxima entre s. Una vez dadas estas
combinaciones, se establece que las combinaciones lineales subsiguientes no estn
correlacionadas con las combinaciones anteriores y que tambin tengan la mayor
correlacin posible.

Anlisis de correspondencias
Uno de los objetivos del anlisis de correspondencias es describir las relaciones
existentes entre dos variables nominales, recogidas en una tabla de correspondencias,
sobre un espacio de pocas dimensiones, mientras que al mismo tiempo se describen
las relaciones entre las categoras de cada variable. Para cada variable, las distancias
sobre un grfico entre los puntos de categoras reflejan las relaciones entre las
categoras, con las categoras similares representadas prximas unas a otras. La
proyeccin de los puntos de una variable sobre el vector desde el origen hasta un
punto de categora de la otra variable describe la relacin entre ambas variables.

Anlisis de homogeneidad
El anlisis de homogeneidad cuantifica los datos (categricos) nominales mediante la
asignacin de valores numricos a los casos (los objetos) y a las categoras. El anlisis
de homogeneidad se conoce tambin por el acrnimo HOMALS, del ingls
homogeneity analysis alternating least squares (anlisis de homogeneidad mediante
mnimos cuadrados alternantes).
El objetivo de HOMALS es describir las relaciones entre dos o ms variables nominales
en un espacio de pocas dimensiones que contiene las categoras de las variables as
como los objetos pertenecientes a dichas categoras. Los objetos pertenecientes a la
misma categora se representan cerca los unos de los otros, mientras que los objetos
de diferentes categoras se representan alejados los unos de los otros. Cada objeto se
encuentra lo ms cerca posible de los puntos de categora para las categoras a las
que pertenece dicho objeto.
El anlisis de homogeneidad es similar al anlisis de correspondencias, pero no est
limitado a dos variables. Es por ello que el anlisis de homogeneidad se conoce
tambin como el anlisis de correspondencias mltiple. Tambin se puede ver el
anlisis de homogeneidad como un anlisis de componentes principales para datos
nominales.
El anlisis de homogeneidad es ms adecuado que el anlisis de componentes
principales tpico cuando puede que no se conserven las relaciones lineales entre las
variables, o cuando las variables se miden a nivel nominal. Adems, la interpretacin
del resultado es mucho ms sencilla en HOMALS que en otras tcnicas categricas,
como pueden ser las tablas de contingencia y los modelos loglineales. Debido a que las
categoras de las variables son cuantificadas, se pueden aplicar sobre las
cuantificaciones tcnicas que requieren datos numricos, en anlisis subsiguientes.

17

Introduccin al SPSS

Escalamiento multidimensional (PROXSCAL)


El escalamiento multidimensional trata de encontrar la estructura existente en un
conjunto de medidas de proximidades entre objetos. Esto se logra asignando las
observaciones a posiciones especficas en un espacio conceptual de pocas
dimensiones, de modo que las distancias entre los puntos en el espacio concuerden al
mximo con las similaridades (o disimilaridades) dadas. El resultado es una
representacin de mnimos cuadrados de los objetos en dicho espacio de pocas
dimensiones que, en muchos casos, le ayudar a entender mejor los datos.

Mdulo Tablas
Generacin de tablas
En la pestaa Tabla del generador de tablas, se seleccionan las variables y las
medidas de resumen que aparecern en la tabla.
Listas de variables. En el panel superior izquierdo de la ventana se muestran las
variables del archivo de datos. Tablas personalizadas distingue entre dos niveles de
medida diferentes para las variables y trata de manera distinta las variables en funcin
de su nivel de medida:

Categrico. Datos con un nmero limitado de valores o categoras distintas (por


ejemplo, sexo o religin). Las variables categricas pueden ser variables de
cadena (alfanumricas) o variables numricas que utilizan cdigos numricos
para representar las categoras (por ejemplo, 0=hombre y 1=mujer). Tambin se
hace referencia a estos datos como datos cualitativos.
Escala. Datos medidos en una escala de intervalo o de razn en los que los
valores de los datos indican el orden de los valores y la distancia entre ellos. Por
ejemplo, un salario de $72.195 es superior a un salario de $52.398 y la distancia
entre ambos valores es $19.797. Tambin se hace referencia a estos datos
como datos cuantitativos o continuos.

Las variables categricas definen categoras (filas, columnas y capas) en la tabla y el


estadstico de resumen por defecto es el recuento (nmero de casos en cada
categora). Por ejemplo, una tabla por defecto de la variable categrica sexo slo
mostrar el nmero de hombres y el nmero de mujeres.
Las variables de escala se resumen normalmente dentro de las categoras de las
variables categricas y el estadstico de resumen por defecto es la media. Por ejemplo,
una tabla por defecto de los ingresos dentro de las categoras de sexo mostrar los
ingresos medios de los hombres y los ingresos medios de las mujeres.
Tambin puede resumir las variables de escala por s mismas, sin utilizar una variable
categrica para definir grupos. Esto resulta especialmente til para apilar resmenes de
varias variables de escala.

18

Introduccin al SPSS

Conjuntos de respuestas mltiples


Tablas personalizadas admite tambin un tipo especial de "variable" llamado conjunto
de respuestas mltiples. En realidad, los conjuntos de respuestas mltiples no son, en
sentido estricto, "variables". No aparecen en el Editor de datos y los dems
procedimientos no los reconocen. Los conjuntos de respuestas mltiples utilizan varias
variables para registrar respuestas a preguntas en las que el encuestado puede ofrecer
ms de una respuesta. Los conjuntos de respuestas mltiples se consideran variables
categricas y la mayor parte de las acciones que se pueden realizar con las variables
categricas se pueden realizar tambin con conjuntos de respuestas mltiples.
Es posible cambiar el nivel de medida de una variable en el generador de tablas,
pulsando con el botn derecho del ratn en ella y seleccionando Categrica o Escala
en el men contextual. Puede cambiar definitivamente el nivel de medida de una
variable en la Vista de variables del Editor de datos. Tablas personalizadas considera
como variables categricas las variables definidas con la mtrica nominal u ordinal.

Reglas bsicas y limitaciones para generar una tabla


Para las variables categricas, los estadsticos de resumen se basan en la
variable ms al interior de la dimensin origen de los estadsticos.
Para las variables categricas, la dimensin origen de los estadsticos por
defecto (las filas o las columnas) depende del orden en el que se arrastren y
coloquen las variables en el panel de lienzo. Por ejemplo, si arrastra una variable
primero al panel de filas, la dimensin de las filas es la dimensin por defecto
origen de los estadsticos.
Las variables de escala slo se pueden resumir dentro de las categoras de la
variable ms al interior de la dimensin de las filas o de las columnas. (Puede
colocar la variable de escala en cualquier nivel de la tabla, pero se resume en el
nivel ms al interior).
Las variables de escala no se pueden resumir dentro de otras variables de
escala. Puede apilar resmenes de varias variables de escala o resumir
variables de escala dentro de las categoras de las variables categricas. No
puede anidar una variable de escala dentro de otra ni colocar una variable de
escala en la dimensin de las filas y otra en la dimensin de las columnas.

Caractersticas generales del mdulo BASE de SPSS


En el curso que nos ocupa, pretendemos dar una visin general del mdulo BASE de
SPSS, que como ya hemos indicado, contiene los siguientes subsistemas:
Gestin y generacin de datos y ficheros.
Generacin de grficos de alta resolucin.
Anlisis estadsticos bsicos.

19

Introduccin al SPSS

Ventana del editor de datos de SPSS


Se trata de una tpica ventana de una aplicacin en Windows que, de arriba abajo,
consta de los siguientes elementos:
Barra de ttulo, con el men de control, el nombre de la ventana y los botones
de minimizar, maximizar y cerrar.
Barra de mens, con 10 mens diferentes: Archivo, Edicin, Ver, Datos,
Transformar, Estadstica, Grficos, Utilidades, Ventana y Ayuda.
ARCHIVO. Mediante este men se pueden abrir, crear o grabar los diferentes
ficheros que SPSS emplea, ya sean de datos, instrucciones, resultados o
procesos. Igualmente, es posible controlar las tareas de impresin.
EDICIN. Permite realizar las tareas habituales de edicin: modificar, borrar,
copiar, pegar, seleccionar, etc.
VER. Permite controlar diversos parmetros de visualizacin en pantalla.
DATOS. Este men permite definir variables, as como efectuar
modificaciones en los ficheros de datos: seleccionar, aadir, ponderar, etc.
TRANSFORMAR. Aqu se encuentran todas las opciones relativas a la
modificacin y generacin de nuevas variables. Las funciones de este men
y del anterior son temporales, y slo estn vigentes durante la sesin, sin que
afecten al fichero original de datos. Si se quieren convertir en permanentes,
deben grabarse los cambios.
ANALIZAR. Mediante este men se accede a los diferentes anlisis
estadsticos que se hayan instalado.
GRFICOS. Permite la creacin y edicin de diversos tipos de grficos de alta
resolucin, algunos de ellos son tambin accesibles a travs de
determinadas tcnicas estadsticas.
UTILIDADES. Entre otras, posibilita mostrar informacin sobre los ficheros de
SPSS, las variables o el tratamiento de conjuntos de variables.
VENTANA. Dispone de las funciones habituales para controlar las ventanas.
?. Proporciona ayuda al usuario en el formato tpico de Windows.
Barra de herramientas, donde, mediante botones con iconos, se representan
algunas de las operaciones ms habituales. Si pasamos el puntero del ratn por
cualquiera de ellos, aparecer en la pantalla un texto en amarillo indicando la
funcin que se activa. Esta barra es personalizable.
Lnea de edicin de datos, consistente en una matriz de datos, flanqueada por
una primera fila en gris con los encabezamientos de las variables y por una
primera columna, tambin en gris, con los nmeros de los casos.
Barra de estado, en la que el sistema proporciona diversos mensajes. Est
dividida en varias zonas de avisos. La primera est reservada para
informaciones de tipo general, y en la segunda aparece lo relativo al procesador
de SPSS (nombre del comando que se est ejecutando, nmero de casos
almacenados...)

20

Introduccin al SPSS

Barra de ttulo
Barra de mens
Barra de herramientas
Lnea de edicin de datos

Matriz de datos
Barras de desplazamiento

Barra de estado

Tipos de ficheros
En SPSS se trabaja con dos tipos bsicos de ficheros: los de datos y los de resultados.
Los ficheros de datos propios de SPSS siempre tienen extensin .sav, y su
contenido aparece en la ventana del editor de datos. Un fichero propio es aquel cuyo
formato es el especfico de SPSS y que contiene, no slo los datos, sino tambin la
informacin que el sistema necesita para procesarlos.
Los ficheros de resultados tienen extensin .spo y contienen resultados estadsticos,
habitualmente en formato de tablas, grficos, o cualquier otro tipo. Al igual que ocurre
con los ficheros de datos, los resultados tambin se pueden exportar en otros formatos:
como ficheros de texto o ficheros *.html. Adicionalmente, los grficos son asimismo
exportables en diversos formatos de imagen: metaarchivo de Windows, mapa de bits
de Windows, PosScript, JPEG, CGM, TIFF o PICT de Macintosh.
Pero adems de estos dos tipos bsicos, SPSS es capaz de generar y leer ficheros de
texto.
Adems de las posibilidades de importacin y exportacin de datos o resultados, en
SPSS nos encontramos con los ficheros de sintaxis. Contienen instrucciones de
SPSS escritas en el lenguaje de mandatos del propio sistema. Son tanto ficheros de
entrada como de salida en la medida en que, si bien su uso ms habitual es el de ser
cargados y ledos por el sistema para ejecutar un programa completo en proceso por
lotes, tambin son generados por el propio sistema cuando en los diferentes cuadros
de dilogo, en vez de ejecutar el procedimiento directamente, se pega la instruccin
subyacente. En este ltimo caso se estar empleando SPSS para Windows como una

21

Introduccin al SPSS
interfaz auxiliar de generacin de programas. De una u otra manera, su extensin es
*.sps y su contenido, escrito en ASCII, se muestra en la ventana de sintaxis.

Tipos de ventanas
En este programa, la operacin con ventanas se realiza mediante los procedimientos
habituales de cualquier aplicacin que opere en entornos Windows.

Ventana del editor de datos. Aparece el contenido del fichero de datos que en ese
momento est activo en el sistema. SPSS slo puede tener cargado y residente en
memoria un solo fichero de datos.

Ventana del visor de resultados. Los resultados de los diferentes subprogramas,


listados, tablas, grficos, informe de las modificaciones efectuadas en los datos y
los mensajes y avisos de errores se van mostrando y almacenando en esta
ventana. Esta informacin se puede grabar posteriormente como fichero de
resultados. Una ventana de este tipo se abre automticamente en el momento en el
que se genera el primer resultado de una sesin. Se pueden tener abiertas tantas
como se quiera.

Ventana del visor de resultados de borrador. Es posible mandar los resultados a


este tipo de ventanas en vez de al visor preestablecido. En este visor, para los
cuadros se utilizan caracteres ASCII y aqu los grficos no son editables. Como
contrapartida, en algunos casos simplifica la exportacin.

Ventana del editor de tablas pivote. Este tipo de ventanas permite editar y
modificar las denominadas tablas pivote de SPSS. Se refiere a la posibilidad de
editar el texto, intercambiar los datos mediante transposicin de filas y columnas,
aadir y modificar los colores, etc.

Ventana del editor de grficos. Todos los grficos que SPSS genera son editables
mediante modificaciones del estilo de cambios de colores, de fuentes y tamaos,
intercambio de ejes, rotaciones, etc.

Ventana del editor de resultados de texto. Aquellos resultados de texto que no


aparezcan en las tablas pivote se pueden modificar con este editor. Las
modificaciones son las habituales pare este tipo de informacin textual, centradas
fundamentalmente en las caractersticas de las fuentes (tipo, estilo, color, tamao).

Ventana del editor de sintaxis. Es posible pegar en una ventana de sintaxis las
especificaciones que se realicen en los cuadros de dilogo, con lo que las mismas
aparecern en forma de comandos. Este fichero de instrucciones es editable
mediante esta ventana, lo cul resulta muy til en diversas situaciones:
Slo es posible acceder a determinadas posibilidades y opciones de los
subprogramas mediante el lenguaje de instrucciones.

22

Introduccin al SPSS
Cuando es previsible que una determinada secuencia de operaciones se vaya a
ejecutar en repetidas ocasiones, parece lgico grabar el programa completo y
procesarlo de corrido.
Cuando el ordenador ha de ser compartido por muchos usuarios, el modo
interactivo de operar de Windows consume mucho tiempo.

Ventana del editor de procesos. Es posible personalizar y automatizar muchas


tareas de SPSS mediante la tecnologa OLE usando el lenguaje BASIC.

Por ltimo una cuestin relativa a las ventanas de SPSS cuando se tienen varias
abiertas, es la distincin entre ventana activa y ventana designada. La ventana activa
es la que est actualmente seleccionada. La ventana designada es aquella en la que
en la barra de estado aparece un signo de exclamacin (!) y es la ventana con la que
trabaja SPSS. En cualquier momento se puede cambiar tal designacin empleando el
icono que con tal smbolo aparece en la barra de herramientas de este tipo de
ventanas. Tambin es posible cambiar la ventana designada activando la opcin
Designar ventana que aparece en el men Utilidades de este tipo de ventanas.

Iniciar una sesin con SPSS


SPSS se abre pulsando en el botn de inicio del escritorio de Windows en la opcin
programas y seleccionando la versin instalada del programa

o bien seleccionando en el icono de acceso directo a SPSS sobre el escritorio si dicho


acceso directo ha sido creado

23

Introduccin al SPSS
Al inicio del programa se abre una ventana sobre el editor de datos, preguntando con
qu datos se va a trabajar

Pasemos a ver con qu ficheros de datos permite trabajar SPSS y cmo definir nuevos
datos.

Ficheros de datos en SPSS


Adems de las posibilidades que SPSS brinda para generar y editar los que
denominamos como ficheros de datos propios, SPSS puede manejar una gran variedad
de otros tipos de ficheros de datos:

Archivos de otros paquetes estadsticos, como SYSTAT.


Archivos de hojas de clculo, como LOTUS EXCEL.
Archivos de sistemas de gestin de bases de datos, como dBASE.
Archivos de datos grabados en ASCII, con o sin tabulacin.
Ficheros de datos SPSS creados en otros entornos y sistemas operativos.
Datos de ACCESS, EXCEL FOXPRO, mediante ODBC.

Para abrir uno de estos ficheros, SPSS habilita un asistente que indica los pasos a
seguir

24

Introduccin al SPSS

INTRODUCCIN DE DATOS
Tras abrir el programa, se selecciona la opcin introducir datos:

La definicin de una variable para ser procesada por SPSS comporta una serie de
tareas:

Denominar la variable
Definir el tipo de la misma
Fijar un formato de columnas
Fijar un formato para los datos
25

Introduccin al SPSS

Asignar, si se desea, etiquetas significativas a variables y valores


Definir cdigos especficos para los valores ausentes o perdidos
Determinar la alineacin de los datos
Especificar el nivel de medida

El nombre se escribe en el cuadro de texto asociado al Nombre de la ventana de


definicin de variables, y al resto de las funciones se accede en las columnas
respectivas. Por defecto, las variables se consideran numricas, con formato 8.2, sin
etiqueta ni cdigo especfico para valores ausentes, con alineamiento de los valores a
la derecha de cada casilla y un nivel de medida de escala.
Nombre de las variables
En lo referente al nombre de las variables, hay que cumplir una serie de requisitos:
1. La extensin mxima de los nombres es de ocho caracteres.
2. El primero de ellos ha de ser una letra forzosamente.
3. Los restantes pueden ser cualquier combinacin de letras, nmeros y los
caracteres siguientes: el punto (excepto si es el ltimo carcter), @, #, $, o el
guin bajo (aunque no es recomendable situarlo al final).
4. Otros signos o caracteres especiales no estn permitidos, y sobre todo hay que
poner especial cuidado en no introducir espacios en blanco.
5. Los nombres deben ser nicos, no estando permitida su repeticin en el mismo
fichero de datos.
6. Es indiferente que se usen maysculas o minsculas, pues internamente el
sistema opera siempre con maysculas, independientemente de la forma en que
aparezcan los nombres.
7. Hay una serie de palabras clave que tienen un significado especial para SPSS,
se emplean en diferentes procesos y subprogramas y por tanto, no se pueden
usar como nombres de variables, son las siguientes:
ALL, AND, BY, EQ, GE, GT, LE, NE, NOT, OR, TO, WITH
Declaracin del tipo de la variable
Existe una importante distincin entre las variables que constituyen una matriz de
datos:

26

Introduccin al SPSS
Variables numricas. Representan las variables estadsticas conocidas como
cuantitativas. Sus valores son nicamente codificables mediante nmeros. SPSS
establece a priori todas las variables como numricas, reales con dos decimales.
A su vez, entre stas podemos distinguir entre variables numricas enteras y
variables numricas con parte decimal.
Las variables numricas admiten cualquier nmero como valor vlido, pudiendo
ir precedido del signo menos o no. Su longitud mxima es de 40 caracteres de
los cuales 16 pueden ser cifras decimales. Los signos o los puntos decimales se
contabilizan a la hora de definir la longitud de la variable.
Variables con coma. Este formato de entrada de datos aade al anterior la
coma como separador de los miles y el punto como separador de la parte entera
y de la decimal.
Variables con punto. Se emplea el punto como separador de los miles y la
coma como separador de la parte decimal
Variables numricas en notacin cientfica. Son valores aceptables todos los
numricos mas las letras D o E y los signos ms o menos. 347E3, -12D-3...
Variables tipo fecha. Desde una perspectiva estricta, estas variables son de
tipo numrico. Si se quiere adoptar un punto de vista estadstico, hay que
considerarlas como variables cuantitativas; sin embargo, su codificacin y
representacin en el editor de datos puede realizarse de distintas maneras. Si se
selecciona este tipo en el cuadro de dilogo, se abre una ventana con todos los
formatos aceptables. En la lista desplegada aparecen formatos para variables de
fecha y otros para las estrictamente temporales.

Variables tipo dlar. A un valor numrico dado, se le aade el smbolo del dlar
en los diferentes formatos que aparecen en la ventana que se despliega caso de
elegir esta opcin. El smbolo $ y las comas como separadores de los miles
aparecen automticamente.

27

Introduccin al SPSS

Variables con formato de moneda personalizada. Si a travs del men de


preferencias se han creado formatos especficos para variables, mediante esta
opcin se puede elegir uno de ellos. Una vez seleccionado el formato, la entrada
de datos se realiza del modo habitual, con la salvedad de que los caracteres
empleados para simbolizar la moneda no deben teclearse, sino que son
introducidos por el sistema.
Variables tipo cadena. En su codificacin admiten cualquier carcter. Al
definirlas nicamente debe especificarse su longitud mxima. Si la sucesin de
caracteres introducida como valor de una variable de este tipo tiene una longitud
menor que el mximo declarado, se completa, mientras no se especifique de
otra manera, aadiendo espacios en blanco hacia la derecha. Con este tipo de
variables s hay diferencia entre emplear los caracteres en minscula o
mayscula.
Aunque la codificacin alfanumrica es la ms recomendable para las variables
cualitativas, tambin es la ms propensa a errores. Una alternativa viable es
codificar numricamente las variables cualitativas y asignar a los diferentes
valores numricos etiquetas ilustrativas, lo que disminuye la probabilidad de
ocurrencia de errores. Adems, el editor de datos permite visualizar la matriz con
las etiquetas de los valores en vez de los valores originales.
Etiquetado de variables y valores
La declaracin de las etiquetas de las variables se lleva a cabo en la caja de texto con
epgrafe Etiqueta
La etiqueta de la variable puede ser cualquier texto con una extensin mxima de 120
caracteres, aunque es recomendable limitar su longitud, pues en la mayora de los
listados de resultados el tamao mximo es excesivo y la etiqueta se trunca. Un valor
aconsejable puede estar entre 20 y 40 caracteres. Las etiquetas pueden escribirse con
cualquier combinacin de maysculas y minsculas y van a aparecer siempre tal y
como hayan sido declaradas.
El procedimiento es similar para las etiquetas de valores. Esta operacin slo merece
la pena para variables cualitativas en las que los cdigos asignados a los valores no
resulten claros, y muy especialmente cuando se haya realizado una codificacin
numrica de los mismos.

28

Introduccin al SPSS
Las etiquetas de los valores pueden tener una extensin mxima de 60 caracteres,
aunque aqu es aconsejable limitar su longitud a un valor cercano a 20.
Para crear las etiquetas, el proceso es el siguiente:
1. Se teclea el cdigo del valor de la variable.
2. Se teclea el texto de la etiqueta en su cuadro correspondiente.
La correspondencia entre valor y etiqueta queda as incorporada al fichero de datos.

Definicin de cdigos para los valores ausentes o perdidos


Se entiende por valores ausentes o perdidos a aquellos casos en que no se dispone de
informacin sobre el valor de una variable determinada.
SPSS distingue dos tipos de valores ausentes:
Los definidos por el propio sistema (system-missing values). Asignados
automticamente a todas las casillas vacas que aparezcan en una variable
declarada como numrica. Se representan por una coma.
Los definidos por el usuario (user-missing values). Para las variables
alfanumricas una casilla en blanco se considera un valor vlido de la variable.
Para definir este tipo de valores faltantes, ha de abrirse el correspondiente
cuadro de dilogo, en el que se distinguen las siguientes opciones:
1. Ausencia de valores faltantes definidos por el usuario. Todos los valores,
excepto los blancos, son considerados como vlidos.
2. Valores perdidos discretos. Se pueden definir un mximo de tres valores
ausentes por cada variable.
3. Intervalo de valores perdidos. Todos los valores comprendidos entre el
mximo y el mnimo (ambos includos) son considerados como valores
ausentes.
4. Un intervalo y un valor nico. Se consideran como ausentes los valores
pertenecientes al intervalo ms el valor discreto declarado.

29

Introduccin al SPSS

Especificacin del nivel de medida


SPSS permite seleccionar entre tres opciones mutuamente excluyentes: escala, ordinal
y nominal, adaptndose a la propuesta clsica de Stevens en la que el nivel de
intervalo se agrupa en la categora de escala que podemos tambin identificar con las
variables cuantitativas.

30

Das könnte Ihnen auch gefallen