Sie sind auf Seite 1von 68

IBM SPSS Categories 23



Nota
Antes de utilizar esta informacin y el producto al que da soporte, lea la informacin del apartado Avisos en la pgina
57.

Informacin del producto


Esta edicin se aplica a la versin 23, release 0, modificacin 0 de IBM SPSS Statistics y a todos los releases y
modificaciones posteriores hasta que se indique lo contrario en ediciones nuevas.

Contenido
Captulo 1. Introduccin a los
procedimientos de escalamiento ptimo
de datos categricos . . . . . . . . . 1
Qu es el escalamiento ptimo?. . . . . . . . 1
Por qu utilizar el escalamiento ptimo? . . . . . 1
Nivel de escalamiento ptimo y nivel de medicin . 2
Seleccin del nivel de escalamiento ptimo . . . 2
Grficos de transformacin . . . . . . . . 3
Cdigos de la categora . . . . . . . . . . 3
Qu procedimiento es el mejor para la aplicacin? . 5
Regresin categrica . . . . . . . . . . . 6
Anlisis de componentes principales categrico . . 6
Anlisis de correlacin cannica no lineal. . . . 7
Anlisis de correspondencias . . . . . . . . 8
Anlisis de correspondencias mltiple . . . . . 9
Escalamiento multidimensional . . . . . . . 10
Desplegamiento multidimensional . . . . . . 10
Relacin de aspecto en grficos de escalamiento
ptimo . . . . . . . . . . . . . . . . 11

Captulo 2. Regresin categrica


(CATREG) . . . . . . . . . . . . . 13
Para definir la escala en regresin categrica . .
Discretizacin de regresin categrica . . . .
Valores perdidos de regresin categrica. . . .
Opciones de regresin categrica . . . . . .
Regularizacin de regresin categrica . . . .
Resultados de la regresin categrica . . . . .
Regresin categrica: Guardar . . . . . . .
Grficos de transformacin en regresin categrica
Caractersticas adicionales del comando CATREG

.
.
.
.
.
.
.

14
14
15
15
16
16
17
18
. 18

Captulo 3. Anlisis de componentes


principales categrico (CATPCA) . . . 19
Definir escala y ponderacin en CATPCA . . . .
Anlisis de componentes principales categrico:
Discretizacin . . . . . . . . . . . . .
Anlisis de componentes principales categrico:
Valores perdidos. . . . . . . . . . . . .
Anlisis de componentes principales categrico:
Opciones . . . . . . . . . . . . . . .
Anlisis de componentes principales categrico:
Resultados. . . . . . . . . . . . . . .
Anlisis de componentes principales categrico:
Guardar . . . . . . . . . . . . . . .
Anlisis de componentes principales categrico:
Grficos de objetos . . . . . . . . . . . .
Anlisis de componentes principales categrico:
Grficos de categoras . . . . . . . . . . .
Anlisis de componentes principales categrico:
grfico de cargas . . . . . . . . . . . .
Simulacin de muestreo del anlisis de componentes
principales categrico . . . . . . . . . . .
Caractersticas adicionales del comando CATPCA

20

Captulo 4. Anlisis de correlacin


cannica no lineal (OVERALS) . . . . 27
Definir rango y escala . . . . . . . . . . .
Definir rango . . . . . . . . . . . . . .
Anlisis de correlacin cannica no lineal: Opciones
Caractersticas adicionales del comando OVERALS

28
29
29
30

Captulo 5. Anlisis de
correspondencias . . . . . . . . . . 31
Definir rango de filas en Anlisis de
correspondencias . . . . . . . .
Definir rango de columnas en Anlisis de
correspondencias . . . . . . . .
Anlisis de correspondencias: Modelo .
Anlisis de correspondencias: Estadsticos
Anlisis de correspondencias: Grficos .
Caractersticas adicionales del comando
CORRESPONDENCE . . . . . . .

. 32

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

. 35

32
33
34
34

Captulo 6. Anlisis de
correspondencias mltiple . . . . . . 37
Definir ponderacin de la variable en el anlisis de
correspondencias mltiple . . . . . . . . .
Discretizacin en el anlisis de correspondencias
mltiple . . . . . . . . . . . . . . .
Valores perdidos en el anlisis de correspondencias
mltiple . . . . . . . . . . . . . . .
Opciones de anlisis de correspondencias mltiple
Resultados del anlisis de correspondencias mltiple
Anlisis de correspondencias mltiple: Guardar . .
Anlisis de correspondencias mltiple: Grficos de
objetos . . . . . . . . . . . . . . . .
Anlisis de correspondencias mltiple: Grficos de
variables . . . . . . . . . . . . . . .
Caractersticas adicionales del comando MULTIPLE
CORRESPONDENCE . . . . . . . . . . .

38
38
38
39
40
40
41
41
41

21
21
22
23
24
24
25
25
25
26

Captulo 7. Escalamiento
multidimensional (PROXSCAL) . . . . 43
Proximidades en matrices a travs de columnas . .
Proximidades en columnas . . . . . . . . .
Proximidades en una columna . . . . . . . .
Crear proximidades de los datos . . . . . . .
Crear la medida a partir de los datos . . . . . .
Definir un modelo de escalamiento
multidimensional . . . . . . . . . . . .
Escalamiento multidimensional: Restricciones . . .
Escalamiento multidimensional: Opciones . . . .
Escalamiento multidimensional: Grficos, Versin 1
Escalamiento multidimensional: Grficos, Versin 2
Escalamiento multidimensional: Resultados. . . .
Caractersticas adicionales del comando PROXSCAL

44
44
45
45
45
46
47
47
48
48
48
49

iii

Captulo 8. Desplegamiento
multidimensional (PREFSCAL) . . . . 51
Definir un modelo de desplegamiento
multidimensional . . . . . . . . . . .
Restricciones del desplegamiento multidimensional
Opciones de desplegamiento multidimensional .
Grficos de desplegamiento multidimensional . .
Resultados del desplegamiento multidimensional.

iv

IBM SPSS Categories 23

. 52
52
. 53
. 54
. 55

Caractersticas adicionales del comando PREFSCAL

55

Avisos . . . . . . . . . . . . . . . 57
Marcas comerciales .

. 59

ndice . . . . . . . . . . . . . . . 61

Captulo 1. Introduccin a los procedimientos de


escalamiento ptimo de datos categricos
Los procedimientos de categoras utilizan el escalamiento ptimo para analizar datos que son difciles o
imposibles de analizar mediante los procedimientos estadsticos estndar. Este captulo describe lo que
hace cada procedimiento, las situaciones en las que cada procedimiento es ms apropiado, las relaciones
entre los procedimientos y las relaciones de estos procedimientos con sus procedimientos estadsticos
anlogos estndar.
Nota: estos procedimientos y su implementacin en IBM SPSS Statistics han sido desarrollados por el
grupo Data Theory Scaling System Group (DTSS), formado por miembros de los departamentos de
educacin y psicologa de la facultad de ciencias sociales y del comportamiento de la Universidad de
Leiden.

Qu es el escalamiento ptimo?
La idea que subyace tras el escalamiento ptimo es asignar cuantificaciones numricas a las categoras de
cada variable, lo que permite utilizar los procedimientos estndar para obtener una solucin con las
variables cuantificadas.
Los valores de escala ptimos se asignan a las categoras de cada variable de acuerdo con el criterio de
optimizacin del procedimiento que se est utilizando. A diferencia de las etiquetas originales de las
variables nominales u ordinales del anlisis, estos valores de escala tienen propiedades mtricas.
En la mayora de los procedimientos de categoras, la cuantificacin ptima de cada variable escalada se
obtiene mediante un mtodo iterativo denominado mnimos cuadrados alternantes en el que, despus de
que se utilicen las cuantificaciones actuales para encontrar una solucin, las cuantificaciones se actualizan
utilizando dicha solucin. A continuacin, se utilizan las cuantificaciones actualizadas para buscar una
nueva solucin, que a su vez se utiliza para actualizar las cuantificaciones y as sucesivamente, hasta que
se alcanza algn criterio que indica al proceso que finalice.

Por qu utilizar el escalamiento ptimo?


Los datos categricos se utilizan con frecuencia en los estudios de mercado, los estudios de encuestas y la
investigacin en las ciencias sociales y del comportamiento. De hecho, muchos investigadores trabajan
casi exclusivamente con datos categricos.
Aunque existen adaptaciones de la mayora de los modelos estndar que permiten analizar
especficamente datos categricos, con frecuencia no funcionan bien con conjuntos de datos con las
siguientes caractersticas:
v Observaciones insuficientes
v Demasiadas variables
v Demasiados valores por cada variable
Mediante la cuantificacin de categoras, las tcnicas de escalamiento ptimo evitan los problemas de
estas situaciones. Adems, son muy tiles incluso cuando es apropiado utilizar tcnicas especializadas.
En vez de interpretar las estimaciones de los parmetros, la interpretacin de los resultados del
escalamiento ptimo muchas veces se basa en representaciones grficas. Las tcnicas de escalamiento
ptimo ofrecen excelentes anlisis exploratorios, que complementan tambin a otros modelos de IBM

Copyright IBM Corp. 1989, 2014

SPSS Statistics. Mediante el acotamiento del objetivo de la investigacin, la visualizacin de los datos
mediante el escalamiento ptimo puede formar la base de un anlisis que se centre en la interpretacin
de los parmetros del modelo.

Nivel de escalamiento ptimo y nivel de medicin


Este concepto puede resultar muy confuso cuando se utilizan por primera vez los procedimientos de
categoras. Al especificar el nivel, no se especifica el nivel al que se miden las variables, sino el nivel al
que se escalan. La idea es que las variables que se van a cuantificar pueden tener relaciones no lineales
independientemente de cmo se midan.
En categoras, hay tres niveles bsicos de mediciones:
v El nivel nominal implica que los valores de una variable representan categoras desordenadas. Algunos
ejemplos de variables que pueden ser nominales seran la regin, el rea del cdigo postal, la confesin
religiosa y las categoras con varias opciones.
v El nivel ordinal implica que los valores de una variable representan categoras ordenadas. Entre los
ejemplos se incluyen escalas de actitud que representan el grado de satisfaccin o confianza y las
puntuaciones de evaluacin de las preferencias.
v El nivel numrico implica que los valores de una variable representan categoras ordenadas con una
mtrica significativa, de modo que las comparaciones de distancia entre categoras son adecuadas.
Entre los ejemplos se incluyen la edad en aos y los ingresos en dlares.
Por ejemplo, suponga que las variables regin, trabajo y edad se codifican como se muestra en la siguiente
tabla.
Tabla 1. Esquema de codificacin para regin, trabajo y edad
Cdigo de regin

Valor de regin

Cdigo de
trabajo

Valor de trabajo

Edad

Norte

trabajador en prcticas

20

Sur

vendedor

22

Este

administrador

25

Oeste

27

Los valores mostrados representan las categoras de cada variable. Regin sera una variable nominal. Hay
cuatro categoras de regin, sin ningn orden intrnseco. Los valores del 1 al 4 sencillamente representan
las cuatro categoras; el esquema de codificacin es completamente arbitrario. Trabajo, por otra parte, se
podra considerar como variable ordinal. Las categoras originales forman una progresin desde
trabajador en prcticas hasta administrador. Los cdigos mayores representan un trabajo superior en la
escala corporativa. Sin embargo, slo se conoce la informacin acerca del orden, no se puede decir nada
acerca de la distancia existente entre categoras adyacentes. Por el contrario, edad se podra considerar
como una variable numrica. En el caso de edad, las distancias entre los valores son intrnsecamente
significativas. La distancia entre 20 y 22 es la misma que la que hay entre 25 y 27, mientras que la
distancia entre 22 y 25 es superior a las dos anteriores.

Seleccin del nivel de escalamiento ptimo


Es importante comprender que no hay propiedades intrnsecas de una variable que predefinan
automticamente el nivel de escalamiento ptimo que se debera definir para ella. Puede explorar los
datos de cualquier manera lgica que facilite la interpretacin. Mediante el anlisis de una variable de
nivel numrico a nivel ordinal, por ejemplo, el uso de una transformacin no lineal puede permitir una
solucin con menos dimensiones.
Los dos ejemplos siguientes ilustran cmo el nivel de medicin "obvio" no siempre es el mejor nivel de
escalamiento ptimo. Supongamos que una variable ordena objetos en dos grupos de edad. Aunque la

IBM SPSS Categories 23

edad se puede escalar como una variable numrica, puede ocurrir que en las personas menores de 25
aos, la seguridad tenga una relacin positiva con la edad, mientras que en las personas mayores de 60
aos, la seguridad tenga una relacin negativa con la edad. En este caso, puede ser mejor tratar la edad
como una variable nominal.
Tomemos otro ejemplo, una variable que ordena a las personas por preferencia poltica parece ser
bsicamente nominal. Sin embargo, si se ordenan los partidos desde la izquierda poltica hasta la derecha
poltica, puede que le interese que la cuantificacin de los partidos respete este orden mediante un nivel
ordinal de anlisis.
Aunque no haya propiedades predefinidas de una variable que la coloquen exclusivamente en un nivel o
en otro, existen algunas normas generales que pueden ayudar al usuario inexperto. Con la cuantificacin
nominal simple, habitualmente no se conoce el orden de las categoras pero se desea que el anlisis
imponga una. Si se conoce el orden de las categoras, debera intentarse la cuantificacin ordinal. Si las
categoras no se pueden ordenar, puede intentar la cuantificacin nominal mltiple.

Grficos de transformacin
Los diferentes niveles en los que se puede escalar cada variable imponen diferentes restricciones sobre las
cuantificaciones. Los grficos de transformacin ilustran la relacin entre las cuantificaciones y las
categoras originales que resultan del nivel de escalamiento ptimo seleccionado. Por ejemplo, se genera
un grfico de transformacin lineal cuando una variable se trata como numrica. Las variables tratadas
como ordinales generan grficos de transformacin no decreciente. Los grficos de transformacin de
variables tratadas nominalmente que tienen forma de U (o la inversa) muestran una relacin cuadrtica.
Las variables nominales tambin pueden generar grficos de transformacin sin tendencias aparentes
mediante el cambio completo del orden de las categoras. La siguiente figura muestra un grfico de
transformacin de ejemplo.
Los grficos de transformacin son especialmente adecuados para determinar si funciona bien el nivel de
escalamiento ptimo seleccionado. Si varias categoras reciben cuantificaciones similares, la agrupacin de
estas categoras en una categora puede estar justificada. Otra posibilidad, si una variable tratada como
nominal recibe cuantificaciones que muestran una tendencia creciente, una transformacin ordinal puede
generar un ajuste similar. Si esta tendencia es lineal, el tratamiento numrico puede resultar adecuado.
Sin embargo, si la agrupacin de categoras o el cambio de los niveles de escalamiento estn justificados,
el anlisis no cambiar de manera significativa.

Cdigos de la categora
Se debe tener cierto cuidado al codificar las variables categricas ya que algunos esquemas de
codificacin pueden generar resultados no deseados o anlisis incompletos. En la siguiente tabla se
muestran algunos posibles esquemas de codificacin para el trabajo.
Tabla 2. Esquemas de codificacin alternativos para el trabajo
Categora

trabajador en prcticas

vendedor

administrador

Algunos procedimientos de categoras requieren que se defina el rango de cada variable. Todo valor fuera
de este rango se tratar como un valor perdido. El valor de categora mnima es siempre 1. El valor de
categora mxima lo indica el usuario. Este valor no es el nmero de categoras de una variable, sino el
valor mayor de la categora. Por ejemplo, en la tabla, el esquema A tiene un valor de categora mxima de
3 y el esquema B tiene un valor de categora mxima de 7, aunque ambos esquemas codifican las mismas
tres categoras.

Captulo 1. Introduccin a los procedimientos de escalamiento ptimo de datos categricos

El rango de la variable determina las categoras que se omitirn del anlisis. Todas las categoras con
cdigos fuera del rango definido se omitirn del anlisis. Se trata de un mtodo sencillo de omitir
categoras, pero puede generar anlisis no deseados. Una categora mxima incorrectamente definida
puede omitir categoras vlidas del anlisis. Por ejemplo, para el esquema B, si se define que el valor de
categora mxima sea 3 indica que trabajo tiene categoras codificadas de 1 a 3; la categora administrador
se tratar como valor perdido. Como no hay ninguna categora que se haya codificado realmente como 3,
la tercera categora del anlisis no contendr ningn caso. Si desea omitir todas las categoras de
administrador, este anlisis sera adecuado. Sin embargo, si desea incluir a los administradores, la
categora mxima deber definirse como 7 y los valores perdidos debern codificarse con valor por
encima de 7 o por debajo de 1.
Para las variables tratadas como nominales u ordinales, el rango de las categoras no afecta a los
resultados. Para las variables nominales, es importante slo la etiqueta y no el valor asociado con dicha
etiqueta. Para las variables ordinales, se conserva el orden de las categoras en las cuantificaciones; los
propios valores de las categoras no son importantes. Todos los esquemas de codificacin que produzcan
el mismo orden de categoras tendrn resultados idnticos. Por ejemplo, los tres primeros esquemas de la
tabla son funcionalmente equivalentes si trabajo se analiza a nivel ordinal. El orden de las categoras es
idntico en estos esquemas. El esquema D, por otra parte, invierte las categoras segunda y tercera y
generar resultados diferentes de los de los otros esquemas.
Aunque muchos esquemas de codificacin de una variable son funcionalmente equivalentes, se prefieren
aquellos esquemas con pequeas diferencias entre los cdigos, ya que los cdigos afectan a la cantidad de
resultados que genera un procedimiento. Todas las categoras codificadas con valores entre 1 y el mximo
definido por el usuario son vlidas. Si alguna de estas categoras est vaca, las cuantificaciones
correspondientes sern valores perdidos del sistema o 0, dependiendo del procedimiento. Aunque
ninguna de estas asignaciones afecta a los anlisis, se generarn los resultados correspondientes a estas
categoras. Por tanto, para el esquema B, trabajo tiene cuatro categoras que reciben valores perdidos del
sistema. Para el esquema C, tambin hay cuatro categoras que reciben indicadores de valores perdidos
del sistema. Por el contrario, para el esquema A no hay ninguna cuantificacin de valores perdidos del
sistema. El uso de nmeros enteros consecutivos como cdigos de las variables tratadas como nominales
u ordinales genera una cantidad mucho menor de resultados sin que stos se vean afectados.
Los esquemas de codificacin de las variables tratadas como numricas son mucho ms restringidos que
cuando se trata de una variable ordinal. Para estas variables, las diferencias entre las categoras
consecutivas son importantes. La siguiente tabla muestra tres esquemas de codificacin para edad.
Tabla 3. Esquemas de codificacin alternativos para la edad
Categora

20

20

22

22

25

25

27

27

Toda recodificacin de las variables numricas debe conservar las diferencias entre las categoras. El uso
de los valores originales es un mtodo para asegurarse de la conservacin de las diferencias. Sin
embargo, esto puede generar que muchas categoras tengan indicadores de valores perdidos del sistema.
Por ejemplo, el esquema A utiliza los valores originales observados. Para todos los procedimientos de
categoras salvo para el anlisis de correspondencias, el valor de categora mxima es 27 y el valor de
categora mnimo se establece en 1. Las primeras 19 categoras estn vacas y reciben indicadores de
valores perdidos del sistema. Los resultados pueden volverse rpidamente bastante engorrosos si la
categora mxima es mucho mayor que 1 y hay muchas categoras vacas entre 1 y el mximo.
Para reducir la cantidad de resultados, se puede aplicar una recodificacin. Sin embargo, en el caso
numrico, la funcin Recodificacin automtica no se debe utilizar. La codificacin en enteros

IBM SPSS Categories 23

consecutivos generar diferencias de 1 entre todas las categoras consecutivas y, por tanto, todas las
cuantificaciones tendrn idntica separacin. Las caractersticas mtricas que se consideraban importantes
al tratar una variable como numrica desaparecen al recodificarla mediante enteros consecutivos. Por
ejemplo, el esquema C de la tabla corresponde a la recodificacin automtica de edad. La diferencia entre
las categoras 22 y 25 ha cambiado de tres a uno y las cuantificaciones reflejarn esta ltima diferencia.
Un esquema de recodificacin alternativa que conserva las diferencias entre las categoras consiste en
restar el valor de la categora ms pequea a cada categora y sumar 1 a cada diferencia. El esquema B
surge de esta transformacin. El valor de categora ms pequeo, 20, se ha restado a cada categora y se
sumado 1 a cada resultado. Los cdigos transformados tienen un mnimo de 1 y todas las diferencias son
idnticas a los datos originales. El valor de categora mxima es ahora 8 y se eliminan todas las
cuantificaciones de cero antes de la primera cuantificacin que no es cero. An as, las cuantificaciones
que no son cero correspondientes a cada categora que resultan del esquema B son idnticas a las
cuantificaciones del esquema A.

Qu procedimiento es el mejor para la aplicacin?


Las tcnicas que se incluyen en cuatro de estos procedimientos (Anlisis de correspondencias, Anlisis de
correspondencias mltiple, Anlisis de componentes principales categrico y Anlisis de correlacin
cannica no lineal) corresponden al rea general del anlisis de datos multivariantes conocido como
reduccin de dimensiones. Es decir, las relaciones entre las variables se representan en un nmero
pequeo de dimensiones (digamos, dos o tres) con tanta frecuencia como sea posible. Esto permite
describir las estructuras o patrones de las relaciones que seran extremadamente difcil de descubrir con
su riqueza y complejidad original. En las aplicaciones de investigacin de mercados, estas tcnicas
pueden ser una forma de correlacin perceptual. Una importante ventaja de estos procedimientos es que
se adaptan a los datos con diferentes niveles de escalamiento ptimo.
La regresin categrica describe la relacin entre una variable de respuesta categrica y una combinacin
de predictores categricos. La influencia de cada predictor sobre la variable de respuesta la describe la
correspondiente ponderacin de regresin. Como en los dems procedimientos, los datos se pueden
analizar con diferentes niveles de escalamiento ptimo.
El escalamiento multidimensional y el desplegamiento multidimensional describe las relaciones entre
objetos en un espacio conceptual de pocas dimensiones utilizando las proximidades entre los objetos.
A continuacin, se indican unas breves normas generales para cada uno de los procedimientos:
v Utilice la regresin categrica para pronosticar los valores de una variable dependiente categrica a
partir de una combinacin de variables independientes categricas.
v Utilice el anlisis de componentes principales categrico para tener en cuenta los patrones de variacin
de un nico conjunto de variables con varios tipos de niveles de escalamiento ptimos.
v Utilice el anlisis de correlacin cannica no lineal para evaluar el grado de correlacin entre dos o
ms conjuntos de variables de varios tipos de niveles de escalamiento ptimo.
v Utilice el anlisis de correspondencias para analizar tablas de contingencia bidimensionales o datos que
se puedan expresar como una tabla de doble clasificacin, como la preferencia por una u otra marca o
datos de opcin sociomtricos.
v Utilice el anlisis de correspondencias mltiple para analizar una matriz de datos multivariantes
categricos cuando no se est dispuesto a suponer que todas las variables se analizan a nivel nominal.
v Utilice el escalamiento multidimensional para analizar datos de proximidad para buscar una
representacin de un solo conjunto de los objetos en un espacio de pocas dimensiones.
v Utilice el desplegamiento multidimensional para analizar datos de proximidad para buscar una
representacin de dos conjuntos de los objetos en un espacio de pocas dimensiones.

Captulo 1. Introduccin a los procedimientos de escalamiento ptimo de datos categricos

Regresin categrica
El uso de la regresin categrica es especialmente adecuado cuando el objetivo del anlisis es pronosticar
una variable dependiente (de respuesta) a partir de un conjunto de variables (predictoras)
independientes. Al igual que ocurre con todos los procedimientos de escalamiento ptimo, los valores de
escala se asignan a cada categora de cada variable de manera que estos valores sean ptimos respecto a
la regresin. La solucin de una regresin categrica maximiza la correlacin de los cuadrados entre la
respuesta transformada y la combinacin ponderada de los predictores transformados.
Relacin con otros procedimientos de categoras. La regresin categrica con escalamiento ptimo se
puede comparar con el anlisis de correlacin cannica mediante escalamiento ptimo con dos conjuntos,
uno de los cuales slo contiene la variable dependiente. En esta ltima tcnica, la similitud de los
conjuntos se determina mediante la comparacin de cada conjunto con una variable desconocida que se
encuentra en algn sitio entre todos los conjuntos. En la regresin categrica, la similitud de la respuesta
transformada y la combinacin lineal de los predictores transformados se evala directamente.
Relacin con las tcnicas estndar. En la regresin lineal estndar, las variables categricas se pueden
recodificar como variables indicadoras o se pueden tratar de la misma manera que las variables de nivel
de intervalo. En el primer mtodo, el modelo contiene una inclinacin y una interseccin diferentes para
cada combinacin de los niveles de las variables categricas. Esto implica que es necesario interpretar un
gran nmero de parmetros. En el segundo enfoque, slo se estima un parmetro para cada variable. Sin
embargo, la naturaleza arbitraria de las codificaciones de categoras hace imposibles las generalizaciones.
Si algunas de las variables no son continuas, habr disponibles anlisis alternativos. Si la respuesta es
continua y los predictores son categricos, se suele utilizar el anlisis de la varianza. Si la respuesta es
categrica y los predictores son continuos, puede que sean adecuados el anlisis discriminante o la
regresin logstica. Si la respuesta y los predictores son ambos categricos, se suelen utilizar modelos
loglineales.
La regresin con el escalamiento ptimo ofrece tres niveles de escalamiento para cada variable. Las
combinaciones de estos niveles pueden tener en cuenta una gran variedad de relaciones no lineales para
las que cualquier mtodo "estndar" no se adapte bien. Por tanto, el escalamiento ptimo ofrece una
mayor flexibilidad que los enfoques estndar con una mnima complejidad adicional.
Adems, las transformaciones no lineales de los predictores suelen reducir las dependencias entre los
predictores. Si compara los autovalores de la matriz de correlaciones de los predictores con los
autovalores de la matriz de correlaciones de los predictores escalados ptimamente, este ltimo conjunto
normalmente ser menos variable que el anterior. Dicho de otra manera, en la regresin categrica, el
escalamiento ptimo hace que los autovalores mayores de la matriz de correlaciones de los predictores
sean ms pequeos y que los autovalores ms pequeos sean ms grandes.

Anlisis de componentes principales categrico


El uso del anlisis de componentes principales categrico es especialmente adecuado cuando se desea
tener en cuenta los patrones de variacin de un nico conjunto de variables con varios tipos de niveles
de escalamiento ptimos. Esta tcnica intenta reducir la dimensionalidad de un conjunto de variables al
mismo tiempo que tiene en cuenta toda la variacin que sea posible. Se asignan valores de escala a cada
categora de cada variable de manera que estos valores sean ptimos respecto a la solucin de
componentes principales. Los objetos del anlisis reciben puntuaciones de componentes en funcin de los
datos cuantificados. Los grficos de las puntuaciones de componentes revelan los patrones de los objetos
del anlisis y pueden revelar objetos poco habituales en los datos. La solucin de un anlisis de
componentes principales categrico maximiza las correlaciones de las puntuaciones de objetos con cada
una de las variables cuantificadas para el nmero de componentes (dimensiones) especificado.
Una aplicacin importante de los componentes principales categricos es el estudio de los datos de
preferencias, en el que los encuestados clasifican o evalan un nmero de elementos de acuerdo con sus
preferencias. En la configuracin de datos de IBM SPSS Statistics habitual, las filas son individuos, las

IBM SPSS Categories 23

columnas son mediciones de los elementos y las puntuaciones a travs de las filas son puntuaciones de
preferencias (en una escala de 0 a 10, por ejemplo), lo que hace que los datos sean condicionales respecto
a las filas. Para los datos de preferencias, es posible que quiera tratar a los individuos como variables.
Mediante el procedimiento Transponer, puede transponer los datos. Los evaluadores se convierten en las
variables y todas las variables se declaran como ordinales. No hay ningn problema en utilizar ms
variables que objetos en CATPCA.
Relacin con otros procedimientos de categoras. Si todas las variables se declaran como nominales
mltiples, el anlisis de componentes principales categrico produce un anlisis equivalente a un anlisis
de correspondencias mltiple ejecutado sobre las mismas variables. Por tanto, el anlisis de componentes
principales categrico se puede considerar como un tipo de anlisis de correspondencias mltiple en el
que algunas de las variables se declaran como ordinales o numricas.
Relacin con las tcnicas estndar. Si todas las variables se escalan a nivel numrico, el anlisis de
componentes principales categrico es equivalente al anlisis de componentes principales estndar.
De manera ms general, el anlisis de componentes principales categricos es una alternativa al clculo
de las correlaciones entre las escalas no numricas y su anlisis mediante un enfoque de anlisis de
factores o de componentes principales estndar. El uso simplista del coeficiente de correlacin de Pearson
habitual como medida de la asociacin de los datos ordinales puede llevar a un sesgo de importancia a la
hora de estimar las correlaciones.

Anlisis de correlacin cannica no lineal


El anlisis de correlacin cannica no lineal es un procedimiento muy general con numerosas aplicaciones
diferentes. El objetivo del anlisis de correlacin cannica no lineal es analizar las relaciones existentes
entre dos o ms conjuntos de variables en vez de entre las propias variables, como ocurre en el anlisis
de componentes principales. Por ejemplo, imaginemos que tiene dos conjuntos de variables, donde un
conjunto de variables pueden contener elementos de informacin demogrfica general en un conjunto de
encuestados, mientras que un segundo puede contener las respuestas a un conjunto de elementos de
actitud. Los niveles de escalamiento del anlisis pueden ser cualquier combinacin de nominal, ordinal y
numrico. El anlisis de correlacin cannica mediante escalamiento ptimo determina la similitud
existente entre los conjuntos mediante la comparacin de manera simultnea de las variables cannicas
de cada conjunto con un conjunto de puntuaciones de compromiso asignadas a los objetos.
Relacin con otros procedimientos de categoras. Si hay dos o ms conjuntos de variables con
nicamente una variable por conjunto, el anlisis de correlacin cannica mediante escalamiento ptimo
es equivalente al anlisis de componentes principales mediante escalamiento ptimo. Si todas las
variables en un anlisis de una variable por conjunto son nominales mltiples, el anlisis de correlacin
cannica mediante escalamiento ptimo es equivalente al anlisis de correspondencias mltiple. Si hay
dos conjuntos de variables, uno de los cuales contiene nicamente una variable, el anlisis de correlacin
cannica categrica mediante escalamiento ptimo es equivalente a una regresin categrica mediante
escalamiento ptimo.
Relacin con las tcnicas estndar. El anlisis de correlacin cannica estndar es una tcnica estadstica
que busca una combinacin lineal de un conjunto de variables y una combinacin lineal de un segundo
conjunto de variables de correlacin mxima. Dado este conjunto de combinaciones lineales, el anlisis de
correlacin cannica puede buscar otros conjuntos independientes de combinaciones lineales, a los que se
denominan variables cannicas, hasta un nmero mximo que es igual que el nmero de variables del
conjunto ms pequeo.
Si hay dos conjuntos de variables en el anlisis y todas las variables se definen como numricas, el
anlisis de correlacin cannica mediante escalamiento ptimo es equivalente a un anlisis de correlacin
cannica estndar. Aunque IBM SPSS Statistics no tiene un procedimiento de anlisis de correlacin
cannica, muchos de los estadsticos pertinentes se pueden obtener mediante un anlisis multivariante de
la varianza.
Captulo 1. Introduccin a los procedimientos de escalamiento ptimo de datos categricos

El anlisis de correlacin cannica mediante escalamiento ptimo tiene otras aplicaciones. Si tiene dos
conjuntos de variables y uno de los conjuntos contiene una variable nominal declarada como nominal
simple, los resultados del anlisis de correlacin cannica mediante escalamiento ptimo se pueden
interpretar de manera similar al anlisis de regresin. Si considera que la variable es nominal mltiple, el
anlisis mediante escalamiento ptimo es una alternativa al anlisis discriminante. La agrupacin de las
variables en ms de dos conjuntos proporciona varias maneras de analizar los datos.

Anlisis de correspondencias
El objetivo del anlisis de correspondencias es hacer grficos de dispersin biespacial para las tablas de
correspondencias. En una tabla de correspondencias, las variables de filas y de columnas se supone que
representan categoras desordenadas; por tanto, se utiliza siempre el nivel de escalamiento ptimo
nominal. Slo se examina la informacin nominal de ambas variables. Es decir, la nica consideracin es
el hecho de que algunos objetos se encuentran en la misma categora, mientras que otros no. No se hace
ninguna suposicin acerca de la distancia o el orden entre las categoras de la misma variable.
Un uso especfico del anlisis de correspondencias es el anlisis de las tablas de contingencia
bidimensionales. Si una tabla tiene r filas activas y c columnas activas, el nmero de dimensiones de la
solucin de anlisis de correspondencias es el mnimo de r menos 1 o c menos 1, el que sea inferior.
Dicho de otra manera, puede representar perfectamente las categoras de fila o las categoras de columna
de una tabla de contingencia en un espacio de dimensiones. En lo que se refiere a la prctica, sin
embargo, resulta preferible representar las categoras de fila y de columna de una tabla bidimensional en
un espacio de pocas dimensiones, por ejemplo de dos dimensiones, ya que los grficos bidimensionales
son de ms fcil comprensin que las representaciones espaciales multidimensionales.
Cuando se utiliza un nmero menor que el nmero mximo de dimensiones posibles, los estadsticos
generados por el anlisis describen la bondad con la que se representan las categoras de fila y de
columna en la representacin de pocas dimensiones. Siempre que la calidad de la representacin de la
solucin de dos dimensiones sea buena, puede examinar los grficos de los puntos de fila y de los puntos
de columna para conocer las categoras de la variable de fila que son similares, las categoras de la
variable de columna que son similares y las categoras de fila y de columna que son similares entre s.
Relacin con otros procedimientos de categoras. El anlisis de correspondencias simple se limita a las
tablas bidimensional. Si hay ms de dos variables de inters, puede combinar las variables para crear
variables de interaccin. Por ejemplo, para las variables regin, trabajo y edad, puede combinar regin y
trabajo para crear una nueva variable retrabajo con las 12 categoras que aparecen en la siguiente tabla.
Esta nueva variable forma una tabla bidimensional con edad (12 filas, 4 columnas), que se pueden analizar
en el anlisis de correspondencias.
Tabla 4. Combinaciones de regin y trabajo
Cdigo de categora

Definicin de categora

Cdigo de categora

Definicin de categora

Norte, trabajador en prcticas

Este, trabajador en prcticas

Norte, vendedor

Este, vendedor

Norte, administrador

Este, administrador

Sur, trabajador en prcticas

10

Oeste, trabajador en prcticas

Sur, vendedor

11

Oeste, vendedor

Sur, administrador

12

Oeste, administrador

Un defecto de este enfoque es que se puede combinar cualquier par de variables. Podemos combinar
trabajo y edad, lo que generara otra variable de 12 categoras. Tambin podemos combinar regin y edad, lo
que generara una nueva variable de 16 categoras. Cada una de estas variables de interaccin forma una
tabla bidimensional con la variable restante. El anlisis de correspondencias de estas tres tablas no
generar resultados idnticos, aunque cada uno de los enfoques es vlido. Adems, si hay cuatro o ms
variables, se pueden generar las tablas bidimensionales que comparen una variable de interaccin con

IBM SPSS Categories 23

otra variable de interaccin. El nmero de posibles tablas que se pueden analizar puede ser bastante
grande, incluso cuando hay pocas variables. Puede seleccionar una de estas tablas para analizarla o
puede analizarlas todas. Otra posibilidad consiste en utilizar el procedimiento Anlisis de
correspondencias mltiple para examinar todas las variables simultneamente sin que sea necesario crear
variables de interaccin.
Relacin con las tcnicas estndar. El procedimiento Tablas cruzadas tambin se puede utilizar para
analizar tablas de contingencia, con independencia como un enfoque comn en los anlisis. Sin embargo,
incluso en las tablas pequeas, la deteccin de las desviaciones de la independencia puede ser difcil. La
utilidad del anlisis de correspondencias reside en la presentacin de tales patrones para tablas
bidimensionales de cualquier tamao. Si hay una asociacin entre las variables de fila y de columna (es
decir, el valor de chi-cuadrado es significativo) el anlisis de correspondencias puede ayudar a revelar la
naturaleza de la relacin.

Anlisis de correspondencias mltiple


El anlisis de correspondencias mltiple intenta generar una solucin en la que los objetos de la misma
categora se representan cerca los unos de los otros y los objetos de categoras diferentes se representan
alejados los unos de los otros. Cada objeto se encuentra lo ms cerca posible de los puntos de categora
para las categoras que se aplican a dicho objeto. De esta manera, las categoras dividen los objetos en
subgrupos homogneos. Las variables se consideran homogneas cuando clasifican objetos de las mismas
categoras en los mismos subgrupos.
Para una solucin de una sola dimensin, el anlisis de correspondencias mltiple asigna valores de
escala ptimos (cuantificaciones de las categoras) a cada categora de cada variable de forma que en
general, como media, las categoras tengan una mxima dispersin. Para una solucin de dos
dimensiones, el anlisis de correspondencias mltiple busca un segundo conjunto de cuantificaciones de
las categoras de cada variable no relacionada con el primer conjunto, volviendo a intentar maximizar la
dispersin y as sucesivamente. Como las categoras de una variable reciben tantas puntuaciones como
dimensiones haya, se supone que las variables del anlisis son nominales mltiples en el nivel de
escalamiento ptimo.
El anlisis de correspondencias mltiple tambin asigna puntuaciones a los objetos del anlisis de manera
que las cuantificaciones de las categoras son los promedios, o los centroides, de las puntuaciones de los
objetos de dicha categora.
Relacin con otros procedimientos de categoras. El anlisis de correspondencias mltiple tambin se
conoce como anlisis de homogeneidad o escalamiento dual. Proporciona resultados comparables, pero
no idnticos, al anlisis de correspondencias cuando hay slo dos variables. El anlisis de
correspondencias genera resultados exclusivos que resumen el ajuste y la calidad de la representacin de
la solucin, incluida la informacin sobre la estabilidad. Por tanto, el anlisis de correspondencias
habitualmente resulta preferible al anlisis de correspondencias mltiple en el caso de dos variables. Otra
diferencia entre los dos procedimientos es que la entrada al anlisis de correspondencias mltiple es una
matriz de datos, donde las filas son objetos y las columnas son variables, mientras que la entrada al
anlisis de correspondencias puede ser la misma matriz de datos, una matriz de proximidades general o
una tabla de contingencia conjunta, que es una matriz agregada en la que tanto las filas como las
columnas representan categoras de variables. El anlisis de correspondencias mltiple tambin se puede
considerar como un anlisis de componentes principales de datos escalados al nivel nominal mltiple.
Relacin con las tcnicas estndar. El anlisis de correspondencias mltiple se puede considerar como el
anlisis de una tabla de contingencia de varios factores. Las tablas de contingencia de varios factores
tambin se pueden analizar con el procedimiento Tablas cruzadas, pero Tablas cruzadas proporciona
estadsticos de resumen independientes para cada categora de cada variable de control. Con el anlisis
de correspondencias mltiple, con frecuencia es posible resumir la relacin entre todas las variables con
un nico grfico bidimensional. Un uso avanzado del anlisis de correspondencias mltiple es sustituir
los valores originales de la categora por los valores de la escala ptimos de la primera dimensin y
Captulo 1. Introduccin a los procedimientos de escalamiento ptimo de datos categricos

realizar un anlisis multivariante secundario. Ya que el anlisis de correspondencias mltiple sustituye las
etiquetas de categora por valores de escala numricos, se pueden aplicar muchos procedimientos
diferentes que requieren datos numricos tras el anlisis de correspondencias mltiple. Por ejemplo, el
procedimiento Anlisis factorial produce un primer componente principal que es equivalente a la primera
dimensin del anlisis de correspondencias mltiple. Las puntuaciones de los componentes de la primera
dimensin son iguales que las puntuaciones de los objetos y las cargas en componentes al cuadrado son
iguales que las medidas de discriminacin. La segunda dimensin del anlisis de correspondencias
mltiple, sin embargo, no es igual que la segunda dimensin del anlisis factorial.

Escalamiento multidimensional
El uso del escalamiento multidimensional es especialmente apropiado cuando el objetivo del anlisis es
buscar la estructura de un conjunto de medidas de distancia entre un solo conjunto de objetos o casos.
Esto se logra asignando las observaciones a posiciones especficas en un espacio conceptual de pocas
dimensiones, de modo que las distancias entre los puntos en el espacio concuerden al mximo con las
similaridades (o disimilaridades) dadas. El resultado es una representacin de mnimos cuadrados de los
objetos en dicho espacio de pocas dimensiones que, en muchos casos, le ayudar a entender mejor los
datos.
Relacin con otros procedimientos de categoras. Cuando tiene datos multivariantes a partir de los que
se crean distancias y, a continuacin, los analiza con el escalamiento multidimensional, los resultados son
similares al anlisis de los datos mediante el anlisis de componentes principales categricos con la
normalizacin principal de objetos. Este tipo de PCA tambin se conoce como anlisis de coordenadas
principales.
Relacin con las tcnicas estndar. El procedimiento Escalamiento multidimensional (PROXSCAL) de
categoras ofrece varias mejoras sobre el procedimiento de escalamiento disponible en la opcin
Estadsticas bsicas (ALSCAL). PROXSCAL ofrece un algoritmo acelerado para ciertos modelos y permite
colocar restricciones en el espacio comn. Adems, PROXSCAL intenta minimizar el estrs bruto
normalizado, en vez del S-stress (tambin denominado tensin). El estrs bruto normalizado se prefiere
en general ya que es una medida basada en las distancias, mientras que el S-stress se basa en los
cuadrados de las distancias.

Desplegamiento multidimensional
El uso del desplegamiento multidimensional es especialmente apropiado cuando el objetivo del anlisis
es buscar la estructura de un conjunto de medidas de distancia entre dos conjuntos de objetos
(denominados objetos de fila y de columna). Esto se logra asignando las observaciones a posiciones
especficas en un espacio conceptual de pocas dimensiones, de modo que las distancias entre los puntos
en el espacio concuerden al mximo con las similaridades (o disimilaridades) dadas. El resultado es una
representacin de mnimos cuadrados de los objetos de fila y de columna en dicho espacio de pocas
dimensiones que, en muchos casos, le ayudar a entender mejor los datos.
Relacin con otros procedimientos de categoras. Si los datos constan de distancias entre un nico
conjunto de objetos (una matriz simtrica cuadrada), utilice Escalamiento multidimensional.
Relacin con las tcnicas estndar. El procedimiento Desplegamiento multidimensional (PREFSCAL) de
categoras ofrece varias mejoras sobre la funcionalidad de desplegamiento disponible en la opcin
Estadsticas bsicas (a travs de ALSCAL). PREFSCAL permite colocar restricciones en el espacio comn;
es ms, PREFSCAL intenta minimizar una medida de estrs penalizado que le ayuda a evitar las
soluciones degeneradas (a las que los algoritmos antiguos son propensos).

10

IBM SPSS Categories 23

Relacin de aspecto en grficos de escalamiento ptimo


La relacin de aspecto en los grficos de escalamiento ptimo es istropa. En un grfico bidimensional, la
distancia que representa una unidad en la dimensin 1 es igual que la distancia que representa una
unidad en la dimensin 2. Si cambia el rango de una dimensin en un diagrama bidimensional, el
sistema cambiar el tamao de la otra dimensin para mantener iguales las distancias fsicas. La relacin
de aspecto istropa no se puede omitir para los procedimientos de escalamiento ptimo.

Captulo 1. Introduccin a los procedimientos de escalamiento ptimo de datos categricos

11

12

IBM SPSS Categories 23

Captulo 2. Regresin categrica (CATREG)


La regresin categrica cuantifica los datos categricos mediante la asignacin de valores numricos a las
categoras, obtenindose una ecuacin de regresin lineal ptima para las variables transformadas. La
regresin categrica se conoce tambin por el acrnimo CATREG, del ingls categorical regression
(regresin categrica).
El anlisis de regresin lineal ordinario implica minimizar las diferencias de la suma de los cuadrados
entre una variable de respuesta (la dependiente) y una combinacin ponderada de las variables
predictoras (las independientes). Las variables son normalmente cuantitativas, con los datos categricos
(nominales) recodificados como variables binarias o de contraste. Como resultado, las variables
categricas sirven para separar grupos de casos y la tcnica estima conjuntos separados de parmetros
para cada grupo. Los coeficientes estimados reflejan cmo los cambios en los predictores afectan a la
respuesta. El prediccin de la respuesta es posible para cualquier combinacin de los valores predictores.
Un mtodo alternativo incluye la regresin de la respuesta respecto a los propios valores predictores
categricos. Como consecuencia, se estima un coeficiente para cada variable. Sin embargo, para las
variables categricas, los valores categricos son arbitrarios. La codificacin de las categoras de diferentes
maneras proporciona diferentes coeficientes, dificultando las comparaciones entre los anlisis de las
mismas variables.
CATREG ampla el mtodo estndar mediante un escalamiento de las variables nominales, ordinales y
numricas simultneamente. El procedimiento cuantifica las variables categricas de manera que las
cuantificaciones reflejen las caractersticas de las categoras originales. El procedimiento trata a las
variables categricas cuantificadas como si fueran variables numricas. La utilizacin de transformaciones
no lineales permite a las variables ser analizadas en varios niveles para encontrar el modelo que ms se
ajusta.
Ejemplo. La regresin categrica se puede utilizar para describir cmo la satisfaccin laboral depende de
la categora laboral, de la regin geogrfica y del nmero de desplazamientos. Observar que los niveles
ms altos de satisfaccin corresponden a ejecutivos y a un nmero bajo de desplazamientos. La ecuacin
de regresin resultante se puede utilizar para pronosticar la satisfaccin laboral para cualquier
combinacin de las tres variables independientes.
Estadsticos y grficos. Frecuencias, coeficientes de regresin, tabla ANOVA, historial de iteraciones,
cuantificaciones de categoras, correlaciones entre predictores no transformados, correlaciones entre
predictores transformados, grficos de residuos y grficos de transformacin.
Regresin categrica: Consideraciones sobre los datos
Datos. CATREG trabaja con variables indicadoras de categoras. Los indicadores de las categoras deben
ser enteros positivos. Puede utilizar el cuadro de dilogo Discretizacin para convertir variables con
valores fraccionarios y variables de cadena en enteros positivos.
Supuestos. Slo se permite una variable de respuesta, pero el nmero mximo de predictores es 200. Los
datos deben contener al menos tres casos vlidos y el nmero de casos vlidos debe ser superior al
nmero de variables predictoras ms uno.
Procedimientos relacionados. CATREG es equivalente al anlisis de correlacin cannica categrico
mediante escalamiento ptimo (OVERALS) con dos conjuntos, uno de los cuales contiene slo una
variable. Si se escalan todas las variables a nivel numrico, el anlisis se corresponder con el anlisis de
regresin mltiple estndar.

Copyright IBM Corp. 1989, 2014

13

Para obtener una regresin categrica


1. Seleccione en los mens:
Analizar > Regresin > Escalamiento ptimo (CATREG)...
2. Seleccione la variable dependiente y la variable o variables independientes.
3. Pulse en Aceptar.
Si lo desea, cambie el nivel de escalamiento de cada variable.

Para definir la escala en regresin categrica


Se puede definir el nivel de escalamiento ptimo de las variables dependientes e independientes. De
forma predeterminada, se escalan como lneasSp (ordinales) monotnicas de segundo orden con dos
nudos interiores. Asimismo, se puede definir la ponderacin para las variables del anlisis.
Nivel de escalamiento ptimo. Tambin se puede seleccionar el nivel de escalamiento para cuantificar
cada variable.
v

Spline ordinal. El orden de las categoras de la variable observada se conserva en la variable escalada
ptimamente. Los puntos de categora estarn sobre una recta (vector) que pasa por el origen. La
transformacin resultante es un polinomio monotnico por tramos suave del orden seleccionado. Las
partes se especifican por el nmero de nudos interiores definido por el usuario y su posicin es
determinada por el procedimiento en funcin del nmero de nudos interiores.
Spline nominal. La nica informacin de la variable observada que se conserva en la variable
escalada ptimamente es la agrupacin de los objetos en categoras. No se conserva el orden de las
categoras de la variable observada. Los puntos de categora estarn sobre una recta (vector) que pasa
por el origen. La transformacin resultante es un polinomio, posiblemente monotnico, por tramos
suave del orden seleccionado. Las partes se especifican por el nmero de nudos interiores definido por
el usuario y su posicin es determinada por el procedimiento en funcin del nmero de nudos
interiores.
Ordinal. El orden de las categoras de la variable observada se conserva en la variable escalada
ptimamente. Los puntos de categora estarn sobre una recta (vector) que pasa por el origen. La
transformacin resultante se ajusta mejor que la transformacin de spline ordinal pero la suavidad es
menor.
Nominal. La nica informacin de la variable observada que se conserva en la variable escalada
ptimamente es la agrupacin de los objetos en categoras. No se conserva el orden de las categoras de
la variable observada. Los puntos de categora estarn sobre una recta (vector) que pasa por el origen.
La transformacin resultante se ajusta mejor que la transformacin de spline nominal pero la suavidad
es menor.
Numrico. Las categoras se tratan como que estn ordenadas y espaciadas uniformemente (a nivel de
intervalo). El orden de las categoras y la equidistancia entre los nmeros de las categoras de la
variable observada se conservan en la variable escalada ptimamente. Los puntos de categora estarn
sobre una recta (vector) que pasa por el origen. Cuando todas las variables estn a nivel numrico, el
anlisis es anlogo al anlisis de componentes principales estndar.

Discretizacin de regresin categrica


El cuadro de dilogo Discretizacin permite seleccionar un mtodo para recodificar las variables. Las
variables con valores fraccionarios se agrupan en siete categoras (o en el nmero de valores distintos de
la variable si dicho nmero es inferior a siete) con una distribucin aproximadamente normal, si no se
especifica lo contrario. Las variables de cadena se convierten siempre en enteros positivos mediante la
asignacin de indicadores de categora en funcin del orden alfanumrico ascendente. La discretizacin
de las variables de cadena se aplica a estos enteros resultantes. De forma predeterminada, las variables
restantes se dejan inalteradas. A partir de ese momento, se utilizan en el anlisis las variables
discretizadas.

14

IBM SPSS Categories 23

Mtodo. Seleccione entre agrupacin, clasificacin y multiplicacin.


v Agrupacin. Se recodifica en un nmero especificado de categoras o se recodifica por intervalos.
v Clasificacin. La variable se discretiza mediante la clasificacin de los casos.
v Multiplicacin. Los valores actuales de la variable se tipifican, multiplican por 10, redondean y se les
suma una constante de manera que el menor valor discretizado sea 1.
Agrupacin. Se encuentran disponibles las siguientes opciones al discretizar variables por agrupacin:
Nmero de categoras. Especifique un nmero de categoras y si los valores de la variable deben
seguir una distribucin aproximadamente normal o uniforme en dichas categoras.
v Intervalos iguales. Las variables se recodifican en las categoras definidas por dichos intervalos de
igual tamao. Se debe especificar la longitud de los intervalos.
v

Valores perdidos de regresin categrica


El cuadro de dilogo Valores perdidos permite seleccionar la estrategia para el tratamiento de los valores
perdidos en las variables de anlisis y las suplementarias.
Estrategia. Seleccione excluir los objetos con valores perdidos (eliminacin por lista) o imputar los valores
perdidos (tratamiento activo).
v Excluir objetos con valores perdidos en esta variable. Los objetos con valores perdidos en la variable
seleccionada se excluyen del anlisis. Esta estrategia no est disponible para las variables
suplementarias.
v

Imputar valores perdidos. Los objetos con valores perdidos en la variable seleccionada tendrn dichos
valores imputados. Se puede seleccionar el mtodo de imputacin. Seleccione Moda para reemplazar
los valores perdidos por la categora ms frecuente. Cuando existen varias modas, se utiliza la que
tiene el indicador de categora ms pequeo. Seleccione Categora adicional para reemplazar los
valores perdidos con la misma cuantificacin de una categora adicional. Esto implica que los objetos
con un valor perdido en esta variable se consideran que pertenecen a la misma categora (la adicional).

Opciones de regresin categrica


El cuadro de dilogo Opciones permite seleccionar el estilo para la configuracin inicial, especificar los
criterios de iteracin y convergencia, seleccionar los objetos suplementarios y definir el etiquetado de los
grficos.
Objetos suplementarios. Permite especificar los objetos que se tratarn como suplementarios. Slo hay
que escribir el nmero de un objeto suplementario (o especificar un intervalo de casos) y pulsar en
Aadir. No es posible ponderar los objetos suplementarios (se ignoran las ponderaciones especificadas).
Configuracin inicial. Si no se trata ninguna variable como nominal, seleccione la configuracin
Numrica. Si al menos una variable se trata como nominal, seleccione la configuracin Aleatoria.
Adems, si al menos una variable tiene un nivel de escalamiento ordinal o spline ordinal, el algoritmo
normal de ajuste de modelo puede dar lugar a una solucin inferior a la ptima. Si selecciona Mltiples
inicios sistemticos con todos los patrones de signos de prueba posibles siempre encontrar la solucin
ptima, pero el tiempo de procesamiento necesario aumentar rpidamente, al aumentar el nmero de
variables ordinales y de spline ordinal del conjunto de datos. Puede reducir el nmero de patrones de
prueba especificando un porcentaje de prdida de umbral de varianza, donde mientras mayor sea el
umbral, ms patrones de signos se excluirn. Con esta opcin, no se garantiza obtener la solucin ptima,
pero se reduce la posibilidad de obtener una solucin que no sea ptima. Adems, si no se encuentra la
solucin ptima, disminuye la posibilidad de que la solucin encontrada sea muy diferente de la solucin
ptima. Cuando se solicitan mltiples inicios sistemticos, los signos de los coeficientes de regresin para
cada inicio se escriben en un archivo de datos de IBM SPSS Statistics externo en la sesin actual. Consulte
el tema Regresin categrica: Guardar en la pgina 17 para obtener ms informacin.
Captulo 2. Regresin categrica (CATREG)

15

Los resultados de una ejecucin anterior con mltiples inicios sistemticos le permiten Utilizar signos
fijos para los coeficientes de regresin. Los signos (indicados por 1 y -1) deben estar en una fila del
conjunto de datos o archivo especificado. El nmero de inicio de valor entero representa el nmero de
caso de la fila de este archivo que contiene los signos que se utilizarn.
Criterios. Se puede especificar el nmero mximo de iteraciones que la regresin puede realizar durante
los clculos. Tambin puede seleccionar un valor para el criterio de convergencia. La regresin detiene la
iteracin si la diferencia del ajuste total entre la dos ltimas iteraciones es menor que el valor de
convergencia o si se ha alcanzado el nmero mximo de iteraciones.
Etiquetar grficos con. Permite especificar si se utilizarn en los grficos las etiquetas de variable y las
etiquetas de valor o los nombres de variable y los valores. Tambin se puede especificar una longitud
mxima para las etiquetas.

Regularizacin de regresin categrica


Mtodo. Los mtodos de regularizacin pueden mejorar el error predictivo del modelo reduciendo la
variabilidad de las estimaciones de coeficiente de regresin reduciendo las estimaciones hacia 0. Lazo y
Red elstica reducen algunas estimaciones de coeficientes a exactamente 0, ofreciendo as una forma de
seleccin de variables. Cuando se solicita un mtodo de regularizacin, el modelo y los coeficientes
regularizados para cada valor de coeficiente de penalizacin se escriben en un archivo o conjunto de
datos de IBM SPSS Statistics externo en la sesin actual. Consulte el tema Regresin categrica:
Guardar en la pgina 17 para obtener ms informacin.
v Regresin Ridge. La regresin Ridge reduce los coeficientes introduciendo un trmino de penalizacin
igual a la suma de coeficientes cuadrados por un coeficiente de penalizacin. Este coeficiente puede
variar de 0 (sin penalizacin) a 1; el procedimiento buscar el "mejor" valor de penalizacin si
especifica un rango e incremento.
v Lazo. El trmino de penalizacin de Lazo se basa en la suma de coeficientes absolutos y la
especificacin de un coeficiente de penalizacin es similar al de la regresin Ridge; sin embargo, Lazo
supone un procesamiento ms extenso.
v Red elstica. La Red elstica simplemente combina las penalizaciones de Lazo y regresin Ridge, y
buscar en la cuadrcula de valores especificada para encontrar los "mejores" coeficientes de
penalizacin de Lazo y de regresin Ridge. En un par concreto de penalizaciones de Lazo y regresin
Ridge, la red elstica no requiere mucho ms procesamiento que Lazo.
Grficos de regularizacin de visualizacin. Son grficos de los coeficientes de regresin en comparacin
con la penalizacin de regularizacin. Cuando busque un rango de valores para el "mejor" coeficiente de
penalizacin, ofrecer una vista de la forma en que los coeficientes cambian en dicho rango.
Grficos de red elstica. En el mtodo de Red elstica se producen grficos de regularizacin distintos
mediante los valores de la penalizacin de regresin Ridge. Todos los grficos posibles utiliza todos los
valores del rango determinados por los valores mnimo y mximo especificados de penalizacin de
regresin Ridge. Para algunas penalizaciones de r. contrada le permite especificar un subconjunto de
valores en el rango determinado por el mnimo y el mximo. Slo hay que escribir el nmero de un valor
de penalizacin (o especificar un rango de valores) y pulsar en Aadir.

Resultados de la regresin categrica


El cuadro de dilogo Resultados permite seleccionar los estadsticos que aparecern en los resultados.
Tablas. Genera tablas correspondientes a:
v R mltiple. Incluye R 2, R 2 corregida y R 2 corregida que tiene en cuenta el escalamiento ptimo.

16

IBM SPSS Categories 23

v
v
v

ANOVA. Esta opcin incluye las sumas de cuadrados de la regresin y de los residuos, las medias
cuadrticas y F. Se muestran dos tablas de ANOVA: una con tantos grados de libertad para la
regresin como predictores haya y otra con los grados de libertad de la regresin teniendo en cuenta el
escalamiento ptimo.
Coeficientes. Esta opcin produce tres tablas: una tabla de coeficientes que incluye betas, error
estndar de las betas, valores t y significacin; una tabla de escalamiento ptimo de coeficientes con el
error estndar de las betas que tiene en cuenta los grados de libertad del escalamiento ptimo; y una
tabla con las correlaciones de orden cero, parciales y semiparciales, la medida de importancia relativa
de Pratt de los predictores transformados y la tolerancia antes y despus de la transformacin.
Historial de iteraciones. Para cada iteracin, incluyendo los valores iniciales del algoritmo, aparecen la
R mltiple y el error de la regresin. El incremento de la R mltiple aparece a partir de la primera
iteracin.
Correlaciones de variables originales. Aparece una matriz que muestra las correlaciones entre las
variables no transformadas.
Correlaciones de variables transformadas. Aparece una matriz que muestra las correlaciones entre las
variables transformadas.
Coeficientes y modelos regularizados. Muestra valores de penalizacin, R cuadrado y los coeficientes
de regresin de cada modelo regularizado. Si se especifica un mtodo de repeticin de muestreo o si se
especifican objetos suplementarios (casos de prueba), tambin mostrar el error de prediccin o MSE
de prueba.

Repeticin de muestreo. Los mtodos de repeticin de muestreo le dan una estimacin del error de
prediccin del modelo.
v Validacin cruzada. La validacin cruzada divide la muestra en un nmero de submuestras o
pliegues. A continuacin, se generan los modelos de regresin categrica, que no incluyen los datos de
cada submuestra. El primer modelo se basa en todos los casos excepto los correspondientes al primer
pliegue de la muestra; el segundo modelo se basa en todos los casos excepto los del segundo pliegue
de la muestra y as sucesivamente. Para cada modelo se calcula el error de prediccin aplicando el
modelo a la submuestra que se excluy al generarse este.
v

Bootstrap .632. Con la simulacin de muestreo, las observaciones se trazan aleatoriamente a partir de
los datos con reposicin, repitiendo este proceso una serie de veces para obtener muestras de
simulacin de muestreo. Se ajusta un modelo para cada muestra de simulacin de muestreo. El error
de prediccin de cada modelo se estima al aplicar el modelo ajustado a los casos que no se encuentran
en la muestra de simulacin de muestreo.

Cuantificaciones de categoras. Aparecen tablas que muestran los valores transformados de las variables
seleccionadas.
Estadsticos descriptivos. Aparecen tablas que muestran las frecuencias, los valores perdidos y los modos
de las variables seleccionadas.

Regresin categrica: Guardar


El cuadro de dilogo Guardar permite guardar valores pronosticados, residuos y valores transformados
en un conjunto de datos activo y/o guardar datos discretizados, valores transformados, modelos y
coeficientes regularizados y signos de coeficientes de regresin en un archivo de datos o conjunto de
datos de IBM SPSS Statistics externo en la sesin actual.
v Los conjuntos de datos estn disponibles durante la sesin actual, pero no as en las sesiones
posteriores, a menos que los haya guardado explcitamente como archivos de datos. El nombre de un
conjunto de datos debe cumplir las normas de denominacin de variables.
v Los nombres de archivo o de conjunto de datos deben ser distintos para cada tipo de dato guardado.
Los coeficientes y modelos regularizados se guardan siempre que se selecciona un mtodo de
regularizacin en el cuadro de dilogo Regularizacin. De forma predeterminada, el procedimiento crea
Captulo 2. Regresin categrica (CATREG)

17

un nuevo conjunto de datos con un nombre exclusivo, aunque por supuesto podr especificar el nombre
que desee seleccionando o escribiendo en un archivo externo.
Los signos de coeficientes de regresin se guardan siempre que se utilizan mltiples inicios sistemticos
como configuracin inicial en el cuadro de dilogo Opciones. De forma predeterminada, el procedimiento
crea un nuevo conjunto de datos con un nombre exclusivo, aunque por supuesto podr especificar el
nombre que desee seleccionando o escribiendo en un archivo externo.

Grficos de transformacin en regresin categrica


El cuadro de dilogo Grficos permite especificar las variables que generarn grficos de transformacin
y de residuos.
Grficos de transformacin. Para cada una de estas variables, se representan las cuantificaciones de las
categoras respecto a los valores de categora originales. Las categoras vacas aparecen en el eje
horizontal pero no afectan a los clculos. Estas categoras se identifican por los saltos en la lnea que
conecta las cuantificaciones.
Grficos de residuos. Para cada una de estas variables, se representan los residuos (calculados para la
variable dependiente pronosticada de todos los predictores salvo del predictor en cuestin) respecto a los
indicadores de las categoras y las cuantificaciones de las categoras ptimas multiplicadas por beta
respecto a los indicadores de las categoras.

Caractersticas adicionales del comando CATREG


Se puede personalizar la regresin categrica si se pegan las selecciones en una ventana de sintaxis y se
edita la sintaxis del comando CATREG resultante. La sintaxis de comandos tambin le permite:
v Especificar nombres de raz para las variables transformadas al guardarlas en el conjunto de datos
activo (con el subcomando SAVE).
Consulte la Referencia de sintaxis de comandos para obtener informacin completa de la sintaxis.

18

IBM SPSS Categories 23

Captulo 3. Anlisis de componentes principales categrico


(CATPCA)
Este procedimiento cuantifica simultneamente las variables categricas a la vez que reduce la
dimensionalidad de los datos. El anlisis de componentes principales categrico se conoce tambin por el
acrnimo CATPCA, del ingls CATegorical Principal Components Analysis.
El objetivo de los anlisis de componentes principales es la reduccin de un conjunto original de
variables en un conjunto ms pequeo de componentes no correlacionados que representen la mayor
parte de la informacin encontrada en las variables originales. La tcnica es ms til cuando un extenso
nmero de variables impide una interpretacin eficaz de las relaciones entre los objetos (sujetos y
unidades). Al reducir la dimensionalidad, se interpreta un pequeo nmero de componentes en lugar de
un extenso nmero de variables.
El anlisis estndar de componentes principales asume relaciones lineales entre las variables numricas.
Por otra parte, el mtodo de escalamiento ptimo permite escalar las variables a diferentes niveles. Las
variables categricas se cuantifican de forma ptima en la dimensionalidad especificada. Como resultado,
se pueden modelar relaciones no lineales entre las variables.
Ejemplo. El anlisis de componentes principales categrico se puede utilizar para representar
grficamente la relacin entre la categora laboral, la divisin laboral, la provincia, el nmero de
desplazamientos (alto, medio y bajo) y la satisfaccin laboral. Observar que con dos dimensiones se
puede explicar una gran cantidad de varianza. La primera dimensin podra separar la categora laboral
de la provincia, mientras que la segunda dimensin podra separar la divisin laboral del nmero de
desplazamientos. Tambin podr observar que la alta satisfaccin laboral est relacionada con un nmero
medio de desplazamientos.
Estadsticos y grficos. Frecuencias, valores perdidos, nivel de escalamiento ptimo, moda, varianza
explicada por: las coordenadas del centroide, las coordenadas de vector, total por variable y total por
dimensin; cargas en componentes para las variables cuantificadas por los vectores, cuantificaciones y
coordenadas de categora, historial de iteraciones, correlaciones entre las variables transformadas y los
autovalores de la matriz de correlaciones, correlaciones entre las variables originales y los autovalores de
la matriz de correlaciones, puntuaciones de objetos, grficos de categoras, grficos de categoras
conjuntas, grficos de transformacin, grficos de residuos, grficos de centroides proyectados, grficos
de objetos, diagramas de dispersin biespaciales, diagramas de dispersin triespaciales y grficos de las
cargas en componentes.
Consideraciones sobre los datos del Anlisis de componentes principales categrico
Datos. Los valores de las variables de cadena se convierten en enteros positivos por orden alfabtico
ascendente. Los valores perdidos del usuario, los valores perdidos del sistema y los valores menores que
1 se consideran valores perdidos; se puede aadir una constante o recodificar las variables con valores
inferiores a 1 para evitar que se pierdan los mismos.
Supuestos. Los datos deben contener al menos tres casos vlidos. El anlisis se basa en datos enteros
positivos. La opcin de discretizacin categorizar de forma automtica una variable con valores
fraccionarios, agrupando sus valores en categoras con una distribucin casi normal y convertir de
forma automtica los valores de las variables de cadena en enteros positivos. Se pueden especificar otros
esquemas de discretizacin.
Procedimientos relacionados. Si se escalan todas las variables a nivel numrico, el anlisis se
corresponder con el anlisis de componentes principales estndar. Hay caractersticas de representacin
Copyright IBM Corp. 1989, 2014

19

alternativas que estn disponibles si se utilizan las variables transformadas en un anlisis de


componentes principales lineal estndar. Si todas las variables tienen un nivel de escalamiento nominal
mltiple, el anlisis de componentes principales categrico es idntico al anlisis de correspondencias
mltiple (HOMALS). Si hay conjuntos de variables que son de inters, se debe utilizar el anlisis de
correlacin cannica categrico (no lineal).
Para obtener un Anlisis de componentes principales categrico
1. Seleccione en los mens:
Analizar > Reduccin de dimensiones > Escalamiento ptimo...
2.
3.
4.
5.
6.

Seleccione Alguna variable no es nominal mltiple.


Seleccione Un conjunto.
Pulse en Definir.
Seleccione al menos dos variables de anlisis y especifique el nmero de dimensiones en la solucin.
Pulse en Aceptar.

Si lo desea, puede especificar variables suplementarias, que sern ajustadas sobre la solucin encontrada,
o variables de etiqueta para los grficos.

Definir escala y ponderacin en CATPCA


Se puede definir el nivel de escalamiento ptimo de las variables del anlisis y de las suplementarias. De
forma predeterminada, se escalan como lneasSp (ordinales) monotnicas de segundo orden con dos
nudos interiores. Asimismo, se puede definir la ponderacin para las variables del anlisis.
Ponderacin de la variable. Se puede definir una ponderacin para cada variable. El valor especificado
debe ser un entero positivo. El valor predeterminado es 1.
Nivel de escalamiento ptimo. Asimismo, se puede seleccionar el nivel de escalamiento que se utilizar
para cuantificar cada variable.
v Spline ordinal. El orden de las categoras de la variable observada se conserva en la variable escalada
ptimamente. Los puntos de categora estarn sobre una recta (vector) que pasa por el origen. La
transformacin resultante es un polinomio monotnico por tramos suave del orden seleccionado. Las
partes se especifican por el nmero de nudos interiores definido por el usuario y su posicin es
determinada por el procedimiento en funcin del nmero de nudos interiores.
v Spline nominal. La nica informacin de la variable observada que se conserva en la variable escalada
ptimamente es la agrupacin de los objetos en categoras. No se conserva el orden de las categoras de
la variable observada. Los puntos de categora estarn sobre una recta (vector) que pasa por el origen.
La transformacin resultante es un polinomio, posiblemente monotnico, por tramos suave del orden
seleccionado. Las partes se especifican por el nmero de nudos interiores definido por el usuario y su
posicin es determinada por el procedimiento en funcin del nmero de nudos interiores.
v Nominal mltiple. La nica informacin de la variable observada que se conserva en la variable
escalada ptimamente es la agrupacin de los objetos en categoras. No se conserva el orden de las
categoras de la variable observada. Los puntos de categora estarn en el centroide de los objetos para
las categoras particulares. El trmino Mltiple indica que se obtienen diferentes conjuntos de
cuantificaciones para cada dimensin.
v Ordinal. El orden de las categoras de la variable observada se conserva en la variable escalada
ptimamente. Los puntos de categora estarn sobre una recta (vector) que pasa por el origen. La
transformacin resultante se ajusta mejor que la transformacin de spline ordinal pero la suavidad es
menor.
v Nominal. La nica informacin de la variable observada que se conserva en la variable escalada
ptimamente es la agrupacin de los objetos en categoras. No se conserva el orden de las categoras de

20

IBM SPSS Categories 23

la variable observada. Los puntos de categora estarn sobre una recta (vector) que pasa por el origen.
La transformacin resultante se ajusta mejor que la transformacin de spline nominal pero la suavidad
es menor.
v Numrico. Las categoras se tratan como que estn ordenadas y espaciadas uniformemente (a nivel de
intervalo). El orden de las categoras y la equidistancia entre los nmeros de las categoras de la
variable observada se conservan en la variable escalada ptimamente. Los puntos de categora estarn
sobre una recta (vector) que pasa por el origen. Cuando todas las variables estn a nivel numrico, el
anlisis es anlogo al anlisis de componentes principales estndar.

Anlisis de componentes principales categrico: Discretizacin


El cuadro de dilogo Discretizacin permite seleccionar un mtodo para recodificar las variables. Las
variables con valores fraccionarios se agrupan en siete categoras (o en el nmero de valores distintos de
la variable si dicho nmero es inferior a siete) con una distribucin aproximadamente normal, si no se
especifica lo contrario. Las variables de cadena se convierten siempre en enteros positivos mediante la
asignacin de indicadores de categora en funcin del orden alfanumrico ascendente. La discretizacin
de las variables de cadena se aplica a estos enteros resultantes. De forma predeterminada, las variables
restantes se dejan inalteradas. A partir de ese momento, se utilizan en el anlisis las variables
discretizadas.
Mtodo. Seleccione entre agrupacin, clasificacin y multiplicacin.
v Agrupacin. Se recodifica en un nmero especificado de categoras o se recodifica por intervalos.
v Clasificacin. La variable se discretiza mediante la clasificacin de los casos.
v Multiplicacin. Los valores actuales de la variable se tipifican, multiplican por 10, redondean y se les
suma una constante de manera que el menor valor discretizado sea 1.
Agrupacin. Se encuentran disponibles las siguientes opciones cuando se discretizan variables por
agrupacin:
v Nmero de categoras. Especifique un nmero de categoras y si los valores de la variable deben
seguir una distribucin aproximadamente normal o uniforme en dichas categoras.
v Intervalos iguales. Las variables se recodifican en las categoras definidas por dichos intervalos de
igual tamao. Se debe especificar la longitud de los intervalos.

Anlisis de componentes principales categrico: Valores perdidos


Utilice el cuadro de dilogo Valores perdidos para elegir la estrategia para manejar los valores que faltan
en las variables de anlisis y las variables complementarias.
Estrategia. Seleccione excluir los valores perdidos (tratamiento pasivo), imputar los valores perdidos
(tratamiento activo) o excluir objetos con valores perdidos (eliminacin por lista).
v Excluir valores perdidos; para las correlaciones, imputar tras la cuantificacin. Los objetos con
valores perdidos en la variable seleccionada no contribuyen en el anlisis de esta variable. Si a todas
las variables se les aplica tratamiento pasivo, los objetos con valores perdidos en todas las variables se
tratarn como suplementarios. Si se especifican correlaciones en el cuadro de dilogo Resultados, tras
el anlisis, los valores perdidos se imputarn con la categora ms frecuente, o moda, de la variable
para las correlaciones de las variables originales. Para las correlaciones de la variable escalada
ptimamente, se puede seleccionar el mtodo de imputacin.
Moda. Sustituya valores que faltan con el modo de la variable escalada de forma ptima.
Categora adicional. Sustituya valores que faltan con la cuantificacin de una categora adicional.
Este valor implica que los objetos con un valor que falta en esta variable se considera que
pertenecen a la misma categora (adicional).

Captulo 3. Anlisis de componentes principales categrico (CATPCA)

21

Categora aleatoria. Impute cada valor que falta en una variable con el valor cuantificado de un
nmero de categora aleatoria diferente basndose en las frecuencias marginales de las categoras de
la variable.
v

Imputar valores perdidos. Los objetos con valores perdidos en la variable seleccionada tendrn dichos
valores imputados. Se puede seleccionar el mtodo de imputacin.
Moda. Sustituya los valores que faltan con la categora ms frecuente. Cuando existen varias modas,
se utiliza la que tiene el indicador de categora ms pequeo.
Categora adicional. Sustituya los valores que falta con la misma cuantificacin de una categora
adicional. Este valor implica que los objetos con un valor que falta en esta variable se considera que
pertenecen a la misma categora (adicional).
Categora aleatoria. Sustituya cada valor que falta en una variable con un nmero de categora
aleatoria diferente basndose en las frecuencias marginales de las categoras.

Excluir objetos con valores perdidos en esta variable. Los objetos con valores perdidos en la variable
seleccionada se excluyen del anlisis. Esta estrategia no est disponible para las variables
suplementarias.

Anlisis de componentes principales categrico: Opciones


El cuadro de dilogo Opciones proporciona controles para seleccionar la configuracin inicial, especificar
criterios de iteracin y de convergencia, seleccionar un mtodo de normalizacin, elegir el mtodo para
etiquetar grficos y especificar objetos complementarios.
Objetos suplementarios. Especifique el nmero de caso del objeto, o bien los nmeros de caso primero y
ltimo de un rango de objetos que desee convertir en suplementario y, a continuacin, pulse en Aadir.
Si se especifica un objeto como suplementario, se ignorarn las ponderaciones de casos para dicho objeto.
Mtodo de normalizacin. Se puede especificar una de las cinco opciones para normalizar las
puntuaciones de objeto y las variables. Solo se puede utilizar un mtodo de normalizacin en cada
anlisis.
v Principal por variable. Esta opcin optimiza la asociacin entre las variables. Las coordenadas de las
variables en el espacio de los objetos son las cargas en componentes (las correlaciones con componentes
principales, como son las dimensiones y las puntuaciones de los objetos). Este mtodo es til si est
interesado bsicamente en la correlacin entre las variables.
v Principal por objeto. Esta opcin optimiza las distancias entre los objetos. Este mtodo es til si est
interesado bsicamente en las diferencias o similitudes entre los objetos.
v Simtrico. Se utiliza esta opcin de normalizacin si el inters principal est en la relacin entre objetos
y variables.
v Independiente. Se utiliza esta opcin de normalizacin si se desea examinar por separado las
distancias entre los objetos y las correlaciones entre las variables.
v

Personalizado. Se puede especificar cualquier valor real en el intervalo cerrado [-1, 1]. Un valor de 1
es igual al mtodo principal del objeto. Un valor de 0 es igual al mtodo simtrico. Un valor de 1 es
igual al mtodo principal de variable. Si se especifica un valor mayor que -1 y menor que 1, se puede
distribuir el autovalor entre los objetos y las variables. Este mtodo es til para generar diagramas de
dispersin biespaciales y triespaciales a medida.

Criterios. Se puede especificar el nmero mximo de iteraciones que el procedimiento puede realizar
durante los clculos. Tambin puede seleccionar un valor para el criterio de convergencia. El algoritmo
detiene la iteracin si la diferencia del ajuste total entre la dos ltimas iteraciones es menor que el valor
de convergencia o si se ha alcanzado el nmero mximo de iteraciones.
Etiquetar grficos con. Puede especificar si las variables y las etiquetas de valor o los nombres y valores
de variable se utilizan en los grficos. Tambin se puede especificar una longitud mxima para las
etiquetas.

22

IBM SPSS Categories 23

Dimensiones del grfico. Puede controlar las dimensiones que se visualizan en el resultado.
v Muestra todas las dimensiones de la solucin. Todas las dimensiones de la solucin se muestran en
un diagrama de dispersin matricial.
v Restringe el nmero de dimensiones Las dimensiones mostradas se restringen a los pares
representados. Si restringe las dimensiones, deber seleccionar las dimensiones menor y mayor que se
van a representar. La dimensin menor puede variar desde 1 hasta el nmero de dimensiones de la
solucin menos 1 y se representa respecto a las dimensiones mayores. El valor de la dimensin mayor
puede oscilar variar desde 2 hasta el nmero de dimensiones de la solucin e indica la dimensin
mayor que se utilizar al representar los pares de dimensiones. Esta especificacin se aplica a todos los
grficos multidimensionales solicitados.
Rotacin. Puede seleccionar un mtodo de rotacin para obtener resultados rotados.
Nota: Estos mtodos de rotacin no estn disponibles si selecciona Realizar simulacin de muestreo en
el dilogo Simulacin de muestreo.
v Varimax. Un mtodo de rotacin ortogonal que minimiza el nmero de variables que tienen
saturaciones altas en cada componente. Simplifica la interpretacin de los componentes.
v Quartimax. Un mtodo de rotacin que minimiza el nmero de componentes que son necesarios para
explicar cada variable. Simplifica la interpretacin de las variables observadas.
v Equamax. Un mtodo de rotacin que es una combinacin del mtodo Varimax, que simplifica los
componentes, y el mtodo Quartimax, que simplifica las variables. El nmero de variables que
imponen una alta saturacin en un componente y el nmero de componentes que son necesarios para
explicar una variable se minimizan.
v Oblimin. Un mtodo para la rotacin oblicua (no ortogonal). Cuando el delta es igual a 0, los
componentes son los ms oblicuos. Cuando delta se vuelve negativo, los componentes pasan a ser
menos oblicuos. Los valores positivos permiten una correlacin adicional de componentes. El valor de
Delta debe ser menor o igual que 0,8.
v Promax. Una rotacin oblicua (no ortogonal), que permite correlacionar los componentes. Se puede
calcular ms rpidamente que una rotacin Oblimin directa, de forma que es til para conjuntos de
datos grandes. La cantidad de correlacin (oblicuidad) que est permitida se controla mediante el
parmetro kappa. El valor de Kappa debe ser mayor o igual que 1 y menor que 10.000.
Configuracin. Puede leer datos en un archivo que contiene las coordenadas de una configuracin. La
primera variable del archivo contiene las coordenadas para la primera dimensin. La segunda variable
contiene las coordenadas para la segunda dimensin y, as, sucesivamente.
v
v

Inicial. La configuracin en el archivo que se especifica se utiliza como el punto de partid del anlisis.
Fija. La configuracin en el archivo que se especifica se utiliza para ajustar las variables. Las variables
que se ajustan se deben seleccionar como variables de anlisis, pero al ser la configuracin fija, se
tratan como variables suplementarias (de manera que no es necesario seleccionarlas como variables
suplementarias).

Anlisis de componentes principales categrico: Resultados


El cuadro de dilogo Resultados controla la visualizacin de resultados.
Puntuaciones de los objetos. Muestra las puntuaciones de los objetos y tiene las siguientes opciones:
v Incluir categoras de. Muestra los indicadores de las categoras de las variables de anlisis
seleccionadas.
v Etiquetar puntuaciones de los objetos por. En la lista de variables que se han especificado como
variables de etiquetado, puede seleccionar una para etiquetar los objetos.

Captulo 3. Anlisis de componentes principales categrico (CATPCA)

23

Saturaciones de componentes. Muestra las cargas en componentes para todas las variables que no
recibieron niveles de escalamiento nominal mltiple. Puede ordenar las saturaciones de componentes por
tamao.
Historial de iteraciones. En cada iteracin, se muestra la varianza explicada, la prdida y el incremento
en la varianza explicada.
Correlaciones de variables originales. Muestra la matriz de correlaciones de las variables originales y los
autovalores de dicha matriz.
Correlaciones de variables transformadas. Muestra la matriz de correlaciones de las variables
transformadas (mediante escalamiento ptimo) y los autovalores de dicha matriz.
varianza explicada por. Muestra la cantidad de varianza explicada por las coordenadas de los centroides,
las coordenadas de vectores y total (coordenadas de centroides y de vectores combinadas) por variable y
por dimensin.
Cuantificaciones de categoras. Proporciona las cuantificaciones de categora y las coordenadas para cada
dimensin de las variables que se han seleccionado.
Estadsticos descriptivos. Muestra frecuencias, el nmero de valores que faltan y el modo de las variables
que se han seleccionado.

Anlisis de componentes principales categrico: Guardar


Los controles del recuadro de dilogo Guardar guardan datos discretizados, puntuaciones de objeto,
valores transformados y otros resultados en el conjunto de datos activo, un nuevo conjunto de datos en la
sesin actual, o un archivo externo.
v Los conjuntos de datos estn disponibles durante la sesin actual, pero no as en las sesiones
posteriores, a menos que los haya guardado explcitamente como archivos de datos. El nombre de un
conjunto de datos debe cumplir las normas de denominacin de variables.
v Los nombres de archivo o de conjunto de datos deben ser distintos para cada tipo de dato guardado.
v Si guarda puntuaciones de objeto o valores transformados en el conjunto de datos activo, podr
especificar el nmero de dimensiones nominales mltiples.
v Las opciones del grupo Elipses de confianza de simulacin de muestreo solo estn disponibles si
selecciona Realizar simulacin de muestreo en el dilogo Simulacin de muestreo.

Anlisis de componentes principales categrico: Grficos de objetos


El cuadro de dilogo Grficos de variables y objetos permite especificar los tipos de grficos que desee y
las variables para las que se generarn los grficos.
Puntos de objetos. Se muestra un grfico de los puntos de objetos.
Objetos y variables (grfico biespacial). Los puntos de objetos se representan con la seleccin realizada
de las coordenadas de las variables (cargas en componentes o centroides de las variables).
Objetos, cargas y centroides (grfico triespacial). Los puntos de objetos se representan con los centroides
de las variables con un nivel de escalamiento nominal mltiple y las cargas en componentes de las otras
variables.
Variables para grficos biespaciales y triespaciales. Puede utilizar todas las variables para los grficos de
dispersin biespacial y triespacial o seleccionar un subconjunto.

24

IBM SPSS Categories 23

Etiquetar objetos. Se puede elegir que los objetos se etiqueten con las categoras de las variables
seleccionadas (se pueden seleccionar entre los valores del indicador de categora o las etiquetas de valor,
en el cuadro de dilogo Opciones) o con sus nmeros de caso. Se genera un grfico por cada variable si
se selecciona Variable.

Anlisis de componentes principales categrico: Grficos de


categoras
El cuadro de dilogo Grficos de categoras permite especificar los tipos de grficos deseados y las
variables para las que se generarn los grficos.
Grficos de categoras. Para cada variable seleccionada, se representa un grfico de las coordenadas de
vector y del centroide. Para las variables con nivel de escalamiento nominal mltiple, las categoras estn
sobre los centroides de los objetos para las categoras particulares. Para todos los dems niveles de
escalamiento, las categoras estn sobre un vector que pasa por el origen.
Grficos de categoras conjuntas. Este es un nico grfico con el centroide y las coordenadas de vector
de cada variable seleccionada.
Grficos de transformacin. Muestra un grfico de las cuantificaciones de las categoras ptimas en
oposicin a los indicadores de las categoras. Se puede especificar el nmero de dimensiones deseado
para las variables con nivel de escalamiento nominal mltiple; se generar un grfico para cada
dimensin. Tambin se puede seleccionar si se muestran los grficos de los residuos para cada variable
seleccionada.
Proyectar los centroides de. Se puede seleccionar una variable y proyectar sus centroides sobre las
variables seleccionadas. Las variables con niveles de escalamiento nominal mltiple no se pueden
seleccionar para la proyeccin. Al solicitar este grfico, aparece una tabla con las coordenadas de los
centroides proyectados.

Anlisis de componentes principales categrico: grfico de cargas


El cuadro de dilogo Grficos de carga controla las variables que se incluyen en el grfico, la
visualizacin de centroides en el grfico de cargas y la visualizacin de grficos de la varianza explicada
por.
Varianza explicada por. Para cada dimensin, muestra un grfico de la varianza explicada por.
Mostrar cargas en componentes. Si est seleccionado, se muestra un grfico de las cargas en
componentes.
Variables de carga. Puede utilizar todas las variables para el grfico de cargas en componentes o bien
seleccionar un subconjunto.
Incluir centroides. Las variables con un nivel de escalamiento nominal mltiple no tienen cargas en
componentes, pero se pueden incluir los centroides de dichas variables en el grfico. Puede utilizar todas
las variables nominales mltiples o bien seleccionar un subconjunto.

Simulacin de muestreo del anlisis de componentes principales


categrico
El dilogo Simulacin de muestreo especifica los parmetros para el anlisis de la simulacin de
muestreo.
Realizar simulacin de muestreo. Realiza la repeticin de la simulacin de muestreo.
Captulo 3. Anlisis de componentes principales categrico (CATPCA)

25

v Si se solicitan grficos de cargas, categoras o puntuaciones de componente, se visualizan grficos


adicionales. Estos grficos muestran los puntos para la muestra de datos y las estimaciones de
simulacin de muestreo. Los grficos de transformacin incluyen regiones de confianza. Tambin se
visualiza un grfico para los autovalores.
v Si se especifica una solucin bidimensional, se visualizan grficos de elipses de confianza para los
autovalores, las cargas de componente, los puntos de categora y los puntos de objeto.
v La repeticin de la simulacin de muestreo no est disponible si especifica un mtodo de rotacin en el
dilogo Opciones.
puede seleccionar una simulacin de muestreo Equilibrado o No equilibrado.
Nmero de muestras. El nmero de muestras de la simulacin de muestreo que se utilizan para calcular
las estimaciones de la simulacin de muestreo. El valor debe ser un entero positivo.
Nivel de confianza. El nivel de confianza de las estimaciones de la simulacin de muestreo, expresado
como porcentaje. El valor debe ser un nmero positivo menor que 100.
Mtodo de bsqueda de coincidencias. Las dos alternativas son Procusto y Reflejo.
Elipses de confianza. Controla el rea de umbral para las elipses de confianza en grficos. Para reas
mayores que (> operador) el valor especificado, el nmero de elipses disminuye cuando aumenta el valor
del umbral.
v El valor de este grupo solo est disponible si el nmero de dimensiones que se han especificado en el
dilogo principal es 2.
v Las elipses de confianza para cargar grficos solo estn disponibles si est seleccionado Mostrar cargas
en componentes en el dilogo Grficos de cargas.
v Las elipses d confianza para los grficos de objetos solo estn disponibles si est seleccionado Puntos
de objeto en el dilogo Grficos de variables y objetos.
v Las elipses de confianza para los grficos de categora solo estn disponibles si se ha especificado una
o ms variables en la lista Grficos de categoras en el dilogo Grficos de categora.
Nmero de puntos de contorno de elipse. El nmero de puntos de grfico utilizados para trazar cada
elipse de confianza. Los valores ms grandes generan elipses ms suaves. El valor debe ser un entero
positivo menor o igual que 100.

Caractersticas adicionales del comando CATPCA


Se puede personalizar el anlisis de componentes principales categrico si se pegan las selecciones en una
ventana de sintaxis y se edita la sintaxis del comando de CATPCA resultante. La sintaxis de comandos
tambin le permite:
v Especificar nombres de raz para las variables transformadas, puntuaciones de objetos y
aproximaciones al guardarlas en el conjunto de datos activo (con el subcomando SAVE).
v Especificar una longitud mxima de las etiquetas para cada grfico por separado (con el subcomando
PLOT).
v Especificar una lista de variables distinta para los grficos de residuos (con el subcomando PLOT).
Consulte la Referencia de sintaxis de comandos para obtener informacin completa de la sintaxis.

26

IBM SPSS Categories 23

Captulo 4. Anlisis de correlacin cannica no lineal


(OVERALS)
El anlisis de correlacin cannica no lineal coincide con el anlisis de correlacin cannica categrico
mediante escalamiento ptimo. El propsito de este procedimiento es determinar la similitud entre los
conjuntos de variables categricas. El anlisis de correlacin cannica no lineal se conoce tambin por el
acrnimo OVERALS.
El anlisis de correlacin cannica estndar es una extensin de la regresin mltiple, en la que el
segundo conjunto no contiene una nica variable de respuesta, sino varias. El objetivo es explicar el
mximo posible de la varianza sobre las relaciones existentes entre dos conjuntos de variables numricas
en un espacio de pocas dimensiones. Inicialmente, las variables de cada conjunto se combinan
linealmente de forma que las combinaciones lineales tengan una correlacin mxima entre s. Una vez
dadas estas combinaciones, se establece que las combinaciones lineales subsiguientes no estn
correlacionadas con las combinaciones anteriores y que tambin tengan la mayor correlacin posible.
El enfoque de escalamiento ptimo expande el anlisis estndar de tres formas decisivas. Primera:
OVERALS permite ms de dos conjuntos de variables. Segunda: las variables se pueden escalar como
nominales, ordinales o numricas. Como resultado, se pueden analizar relaciones no lineales entre las
variables. Finalmente, en lugar de maximizar las correlaciones entre los conjuntos de variables, los
conjuntos se comparan con un conjunto de compromiso desconocido definido por las puntuaciones de los
objetos.
Ejemplo. El anlisis de correlacin cannica categrica mediante escalamiento ptimo se puede utilizar
para representar grficamente la relacin entre un conjunto de variables que contienen la categora laboral
y los aos de formacin y otro conjunto de variables con la regin de residencia y el sexo. Podemos
encontrar que los aos de formacin y la regin de residencia discriminan mejor que las variables
restantes. Tambin podemos encontrar que los aos de formacin es la variable que mejor discrimina en
la primera dimensin.
Estadsticos y grficos. Frecuencias, centroides, historial de iteraciones, puntuaciones de objeto,
cuantificaciones de categora, ponderaciones, cargas en las componentes, ajuste simple y mltiple, grficos
de las puntuaciones de objeto, grficos de las coordenadas de categora, grficos de las cargas en las
componentes, grficos de los centroides de categora y grficos de transformacin.
Anlisis de correlacin cannica no lineal: Consideraciones sobre los datos
Datos. Utilice enteros para codificar las variables categricas (nivel de escalamiento nominal u ordinal).
Para minimizar los resultados, utilice enteros consecutivos, comenzando por el 1, para codificar cada
variable. Las variables escaladas a nivel numrico no deben ser recodificadas en enteros consecutivos.
Para minimizar los resultados, en cada variable escalada a nivel numrico, sustraiga el menor valor
observado a todos los valores y smele 1. Los valores fraccionarios se truncarn tras el decimal.
Supuestos. Las variables se pueden clasificar en dos o ms conjuntos. Las variables del anlisis se escalan
como nominales mltiples, nominales simples, ordinales o numricas. El nmero mximo de dimensiones
que se utiliza en el procedimiento depende del nivel de escalamiento ptimo de las variables. Si todas las
variables se especifican como ordinales, nominales simples o numricas, el nmero mximo de
dimensiones es el menor de los dos valores siguientes: el nmero de observaciones menos 1 o el nmero
total de variables. Sin embargo, si slo se definen dos conjuntos de variables, el nmero mximo de
dimensiones es el nmero de variables en el conjunto ms pequeo. Si algunas variables son nominales
mltiples, el nmero mximo de dimensiones es el nmero total de categoras nominales mltiples ms el
nmero de variables nominales no mltiples menos el nmero de variables nominales mltiples. Por
Copyright IBM Corp. 1989, 2014

27

ejemplo, si el anlisis incluye cinco variables, una de las cuales es nominal mltiple con cuatro categoras,
el nmero mximo de dimensiones ser (4 + 4 - 1) o 7. Si se especifica un nmero mayor que el mximo,
se utilizar el valor mximo.
Procedimientos relacionados. Si cada conjunto contiene una variable, el Anlisis de correlacin cannica
no lineal ser equivalente al Anlisis de componentes principales mediante escalamiento ptimo. Si todas
estas variables son nominales mltiples, el anlisis coincidir con el anlisis de correspondencias mltiple.
Si hay dos conjuntos de variables implicados y uno de ellos contiene slo una variable, el anlisis ser
idntico a la Regresin categrica mediante escalamiento ptimo.
Para obtener un anlisis de correlacin cannica no lineal
1. Seleccione en los mens:
Analizar > Reduccin de dimensiones > Escalamiento ptimo...
2. Seleccione Todas las variables son nominales mltiples o Alguna variable no es nominal mltiple.
3. Seleccione Mltiples conjuntos.
4. Pulse en Definir.
5. Defina al menos dos conjuntos de variables. Seleccione la variable o variables que desee incluir en el
primer conjunto. Para desplazarse al siguiente conjunto, pulse en Siguiente y seleccione las variables
que desee incluir en el segundo conjunto. Puede aadir conjuntos adicionales. Pulse en Anterior para
volver al conjunto de variables definido anteriormente.
6. Defina el rango de valores y la escala de medicin (nivel de escalamiento ptimo) para cada variable
seleccionada.
7. Pulse en Aceptar.
8. Si lo desea:
v Seleccionar una o ms variables para proporcionar etiquetas de punto en los grficos de las
puntuaciones de objeto. Cada variable genera un grfico diferente, con los puntos etiquetados mediante
los valores de dicha variable. Debe definir un rango para cada una de las variables de etiquetado de
los grficos. Cuando se usa el cuadro de dilogo, no se puede utilizar una misma variable en el anlisis
y como variable de etiquetado. Si desea etiquetar el grfico de las puntuaciones de objeto con una
variable ya utilizada en el anlisis, utilice la funcin Calcular (disponible en el men Transformar) para
crear una copia de dicha variable. Utilice la nueva variable para etiquetar el grfico. Alternativamente,
se puede utilizar la sintaxis de comandos.
v Especifique el nmero de dimensiones que desea en la solucin. En general, seleccione el menor
nmero de dimensiones que necesite para explicar la mayor parte de la variacin. Si el anlisis incluye
ms de dos dimensiones, se generarn grficos tridimensionales de las tres primeras dimensiones. Si se
edita el grfico, se pueden representar otras dimensiones.

Definir rango y escala


Debe definir un rango para cada variable. El valor mximo especificado debe ser un entero. En el anlisis,
se truncarn los valores de los datos fraccionarios. Se ignorar en el anlisis cualquier valor de categora
que est fuera del rango especificado. Para minimizar el resultado, utilice la funcin Recodificacin
automtica (disponible en el men Transformar) para crear categoras consecutivas, comenzando en el 1,
para las variables tratadas como nominales u ordinales. No se recomienda la recodificacin en enteros
consecutivos de las variables que se escalan a nivel numrico. Para minimizar el resultado para variables
tratadas como numricas, para cada variable sustraiga el valor mnimo de cada valor y adale 1.
Asimismo, se puede seleccionar el nivel de escalamiento que se utilizar para cuantificar cada variable.
v Ordinal. El orden de las categoras de la variable observada se conserva en la variable cuantificada.
v Nominal simple. En la variable cuantificada, los objetos que se encuentran en la misma categora
reciben la misma puntuacin.
v Nominal mltiple. Las cuantificaciones pueden ser distintas para cada dimensin.

28

IBM SPSS Categories 23

v Numrica discreta. Las categoras se tratan como si estuvieran ordenadas y espaciadas uniformemente.
Las diferencias entre los nmeros de las categoras y el orden de las categoras de la variable observada
se conservan en la variable cuantificada.

Definir rango
Debe definir un rango para cada variable. El valor mximo especificado debe ser un entero. En el anlisis,
se truncarn los valores de los datos fraccionarios. Se ignorar en el anlisis cualquier valor de categora
que est fuera del rango especificado. Para minimizar los resultados, utilice la funcin Recodificacin
automtica (disponible en el men Transformar) para crear categoras consecutivas, comenzando en el 1.
Tambin debe definir un rango para cada una de las variables utilizadas para etiquetar los grficos de las
puntuaciones de objeto. Sin embargo, las etiquetas para las categoras con valores de los datos fuera del
rango definido para la variable s aparecen en los grficos.

Anlisis de correlacin cannica no lineal: Opciones


El cuadro de dilogo Opciones permite seleccionar grficos y estadsticos opcionales, guardar las
puntuaciones de objeto como variables nuevas en conjunto de datos activo, especificar los criterios de
iteracin y convergencia y especificar una configuracin inicial para el anlisis.
Representacin. Los estadsticos disponibles incluyen las frecuencias marginales (los recuentos), los
centroides, el historial de iteraciones, las ponderaciones y las cargas en las componentes, las
cuantificaciones de las categoras, las puntuaciones de objeto y los estadsticos de ajuste simple y
mltiple.
v Centroides. Las cualificaciones de las categoras y los promedios proyectados y reales de las
puntuaciones de los objetos para los objetos (los casos) incluidos en cada conjunto para aquellos casos
que pertenecen a la misma categora de la variable.
v Ponderaciones y cargas en componentes. Los coeficientes de regresin en cada dimensin para toda
variable cuantificada de un conjunto, donde las puntuaciones de los objetos se regresan sobre las
variables cuantificadas; y la proyeccin de cada variable cuantificada en el espacio de los objetos.
Proporciona una indicacin de la contribucin que cada variable aporta a la dimensin dentro de cada
conjunto.
Ajuste simple y mltiple. Medidas de bondad de ajuste simple y mltiple de las coordenadas de las
categoras/cuantificaciones de las categoras, respecto a los objetos.
v Cuantificaciones de categoras. Valores de escalamiento ptimo asignados a las categoras de una
variable.
v Puntuaciones de los objetos. Puntuacin ptima que se asigna a un objeto (caso) en una dimensin
particular.
v

Grfico. Puede generar grficos de las coordenadas de las categoras, las puntuaciones de objeto, las
cargas en las componentes, los centroides de las categoras y las transformaciones.
Guardar puntuaciones de los objetos. Puede guardar las puntuaciones de los objetos como nuevas
variables en el conjunto de datos activo. Las puntuaciones de objeto se guardan para el nmero de
dimensiones especificadas en el cuadro de dilogo principal.
Utilizar configuracin inicial aleatoria. Una configuracin inicial aleatoria debe utilizarse en el caso de
que algunas o todas las variables sean nominales simples. Si esta opcin no se selecciona, se utiliza una
configuracin inicial anidada.
Criterios. Puede especificar el nmero mximo de iteraciones que el anlisis de correlacin cannica no
lineal puede realizar durante los clculos. Tambin puede seleccionar un valor para el criterio de
convergencia. El anlisis detiene la iteracin si la diferencia del ajuste total entre la dos ltimas
iteraciones es menor que el valor de convergencia o si se ha alcanzado el nmero mximo de iteraciones.
Captulo 4. Anlisis de correlacin cannica no lineal (OVERALS)

29

Caractersticas adicionales del comando OVERALS


Se puede personalizar el anlisis de correlacin cannica no lineal si se pegan las selecciones en una
ventana de sintaxis y se edita la sintaxis del comando OVERALS resultante. La sintaxis de comandos
tambin le permite:
v Especificar los pares de dimensiones que se van a representar, en lugar de representar todas las
dimensiones extradas (mediante la palabra clave NDIM en el subcomando PLOT ).
v Especificar el nmero de caracteres de la etiqueta del valor utilizado para etiquetar los puntos en los
grficos (mediante el subcomando PLOT).
v Designar ms de cinco variables como variables de etiqueta para los grficos de las puntuaciones de
objeto (mediante el subcomando PLOT).
v Seleccionar las variables utilizadas en el anlisis tambin como variables de etiqueta para los grficos
de las puntuaciones de objeto (mediante el subcomando PLOT).
v Seleccionar variables para proporcionar etiquetas de punto para el grfico de las puntuaciones de
cuantificacin (mediante el subcomando PLOT).
v Especificar el nmero de casos que se van a incluir en el anlisis si no desea utilizar todos los casos
existentes en el conjunto de datos activo (mediante el subcomando NOBSERVATIONS).
v Especificar nombres de raz para las variables creadas al guardar las puntuaciones de objeto (mediante
el subcomando SAVE).
v Especificar el nmero de dimensiones que se van a guardar, en lugar de guardar todas las dimensiones
extradas (mediante el subcomando SAVE).
v Escribir las cuantificaciones de las categoras en un archivo matricial (utilizando el subcomando
MATRIX).
v Generar grficos de baja resolucin ms fciles de leer que los grficos de alta resolucin habituales
(mediante el comando SET).
v Generar grficos de transformacin y de los centroides slo para las variables especificadas (mediante
el subcomando PLOT).
Consulte la Referencia de sintaxis de comandos para obtener informacin completa de la sintaxis.

30

IBM SPSS Categories 23

Captulo 5. Anlisis de correspondencias


Uno de los objetivos del anlisis de correspondencias es describir las relaciones existentes entre dos
variables nominales, recogidas en una tabla de correspondencias, sobre un espacio de pocas dimensiones,
mientras que al mismo tiempo se describen las relaciones entre las categoras de cada variable. Para cada
variable, las distancias sobre un grfico entre los puntos de categoras reflejan las relaciones entre las
categoras, con las categoras similares representadas prximas unas a otras. La proyeccin de los puntos
de una variable sobre el vector desde el origen hasta un punto de categora de la otra variable describe la
relacin entre ambas variables.
El anlisis de las tablas de contingencia a menudo incluye examinar los perfiles de fila y de columna, as
como contrastar la independencia a travs del estadstico de chi-cuadrado. Sin embargo, el nmero de
perfiles puede ser bastante grande y la prueba de chi-cuadrado no revelar la estructura de la
dependencia. El procedimiento Tablas cruzadas ofrece varias medidas y pruebas de asociacin pero no
puede representar grficamente ninguna relacin entre las variables.
El anlisis factorial es una tcnica estndar para describir las relaciones existentes entre variables en un
espacio de pocas dimensiones. Sin embargo, el anlisis factorial requiere datos de intervalo y el nmero
de observaciones debe ser cinco veces el nmero de variables. Por su parte, el anlisis de
correspondencias asume que las variables son nominales y permite describir las relaciones entre las
categoras de cada variable, as como la relacin entre las variables. Adems, el anlisis de
correspondencias se puede utilizar para analizar cualquier tabla de medidas de correspondencia que sean
positivas.
Ejemplo. El anlisis de correspondencias se puede utilizar para representar grficamente la relacin entre
la categora laboral y el hbito de fumar. Observar que, en relacin al tabaco, el comportamiento de los
subdirectores difiere del de las secretarias, pero el comportamiento de stas no difiere del de los
directores. Asimismo observar, que el tabaquismo pronunciado se encuentra asociado a los
subdirectores, mientras que el tabaquismo leve se encuentra asociado a las secretarias.
Estadsticos y grficos. Medidas de correspondencia, perfiles de fila y de columna, valores singulares,
puntuaciones de fila y de columna, inercia, masa, estadsticos de confianza para las puntuaciones de fila
y de columna, estadsticos de confianza para los valores propios, grficos de transformacin, grficos de
los puntos de fila, grficos de los puntos de columna y diagramas de dispersin biespaciales.
Anlisis de correspondencias: Consideraciones sobre los datos
Datos. Las variables categricas que se van a analizar se encuentran escaladas a nivel nominal. Para los
datos agregados o para una medida de correspondencia distinta de las frecuencias, utilice una variable de
ponderacin con valores de similaridad positivos. De manera alternativa, para datos tabulares, utilice la
sintaxis para leer la tabla.
Supuestos. El mximo nmero de dimensiones utilizado en el procedimiento depende del nmero de
categoras activas de fila y de columna y del nmero de restricciones de igualdad. Si no se utilizan
criterios de igualdad y todas las categoras son activas, la dimensionalidad mxima es igual al nmero de
categoras de la variable con menos categoras menos uno. Por ejemplo, si una variable dispone de cinco
categoras y la otra de cuatro, el nmero mximo de dimensiones es tres. Las categoras suplementarias
no son activas. Por ejemplo, si una variable dispone de cinco categoras, dos de las cuales son
suplementarias, y la otra variable dispone de cuatro categoras, el nmero mximo de dimensiones es
dos. Considere todos los conjuntos de categoras con restriccin de igualdad como una nica categora.
Por ejemplo, si una variable dispone de cinco categoras, tres de las cuales tienen restriccin de igualdad,
dicha variable se debe tratar como si tuviera tres categoras en el momento de calcular la

Copyright IBM Corp. 1989, 2014

31

dimensionalidad mxima. Dos de las categoras no tienen restriccin y la tercera corresponde a las tres
categoras restringidas. Si se especifica un nmero de dimensiones superior al mximo, se utilizar el
valor mximo.
Procedimientos relacionados. Si hay implicadas ms de dos variables, utilice el anlisis de
correspondencias mltiple. Si se deben escalar las variables de forma ordinal, utilice el anlisis de
componentes principales categrico.
Para obtener un anlisis de correspondencias
1. Seleccione en los mens:
Analizar > Reduccin de dimensiones > Anlisis de correspondencias...
2. Seleccione una variable de filas.
3. Seleccione una variable de columnas.
4. Defina los rangos para las variables.
5. Pulse en Aceptar.

Definir rango de filas en Anlisis de correspondencias


Debe definir un rango para la variable de filas. Los valores mnimo y mximo especificados deben ser
nmeros enteros. En el anlisis, se truncarn los valores de los datos fraccionarios. Se ignorar en el
anlisis cualquier valor de categora que est fuera del rango especificado.
Inicialmente, todas las variables estarn sin restringir y activas. Puede restringir las categoras de fila para
igualarlas a otras categoras de fila o puede definir cualquier categora de fila como suplementaria.
v Las categoras deben ser iguales. Las puntuaciones de las categoras deben ser iguales. Utilice las
restricciones de igualdad si el orden obtenido para las categoras no es el deseado o si no se
corresponde con lo intuitivo. El mximo nmero de categoras de fila que se puede restringir para que
sean consideradas iguales es el nmero total de categoras de fila activas menos 1. Utilice la sintaxis
para imponer restricciones de igualdad a diferentes conjuntos de categoras. Por ejemplo, utilice la
sintaxis para imponer la restriccin de que sean consideradas iguales las categoras 1 y 2 y, por otra
parte, que sean consideradas iguales las categoras 3 y 4.
v La categora es suplementaria. Las categoras suplementarias no influyen en el anlisis pero se
representan en el espacio definido por las categoras activas. Las categoras suplementarias no juegan
ningn papel en la definicin de las dimensiones. El nmero mximo de categoras de fila
suplementarias es el nmero total de categoras de fila menos 2.

Definir rango de columnas en Anlisis de correspondencias


Debe definir un rango para la variable de columnas. Los valores mnimo y mximo especificados deben
ser nmeros enteros. En el anlisis, se truncarn los valores de los datos fraccionarios. Se ignorar en el
anlisis cualquier valor de categora que est fuera del rango especificado.
Inicialmente, todas las variables estarn sin restringir y activas. Puede restringir las categoras de columna
para igualarlas a otras categoras de columna o puede definir cualquier categora de columna como
suplementaria.
v Las categoras deben ser iguales. Las puntuaciones de las categoras deben ser iguales. Utilice las
restricciones de igualdad si el orden obtenido para las categoras no es el deseado o si no se
corresponde con lo intuitivo. El nmero mximo de categoras de columna al que se puede imponer la
restriccin de igualdad es el nmero total de categoras de columna activas menos 1. Utilice la sintaxis
para imponer restricciones de igualdad a diferentes conjuntos de categoras. Por ejemplo, utilice la
sintaxis para imponer la restriccin de que sean consideradas iguales las categoras 1 y 2 y, por otra
parte, que sean consideradas iguales las categoras 3 y 4.

32

IBM SPSS Categories 23

v La categora es suplementaria. Las categoras suplementarias no influyen en el anlisis pero se


representan en el espacio definido por las categoras activas. Las categoras suplementarias no juegan
ningn papel en la definicin de las dimensiones. El nmero mximo de categoras de columna
suplementarias es el nmero total de categoras de columna menos 2.

Anlisis de correspondencias: Modelo


El cuadro de dilogo Modelo permite especificar el nmero de dimensiones, la medida de distancia, el
mtodo de estandarizacin y el mtodo de normalizacin.
Dimensiones en la solucin. Especifique el nmero de dimensiones. En general, seleccione el menor
nmero de dimensiones que necesite para explicar la mayor parte de la variacin. El mximo nmero de
dimensiones depende del nmero de categoras activas utilizadas en el anlisis y de las restricciones de
igualdad. El mximo nmero de dimensiones es el menor entre:
v El nmero de categoras de fila activas menos el nmero de categoras de fila con restriccin de
igualdad, ms el nmero de conjuntos de categoras de fila que se han restringido.
v El nmero de categoras de columna activas menos el nmero de categoras de columna con restriccin
de igualdad, ms el nmero de conjuntos de categoras de columna que se han restringido.
Medida de distancia. Puede seleccionar la medida de distancia entre las filas y columnas de la tabla de
correspondencias. Seleccione una de las siguientes opciones:
v Chi-cuadrado. Utiliza una distancia ponderada entre los perfiles, donde la ponderacin es la masa de
las filas o de las columnas. Esta distancia es necesaria para el anlisis de correspondencias estndar.
v Eucldea. Utiliza la raz cuadrada de la suma de los cuadrados de las diferencias entre los pares de
filas y entre los pares de columnas.
Mtodo de estandarizacin. Seleccione una de las siguientes opciones:
v Se eliminan las medias de filas y columnas. Se centran las filas y las columnas. Este mtodo es
necesario para el anlisis de correspondencias estndar.
v Se eliminan las medias de filas. Slo se centran las filas.
v Se eliminan las medias de columnas. Slo se centran las columnas.
v Se igualan los totales de fila y se eliminan las medias. Antes de centrar las filas, se igualan los
mrgenes de fila.
v Se igualan los totales de columna y se eliminan las medias. Antes de centrar las columnas, se igualan
los mrgenes de columna.
Mtodo de normalizacin. Seleccione una de las siguientes opciones:
v Simtrico. Para cada dimensin, las puntuaciones de fila son la media ponderada de las puntuaciones
de columna divididas por el valor singular coincidente y las puntuaciones de columna son la media
ponderada de las puntuaciones de fila divididas por el valor propio coincidente. Utilice este mtodo si
desea examinar las diferencias o similaridades entre las categoras de las dos variables.
v Principal. Las distancias entre los puntos de fila y los puntos de columna son aproximaciones de las
distancias en la tabla de correspondencias de acuerdo con la medida de distancia seleccionada. Utilice
este mtodo si desea examinar las diferencias entre las categoras de una o de ambas variables en lugar
de las diferencias entre las dos variables.
v Principal por fila. Las distancias entre los puntos de fila son aproximaciones de las distancias en la
tabla de correspondencias de acuerdo con la medida de distancia seleccionada. Las puntuaciones de
fila son la media ponderada de las puntuaciones de columna. Utilice este mtodo si desea examinar las
diferencias o similaridades entre las categoras de la variable de filas.
v Principal por columna. Las distancias entre los puntos de columna son aproximaciones de las
distancias en la tabla de correspondencias de acuerdo con la medida de distancia seleccionada. Las
puntuaciones de columna son la media ponderada de las puntuaciones de fila. Utilice este mtodo si
desea examinar las diferencias o similaridades entre las categoras de la variable de columnas.
Captulo 5. Anlisis de correspondencias

33

v Personalizado. Debe especificar un valor entre -1 y 1. El valor -1 corresponde a Principal por columna.
El valor 1 corresponde a Principal por fila. El valor 0 corresponde a simtrico. Todos los dems valores
dispersan la inercia entre las puntuaciones de columna y de fila en diferentes grados. Este mtodo es
til para generar diagramas de dispersin biespaciales a medida.

Anlisis de correspondencias: Estadsticos


El cuadro de dilogo Estadsticos permite especificar los resultados numricos producidos.
Tabla de correspondencias. Es la tabulacin cruzada de las variables de entrada con los totales
marginales de fila y columna.
Inspeccin de los puntos de fila. Para cada categora de fila, las puntuaciones, la masa, la inercia, la
contribucin a la inercia de la dimensin y la contribucin de la dimensin a la inercia del punto.
Inspeccin de los puntos de columna. Para cada categora de columna, las puntuaciones, la masa, la
inercia, la contribucin a la inercia de la dimensin y la contribucin de la dimensin a la inercia del
punto.
Perfiles de fila. Para cada categora de fila, la distribucin a travs de las categoras de la variable de
columna.
Perfiles de col. Para cada categora de columna, la distribucin a travs de las categoras de la variable
de fila.
Permutaciones de la tabla de correspondencias. La tabla de correspondencias reorganizada de tal
manera que las filas y las columnas estn en orden ascendente de acuerdo con las puntuaciones en la
primera dimensin. Si lo desea, puede especificar el nmero de la dimensin mxima para el que se
generarn las tablas permutadas. Se generar una tabla permutada para cada dimensin desde 1 hasta el
nmero especificado.
Estadsticos de confianza para puntos de fila. Incluye la desviacin estndar y las correlaciones para
todos los puntos de fila no suplementarios.
Estadsticos de confianza para puntos de columna. Incluye la desviacin estndar y las correlaciones
para todos los puntos de columna no suplementarios.

Anlisis de correspondencias: Grficos


El cuadro de dilogo Grficos permite especificar qu grficos se van a generar.
Diagramas de dispersin. Produce una matriz de todos los grficos por parejas de las dimensiones. Los
diagramas de dispersin disponibles incluyen:
v Diagrama de dispersin biespacial. Produce una matriz de diagramas conjuntos de los puntos de fila
y de columna. Si est seleccionada la normalizacin principal, el diagrama de dispersin biespacial no
estar disponible.
v Puntos de fila. Produce una matriz de diagramas de los puntos de fila.
v Puntos de columna. Produce una matriz de diagramas de los puntos de columna.
Si lo desea, puede especificar el nmero de caracteres de etiqueta de valor que se va a utilizar al etiquetar
los puntos. Este valor debe ser un entero no negativo menor o igual que 20.
Grficos de lnea. Produce un grfico para cada dimensin de la variable seleccionada. Los grficos de
lneas disponibles incluyen:

34

IBM SPSS Categories 23

v Categoras de fila transformadas. Produce un grfico de los valores originales para las categoras de
fila frente a las puntuaciones de fila correspondientes.
v Categoras de columna transformadas. Produce un grfico de los valores originales para las categoras
de columna frente a las puntuaciones de columna correspondientes.
Si lo desea, puede especificar el nmero de caracteres de etiqueta de valor que se va a utilizar al etiquetar
los ejes de categoras. Este valor debe ser un entero no negativo menor o igual que 20.
Dimensiones del grfico. Permite controlar las dimensiones que se muestran en los resultados.
v Muestra todas las dimensiones de la solucin. Todas las dimensiones de la solucin se muestran en
un diagrama de dispersin matricial.
v Restringe el nmero de dimensiones Las dimensiones mostradas se restringen a los pares
representados. Si restringe las dimensiones, deber seleccionar las dimensiones menor y mayor que se
van a representar. La dimensin menor puede variar desde 1 hasta el nmero de dimensiones de la
solucin menos 1 y se representa respecto a las dimensiones mayores. El valor de la dimensin mayor
puede oscilar variar desde 2 hasta el nmero de dimensiones de la solucin e indica la dimensin
mayor que se utilizar al representar los pares de dimensiones. Esta especificacin se aplica a todos los
grficos multidimensionales solicitados.

Caractersticas adicionales del comando CORRESPONDENCE


Se puede personalizar el anlisis de correspondencias si se pegan las selecciones en una ventana de
sintaxis y se edita la sintaxis del comando CORRESPONDENCE resultante. La sintaxis de comandos tambin le
permite:
v Especificar datos tabulares como entrada en lugar de utilizar datos por caso (mediante el subcomando
TABLE = ALL).
v Especificar el nmero de caracteres de etiqueta de valor que se utilizan al etiquetar los puntos para
cada tipo de diagrama de dispersin matricial o diagrama de dispersin biespacial matricial (mediante
el subcomando PLOT).
v Especificar el nmero de caracteres de etiqueta de valor que se utilizan al etiquetar los puntos para
cada tipo de grfico de lneas (mediante el subcomando PLOT).
v Escribir una matriz de puntuaciones de fila y de columna en un archivo de datos de matriz (mediante
el subcomando OUTFILE).
v Escribir una matriz de estadsticos de confianza (varianzas y covarianzas) para los valores singulares y
las puntuaciones en un archivo de datos de matriz (mediante el subcomando OUTFILE).
v Especificar varios conjuntos de categoras para igualar (mediante el subcomando EQUAL).
Consulte la Referencia de sintaxis de comandos para obtener informacin completa de la sintaxis.

Captulo 5. Anlisis de correspondencias

35

36

IBM SPSS Categories 23

Captulo 6. Anlisis de correspondencias mltiple


El anlisis de correspondencias mltiple cuantifica los datos nominales (categricos) mediante la
asignacin de valores numricos a los casos (objetos) y a las categoras, de manera que los objetos de la
misma categora estn cerca los unos de los otros y los objetos de categoras diferentes estn alejados los
unos de los otros. Cada objeto se encuentra lo ms cerca posible de los puntos de categora para las
categoras que se aplican a dicho objeto. De esta manera, las categoras dividen los objetos en subgrupos
homogneos. Las variables se consideran homogneas cuando clasifican objetos de las mismas categoras
en los mismos subgrupos.
Ejemplo. El anlisis de correspondencias mltiple se puede utilizar para representar grficamente la
relacin entre la categora laboral, la clasificacin tnica y el gnero. Puede que encontremos que la
clasificacin tnica y el gnero son capaces de discriminar entre las personas, pero no as la categora
laboral. Tambin puede que encontremos que las categoras Latino y Afro-americano son similares entre
s.
Estadsticos y grficos. Puntuaciones de objetos, medidas de discriminacin, historial de iteraciones,
correlaciones de las variables originales y transformadas, cuantificaciones de categoras, estadsticos
descriptivos, grficos de puntos de objetos, grficos de dispersin biespacial, grficos de categoras,
grficos de categoras conjuntas, grficos de transformacin y grficos de medidas de discriminacin.
Anlisis de correspondencias mltiple: Consideraciones sobre los datos
Datos. Los valores de las variables de cadena se convierten en enteros positivos por orden alfabtico
ascendente. Los valores perdidos del usuario, los valores perdidos del sistema y los valores menores que
1 se consideran valores perdidos; se puede aadir una constante o recodificar las variables con valores
inferiores a 1 para evitar que se pierdan los mismos.
Supuestos. Todas las variables tienen un nivel de escalamiento nominal mltiple. Los datos deben
contener al menos tres casos vlidos. El anlisis se basa en datos enteros positivos. La opcin de
discretizacin categorizar de forma automtica una variable con valores fraccionarios, agrupando sus
valores en categoras con una distribucin casi normal y convertir de forma automtica los valores de las
variables de cadena en enteros positivos. Se pueden especificar otros esquemas de discretizacin.
Procedimientos relacionados. Para dos variables, el anlisis de correspondencias mltiple es anlogo al
anlisis de correspondencias. Si piensa que las variables poseen propiedades ordinales o numricas, se
debe utilizar el anlisis de componentes principales categrico. Si hay conjuntos de variables que son de
inters, se debe utilizar el anlisis de correlacin cannica no lineal.
Para obtener un anlisis de correspondencias mltiple
1. Seleccione en los mens:
Analizar > Reduccin de dimensiones > Escalamiento ptimo...
2. Seleccione Todas las variables son nominales mltiples.
3. Seleccione Un conjunto.
4. Pulse en Definir.
5. Seleccione al menos dos variables de anlisis y especifique el nmero de dimensiones en la solucin.
6. Pulse en Aceptar.
Si lo desea, puede especificar variables suplementarias, que sern ajustadas sobre la solucin encontrada,
o variables de etiqueta para los grficos.

Copyright IBM Corp. 1989, 2014

37

Definir ponderacin de la variable en el anlisis de correspondencias


mltiple
Se puede definir la ponderacin para las variables del anlisis.
Ponderacin de la variable. Se puede definir una ponderacin para cada variable. El valor especificado
debe ser un entero positivo. El valor predeterminado es 1.

Discretizacin en el anlisis de correspondencias mltiple


El cuadro de dilogo Discretizacin permite seleccionar un mtodo para recodificar las variables. Las
variables con valores fraccionarios se agrupan en siete categoras (o en el nmero de valores distintos de
la variable si dicho nmero es inferior a siete) con una distribucin aproximadamente normal, si no se
especifica lo contrario. Las variables de cadena se convierten siempre en enteros positivos mediante la
asignacin de indicadores de categora en funcin del orden alfanumrico ascendente. La discretizacin
de las variables de cadena se aplica a estos enteros resultantes. De forma predeterminada, las variables
restantes se dejan inalteradas. A partir de ese momento, se utilizan en el anlisis las variables
discretizadas.
Mtodo. Seleccione entre agrupacin, clasificacin y multiplicacin.
v Agrupacin. Se recodifica en un nmero especificado de categoras o se recodifica por intervalos.
v Clasificacin. La variable se discretiza mediante la clasificacin de los casos.
v Multiplicacin. Los valores actuales de la variable se tipifican, multiplican por 10, redondean y se les
suma una constante de manera que el menor valor discretizado sea 1.
Agrupacin. Se encuentran disponibles las siguientes opciones al discretizar variables por agrupacin:
v Nmero de categoras. Especifique un nmero de categoras y si los valores de la variable deben
seguir una distribucin aproximadamente normal o uniforme en dichas categoras.
v Intervalos iguales. Las variables se recodifican en las categoras definidas por dichos intervalos de
igual tamao. Se debe especificar la longitud de los intervalos.

Valores perdidos en el anlisis de correspondencias mltiple


El cuadro de dilogo Valores perdidos permite seleccionar la estrategia para el tratamiento de los valores
perdidos en las variables de anlisis y las suplementarias.
Estrategia de valores perdidos. Seleccione excluir los valores perdidos (tratamiento pasivo), imputar los
valores perdidos (tratamiento activo) o excluir objetos con valores perdidos (eliminacin por lista).
v Excluir valores perdidos; para las correlaciones, imputar tras la cuantificacin. Los objetos con
valores perdidos en la variable seleccionada no contribuyen en el anlisis de esta variable. Si a todas
las variables se les aplica tratamiento pasivo, los objetos con valores perdidos en todas las variables se
tratarn como suplementarios. Si se especifican correlaciones en el cuadro de dilogo Resultados, tras
el anlisis, los valores perdidos se imputarn con la categora ms frecuente, o moda, de la variable
para las correlaciones de las variables originales. Para las correlaciones de la variable escalada
ptimamente, se puede seleccionar el mtodo de imputacin. Seleccione Moda para reemplazar los
valores perdidos por la moda de la variable escalada ptimamente. Seleccione Categora adicional para
reemplazar los valores perdidos por la cuantificacin de una categora adicional. Esto implica que los
objetos con un valor perdido en esta variable se consideran que pertenecen a la misma categora (la
adicional).
v Imputar valores perdidos. Los objetos con valores perdidos en la variable seleccionada tendrn dichos
valores imputados. Se puede seleccionar el mtodo de imputacin. Seleccione Moda para reemplazar
los valores perdidos por la categora ms frecuente. Cuando existen varias modas, se utiliza la que
tiene el indicador de categora ms pequeo. Seleccione Categora adicional para reemplazar los

38

IBM SPSS Categories 23

valores perdidos con la misma cuantificacin de una categora adicional. Esto implica que los objetos
con un valor perdido en esta variable se consideran que pertenecen a la misma categora (la adicional).
v Excluir objetos con valores perdidos en esta variable. Los objetos con valores perdidos en la variable
seleccionada se excluyen del anlisis. Esta estrategia no est disponible para las variables
suplementarias.

Opciones de anlisis de correspondencias mltiple


El cuadro de dilogo de opciones permite seleccionar la configuracin inicial, especificar los criterios de
iteracin y convergencia, seleccionar un mtodo de normalizacin, elegir el mtodo para etiquetar los
grficos y especificar objetos suplementarios.
Objetos suplementarios. Especifique el nmero de caso del objeto (o bien los nmeros de caso primero y
ltimo de un rango de objetos) que desee convertir en suplementario y, a continuacin, pulse en Aadir.
Contine hasta que haya especificado todos los objetos suplementarios. Si se especifica un objeto como
suplementario, se ignorarn las ponderaciones de casos para dicho objeto.
Mtodo de normalizacin. Se puede especificar una de las cinco opciones para normalizar las
puntuaciones de objeto y las variables. Slo se puede utilizar un mtodo de normalizacin en un anlisis
dado.
v Principal por variable. Esta opcin optimiza la asociacin entre las variables. Las coordenadas de las
variables en el espacio de los objetos son las cargas en componentes (las correlaciones con componentes
principales, como son las dimensiones y las puntuaciones de los objetos). Esta opcin es til cuando el
inters principal est en la correlacin entre las variables.
v Principal por objeto. Esta opcin optimiza las distancias entre los objetos. Esta opcin es til cuando el
inters principal est en las diferencias y similitudes entre los objetos.
v Simtrico. Se utiliza esta opcin de normalizacin si el inters principal est en la relacin entre objetos
y variables.
v Independiente. Se utiliza esta opcin de normalizacin si se desea examinar por separado las
distancias entre los objetos y las correlaciones entre las variables.
v Personalizado. Se puede especificar cualquier valor real en el intervalo cerrado [-1, 1]. Un valor 1 es
igual al mtodo Principal por objeto, un valor 0 es igual al mtodo Simtrico y un valor -1 es igual al
mtodo Principal por variable. Si se especifica un valor mayor que -1 y menor que 1, se puede
distribuir el autovalor entre los objetos y las variables. Este mtodo es til para generar diagramas de
dispersin biespaciales y triespaciales a medida.
Criterios. Se puede especificar el nmero mximo de iteraciones que el procedimiento puede realizar
durante los clculos. Tambin puede seleccionar un valor para el criterio de convergencia. El algoritmo
detiene la iteracin si la diferencia del ajuste total entre la dos ltimas iteraciones es menor que el valor
de convergencia o si se ha alcanzado el nmero mximo de iteraciones.
Etiquetar grficos con. Permite especificar si se utilizarn en los grficos las etiquetas de variable y las
etiquetas de valor o los nombres de variable y los valores. Tambin se puede especificar una longitud
mxima para las etiquetas.
Dimensiones del grfico. Permite controlar las dimensiones que se muestran en los resultados.
v Muestra todas las dimensiones de la solucin. Todas las dimensiones de la solucin se muestran en
un diagrama de dispersin matricial.
v Restringe el nmero de dimensiones Las dimensiones mostradas se restringen a los pares
representados. Si restringe las dimensiones, deber seleccionar las dimensiones menor y mayor que se
van a representar. La dimensin menor puede variar desde 1 hasta el nmero de dimensiones de la
solucin menos 1 y se representa respecto a las dimensiones mayores. El valor de la dimensin mayor

Captulo 6. Anlisis de correspondencias mltiple

39

puede oscilar variar desde 2 hasta el nmero de dimensiones de la solucin e indica la dimensin
mayor que se utilizar al representar los pares de dimensiones. Esta especificacin se aplica a todos los
grficos multidimensionales solicitados.
Configuracin. Se pueden leer datos de un archivo que contenga las coordenadas de una configuracin.
La primera variable del archivo deber contener las coordenadas para la primera dimensin, la segunda
variable las coordenadas para la segunda dimensin, y as sucesivamente.
v Inicial. La configuracin del archivo especificado se utilizar como el punto inicial del anlisis.
v Fija. La configuracin del archivo especificado se utilizar para ajustar las variables. Las variables que
se ajustan se deben seleccionar como variables de anlisis, pero, al ser la configuracin fija, se tratan
como variables suplementarias (de manera que no es necesario seleccionarlas como variables
suplementarias).

Resultados del anlisis de correspondencias mltiple


El cuadro de dilogo permite generar tablas para las puntuaciones de los objetos, las medidas de
discriminacin, el historial de iteraciones, las correlaciones de las variables originales y transformadas, las
cuantificaciones de categoras para las variables seleccionadas y los estadsticos descriptivos de las
variables seleccionadas.
Puntuaciones de los objetos. Muestra las puntuaciones de los objetos (incluidas la masa, la inercia y las
contribuciones) y tiene las siguientes opciones:
v Incluir categoras de. Muestra los indicadores de las categoras de las variables de anlisis
seleccionadas.
v Etiquetar puntuaciones de los objetos por. De la lista de variables especificadas como variables de
etiquetado, se puede seleccionar una para etiquetar los objetos.
Medidas de discriminacin. Muestra las medidas de discriminacin por variable y por dimensin.
Historial de iteraciones. En cada iteracin, se muestra la varianza explicada, la prdida y el incremento
en la varianza explicada.
Correlaciones de variables originales. Muestra la matriz de correlaciones de las variables originales y los
autovalores de dicha matriz.
Correlaciones de variables transformadas. Muestra la matriz de correlaciones de las variables
transformadas (mediante escalamiento ptimo) y los autovalores de dicha matriz.
Cuantificaciones de categoras y contribuciones. Muestra las cuantificaciones de las categoras
(coordenadas), incluidas la masa, la inercia y las contribuciones) para cada dimensin de las variables
seleccionadas.
Nota: las coordenadas y contribuciones (incluyendo masa e inercia) se muestran en capas diferentes de los
resultados de la tabla dinmica, mostrando las coordenadas de forma predeterminada. Para mostrar la
contribuciones, active (pulse dos veces) la tabla y seleccione Contribuciones de la lista desplegable Capas.
Estadsticos descriptivos. Muestra las frecuencias, el nmero de valores perdidos y la moda de las
variables seleccionadas.

Anlisis de correspondencias mltiple: Guardar


El cuadro de dilogo Guardar permite guardar datos discretizados, puntuaciones de objeto, valores
transformados en un archivo de datos o conjunto de datos de IBM SPSS Statistics. Tambin puede
guardar estos valores transformados y puntuaciones de objetos en el conjunto de datos activo.

40

IBM SPSS Categories 23

v Los conjuntos de datos estn disponibles durante la sesin actual, pero no as en las sesiones
posteriores, a menos que los haya guardado explcitamente como archivos de datos. El nombre de un
conjunto de datos debe cumplir las normas de denominacin de variables.
v Los nombres de archivo o de conjunto de datos deben ser distintos para cada tipo de dato guardado.
v Si guarda puntuaciones de objeto o valores transformados en el conjunto de datos activo, podr
especificar el nmero de dimensiones nominales mltiples.

Anlisis de correspondencias mltiple: Grficos de objetos


El cuadro de dilogo Grficos de objetos permite especificar los tipos de grficos que desee y las
variables que se van a representar
Puntos de objetos. Se muestra un grfico de los puntos de objetos.
Objetos y centroides (diagrama de dispersin biespacial). Los puntos de objetos se representan con los
centroides de las variables.
Variables de diagrama de dispersin biespacial. Puede utilizar todas las variables para los grficos de
dispersin biespacial o seleccionar un subconjunto.
Etiquetar objetos. Se puede elegir que los objetos se etiqueten con las categoras de las variables
seleccionadas (se pueden seleccionar entre los valores del indicador de categora o las etiquetas de valor,
en el cuadro de dilogo Opciones) o con sus nmeros de caso. Se genera un grfico por cada variable si
se selecciona Variable.

Anlisis de correspondencias mltiple: Grficos de variables


El cuadro de dilogo Grficos de variables permite especificar los tipos de grficos que desee y las
variables que se van a representar.
Grficos de categoras. Para cada variable seleccionada, se representa un grfico de las coordenadas del
centroide. Las categoras se encuentran en los centroides de los objetos de las categoras particulares.
Grficos de categoras conjuntas. Este es un nico grfico de las coordenadas del centroide de cada
variable seleccionada.
Grficos de transformacin. Muestra un grfico de las cuantificaciones de las categoras ptimas en
oposicin a los indicadores de las categoras. Puede especificar el nmero de dimensiones; se generar un
grfico para cada dimensin. Tambin se puede seleccionar si se muestran los grficos de los residuos
para cada variable seleccionada.
Medidas de discriminacin. Genera un nico grfico de las medidas de discriminacin de las variables
seleccionadas.

Caractersticas adicionales del comando MULTIPLE


CORRESPONDENCE
Se puede personalizar el anlisis de correspondencias mltiple si se pegan las selecciones en una ventana
de sintaxis y se edita la sintaxis del comando MULTIPLE CORRESPONDENCE. La sintaxis de comandos tambin
le permite:
v Especificar nombres de raz para las variables transformadas, puntuaciones de objetos y
aproximaciones al guardarlas en el conjunto de datos activo (con el subcomando SAVE).
v Especificar una longitud mxima de las etiquetas para cada grfico por separado (con el subcomando
PLOT).
Captulo 6. Anlisis de correspondencias mltiple

41

v Especificar una lista de variables distinta para los grficos de residuos (con el subcomando PLOT).
Consulte la Referencia de sintaxis de comandos para obtener informacin completa de la sintaxis.

42

IBM SPSS Categories 23

Captulo 7. Escalamiento multidimensional (PROXSCAL)


El escalamiento multidimensional trata de encontrar la estructura existente en un conjunto de medidas de
proximidades entre objetos. Este proceso se logra asignando las observaciones a posiciones especficas en
un espacio conceptual de pocas dimensiones, de modo que las distancias entre los puntos en el espacio
concuerden al mximo con las similaridades (o disimilaridades) dadas. El resultado es una representacin
de mnimos cuadrados de los objetos en dicho espacio de pocas dimensiones que, en muchos casos, le
ayudar a entender mejor los datos.
Ejemplo. El escalamiento multidimensional puede ser muy til en la determinacin de relaciones
perceptuales. Por ejemplo, al considerar la imagen de un producto, se puede llevar a cabo un estudio
para obtener un conjunto de datos que describa la similaridad percibida (o proximidad) de este producto
con el de la competencia. Mediante estas proximidades y las variables independientes (como el precio),
puede intentar determinar las variables que son importantes en la visin que el pblico tiene del
producto, as como ajustar la imagen de acuerdo con ello.
Estadsticos y grficos. Historial de iteraciones, medidas de estrs, descomposicin del estrs,
coordenadas del espacio comn, distancias entre objetos dentro de la configuracin final, ponderaciones
del espacio individual, espacios individuales, proximidades transformadas, variables independientes
transformadas, grficos del estrs, diagramas de dispersin del espacio comn, diagramas de dispersin
de la ponderacin del espacio individual, diagramas de dispersin de los espacios individuales, grficos
de transformacin, grficos de residuos de Shepard y grficos de transformacin de las variables
independientes.
Escalamiento multidimensional: Consideraciones sobre los datos
Datos. Los datos se pueden suministrar en forma de matrices de proximidades o como variables que se
convierten en matrices de proximidades. Las matrices pueden tener formato en columna o a travs de las
columnas. Las proximidades se pueden tratar con los niveles de escalamiento de razn, de intervalo,
ordinal o de spline.
Supuestos. Se deben especificar al menos tres variables. El nmero de dimensiones no puede superar al
nmero de objetos menos uno. Se omite la reduccin de dimensionalidad si se combina con varios inicios
aleatorios. Si slo se especifica un origen, todos los modelos son equivalentes al modelo de identidad, por
consiguiente, el anlisis toma de forma predeterminada el modelo de identidad.
Procedimientos relacionados. Si se escalan todas las variables a nivel numrico, el anlisis se
corresponder con el anlisis de escalamiento multidimensional estndar.
Para obtener un escalamiento multidimensional
1. Seleccione en los mens:
Analizar > Escala > Escalamiento multidimensional (PROXSCAL)...
Acceder al cuadro de dilogo Formato de datos.
2. Especifique el formato de los datos:
Formato de datos. Especifique si los datos son medidas de proximidad o si desea crear las
proximidades a partir de los datos.
Nmero de orgenes. Si los datos son proximidades, debe especificar si dispone de un nico o de
diversos orgenes de medidas de proximidad.
Un origen. Si hay un solo origen de proximidades, especifique si el conjunto de datos se encuentra en
un formato con las proximidades en una matriz a travs de las columnas o en una nica columna con
dos variables diferentes para identificar la fila y la columna de cada proximidad.
Copyright IBM Corp. 1989, 2014

43

Las proximidades estn en una matriz entre columnas. . La matriz de proximidades est distribuida en
un nmero de columnas igual al nmero de objetos. Lo que conduce al cuadro de dilogo
Proximidades en matrices a travs de columnas.

Las proximidades estn en una sola columna. Las matrices de proximidades se contraen en una nica
columna o variable. Se necesitan dos variables adicionales, que identifican la fila y la columna de
cada casilla. Lo que conduce al cuadro de dilogo Proximidades en una columna.
Diversos orgenes. Si hay diversos orgenes de proximidades, especifique si el conjunto de datos se
encuentra en un formato con las proximidades a travs de las columnas en matrices apiladas, en
varias columnas con un origen por columna o en una nica columna.

Las proximidades se encuentran en matrices apiladas en las columnas. Las matrices de proximidades
estn distribuidas a lo largo de un nmero de columnas igual al nmero de objetos y apiladas una
sobre la otra a lo largo de un nmero de filas igual al nmero de objetos por el nmero de
orgenes. Lo que conduce al cuadro de dilogo Proximidades en matrices a travs de columnas.

Las proximidades estn en columnas, un origen por columna.. Las matrices de proximidad se contraen
en varias columnas o variables. Se necesitan dos variables adicionales, que identifican la fila y la
columna de cada casilla. Lo que conduce al cuadro de dilogo Proximidades en columnas.
v Las proximidades se apilan en una sola columna. . Las matrices de proximidades se contraen en una
nica columna o variable. Se necesitan tres variables adicionales, que identifican la fila, la columna
y el origen de cada casilla. Lo que conduce al cuadro de dilogo Proximidades en una columna.

3. Pulse en Definir.

Proximidades en matrices a travs de columnas


Si selecciona el modelo para los datos con las proximidades en matrices para uno o varios orgenes en el
cuadro de dilogo Formato de datos, realice lo siguiente:
1. Seleccione tres o ms variables de proximidades. (Asegrese de que el orden de las variables en la
lista coincide con el orden de las columnas para las proximidades.)
2. Si lo desea, seleccione un nmero de variables de ponderaciones igual al nmero de variables de
proximidades. (Asegrese de que el orden de las ponderaciones coincide con el orden de las
proximidades a las que ponderan.)
3. Como alternativa, si existen diversos orgenes, seleccione una variable de orgenes. (El nmero de
casos en cada variable de proximidades debe ser igual al nmero de variables de proximidades
multiplicado por el nmero de orgenes.)
Adems, puede definir un modelo para el escalamiento multidimensional, establecer restricciones en el
espacio comn, establecer criterios de convergencia, especificar la configuracin inicial que se va a utilizar
y seleccionar grficos y resultados.

Proximidades en columnas
Si selecciona el modelo de varias columnas para diversos orgenes en el cuadro de dilogo Formato de
datos, realice lo siguiente:
1. Seleccione dos o ms variables de proximidades. (Se asume que cada variable es una matriz de
proximidades de un origen diferente.)
2. Seleccione una variable de fila para definir las ubicaciones de fila para las proximidades en cada
variable de proximidades.
3. Seleccione una variable de columna para definir las ubicaciones de columna para las proximidades en
cada una de las variables de proximidades. (Las casillas de la matriz de proximidades que no reciban
una designacin fila/columna se tratarn como perdidas.)
4. Si lo desea, seleccione un nmero de variables de ponderaciones igual al nmero de variables de
proximidades.

44

IBM SPSS Categories 23

Adems, puede definir un modelo para el escalamiento multidimensional, establecer restricciones en el


espacio comn, establecer criterios de convergencia, especificar la configuracin inicial que se va a utilizar
y seleccionar grficos y resultados.

Proximidades en una columna


Si selecciona el modelo de una columna para una o varios orgenes en el cuadro de dilogo Formato de
datos, realice lo siguiente:
1. Seleccione una variable de proximidades. (Se asume que es una o ms matrices de proximidades.)
2. Seleccione una variable de fila para definir las ubicaciones de fila para las proximidades en la variable
de proximidades.
3. Seleccione una variable de columna para definir las ubicaciones de columna para las proximidades en
la variable de proximidades.
4. Si existen diversos orgenes, seleccione una variable de orgenes. (Para cada origen, las casillas de la
matriz de proximidades que no reciban una designacin fila/columna se tratarn como perdidas.)
5. Si lo desea, seleccione una variable de ponderaciones.
Adems, puede definir un modelo para el escalamiento multidimensional, establecer restricciones en el
espacio comn, establecer criterios de convergencia, especificar la configuracin inicial que se va a utilizar
y seleccionar grficos y resultados.

Crear proximidades de los datos


Si decide crear proximidades a partir de los datos en el cuadro de dilogo Formato de datos, realice lo
siguiente:
1. Si crea distancias entre variables (consulte el cuadro de dilogo Crear la medida a partir de los datos),
seleccione al menos tres variables. Estas variables se utilizarn para crear la matriz de proximidades
(o matrices, si hay diversos orgenes). Si crea las distancias entre los casos, slo ser necesaria una
variable.
2. Si existen diversos orgenes, seleccione una variable de orgenes.
3. Si lo desea, seleccione una medida para crear proximidades.
Adems, puede definir un modelo para el escalamiento multidimensional, establecer restricciones en el
espacio comn, establecer criterios de convergencia, especificar la configuracin inicial que se va a utilizar
y seleccionar grficos y resultados.

Crear la medida a partir de los datos


El escalamiento multidimensional utiliza datos de disimilaridad para crear una solucin de escalamiento.
Si los datos son datos multivariantes (los valores de las variables que se han medido), debe crear los
datos de disimilaridad para poder calcular una solucin de escalamiento multidimensional. Puede
especificar los detalles para la creacin de las medidas de disimilaridad a partir de los datos.
Medida. Le permite especificar la medida de disimilaridad para el anlisis. Seleccione una opcin del
grupo Medida que se corresponda con el tipo de datos y, a continuacin, seleccione una de las medidas
de la lista desplegable correspondiente a ese tipo de medida. Las opciones disponibles son:
Intervalo. Distancia eucldea, Distancia eucldea al cuadrado, Chebychev, Bloque, Minkowski o
Personalizada.
v Contar apariciones. Medida de chi-cuadrado o Medida de phi-cuadrado.

Binario. Distancia eucldea, Distancia eucldea al cuadrado, Diferencia de tamao, Diferencia de


configuracin, Varianza o Lance y Williams.

Captulo 7. Escalamiento multidimensional (PROXSCAL)

45

Crear matriz de proximidades. Le permite elegir la unidad de anlisis. Las opciones son Entre variables o
Entre casos.
Transformar valores. En determinados casos, como cuando las variables se miden en escalas muy
distintas, puede que desee tipificar los valores antes de calcular las proximidades (no es aplicable a datos
binarios). Seleccione un mtodo de estandarizacin de la lista desplegable Estandarizar (si no se requiere
ninguna estandarizacin, seleccione Ninguna).

Definir un modelo de escalamiento multidimensional


El cuadro de dilogo modelo permite especificar un modelo de escalamiento, su nmero de dimensiones
mximo y mnimo, la estructura de la matriz de proximidades, la transformacin que se va a utilizar en
las proximidades y si las proximidades se transforman dentro de cada origen por separado o de forma
incondicional en el origen.
Modelo de escalamiento. Seleccione entre las siguientes alternativas:
v Identidad. Todos los orgenes tienen la misma configuracin.
v Eucldeo ponderado. ste es un modelo de diferencias individuales. Cada origen dispone de un
espacio individual en el que cada dimensin del espacio comn se pondera de forma diferenciada.
v Eucldeo generalizado. ste es un modelo de diferencias individuales. Cada origen dispone de un
espacio individual que es igual a la rotacin del espacio comn, seguida de una ponderacin
diferencial de las dimensiones.
v Rango reducido. Este modelo es un modelo Eucldeo generalizado para el que puede especificar el
rango del espacio individual. Debe especificar un rango que sea mayor o igual que 1 y menor que el
mximo nmero de dimensiones.
Forma. Especifique si las proximidades deben tomarse de la parte triangular inferior o de la triangular
superior de la matriz de proximidades. Puede especificar que se utilice la matriz completa, en cuyo caso
se analizar la suma ponderada de la parte triangular superior y de la parte triangular inferior. En
cualquier caso, se debe especificar la matriz completa, incluyendo la diagonal, aunque slo se utilicen las
partes especificadas.
Proximidades. Especifique si la matriz de proximidades contiene medidas de similaridad o disimilaridad.
Transformaciones de proximidades. Seleccione entre las siguientes alternativas:
v Razn. Las proximidades transformadas son proporcionales a las proximidades originales. Slo se
permite para proximidades con un valor positivo.
v Intervalo. Las proximidades transformadas son proporcionales a las proximidades originales, ms un
trmino de interseccin. La interseccin asegura que todas las proximidades transformadas sean
positivas.
v Ordinal. Las proximidades transformadas tienen el mismo orden que las proximidades originales.
Puede especificar si para las proximidades empatadas se debe mantener el empate o si se deben
desempatar.
v Spline. Las proximidades transformadas son una transformacin polinmica por partes no decreciente
suave de las proximidades originales. Puede especificar el grado del polinomio y el nmero de nudos
interiores.
Aplicar transformaciones. Especifica si slo las proximidades dentro de cada origen se comparan entre s
o si las comparaciones son incondicionales respecto al origen.
Dimensiones. De forma predeterminada, se calcula una solucin en dos dimensiones (Mnimo=2,
Mximo=2). Puede seleccionar un entero mnimo y otro mximo entre 1 y el nmero de objetos menos 1

46

IBM SPSS Categories 23

(siempre y cuando el mnimo sea menor o igual que el mximo). El procedimiento calcula una solucin
en las dimensiones mximas y, a continuacin, reduce la dimensionalidad por pasos hasta llegar al
mnimo.

Escalamiento multidimensional: Restricciones


El cuadro de dilogo Restricciones permite establecer restricciones en el espacio comn.
Restricciones en el espacio comn. Especifique el tipo de restricciones que desee.
Sin restricciones. No se impone ninguna restriccin en el espacio comn.
Algunas coordenadas fijas. La primera variable seleccionada incluye las coordenadas de los objetos en
la primera dimensin, la segunda variable corresponde a las coordenadas de la segunda dimensin,
etc. Un valor perdido indica que una coordenada en una dimensin est libre. El nmero de variables
seleccionadas debe ser igual al nmero mximo de dimensiones solicitadas.
v Combinacin lineal de variables independientes. El espacio comn se restringe hasta ser una
combinacin lineal de las variables seleccionadas.
v
v

Variables de restriccin. Seleccione las variables que definen las restricciones en el espacio comn. Si se
especifica una combinacin lineal, se debe especificar una transformacin de intervalo, nominal, ordinal o
de spline para las variables de restriccin. En cualquier caso, el nmero de casos para cada variable debe
ser igual al nmero de objetos.

Escalamiento multidimensional: Opciones


El cuadro de dilogo Opciones permite seleccionar el estilo para la configuracin inicial, especificar los
criterios de iteracin y convergencia y seleccionar entre actualizaciones estndar o relajadas.
Configuracin inicial. Seleccione una de las siguientes opciones:
v Simplex. Los objetos se colocan a la misma distancia unos de otros en la mxima dimensin. Se lleva a
cabo una iteracin para mejorar esta configuracin de gran dimensionalidad, seguida de una operacin
de reduccin de dimensiones para obtener una configuracin inicial que tenga el nmero mximo de
dimensiones especificadas en el cuadro de dilogo Modelo.
v Torgerson. Se utiliza una solucin de escalamiento clsico como la configuracin inicial.
v Inicio aleatorio nico. Se selecciona una configuracin aleatoriamente.
v Inicios aleatorios mltiples. Se seleccionan varias configuraciones aleatoriamente y se utiliza la que
tenga menor estrs bruto normalizado como la configuracin inicial.
v Personalizado. Seleccione variables que contengan las coordenadas de su propia configuracin inicial.
El nmero de variables seleccionadas debe ser igual al nmero mximo de dimensiones especificadas,
correspondiendo la primera variable a las coordenadas en la dimensin 1, la segunda variable a las
coordenadas en la dimensin 2 y as sucesivamente. El nmero de casos en cada variable debe ser
igual al nmero de objetos.
Criterios de iteracin. Especifique los valores de los criterios de iteracin.
v Convergencia del estrs. El algoritmo detendr la iteracin cuando la diferencia entre valores
consecutivos del estrs bruto normalizado sea menor que el nmero aqu especificado, que debe estar
entre 0,0 y 1,0.
v Estrs mnimo. El algoritmo detendr la iteracin cuando el estrs bruto normalizado sea menor que el
nmero aqu especificado, que debe estar entre 0,0 y 1,0.
v Nmero mximo de iteraciones. El algoritmo realizar el nmero de iteraciones aqu especificado, a no
ser que antes se satisfaga alguno de los criterios anteriores.
v Usar actualizaciones relajadas. Las actualizaciones relajadas acelerarn el algoritmo; no se pueden
utilizar con modelos que no sean el de identidad, ni tampoco con restricciones.

Captulo 7. Escalamiento multidimensional (PROXSCAL)

47

Escalamiento multidimensional: Grficos, Versin 1


El cuadro de dilogo Grficos permite especificar los grficos que se van a generar. Este tema describe el
cuadro de dilogo Grficos si dispone del formato de datos Proximidades en columnas. Para los grficos
Ponderaciones del espacio individual, Proximidades originales frente a transformadas y Proximidades
transformadas frente a distancias, puede especificar los orgenes para los que se generarn los grficos.
La lista de orgenes disponibles es la lista de variables de proximidades en el cuadro de dilogo principal.
Estrs. Se genera un grfico del estrs bruto normalizado frente a las dimensiones. Este grfico se genera
slo si el nmero mximo de dimensiones es mayor que el nmero mnimo de dimensiones.
Espacio comn. Aparecer un diagrama de dispersin matricial de las coordenadas del espacio comn.
Espacios individuales. Para cada origen, las coordenadas de los espacios individuales aparecern
diagramas de dispersin matriciales. Esto es posible slo si se especifica uno de los modelos de
diferencias individuales en el cuadro de dilogo Modelo.
Ponderaciones del espacio individual. Se genera un diagrama de dispersin de las ponderaciones del
espacio individual. Esto es posible slo si se especifica uno de los modelos de diferencias individuales en
el cuadro de dilogo Modelo. Para el modelo Eucldeo ponderado, las ponderaciones se imprimen en
grficos, con una dimensin en cada eje. Para el modelo Eucldeo generalizado, se genera un grfico por
cada dimensin, indicando la rotacin y la ponderacin de dicha dimensin. El modelo de rango
reducido genera el mismo grfico que el modelo Eucldeo generalizado, pero reduce el nmero de
dimensiones para los espacios individuales.
Proximidades originales frente a transformadas. Se generan grficos de las proximidades originales
frente a las transformadas.
Proximidades transformadas frente a distancias. Se representan las proximidades transformadas frente a
las distancias.
Variables independientes transformadas. Se generan grficos de transformacin para las variables
independientes.
Correlaciones entre variables y dimensiones. Aparece un grfico de las correlaciones entre las variables
independientes y las dimensiones del espacio comn.

Escalamiento multidimensional: Grficos, Versin 2


El cuadro de dilogo Grficos permite especificar los grficos que se van a generar. Este tema describe el
cuadro de dilogo Grficos si dispone de un formato de datos dinstinto a Proximidades en columnas.
Para los grficos Ponderaciones del espacio individual, Proximidades originales frente a transformadas
y Proximidades transformadas frente a distancias, puede especificar los orgenes para los que se
generarn los grficos. Los nmeros de orgenes introducidos deben ser valores de la variable de orgenes
especificada en el cuadro de dilogo principal y el rango debe estar entre 1 y el nmero de orgenes.

Escalamiento multidimensional: Resultados


El cuadro de dilogo Resultados permite controlar la cantidad de resultados mostrados y guardar parte
en archivos independientes.
Representacin. Seleccione uno o varios de los siguientes elementos para su visualizacin:
v Coordenadas del espacio comn. Muestra las coordenadas del espacio comn.
v Coordenadas del espacio individual. Las coordenadas del espacio individual slo aparecen si no se
trata del modelo de identidad.

48

IBM SPSS Categories 23

v Ponderaciones del espacio individual. Muestra las ponderaciones del espacio individual slo si se
especifican modelos de diferencias individuales. En funcin del modelo, las ponderaciones del espacio
se descomponen en ponderaciones de rotacin y de dimensin, que tambin se muestran.
v Distancias. Muestra las distancias entre los objetos en la configuracin.
v Proximidades transformadas. Muestra las proximidades transformadas entre los objetos en la
configuracin.
v Datos de entrada. Incluye las proximidades originales y, si aparecen, las ponderaciones de los datos, la
configuracin inicial y las coordenadas fijas de las variables independientes.
v Estrs para inicios aleatorios. Muestra la semilla de aleatorizacin y el valor del estrs bruto
normalizado para cada inicio aleatorio.
v Historial de iteraciones. Muestra el historial de iteraciones del algoritmo principal.
v Diversas medidas del estrs. Muestra distintos valores del estrs. La tabla contiene valores para el
estrs bruto normalizado, Stress-I, Stress-II, S-Stress, la Dispersin explicada (DAF),
v Descomposicin del estrs. Muestra la descomposicin por orgenes y por objetos del estrs bruto
normalizado final, incluyendo el promedio por objeto y por origen.
v Variables independientes transformadas. Si se ha seleccionado una restriccin de combinacin lineal,
se muestran las variables independientes transformadas y las ponderaciones de regresin
correspondientes.
v Correlaciones entre variables y dimensiones. Si se ha seleccionado una restriccin de combinacin
lineal, se muestran las correlaciones entre las variables independientes y las dimensiones del espacio
comn.
Guardar en archivo nuevo. Puede guardar las coordenadas del espacio comn, las ponderaciones del
espacio individual, las distancias, las proximidades transformadas y las variables independientes
transformadas en distintos archivos de datos de IBM SPSS Statistics.

Caractersticas adicionales del comando PROXSCAL


Se puede personalizar el escalamiento multidimensional del anlisis de proximidades si se pegan las
selecciones en una ventana de sintaxis y se edita la sintaxis del comando PROXSCAL resultante. La sintaxis
de comandos tambin le permite:
v Especificar una lista de variables distinta para los grficos de transformacin y los de residuos (con el
subcomando PLOT).
v Especificar listas de orgenes distintas para los grficos de ponderaciones del espacio individual, los de
transformaciones y los de residuos (con el subcomando PLOT).
v Especificar un subconjunto de los grficos de transformacin de las variables independientes que se
van a mostrar (con el subcomando PLOT).
Consulte la Referencia de sintaxis de comandos para obtener informacin completa de la sintaxis.

Captulo 7. Escalamiento multidimensional (PROXSCAL)

49

50

IBM SPSS Categories 23

Captulo 8. Desplegamiento multidimensional (PREFSCAL)


El procedimiento Desplegamiento multidimensional intenta buscar una escala cuantitativa comn que
permita examinar visualmente las relaciones entre dos conjuntos de objetos.
Ejemplos. Ha pedido a 21 individuos que clasifiquen 15 elementos de desayuno por orden de
preferencia, del 1 al 15. Con el desplegamiento multidimensional, puede determinar que los individuos
discriminan entre los elementos de desayuno de dos formas principales: entre pan tierno y crujiente, y
entre elementos con mucha grasa o con poca grasa.
Por otro lado, tambin ha pedido a un grupo de conductores que evalen 26 modelos de coches respecto
a 10 atributos, en una escala de 6 puntos, desde 1="completamente falso" hasta 6="totalmente cierto". Los
valores promediados respecto a los individuos se toman como similaridades. Utilice el desplegamiento
multidimensional para encontrar clsteres de modelos similares y los atributos con los que ms se
asocian.
Estadsticos y grficos. El procedimiento Desplegamiento multidimensional puede producir historial de
iteraciones, medidas de estrs, descomposicin del estrs, coordenadas del espacio comn, distancias
entre objetos dentro de la configuracin final, ponderaciones del espacio individual, espacios
individuales, proximidades transformadas, grficos del estrs, diagramas de dispersin del espacio
comn, diagramas de dispersin de la ponderacin del espacio individual, diagramas de dispersin de
los espacios individuales, grficos de transformacin y grficos de residuos de Shepard.
Desplegamiento multidimensional: Consideraciones sobre los datos
Datos. Los datos se suministran en forma de matrices de proximidades rectangulares. Cada columna se
considera como un objeto de columna independiente. Cada fila de una matriz de proximidades se
considera como un objeto de fila independiente. Cuando hay diversos orgenes de proximidades, las
matrices se apilan.
Supuestos. Se deben especificar al menos dos variables. El nmero de dimensiones de la solucin no
puede superar el nmero de objetos menos uno. Si slo se especifica un origen, todos los modelos son
equivalentes al modelo de identidad, por consiguiente, el anlisis toma de forma predeterminada el
modelo de identidad.
Para obtener un desplegamiento multidimensional
1. Seleccione en los mens:
Analizar > Escala > Desplegamiento multidimensional (PREFSCAL)...
2. Seleccione dos o ms variables que identifiquen las columnas en la matriz de proximidades
rectangular. Cada variable representa un objeto de columna distinto.
3. Si lo desea, seleccione un nmero de variables de ponderacin que sea igual al nmero de variables
de objeto de columna. El orden de las variables de ponderacin debe coincidir con el orden de los
objetos de columna a los que ponderan.
4. Si lo desea, seleccione una variable de filas. Los valores (o etiquetas de valor) de esta variable se
utilizan para etiquetar los objetos de fila en los resultados.
5. Si existen diversos orgenes, puede seleccionar una variable de orgenes, si lo desea. El nmero de
casos del archivo de datos debe ser igual al nmero de objetos de fila multiplicado por el nmero de
orgenes.

Copyright IBM Corp. 1989, 2014

51

Adems, puede definir un modelo para el desplegamiento multidimensional, establecer restricciones en el


espacio comn, establecer criterios de convergencia, especificar la configuracin inicial que se va a utilizar
y seleccionar grficos y resultados.

Definir un modelo de desplegamiento multidimensional


El cuadro de dilogo Modelo permite especificar un modelo de escalamiento, su nmero de dimensiones
mximo y mnimo, la estructura de la matriz de proximidades, la transformacin que se va a utilizar en
las proximidades y si las proximidades se transforman de forma condicional sobre la fila, de forma
condicional sobre el origen o de forma incondicional en la fila.
Modelo de escalamiento. Seleccione entre las siguientes alternativas:
v Identidad. Todos los orgenes tienen la misma configuracin.
v Eucldeo ponderado. ste es un modelo de diferencias individuales. Cada origen dispone de un
espacio individual en el que cada dimensin del espacio comn se pondera de forma diferenciada.
v Eucldeo generalizado. ste es un modelo de diferencias individuales. Cada origen dispone de un
espacio individual que es igual a la rotacin del espacio comn, seguida de una ponderacin
diferencial de las dimensiones.
Proximidades. Especifique si la matriz de proximidades contiene medidas de similaridad o disimilaridad.
Dimensiones. De forma predeterminada, se calcula una solucin en dos dimensiones (Mnimo=2,
Mximo=2). Puede seleccionar un entero mnimo y otro mximo entre 1 y el nmero de objetos menos 1,
siempre y cuando el mnimo sea menor o igual que el mximo. El procedimiento calcula una solucin en
las dimensiones mximas y, a continuacin, reduce la dimensionalidad por pasos hasta llegar al mnimo.
Transformaciones de proximidades. Seleccione entre las siguientes alternativas:
v Ninguna. Las proximidades no se transforman. Si lo desea, puede seleccionar Incluir interseccin, en
cuyo caso las proximidades se pueden desplazar segn un trmino constante.
v Lineal. Las proximidades transformadas son proporcionales a las proximidades originales, es decir, la
funcin de transformacin estima una inclinacin y la interseccin se fija en 0. Tambin se denomina
transformacin de la razn. Si lo desea, puede seleccionar Incluir interseccin, en cuyo caso las
proximidades tambin se pueden desplazar segn un trmino constante. Tambin se le denomina una
transformacin de intervalo.
v Spline. Las proximidades transformadas son una transformacin polinmica por partes no decreciente
suave de las proximidades originales. Puede especificar el orden del polinomio y el nmero de nudos
interiores. Si lo desea, puede seleccionar Incluir interseccin, en cuyo caso las proximidades tambin
se pueden desplazar segn un trmino constante.
v Suavizado. Las proximidades transformadas tienen el mismo orden que las originales, incluida una
restriccin que tiene en cuenta las diferencias entre los valores posteriores. El resultado es una
transformacin "ordinal suavizada". Puede especificar si para las proximidades empatadas se debe
mantener el empate o si se deben desempatar.
v Ordinal. Las proximidades transformadas tienen el mismo orden que las proximidades originales.
Puede especificar si para las proximidades empatadas se debe mantener el empate o si se deben
desempatar.
Aplicar transformaciones. Especifique si se compararn entre s slo las proximidades dentro de cada fila
o slo las proximidades dentro de cada origen, o las comparaciones ser incondicionales en la fila o en el
origen, es decir, si las transformaciones se realizarn por fila, por origen o sobre todas las proximidades a
la vez.

Restricciones del desplegamiento multidimensional


El cuadro de dilogo Restricciones permite establecer restricciones en el espacio comn.

52

IBM SPSS Categories 23

Restricciones en el espacio comn. Puede fijar las coordenadas de los objetos de fila y/o columna en el
espacio comn.
Variables de restriccin de fila/columna. Seleccione el archivo que contiene las restricciones y seleccione
las variables que definen las restricciones en el espacio comn. La primera variable seleccionada incluye
las coordenadas de los objetos en la primera dimensin, la segunda variable corresponde a las
coordenadas de la segunda dimensin, etc. Un valor perdido indica que una coordenada en una
dimensin est libre. El nmero de variables seleccionadas debe ser igual al nmero mximo de
dimensiones solicitadas. El nmero de casos de cada variable debe ser igual al nmero de objetos.

Opciones de desplegamiento multidimensional


El cuadro de dilogo Opciones permite seleccionar el estilo para la configuracin inicial, especificar los
criterios de iteracin y convergencia, y establecer el trmino de penalizacin para el estrs.
Configuracin inicial. Seleccione una de las siguientes opciones:
v Clsica. La matriz de proximidades rectangular se utiliza para complementar los intrabloques (valores
entre filas y entre columnas) de la matriz MDS simtrica completa. Despus de formarse la matriz
completa, se utiliza una solucin de escalamiento clsico como configuracin inicial. Los intrabloques
se pueden rellenar mediante la imputacin, utilizando la desigualdad de tringulo o las distancias de
Spearman.
v Ross-Cliff. El inicio Ross-Cliff utiliza los resultados de una descomposicin en valores singulares en la
matriz de proximidades cuadrada y doblemente centrada como los valores iniciales de los objetos de
fila y columna.
v Correspondencia. El inicio de correspondencia utiliza los resultados de un anlisis de correspondencias
en los datos invertidos (similaridades en lugar de disimilaridades) con la normalizacin simtrica de
las puntuaciones de fila y columna.
v Centroides. El procedimiento comienza colocando los objetos de fila en la configuracin con una
descomposicin de autovalor. A continuacin, los objetos de columna se colocan en el centroide de las
opciones especficas. Para el nmero de opciones, especifique un entero positivo entre 1 y el nmero de
variables de proximidad.
v Inicios aleatorios mltiples. Las soluciones se calculan para varias configuraciones iniciales
seleccionadas aleatoriamente y se muestra como la mejor solucin la que tenga el estrs penalizado
ms baja.
v Personalizado. Puede seleccionar variables que contengan las coordenadas de su propia configuracin
inicial. El nmero de variables seleccionadas debe ser igual al nmero mximo de dimensiones
especificadas, correspondiendo la primera variable a las coordenadas en la dimensin 1, la segunda
variable a las coordenadas en la dimensin 2 y as sucesivamente. El nmero de casos en cada variable
debe ser igual al nmero combinado de objetos de fila y columna. Las coordenadas de fila y columna
deben estar apiladas, con las coordenadas de columna situadas despus de las coordenadas de fila.
Criterios de iteracin. Especifique los valores de los criterios de iteracin.
v Convergencia del estrs. El algoritmo detendr la iteracin cuando la diferencia relativa entre valores
consecutivos de estrs penalizado sea menor que el nmero aqu especificado, que debe ser no
negativo.
v Estrs mnimo. El algoritmo detendr la iteracin cuando el estrs penalizado sea menor que el
nmero aqu especificado, que debe ser no negativo.
v Nmero mximo de iteraciones. El algoritmo realizar el nmero de iteraciones aqu especificado, a no
ser que antes se satisfaga alguno de los criterios anteriores.
Trmino de penalizacin. El algoritmo intenta minimizar el estrs penalizado, una medida de bondad de
ajuste igual al producto del Stress-I de Kruskal y un trmino de penalizacin basado en el coeficiente de
variacin de las proximidades transformadas. Estos controles permiten especificar la magnitud y el rango
del trmino de penalizacin.
Captulo 8. Desplegamiento multidimensional (PREFSCAL)

53

v Magnitud. Cuanto menor sea el valor del parmetro de magnitud, ms fuerte ser la penalizacin.
Especifique un valor entre 0,0 y 1,0.
v Rango. Este parmetro establece el momento en el que la penalizacin se vuelve activa. Si se establece
en 0,0, la penalizacin est inactiva. Si se aumenta el valor, el algoritmo buscar una solucin con
mayor variacin entre las proximidades transformadas. Especifique un valor no negativo.

Grficos de desplegamiento multidimensional


El cuadro de dilogo Grficos permite especificar los grficos que se van a generar.
Diagramas. Se encuentran disponibles los siguientes grficos:
v Inicios mltiples. Muestra un histograma apilado de estrs penalizado que indica tanto el estrs como
la penalizacin.
v Espacio comn inicial. Muestra un diagrama de dispersin matricial de las coordenadas del espacio
comn inicial.
v Estrs por dimensin. Genera un grfico lineal de estrs penalizado frente a dimensionalidad. Este
grfico se genera slo si el nmero mximo de dimensiones es mayor que el nmero mnimo de
dimensiones.
v Espacio comn final. Aparecer un diagrama de dispersin matricial de las coordenadas del espacio
comn.
v Ponderaciones del espacio. Se genera un diagrama de dispersin de las ponderaciones del espacio
individual. Esto es posible slo si se especifica uno de los modelos de diferencias individuales en el
cuadro de dilogo Modelo. Para el modelo Eucldeo ponderado, las ponderaciones de todos los
orgenes se muestran en un grfico, con una dimensin en cada eje. Para el modelo Eucldeo
generalizado, se genera un grfico por cada dimensin, indicando la rotacin y la ponderacin de
dicha dimensin para cada origen.
v Espacios individuales. Se muestra un diagrama de dispersin matricial de las coordenadas del espacio
individual de cada origen. Esto es posible slo si se especifica uno de los modelos de diferencias
individuales en el cuadro de dilogo Modelo.
v Grficos de transformacin. Se genera un diagrama de dispersin de las proximidades originales
frente a las transformadas. Segn cmo se apliquen las transformaciones, se asignar un color distinto
a cada fila u origen. Una transformacin incondicional genera un solo color.
v Grficos de Shepard. Las proximidades originales frente a las distancias y las proximidades
transformadas. Las distancias se indican con puntos y las proximidades transformadas se indican con
una lnea. Segn cmo se apliquen las transformaciones, se generar una lnea distinta para cada fila u
origen. Una transformacin incondicional produce una lnea.
v Diagrama de dispersin del ajuste. Se muestra un diagrama de dispersin de las proximidades
transformadas frente a las distancias. Si se especifican diversos orgenes, se asignar un color distinto a
cada uno.
v Grficos de los residuos. Se muestra un diagrama de dispersin de las proximidades transformadas
frente a los residuos (proximidades transformadas menos las distancias). Si se especifican diversos
orgenes, se asignar un color distinto a cada uno.
Estilos de objetos fila. Permiten tener un mayor control de la visualizacin de los objetos de fila en los
grficos. Los valores de la variable de colores opcional se utilizan para mostrar sucesivamente todos los
colores. Los valores de la variable de marcadores opcionales se utilizan para mostrar sucesivamente todos
los posibles marcadores.
Grficos de orgenes. Para los grficos de espacios individuales, de diagrama de dispersin del ajuste y
de residuos y, en caso de que las transformaciones se apliquen por fuente, para los grficos de
transformacin y de Shepard se pueden especificar los orgenes para los que se deben generar los
grficos. Los nmeros de orgenes introducidos deben ser valores de la variable de orgenes especificada
en el cuadro de dilogo principal y el rango debe estar entre 1 y el nmero de orgenes.

54

IBM SPSS Categories 23

Grficos de las filas. Si se aplican transformaciones por fila, para los grficos de transformacin y
grficos de Shepard, puede especificar la fila para la que se deben generar los grficos. Los nmeros de
fila especificados deben estar comprendidos entre 1 y el nmero de filas.

Resultados del desplegamiento multidimensional


El cuadro de dilogo Resultados permite controlar la cantidad de resultados mostrados y guardar parte
en archivos independientes.
Representacin. Seleccione una o varias de las siguientes opciones para su visualizacin:
v Datos de entrada. Incluye las proximidades originales y, si aparecen, las ponderaciones de los datos, la
configuracin inicial y las coordenadas fijas.
v Inicios mltiples. Muestra la semilla de aleatorizacin y el valor del estrs penalizado de cada inicio
aleatorio.
v Datos iniciales. Muestra las coordenadas del espacio comn inicial.
v Historial de iteraciones. Muestra el historial de iteraciones del algoritmo principal.
v Medidas de ajuste. Muestra diferentes medidas. La tabla contiene varias medidas de bondad de ajuste,
maldad de ajuste, correlacin, variacin y medidas de no degeneracin.
v Descomposicin del estrs. Muestra la descomposicin de objetos, filas y orgenes de estrs
penalizado, incluidas las desviaciones estndar y las medias de fila, columna y fuente.
v Proximidades transformadas. Muestra las proximidades transformadas.
v Espacio comn final. Muestra las coordenadas del espacio comn.
v Ponderaciones del espacio. Muestra las ponderaciones del espacio individual. Esta opcin est
disponible nicamente si se especifica uno de los modelos de diferencias individuales. En funcin del
modelo, las ponderaciones del espacio se descomponen en ponderaciones de rotacin y de dimensin,
que tambin se muestran.
v Espacios individuales. Se muestran las coordenadas de los espacios individuales. Esta opcin est
disponible nicamente si se especifica uno de los modelos de diferencias individuales.
v Distancias ajustadas. Muestra las distancias entre los objetos en la configuracin.
Guardar en archivo nuevo. Puede guardar las coordenadas del espacio comn, las ponderaciones del
espacio individual, las distancias y las proximidades transformadas en distintos archivos de datos de IBM
SPSS Statistics.

Caractersticas adicionales del comando PREFSCAL


Se puede personalizar el desplegamiento multidimensional del anlisis de proximidades si se pegan las
selecciones en una ventana de sintaxis y se edita la sintaxis del comando PREFSCAL resultante. La sintaxis
de comandos tambin le permite:
v Especifique varias listas de origen para grficos de espacios individuales, diagramas de dispersin del
ajuste y grficos de residuos y, en el caso de transformaciones condicionales de matriz, para grficos de
transformacin y grficos de Shepard, cuando varias fuentes estn disponibles (con el subcomando
PLOT).
v Especifique varias listas de filas para los grficos de transformacin y los grficos de Shepard en caso
de transformaciones condicionales de filas (subcomando PLOT).
v Especifique un nmero de filas en lugar de una variable de ID de fila (con el subcomando INPUT).
v Especifique un nmero de orgenes en lugar de una variable de ID de fuente (con el subcomando
INPUT).
Consulte la Referencia de sintaxis de comandos para obtener informacin completa de la sintaxis.

Captulo 8. Desplegamiento multidimensional (PREFSCAL)

55

56

IBM SPSS Categories 23

Avisos
Esta informacin se ha desarrollado para productos y servicios ofrecidos en los EE.UU.
Es posible que IBM no ofrezca los productos, servicios o caractersticas que se tratan en este documento
en otros pases. El representante local de IBM le puede informar sobre los productos y servicios que estn
actualmente disponibles en su localidad. Cualquier referencia a un producto, programa o servicio de IBM
no pretende afirmar ni implicar que solamente se pueda utilizar ese producto, programa o servicio de
IBM. En su lugar, se puede utilizar cualquier producto, programa o servicio funcionalmente equivalente
que no infrinja los derechos de propiedad intelectual de IBM. Sin embargo, es responsabilidad del usuario
evaluar y comprobar el funcionamiento de todo producto, programa o servicio que no sea de IBM.
IBM puede tener patentes o solicitudes de patente en tramitacin que cubran la materia descrita en este
documento. Este documento no le otorga ninguna licencia para estas patentes. Puede enviar preguntas
acerca de las licencias, por escrito, a:
IBM Director of Licensing
IBM Corporation
North Castle Drive
Armonk, NY 10504-1785
EE.UU.
Para consultas sobre licencias relacionadas con informacin de doble byte (DBCS), pngase en contacto
con el departamento de propiedad intelectual de IBM de su pas o enve sus consultas, por escrito, a:
Intellectual Property Licensing
Legal and Intellectual Property Law
IBM Japan Ltd.
1623-14, Shimotsuruma, Yamato-shi
Kanagawa 242-8502, Japn
El siguiente prrafo no se aplica al Reino Unido ni a ningn otro pas donde estas disposiciones sean
incompatibles con la legislacin vigente: INTERNATIONAL BUSINESS MACHINES CORPORATION
PROPORCIONA ESTA PUBLICACIN "TAL CUAL" SIN GARANTAS DE NINGN TIPO, NI
EXPLCITAS NI IMPLCITAS, INCLUYENDO PERO NO LIMITNDOSE A ELLAS, LAS GARANTAS
IMPLCITAS DE NO VULNERACIN, COMERCIALIZACIN O IDONEIDAD PARA UN PROPSITO
DETERMINADO. Algunos estados no permiten la renuncia a expresar o a garantas implcitas en
determinadas transacciones , por lo tanto , esta declaracin no se aplique a usted.
Esta informacin puede incluir imprecisiones tcnicas o errores tipogrficos. Peridicamente, se efectan
cambios en la informacin aqu y estos cambios se incorporarn en nuevas ediciones de la publicacin.
IBM puede realizar en cualquier momento mejoras o cambios en los productos o programas descritos en
esta publicacin sin previo aviso.
Cualquier referencia a sitios Web que no sean de IBM en esta informacin slo es ofrecida por comodidad
y de ningn modo sirve como aprobacin de esos sitios Web. Los materiales de estos sitios Web no
forman parte de los materiales destinados a este producto de IBM, y el usuario ser responsable del uso
que se haga de estos sitios Web.
IBM puede utilizar o distribuir la informacin que se le proporcione de la forma que considere adecuada,
sin incurrir en ninguna obligacin con el cliente.

57

Los propietarios de licencia de este programa que deseen tener informacin sobre el mismo con el fin de:
(i) intercambiar informacin entre programas creados de forma independiente y otros programas
(incluido ste) y (ii) utilizar mutuamente la informacin que se ha intercambiado, debern ponerse en
contacto con:
Tel. 901 100 400
ATTN: Licensing
200 W. Madison St.
Chicago, IL; 60606
EE.UU.
Esta informacin estar disponible, bajo las condiciones adecuadas, incluyendo en algunos casos el pago
de una cuota.
El programa bajo licencia que se describe en este documento y todo el material bajo licencia disponible
los proporciona IBM bajo los trminos de las Condiciones Generales de IBM, Acuerdo Internacional de
Programas Bajo Licencia de IBM o cualquier acuerdo equivalente entre las partes.
Cualquier dato de rendimiento mencionado aqu ha sido determinado en un entorno controlado. Por lo
tanto, los resultados obtenidos en otros entornos operativos pueden variar de forma significativa. Es
posible que algunas mediciones se hayan realizado en sistemas en desarrollo y no existe ninguna garanta
de que estas mediciones sean las mismas en los sistemas comerciales. Adems, es posible que algunas
mediciones hayan sido estimadas a travs de extrapolacin. Los resultados reales pueden variar. Los
usuarios de este documento deben consultar los datos que corresponden a su entorno especfico.
Se ha obtenido informacin acerca de productos que no son de IBM de los proveedores de esos
productos, de sus publicaciones anunciadas o de otros orgenes disponibles pblicamente. IBM no ha
probado esos productos y no puede confirmar la exactitud del rendimiento, de la compatibilidad ni de
ninguna otra declaracin relacionada con productos que no sean de IBM. Las preguntas acerca de las
aptitudes de productos que no sean de IBM deben dirigirse a los proveedores de dichos productos.
Todas las declaraciones sobre el futuro del rumbo y la intencin de IBM estn sujetas a cambio o retirada
sin previo aviso y representan nicamente metas y objetivos.
Esta informacin contiene ejemplos de datos e informes utilizados en operaciones comerciales diarias.
Para ilustrarlos lo mximo posible, los ejemplos incluyen los nombres de las personas, empresas, marcas
y productos. Todos esos nombres son ficticios y cualquier parecido con los nombres y direcciones
utilizados por una empresa real es pura coincidencia.
LICENCIA DE DERECHOS DE AUTOR:
Esta informacin contiene programas de aplicacin de muestra escritos en lenguaje fuente, los cuales
muestran tcnicas de programacin en diversas plataformas operativas. Puede copiar, modificar y
distribuir estos programas de muestra de cualquier modo sin realizar ningn pago a IBM, con el fin de
desarrollar, utilizar, comercializar o distribuir programas de aplicacin que se ajusten a la interfaz de
programacin de aplicaciones para la plataforma operativa para la que se han escrito los programas de
muestra. Estos ejemplos no se han probado exhaustivamente en todas las condiciones. Por lo tanto, IBM
no puede garantizar ni dar por supuesta la fiabilidad, la capacidad de servicio ni la funcionalidad de
estos programas. Los programas de muestra se proporcionan "TAL CUAL" sin garanta de ningn tipo.
IBM no ser responsable de ningn dao derivado del uso de los programas de muestra.
Cada copia o fragmento de estos programas de ejemplo o de cualquier trabajo derivado de ellos, debe
incluir el siguiente aviso de copyright:
(nombre de la compaa) (ao). Algunas partes de este cdigo procede de los programas de ejemplo de
IBM Corp.

58

IBM SPSS Categories 23

Copyright IBM Corp. _especificar el ao o aos_. Reservados todos los derechos.

Marcas comerciales
IBM, el logotipo de IBM e ibm.com son marcas registradas o marcas comerciales registradas de
International Business Machines Corp., registrada en muchas jurisdicciones en todo el mundo. Otros
nombres de productos y servicios podran ser marcas registradas de IBM u otras compaas. Encontrar
una lista actual de marcas registradas de IBM en la Web en "Informacin de copyright y marca
registrada" en www.ibm.com/legal/copytrade.shtml.
Adobe, el logotipo Adobe, PostScript y el logotipo PostScript son marcas registradas o marcas comerciales
de Adobe Systems Incorporated en Estados Unidos y/o otros pases.
Intel, el logotipo de Intel, Intel Inside, el logotipo de Intel Inside, Intel Centrino, el logotipo de Intel
Centrino, Celeron, Intel Xeon, Intel SpeedStep, Itanium y Pentium son marcas comerciales o marcas
registradas de Intel Corporation o sus filiales en Estados Unidos y otros pases.
Linux es una marca registrada de Linus Torvalds en Estados Unidos, otros pases o ambos.
Microsoft, Windows, Windows NT, y el logotipo de Windows son marcas comerciales de Microsoft
Corporation en Estados Unidos, otros pases o ambos.
UNIX es una marca registrada de The Open Group en Estados Unidos y otros pases.
Java y todas las marcas comerciales y los logotipos basados en Java son marcas comerciales o registradas
de Oracle y/o sus afiliados.

Avisos

59

60

IBM SPSS Categories 23

ndice
A
actualizaciones relajadas
en Escalamiento multidimensional 47
ajuste
en Anlisis de correlacin cannica no
lineal 29
Anlisis de componentes principales
categrico 19, 22
almacenamiento de variables 24
Caractersticas adicionales del
comando 26
nivel de escalamiento ptimo 20
simulacin de muestreo 25
Anlisis de correlacin cannica no
lineal 27, 28, 29
Caractersticas adicionales del
comando 30
estadsticos 27
grficos 27
Anlisis de correspondencias 31, 32, 33,
34
Caractersticas adicionales del
comando 35
estadsticos 31
grficos 31
Anlisis de correspondencias
mltiple 37, 39
almacenamiento de variables 40
Caractersticas adicionales del
comando 41
nivel de escalamiento ptimo 38
ANOVA
en Regresin categrica 16

C
cargas en componentes
en Anlisis de componentes
principales categrico 23
en Anlisis de correlacin cannica
lineal 29
centroides
en Anlisis de correlacin cannica
lineal 29
coeficientes de regresin
en Regresin categrica 16
configuracin inicial
en Anlisis de correlacin cannica
lineal 29
en desplegamiento
multidimensional 53
en Escalamiento multidimensional
en Regresin categrica 15
coordenadas del espacio comn
en desplegamiento
multidimensional 55
en Escalamiento multidimensional
coordenadas del espacio individual
en desplegamiento
multidimensional 55

no

no

no

47

48

correlaciones
en Escalamiento multidimensional 48
criterios de iteracin
en desplegamiento
multidimensional 53
en Escalamiento multidimensional 47
cuantificaciones de categoras
en Anlisis de componentes
principales categrico 23
en Anlisis de correlacin cannica no
lineal 29
en el anlisis de correspondencias
mltiple 40
en Regresin categrica 16

D
Desplegamiento multidimensional 51
Caractersticas adicionales del
comando 55
estadsticos 51
grficos 51, 54
modelo 52
opciones 53
restricciones en el espacio comn 52
salida 55
diagrama de dispersin del ajuste
en desplegamiento
multidimensional 54
diagramas de dispersin biespacial
en Anlisis de componentes
principales categrico 24
en Anlisis de correspondencias 34
en el anlisis de correspondencias
mltiple 41
diagramas de dispersin triespacial
en Anlisis de componentes
principales categrico 24
dimensiones
en Anlisis de correspondencias 33
discretizacin
en Anlisis de componentes
principales categrico 21
en el anlisis de correspondencias
mltiple 38
en Regresin categrica 14
distancias
en desplegamiento
multidimensional 55
en Escalamiento multidimensional 48

E
Escalamiento multidimensional 43, 44,
45
Caractersticas adicionales del
comando 49
estadsticos 43
grficos 43, 48
modelo 46

Escalamiento multidimensional
(continuacin)
opciones 47
restricciones 47
salida 48
estadsticos de confianza
en Anlisis de correspondencias
estadsticos descriptivos
en Regresin categrica 16

34

G
grficos
en Anlisis de correlacin cannica no
lineal 29
en Anlisis de correspondencias 34
en Escalamiento multidimensional 48
en Regresin categrica 18
grficos de cargas en componentes
en Anlisis de componentes
principales categrico 25
grficos de categoras
en Anlisis de componentes
principales categrico 25
en el anlisis de correspondencias
mltiple 41
grficos de categoras conjuntas
en Anlisis de componentes
principales categrico 25
en el anlisis de correspondencias
mltiple 41
grficos de centroides proyectados
en Anlisis de componentes
principales categrico 25
grficos de correlaciones
en Escalamiento multidimensional 48
grficos de espacio comn inicial
en desplegamiento
multidimensional 54
grficos de espacios individuales
en desplegamiento
multidimensional 54
en Escalamiento multidimensional 48
grficos de estrs
en desplegamiento
multidimensional 54
en Escalamiento multidimensional 48
grficos de inicio mltiple
en desplegamiento
multidimensional 54
grficos de medidas de discriminacin
en el anlisis de correspondencias
mltiple 41
grficos de ponderaciones del espacio
en desplegamiento
multidimensional 54
grficos de ponderaciones del espacio
individual
en desplegamiento
multidimensional 54
en Escalamiento multidimensional 48

61

grficos de puntos de objetos


en Anlisis de componentes
principales categrico 24
en el anlisis de correspondencias
mltiple 41
grficos de residuos
en desplegamiento
multidimensional 54
Grficos de Shepard
en desplegamiento
multidimensional 54
grficos de transformacin
en Anlisis de componentes
principales categrico 25
en desplegamiento
multidimensional 54
en el anlisis de correspondencias
mltiple 41
en Escalamiento multidimensional
grficos del espacio comn
en desplegamiento
multidimensional 54
en Escalamiento multidimensional
grficos del espacio comn final
en desplegamiento
multidimensional 54

48

48

Regresin categrica (continuacin)


grficos 13
guardar 17
nivel de escalamiento ptimo 14
regularizacin 16
regresin Ridge
en Regresin categrica 16
restricciones
en Escalamiento multidimensional
restricciones en el espacio comn
en desplegamiento
multidimensional 52

nivel de escalamiento ptimo


en Anlisis de componentes
principales categrico 20
en el anlisis de correspondencias
mltiple 38
normalizacin
en Anlisis de correspondencias 33

simulacin de muestreo
Anlisis de componentes principales
categrico 25

objetos suplementarios
en Regresin categrica

historial de iteraciones
en Anlisis de componentes
principales categrico 23
en desplegamiento
multidimensional 55
en el anlisis de correspondencias
mltiple 40
en Escalamiento multidimensional

48

I
inercia
en Anlisis de correspondencias

34

L
lazo
en Regresin categrica

16

M
matriz de correlaciones
en Anlisis de componentes
principales categrico 23
en el anlisis de correspondencias
mltiple 40
medidas de discriminacin
en el anlisis de correspondencias
mltiple 40
medidas de distancia
en Anlisis de correspondencias 33
medidas del estrs
en desplegamiento
multidimensional 55
en Escalamiento multidimensional 48

IBM SPSS Categories 23

trmino de penalizacin
en desplegamiento
multidimensional 53
tipificacin
en Anlisis de correspondencias
transformaciones de proximidades
en desplegamiento
multidimensional 52

15

ponderacin de la variable
en Anlisis de componentes
principales categrico 20
en el anlisis de correspondencias
mltiple 38
ponderaciones
en Anlisis de correlacin cannica
lineal 29
ponderaciones del espacio individual.
en desplegamiento
multidimensional 55
en Escalamiento multidimensional
PREFSCAL 51
proximidades transformadas
en desplegamiento
multidimensional 55
en Escalamiento multidimensional
puntuaciones de los objetos
en Anlisis de componentes
principales categrico 23
en Anlisis de correlacin cannica
lineal 29
en el anlisis de correspondencias
mltiple 40

R
R mltiple
en Regresin categrica 16
red elstica
en Regresin categrica 16
Regresin categrica 13
Caractersticas adicionales del
comando 18
estadsticos 13

47

62

modelo de escalamiento
en desplegamiento
multidimensional 52
modelo de identidad
en desplegamiento
multidimensional 52
modelo Eucldeo generalizado
en desplegamiento
multidimensional 52
modelo Eucldeo ponderado
en desplegamiento
multidimensional 52

33

no

48

48

no

valores perdidos
en Anlisis de componentes
principales categrico 21
en el anlisis de correspondencias
mltiple 38
en Regresin categrica 15
variables independientes transformadas
en Escalamiento multidimensional 48
varianza explicada
en Anlisis de componentes
principales categrico 23



Impreso en Espaa

Das könnte Ihnen auch gefallen