Beruflich Dokumente
Kultur Dokumente
y Análisis de Correlación
canónico
Para empezar, les contaremos de que se trata cada análisis. El análisis de correspondencia es una
técnica de reducción de dimensiones, una técnica para visualizar una nube de puntos
multidimensional en dos dimensiones. Consiste, como las demás técnicas de reducción de
dimensiones, en un procedimiento de traslado de una nube de puntos definida en un espacio de
muchas dimensiones a un espacio de dos dimensiones donde poder visualizar la posición relativa de
unos puntos. Este traslado se hará respetando al máximo las posiciones relativas de los puntos en
la nube de puntos original.
El análisis de correlación canónica se utiliza para identificar y medir las asociaciones entre dos
conjuntos de variables. La correlación canónica es apropiada en las mismas situaciones donde la
regresión múltiple sería, pero donde hay múltiples variables de resultado interrelacionadas. El
análisis de correlación canónica determina un conjunto de variables canónicas, combinaciones
lineales ortogonales de las variables dentro de cada conjunto que explican mejor la variabilidad
tanto dentro como entre conjuntos.
Análisis de Correspondencia
Este análisis se enfoca a construir un modelo espacial que muestra las asociaciones entre un
conjunto de variables categóricas, el análisis de correspondencia tiene una historia relativamente
larga (ver de Leeuw 1983) pero durante un largo período solo se usó de forma rutinaria en Francia,
en gran parte debido a los esfuerzos casi evangélicos de Benzécri (1992). Pero hoy en día el
método se usa bastante más ampliamente y a menudo se aplica para complementar, digamos, una
prueba de independencia de Chi cuadrado para dos variables categóricas que forman una mesa de
contingencia.
Fig. 1.1 Escalamiento multidimensional no métrico de las distancias percibidas los lideres de la
segunda guerra mundial.
La tabla general de contingencia bidimensional en la que hay “r” filas y “c” columnas se pueden
escribir como:
Ejemplo:
Considere los datos que se muestran en la Tabla 1.2 relacionados con la influencia de las niñas edad
en su relación con su novio. En esta tabla, cada una de las 139 chicas tiene ha sido clasificado en uno
de tres grupos:
ˆ no novio;
Además, se registró la edad de cada niña y se usó para dividir a las niñas en cinco grupos de edad
Tabla 1.2: datos de teensex. La influencia de la edad en las relaciones con novios
El escalamiento multidimensional aplicado a matrices de proximidad suele ser útil para descubrir
las dimensiones sobre las cuales se hacen los juicios de similitud, y la correspondencia. El análisis a
menudo permite una mayor comprensión del patrón de relaciones en una tabla de contingencia
que una simple prueba de chi-cuadrado.
Análisis de correlación canónica
En esta sección consideramos dos conjuntos de variables con una distribución conjunta y analizamos
las correlaciones entre las variables de un conjunto y las del otro conjunto.
Hay una localidad a la que le falta el conjunto de datos de mediciones químicas. Identificamos esta
localidad y no la consideramos para un análisis más detallado. Ambos conjuntos de datos están
alineados con respecto a los nombres de la localidad, la primera columna de cada conjunto de datos.
Una buena herramienta gráfica para ver ambos conjuntos de datos con respecto a su estructura de
correlación general (dentro y entre ellos) está disponible dentro del paquete R “CCA” (Análisis de
correlación canónica).
Primero se deben instalar los paquetes “CCA” y luego se pueden usar las funciones “matcor” y
“img.matcor” para mostrar gráficamente la matriz de corrección:
Cross-correlation
Se pueden aprovechar las herramientas gráficas disponibles (del paquete ”CAA”) para el análisis de
correlación canónica. La idea es mostrar las correlaciones maximizadas entre las variables
transformadas del conjunto de datos X y el conjunto de datos Y.
> plt.cc(ccxy, var.label = TRUE, ind.names = data[,1])
Representaciones de
variables (arriba) y
unidades (abajo) :
Bibliografía
Links:
http://www.karlin.mff.cuni.cz/~maciak/NMST539/cvicenie11.html
https://cran.r-project.org/doc/contrib/rdebuts_es.pdf
https://estadisticaorquestainstrumento.wordpress.com/2013/07/06/tema-27-analisis-de-
correspondencias/
http://www.fuenterrebollo.com/Economicas/ECONOMETRIA/REDUCIR-
DIMENSION/CORRESPONDENCIAS/correspondencias.pdf
libros
Multi_Brian Everitt, Torsten Hothorn-An Introduction to Applied Multivariate Analysis with R (Use R)-
Springer(2011).