Beruflich Dokumente
Kultur Dokumente
net/publication/324018540
CITATIONS READS
0 1,115
1 author:
Dimas Sulbarán
Central University of Venezuela
20 PUBLICATIONS 16 CITATIONS
SEE PROFILE
Some of the authors of this publication are also working on these related projects:
All content following this page was uploaded by Dimas Sulbarán on 26 March 2018.
Dimas Sulbarán
Universidad Central de Venezuela
18-5-2015
Introducción al Análisis Multivariado en Psicología 1
Índice de contenido
Varianza ........................................................................................................................ 10
Covarianza .................................................................................................................... 11
Razón de co-varianza.................................................................................................... 11
Linealidad. ................................................................................................................... 15
Homocedasticidad. ....................................................................................................... 16
Normalidad. ................................................................................................................. 16
No colinealidad. ........................................................................................................... 17
Conclusiones ................................................................................................. 19
Referencias.................................................................................................... 21
Dimas Sulbarán 2
El texto a continuación ha sido escrito con un objetivo simple: hacer que el tema de las
estadísticas multivariantes sea más accesible y comprensible para el estudiante de Psicología.
En este sentido, se procura fomentar un conocimiento global de la naturaleza de los métodos
multivariantes, con énfasis en el uso de esta herramienta estadística en la psicología. A
continuación se muestra el desarrollo de una serie de temas claves para el estudio de los
métodos multivariantes; susceptibles de ser cubiertos en un curso de estadística para
estudiantes de pregrado de la escuela de Psicología de la UCV. Se aspira que el conocimiento
de estos aspectos generales procure la comprensión de los conceptos básicos integrales que
subyacen al razonamiento multivariante. De acuerdo con un enfoque, más de orden aplicado
que teórico-formal, se omiten las complejas demostraciones teóricas y se procura que el
discurso matemático esté adecuado al nivel del estudiante de un curso de segundo semestre
de Psicología. No obstante, para el lector acucioso, interesado en ampliar los contenidos de
este texto, se hace referencia a una serie de trabajos estadísticos excelentes que presentan
mayores detalles matemáticos y estadísticos que permitirán ampliar los alcances del presente.
Palabras clave: Estadística, Métodos Multivariados, Psicología.
1
Profesor Instructor por concurso de la Cátedra de Estadística de la Escuela de Psicología, Facultad de
Humanidades y Educación - UCV.
Introducción al Análisis Multivariado en Psicología 3
En segundo lugar, se delinean varios temas de fondo de la estadística que pertenecen a ambos
métodos univariados y multivariados. Esto incluye la discusión acerca de los datos, de la
muestra, la medición, las variables, las hipótesis y la selección preliminar para preparar los
datos para su análisis.
Finalmente, a partir de algunos criterios claves que subyacen a la discriminación de estas
técnicas estadísticas, se muestra una taxonomía de métodos multivariantes. Estas categorías
se elaboran para proporcionar un sentido general de los fundamentos en la selección de estos
Dimas Sulbarán 4
procedimientos. En este sentido, este trabajo se pasea por las relaciones múltiples de
dependencia, interdependencia y ecuaciones estructurales.
Al igual que con la estadística descriptiva e inferencial a nivel bivariado, los métodos
multivariantes nos ayudan a entender y cuantificar cómo las variables co-varían. Los métodos
multivariantes proveen al investigador en Psicología de un conjunto de herramientas para
analizar cómo el comportamiento de varias variables covaría, ya sea a través de las
diferencias entre grupos, las correlaciones, o la identificación de las dimensiones subyacentes
para explicar la varianza sistemática por encima de la varianza del error aleatorio. Por lo
tanto, con el uso de métodos multivariantes estamos ampliando la posibilidad de explicar o
dar sentido a la varianza en un conjunto de variables procurando en lo posible la
minimización de la varianza de error aleatorio (Harlow, 2005).
descripciones univariadas y bivariadas de las partes por separado. Es en este sentido que la
literatura nos advierte que “el elemento esencial del análisis Multivariante es el valor teórico,
una combinación lineal de variables con ponderaciones determinadas empíricamente” (Hair,
Anderson, Tatham, & Black, 1999, pág. 4).
Haciendo un poco de historia, se puede apreciar la cercanía de los orígenes del análisis
multivariante a la Psicología, especialmente en lo que refiere al análisis factorial y los
desarrollos de la psicometría. Fue Charles Spearman en 1904 el primero en describir con el
uso de técnicas estadísticas multivariadas las respuestas de los sujetos a un test de inteligencia
en términos de un factor general (factor g) y un factor específico propio de cada test; la cual
dio lugar a la clásica Teoría Factorial de la Inteligencia. Aunque, se atribuye a Spearman los
comienzos en el uso del análisis factorial, lo que se entiende en la actualidad por esto tiene
sus orígenes en el trabajo pionero “Multiple Factor Analysis” (Thurstone, 1931). Los trabajos
de Eysenck para determinar las dimensiones de la personalidad (Eysenck, 1947) permitieron
confirmar la tesis de que esta podía definirse en torno a dos dimensiones básicas:
extroversión-introversión y neuroticismo-estabilidad emocional. Por su parte, Cattell
también utilizó el análisis factorial para reducir los casi ochenta y tres factores vinculados
con los rasgos de personalidad (Cattell, 1957). Por su parte, los trabajos contemporáneos de
investigadores como Costa y McCrae se basaron en el análisis multivariante para reducir en
una estructura de cinco rasgos y treinta facetas la descripción de la personalidad (McCrae &
Costa, 1987).
Además del popular uso del análisis factorial, también destacan en la investigación
psicológica los interesantes aportes teóricos y metodológicos para la implementación de los
modelos de ecuaciones estructurales (Ruiz, Pardo, & San Martín, 2010; MacCallum &
Austin, 2000) y la identificación de los efectos de variables terciarias en la construcción de
modelos de mediación y moderación en la investigación psicológica (Baron & Kenny, 1986).
Grosso modo, la técnica de ecuaciones estructurales deviene de la combinación del análisis
factorial con la regresión lineal para determinar el nivel de ajuste de unos datos observados
a un modelo hipotetizado y expresado mediante un diagrama de rutas. De esta manera, los
análisis de ecuaciones estructurales identifican los parámetros de cada relación y, en suma,
Dimas Sulbarán 6
un estadístico que expresa el grado en el que los datos se ajustan al modelo propuesto,
confirmando su validez.
El texto a continuación nace con la intención de atender las necesidades del estudiante
de psicología, por lo que intentará abordar el tema de los estadísticos multivariados en la
investigación psicológica y, en consonancia con los desarrollos tecnológicos, el énfasis de la
exposición estará en los aspectos lógicos del uso e interpretación de los resultados, más que
en el desarrollo de complejas demostraciones matemáticas. En este sentido, se atenderán los
siguientes puntos: a) qué es y cuándo usar el análisis multivariante en la investigación
psicológica, b) cuáles son los supuestos que subyacen al uso de las diferentes técnicas
multivariante y c) cuáles son las diferentes técnicas de análisis multivariante.
investigación. Cualquier análisis simultaneo de más de dos variables puede ser considerado
aproximadamente como un análisis Multivariante” (Hair, Anderson, Tatham, & Black, 1999,
pág. 4).
El pensamiento multivariado
Gran parte de la ciencia y de la vida del hombre, transcurre tratando de aprehender el orden
subyacente a un mundo complejo, en apariencia caótico. Cuando comenzamos a entender
que la realidad está conformada por una cantidad infinita de partes interrelacionadas; que el
mundo está determinado por la influencia de múltiples factores, entonces estamos sentando
las bases para el razonamiento multivariado. Es en la búsqueda del orden y la claridad latente
en un mundo complejo donde se podría hacer mucho más fértil los desarrollos de un pensar
multivariante. El pensamiento multivariable se define como: “un conjunto de procesos del
pensamiento que iluminan la interrelación entre y dentro de grupos de variables” (Harlow,
2005, pág. 3).
Los métodos multivariantes que se examinan a continuación son un conjunto de herramientas
que responden al razonamiento que permite visualizar el análisis de múltiples variables, de
una manera integrada y potente. Estos métodos permiten examinar diseños más ricos y más
realistas de los que pueden ser evaluados con métodos bivariados tradicionales que analizan
Dimas Sulbarán 8
sólo una variable de resultado y por lo general sólo una o, a lo sumo, dos variables
independientes. En comparación con los métodos bivariantes, los métodos multivariantes
permiten al investigador analizar en forma conjunta un complejo número de variables. De
esta manera, se consigue una mayor confianza en las conclusiones que suponen una síntesis
con menos errores y más validez que si tuviéramos que analizar las relaciones entre las
variables de forma aislada.
Sin pretensión de que esta sea una versión última de los beneficios asociados al uso del
pensamiento multivariado, se desglosan a continuación aquellas que, en concordancia con la
literatura (Harlow, 2005), se consideran como los principales beneficios de este recurso
metodológico.
Tras haber revisado algunas ventajas y desventajas del uso de este razonamiento, a
continuación se esbozan algunos temas centrales para el análisis multivariante.
Temas centrales
Varianza
Covarianza
Razón de co-varianza
covarianza entre las variables sobre la varianza dentro de las variables. Cuando la covarianza
entre variables es casi tan grande como la varianza dentro de cualquiera de las variables, esto
indica una relación más fuerte entre las variables. Por lo tanto, una gran correlación indica
que gran parte de la varianza dentro de cada variable es compartida o covaría entre las
variables.
Combinaciones lineales
Siguiendo la literatura (Hair, Anderson, Tatham, & Black, 1999), se sugiere discriminar el
tipo de análisis multivariante en función de la respuesta a tres preguntas clave: a) con base
en los elementos teóricos, la hipótesis de relación entre las variables supone dependencia,
interdependencia o ambas? b) cuántas variables se encuentran implicadas en la relación? Y
c) ¿cuál es el nivel de medida de las variables?
Si bien, este diagrama expuesto en la figura 1 nos muestra un amplio conjunto de técnicas de
análisis multivariante susceptible de ser empleados en la práctica psicológica, en los
programas de la escuela de Psicología se hace referencia en forma fundamental a tres casos,
a saber: a) el análisis de correlación múltiple, b) la regresión múltiple, c) el análisis factorial
y d) las ecuaciones estructurales. A continuación, se amplía la información con relación a
cada uno de estas técnicas, pero antes revisamos algunos supuestos subyacentes al uso de
estas técnicas multivariantes.
Los supuestos hacen refrencia a una serie de condiciones que deben cubrir los datos para
llevar a cabo análisis estadísticos en forma válida. Siguiendo la literatura se encuentran cuatro
supuestos fundamentales que subyacen al uso de las técncias multivariantes que se ampliarán
a continuación, tales como la correlación y la regresión múltiple y el análisis factorial. Entre
estos supuestos se cuenta: a) normalidad, b) homocedasticidad, c) linealidad y d)
independencia de los errores (Gujarati & Porter, 2010). El texto a continuación describe cada
uno en términos conceptuales y muestra técnicas claves para su identificación y control.
Linealidad.
Por linealidad se entiende a las siguientes formas que pueden definir a una ecuación:
a) linealidad en las variables y/o b) linealidad en los parámetros. Como estos términos no son
independientes, las variables pueden cumplir con cualquiera de las combinaciones posibles
entre la presencia y ausencia de linealidad tanto en las variables como en los parámetros, tal
como se resume en el cuadro siguiente:
Este supuesto se resume en el principio de que el error (ε) es una variable aleatoria
para todo valor de xi, por tanto la correlación entre estas dos variables debe ser igual a cero.
En otras palabras, se espera que rxe=0. En el caso contrario, la literatura permite sostener que
“no se podría afirmar que los valores predichos por el modelo sean independientes de los
niveles que estamos intentando predecir” (Hair, Anderson, Tatham, & Black, 1999, pág. 68);
lo cual, atenta contra la calidad del modelo que se está proponiendo.
Homocedasticidad.
Se espera que la varianza del término de error para todos los valores de xi sea
equivalente. Esta cualidad es necesaria, según el Teorema clásico de Gauss-Márkov, para
que en un modelo los coeficientes estimados sean los mejores o eficientes, lineales e
insesgados.
Cuando no se cumple esta situación, se dice que existe heterocedasticidad, que es
cuando la varianza de cada término de perturbación no es un número constante
Normalidad.
Dado que se asume que las perturbaciones del modelo o término de error para cada
valor de xi obedecen a una distribución aleatoria, se espera que esta se distribuya de manera
normal. En otras palabras, los valores de error tienden a distribuirse de la forma: 𝜀 ∼ 𝑁(𝜇, 𝜎),
dado que Ε( 𝜐 ∣ 𝑥 ) = 0, entonces la distribución de los errores debe cumplir con 𝜀 ∼
Introducción al Análisis Multivariado en Psicología 17
𝑁(0, 𝜎) . El cumplimiento de este supuesto es fundamental para los análisis con fines
inferenciales.
No colinealidad.
Este supuesto está relacionado, fundamentalmente, con los casos de los análisis de
regresión múltiple. Atendiendo al principio fundamental de parsimonia, se espera que la
incorporación de cada variable independiente o predictora al modelo se dé porque representa
un valor agregado significativo en la definición del mismo para la explicación del fenómeno
de interés. Para cumplir con este propósito se debe procurar que cada variable independiente
sea efectivamente algo “independiente” a las otras variables explicativas que se agrega a la
ecuación. En este caso, estaremos en presencia de No colinealidad. Cuando no se cumple con
este supuesto se habla de la presencia de colinealidad de que las variables incluidas en el
modelo están correlacionadas entre sí y resultan en un modelo redundante.
Las técnicas multivariantes son, en su mayoría, herramientas muy poderosas que permiten al
investigador extraer abundante información de los datos disponibles. Estas técnicas son, en
sí mismas, relativamente complejas y requieren para su utilización un conocimiento profundo
de sus fundamentos y condiciones de aplicabilidad. Sin embargo, el notable desarrollo de
programas informáticos de manejo sencillo y el invariable avance de la tecnología están
provocando que, en muchas áreas de conocimiento, y de manera especial en el campo de las
ciencias sociales, las técnicas de análisis multivariante estén siendo ampliamente empleadas.
El problema que de inmediato se presenta es que el uso indiscriminado de los paquetes
estadísticos genera, muchas veces, que no se utilicen adecuadamente, puesto que el usuario
con frecuencia carece del suficiente respaldo teórico que el escenario requiere.
En virtud de lo que precede, en este apartado se brinda una guía para la correcta aplicación
de las técnicas multivariantes y el posterior arribo a conclusiones razonables. El desarrollo
Dimas Sulbarán 18
que a continuación se expone sigue el proceso planteado por Hair, Anderson, Tatham y Black
(1999).
1. Definición del problema que se está investigando, sus objetivos y decisión sobre la técnica
multivariante que debe utilizarse: para ello se debe realizar una adecuada aproximación
teórica al problema que se aborda; esto es, analizar conceptualmente el objeto de
investigación, especificar los objetivos e identificar las relaciones fundamentales que se
pretenden investigar. Sólo después de haber realizado lo anterior, se pueden seguir los
esquemas representados en el apartado previo para seleccionar la técnica más conveniente.
2. Desarrollo del plan de análisis: una vez establecido el modelo conceptual, el énfasis debe
centrarse en aplicar correctamente la técnica elegida, por lo que será necesario observar que
la muestra posea un tamaño que permita su aplicación. También, debe asegurarse que los
instrumentos que se usan en el procedimiento de recogida de datos (e.g., cuestionarios,
escalas, tests) midan las variables con las escalas pertinentes (métricas y/o no métricas).
3. Análisis de las condiciones de aplicabilidad de la técnica elegida: tras haber recogido los
datos, es necesario evaluar las hipótesis subyacentes a la técnica multivariante, puesto que si
no se cumplen hace que carezca de sentido su aplicación. En las técnicas de dependencia, por
ejemplo, suele ser necesario que los datos verifiquen hipótesis de normalidad, linealidad,
independencia y homoscedasticidad. Además, en caso que los hubiera, debe decidirse qué
hacer con los valores perdidos.
4. Estimación del modelo multivariante y ajuste global del mismo: se aplica la técnica
multivariante elegida, luego se evalúa si el nivel de bondad del ajuste es adecuado. Si no es
así, se deberá reespecificar el modelo, incorporando o eliminando variables. Se hace notar
que no todas las técnicas tienen indicadores de bondad de ajuste.
6. Validación del modelo: previo a la aceptación de los resultados a los que se haya llegado,
debe aplicarse una serie de técnicas de diagnóstico que aseguren que los resultados obtenidos
pueden ser generalizados al conjunto de la población.
Conclusiones
Este trabajo tuvo como propósito fundamental brindar un horizonte introductorio acerca del
análisis multivariante en el contexto de la Psicología. Se pensó en un trabajo que permitiera
presentar las nociones fundamentales para el razonamiento multivariado, sin la necesidad del
manejo de complejas nociones matemáticas. Pensado así, más como un conocimiento
interdisciplinario que disciplinario y apoyados en los importantes desarrollos
computacionales para el procesamiento estadístico de datos multivariados, el discurso estuvo
orientado básicamente a mostrarle al estudiante de Psicología las bases del pensamiento
multivariado y sus posibilidades para la investigación psicológica.
En este sentido, se hizo referencia a los principales antecedentes del análisis multivariado en
la investigación psicológica, tales como los trabajos pioneros de Spearman, Thurstone,
Eysenck, Cattell, Costa y McCrae, entre otros; en los desarrollos de emblemáticos modelos
para el estudio de la inteligencia y la personalidad. Se pretendió resaltar de este modo la
importancia de los análisis multivariados para los desarrollos de la Psicometría.
Para entender el pensamiento multivariado es necesario rescatar nociones básicas, tales como
la varianza, la covarianza y las combinaciones lineales. De esta manera se sostuvo que el
análisis multivariado es; de alguna manera, una extensión de los métodos estudiados en los
cursos de estadística univariada y bivariada, con ajustes para estimar el comportamiento
conjunto de más de dos variables. Con esto, se introduce el concepto de valor teórico,
entendido como un valor único, determinado empíricamente, que representa el
comportamiento conjunto de las variables del modelo.
Ninguna revisión de las técnicas multivariantes estaría completa sin una exposición de su
clasificación. Debido a las limitaciones de este texto, ajustado a los requerimientos de un
curso de estadística en Psicología, no se pretendió llevar a cabo una exposición exhaustiva
de las técnicas multivariantes disponibles en el mercado. No obstante, en sintonía con el
espíritu que inspira el presente trabajo se remite al lector interesado a prestigiosas referencias
que le permitirán ampliar la información que aquí se ha omitido. En tal sentido, se dejaron
ver tres grandes categorías, a saber: técnicas de dependencia, interdependencia y mixtas. De
las tres se rescatan, para su explicación los temas de correlación parcial y múltiple,
regresiones múltiples y análisis factorial de componentes principales; todos estos, temas
presentes en el programa de la asignatura estadística II.
Referencias
Baron, R., & Kenny, D. (1986). The moderator–mediator variable distinction in social
psychological research: conceptual, strategic, and statistical considerations. Journal
of Personality and Social Psychology, 1173-1182.
Cattell, R. (1957). Personality and Motivation Structure and Measurement. New York:
World Book.
Eysenck, H. (1947). Dimensions of personality. Londres: Routledge y Kegan Paul.
Gujarati, D., & Porter, D. (2010). Econometría (Quinta ed.). (P. Carril Villareal, Trad.) D.F.,
México: Mc Graw Hill.
Hair, J., Anderson, R., Tatham, R., & Black, W. (1999). Análisis Multivariante. (D. Cano,
Trad.) Madrid, España: Prentice Hall.
Harlow, L. L. (2005). The Essence of Multivariate Thinking: Basic Themes and Methods.
New Jersey: LAWRENCE ERLBAUM ASSOCIATES.
MacCallum, R., & Austin, J. (2000). Applications of structural equation modeling in
psychological research. Annual review of psychology, 51(1), 201-226.
McCrae, R., & Costa, P. (1987). Validation of the five-factor model of personality across
instruments and observers. Journal of Personality and Social Psychology, 52(1), 81-
90.
Ruiz, M., Pardo, A., & San Martín, R. (2010). Modelo de Ecuaciones Estructurales. Papeles
del Psicólogo, 34-45.
Thurstone, L. (1931). Multiple Factor Analysis. Psychological Review, 38, 406-427.