Sie sind auf Seite 1von 23

See discussions, stats, and author profiles for this publication at: https://www.researchgate.

net/publication/324018540

Introducción al Análisis Multivariado

Preprint · May 2015


DOI: 10.13140/RG.2.2.18337.30560

CITATIONS READS

0 1,115

1 author:

Dimas Sulbarán
Central University of Venezuela
20 PUBLICATIONS   16 CITATIONS   

SEE PROFILE

Some of the authors of this publication are also working on these related projects:

Salud laboral y psicología positiva del trabajo View project

Enseñanza de la Estadística View project

All content following this page was uploaded by Dimas Sulbarán on 26 March 2018.

The user has requested enhancement of the downloaded file.


2015
INTRODUCCIÓN AL ANÁLISIS
MULTIVARIADO

Trabajo presentado a la escuela de Psicología


de la Universidad Central de Venezuela como
parte del programa de formación para el
escalafón docente de asistente.

Dimas Sulbarán
Universidad Central de Venezuela
18-5-2015
Introducción al Análisis Multivariado en Psicología 1

Índice de contenido

Índice de contenido ......................................................................................... 0

Introducción al Análisis Multivariado en Psicología ....................................... 2

El Análisis Multivariante en la Investigación Social ................................... 4


Qué es y cuándo usar el análisis multivariante en la investigación psicológica,................ 6

El pensamiento multivariado .......................................................................................... 7

Beneficios del pensamiento multivariado ...................................................................... 8

Inconvenientes del Pensamiento Multivariado ............................................................... 9

Temas centrales ................................................................................................................ 10

Varianza ........................................................................................................................ 10

Covarianza .................................................................................................................... 11

Razón de co-varianza.................................................................................................... 11

Combinaciones lineales ................................................................................................ 12

Una clasificación de las técnicas multivariantes .............................................................. 13

Supuestos que subyacen al uso de las diferentes técnicas Multivariante. .................... 15

Linealidad. ................................................................................................................... 15

Independencia de los errores....................................................................................... 16

Homocedasticidad. ....................................................................................................... 16

Normalidad. ................................................................................................................. 16

No colinealidad. ........................................................................................................... 17

Pasos para la aplicación de una técnica multivariante ...................................................... 17

Conclusiones ................................................................................................. 19

Referencias.................................................................................................... 21
Dimas Sulbarán 2

Introducción al Análisis Multivariado en Psicología


Dimas Sulbarán1
Universidad Central de Venezuela
Mayo, 2015

El texto a continuación ha sido escrito con un objetivo simple: hacer que el tema de las
estadísticas multivariantes sea más accesible y comprensible para el estudiante de Psicología.
En este sentido, se procura fomentar un conocimiento global de la naturaleza de los métodos
multivariantes, con énfasis en el uso de esta herramienta estadística en la psicología. A
continuación se muestra el desarrollo de una serie de temas claves para el estudio de los
métodos multivariantes; susceptibles de ser cubiertos en un curso de estadística para
estudiantes de pregrado de la escuela de Psicología de la UCV. Se aspira que el conocimiento
de estos aspectos generales procure la comprensión de los conceptos básicos integrales que
subyacen al razonamiento multivariante. De acuerdo con un enfoque, más de orden aplicado
que teórico-formal, se omiten las complejas demostraciones teóricas y se procura que el
discurso matemático esté adecuado al nivel del estudiante de un curso de segundo semestre
de Psicología. No obstante, para el lector acucioso, interesado en ampliar los contenidos de
este texto, se hace referencia a una serie de trabajos estadísticos excelentes que presentan
mayores detalles matemáticos y estadísticos que permitirán ampliar los alcances del presente.
Palabras clave: Estadística, Métodos Multivariados, Psicología.

Antes de esbozar el contenido de los puntos que se expondrán a continuación, es importante


advertir qué tipo de información sería útil tener como prerrequisito para estudiar los métodos
multivariantes. Es recomendable que, en forma previa, el lector tenga un conocimiento de las
estadísticas univariadas y bivariadas, así como de los problemas y métodos de investigación
que se manejan a nivel de los estudios psicométricos y experimentales. Estos fundamentos
deberán incluir la familiaridad con las nociones generales de la estadística descriptiva e
inferencial, tales como los conceptos y la lógica de los procedimientos para la prueba de
hipótesis. No obstante, estos temas se retoman más adelante en este texto, con especial

1
Profesor Instructor por concurso de la Cátedra de Estadística de la Escuela de Psicología, Facultad de
Humanidades y Educación - UCV.
Introducción al Análisis Multivariado en Psicología 3

atención en lo relativo a los métodos multivariantes. Al lector preocupado por el manejo de


los aspectos básicos para el entendimiento del planteamiento multivariado se le invita a
revisar el material sugerido para asegurar una buena preparación en el nivel de introducción
y un desarrollo más óptimo del pensamiento multivariado.

El asunto fundamental que se rescata de los métodos multivariantes es el que permite el


estudio de la complejidad, que soporta el interés en fuentes múltiples de interacción de la
varianza para el desarrollo de un sistema de conocimiento más cercano al mundo real. El uso
de estos métodos reconoce y alienta la atención a formas más integrales de investigar los
fenómenos. Podemos hacer esto mediante la ampliación de nuestra óptica para identificar, lo
que me gusta llamar como “múltiples y pertinentes fuentes de varianza de la varianza”.
Aunque ningún estudio puede abarcar toda la complejidad de la naturaleza, el dominio de
este tipo de recursos que se identifican como métodos multivariantes permite abarcar un
rango más amplio de elementos en interacción que de lo contrario tendríamos que prescindir
al examinar el comportamiento humano. Este enfoque amplía en los distintos niveles de la
investigación el análisis de la realidad y proporciona una mayor confiabilidad y validez a
nuestra investigación. Los tres puntos generales que engloban el presente texto buscan
ofrecer una visión general de los conceptos y el enfoque que se aborda en este trabajo.

En primer lugar, se ofrece un marco introductorio para el entendimiento de los métodos


multivariantes que incluye una revisión de los beneficios y los inconvenientes de utilizar
dichos métodos antes de proporcionar los criterios básicos para la participación en la
investigación multivariante.

En segundo lugar, se delinean varios temas de fondo de la estadística que pertenecen a ambos
métodos univariados y multivariados. Esto incluye la discusión acerca de los datos, de la
muestra, la medición, las variables, las hipótesis y la selección preliminar para preparar los
datos para su análisis.
Finalmente, a partir de algunos criterios claves que subyacen a la discriminación de estas
técnicas estadísticas, se muestra una taxonomía de métodos multivariantes. Estas categorías
se elaboran para proporcionar un sentido general de los fundamentos en la selección de estos
Dimas Sulbarán 4

procedimientos. En este sentido, este trabajo se pasea por las relaciones múltiples de
dependencia, interdependencia y ecuaciones estructurales.

El Análisis Multivariante en la Investigación Social

En algún momento el hombre se empezó a formular hipótesis más complejas para


describir, entender, explicar y predecir el comportamiento del mundo. En este punto no
bastaba conocer el comportamiento de las variables a nivel univariado; ni siquiera a nivel
bivariado, porque las teorías empezaron a definirse como estructuras complejas que no
podían estudiarse desde el simple conocimiento de sus partes por separado. Ante este
escenario, las técnicas estadísticas multivariantes ofrecieron al investigador los recursos
metodológicos para el análisis que permitiera determinar la validez de aquellas hipótesis.

Al igual que con la estadística descriptiva e inferencial a nivel bivariado, los métodos
multivariantes nos ayudan a entender y cuantificar cómo las variables co-varían. Los métodos
multivariantes proveen al investigador en Psicología de un conjunto de herramientas para
analizar cómo el comportamiento de varias variables covaría, ya sea a través de las
diferencias entre grupos, las correlaciones, o la identificación de las dimensiones subyacentes
para explicar la varianza sistemática por encima de la varianza del error aleatorio. Por lo
tanto, con el uso de métodos multivariantes estamos ampliando la posibilidad de explicar o
dar sentido a la varianza en un conjunto de variables procurando en lo posible la
minimización de la varianza de error aleatorio (Harlow, 2005).

Y es que, a nivel ontológico, las técnicas estadísticas multivariantes se conectan con el


vanguardista concepto de complejidad. Se puede afirmar que uno de los aportes más
significativos de las técnicas estadísticas multivariadas a la ciencia es haber procurado
recursos teóricos de las matemáticas que permiten fundamentar empíricamente las hipótesis
acerca de una realidad que posee una identidad compleja; entendiendo por complejidad la
cualidad de lo que está compuesto por múltiples elementos interrelacionados; cuyo
comportamiento como conjunto se diferencia de la tesis reduccionista que supone que el
conocimiento de un sistema se basa en la acumulación de conocimientos derivados de las
Introducción al Análisis Multivariado en Psicología 5

descripciones univariadas y bivariadas de las partes por separado. Es en este sentido que la
literatura nos advierte que “el elemento esencial del análisis Multivariante es el valor teórico,
una combinación lineal de variables con ponderaciones determinadas empíricamente” (Hair,
Anderson, Tatham, & Black, 1999, pág. 4).

Haciendo un poco de historia, se puede apreciar la cercanía de los orígenes del análisis
multivariante a la Psicología, especialmente en lo que refiere al análisis factorial y los
desarrollos de la psicometría. Fue Charles Spearman en 1904 el primero en describir con el
uso de técnicas estadísticas multivariadas las respuestas de los sujetos a un test de inteligencia
en términos de un factor general (factor g) y un factor específico propio de cada test; la cual
dio lugar a la clásica Teoría Factorial de la Inteligencia. Aunque, se atribuye a Spearman los
comienzos en el uso del análisis factorial, lo que se entiende en la actualidad por esto tiene
sus orígenes en el trabajo pionero “Multiple Factor Analysis” (Thurstone, 1931). Los trabajos
de Eysenck para determinar las dimensiones de la personalidad (Eysenck, 1947) permitieron
confirmar la tesis de que esta podía definirse en torno a dos dimensiones básicas:
extroversión-introversión y neuroticismo-estabilidad emocional. Por su parte, Cattell
también utilizó el análisis factorial para reducir los casi ochenta y tres factores vinculados
con los rasgos de personalidad (Cattell, 1957). Por su parte, los trabajos contemporáneos de
investigadores como Costa y McCrae se basaron en el análisis multivariante para reducir en
una estructura de cinco rasgos y treinta facetas la descripción de la personalidad (McCrae &
Costa, 1987).

Además del popular uso del análisis factorial, también destacan en la investigación
psicológica los interesantes aportes teóricos y metodológicos para la implementación de los
modelos de ecuaciones estructurales (Ruiz, Pardo, & San Martín, 2010; MacCallum &
Austin, 2000) y la identificación de los efectos de variables terciarias en la construcción de
modelos de mediación y moderación en la investigación psicológica (Baron & Kenny, 1986).
Grosso modo, la técnica de ecuaciones estructurales deviene de la combinación del análisis
factorial con la regresión lineal para determinar el nivel de ajuste de unos datos observados
a un modelo hipotetizado y expresado mediante un diagrama de rutas. De esta manera, los
análisis de ecuaciones estructurales identifican los parámetros de cada relación y, en suma,
Dimas Sulbarán 6

un estadístico que expresa el grado en el que los datos se ajustan al modelo propuesto,
confirmando su validez.

Si bien, la historia de los análisis multivariantes acumula un período importante de


tiempo desde su surgimiento hasta nuestros días, es sólo a partir de la década de los 80 que
su uso se ha popularizado en un extenso sector de la comunidad académica e incluso
comercial. Además de los importantes desarrollos de las teorías psicológicas que devienen
en complejos modelos multivariados, la razón fundamental de esta situación se ubica en los
desarrollos de las tecnologías de computación; lo cual, han facilitado, vale decir, en forma
superlativa, los procedimientos para el cálculo de los estadísticos multivariados. El mundo
contemporáneo ha conseguido que cualquier investigador cuente con eficientes procesadores
de información dotados de eficientes software para la ejecución de los más complejos análisis
estadísticos. Todo esto con el sencillo uso de amigables herramientas informáticas. Esto ha
significado una ganancia en el número de personas que se integran al contraste de hipótesis
multivariadas en tanto que: a) se ha reducido en forma significativa los niveles de
competencias matemáticas requeridos por los participantes, b) ha reducido los costos del
procesamiento de los datos y c) ha reducido el error de los resultados.

El texto a continuación nace con la intención de atender las necesidades del estudiante
de psicología, por lo que intentará abordar el tema de los estadísticos multivariados en la
investigación psicológica y, en consonancia con los desarrollos tecnológicos, el énfasis de la
exposición estará en los aspectos lógicos del uso e interpretación de los resultados, más que
en el desarrollo de complejas demostraciones matemáticas. En este sentido, se atenderán los
siguientes puntos: a) qué es y cuándo usar el análisis multivariante en la investigación
psicológica, b) cuáles son los supuestos que subyacen al uso de las diferentes técnicas
multivariante y c) cuáles son las diferentes técnicas de análisis multivariante.

Qué es y cuándo usar el análisis multivariante en la investigación psicológica,

La literatura identifica el análisis Multivariante como “todos los métodos estadísticos


que analizan simultáneamente medidas múltiples de cada individuo u objeto sometido a
Introducción al Análisis Multivariado en Psicología 7

investigación. Cualquier análisis simultaneo de más de dos variables puede ser considerado
aproximadamente como un análisis Multivariante” (Hair, Anderson, Tatham, & Black, 1999,
pág. 4).

El análisis multivariante se compone de una colección de métodos que se puede utilizar


cuando varias mediciones se hacen en cada individuo u objeto en una o más muestras. En lo
sucesivo se hará referencia a las mediciones como variables y a las personas o los objetos
como unidades de análisis (unidades de investigación, unidades de muestreo o unidades
experimentales) u observaciones. En la práctica, los conjuntos de datos multivariantes son
comunes, aunque no siempre se analizan como tales. Sin embargo, pese a su complejidad, un
uso exclusivo de técnicas estadísticas univariadas con estos datos ya no es justificable, dada
la disponibilidad de técnicas multivariantes y poder de cómputo de bajo costo para llevarlas
a cabo. En cualquier caso, el análisis Multivariante es una fase accesoria al proceso creativo
del investigador que ha desarrollado el pensamiento Multivariante, tema que se ampliará a
continuación.

El pensamiento multivariado

Gran parte de la ciencia y de la vida del hombre, transcurre tratando de aprehender el orden
subyacente a un mundo complejo, en apariencia caótico. Cuando comenzamos a entender
que la realidad está conformada por una cantidad infinita de partes interrelacionadas; que el
mundo está determinado por la influencia de múltiples factores, entonces estamos sentando
las bases para el razonamiento multivariado. Es en la búsqueda del orden y la claridad latente
en un mundo complejo donde se podría hacer mucho más fértil los desarrollos de un pensar
multivariante. El pensamiento multivariable se define como: “un conjunto de procesos del
pensamiento que iluminan la interrelación entre y dentro de grupos de variables” (Harlow,
2005, pág. 3).
Los métodos multivariantes que se examinan a continuación son un conjunto de herramientas
que responden al razonamiento que permite visualizar el análisis de múltiples variables, de
una manera integrada y potente. Estos métodos permiten examinar diseños más ricos y más
realistas de los que pueden ser evaluados con métodos bivariados tradicionales que analizan
Dimas Sulbarán 8

sólo una variable de resultado y por lo general sólo una o, a lo sumo, dos variables
independientes. En comparación con los métodos bivariantes, los métodos multivariantes
permiten al investigador analizar en forma conjunta un complejo número de variables. De
esta manera, se consigue una mayor confianza en las conclusiones que suponen una síntesis
con menos errores y más validez que si tuviéramos que analizar las relaciones entre las
variables de forma aislada.

Tras elaborar una comprensión preliminar de lo que se entiende por pensamiento


multivariado, es útil detallar a continuación varias ventajas y desventajas del uso del
razonamiento multivariante.

Beneficios del pensamiento multivariado

Sin pretensión de que esta sea una versión última de los beneficios asociados al uso del
pensamiento multivariado, se desglosan a continuación aquellas que, en concordancia con la
literatura (Harlow, 2005), se consideran como los principales beneficios de este recurso
metodológico.

 En primer lugar, nuestro pensamiento se amplía para contemplar un marco más


amplio en el que podemos imaginar teorías y modelos más complejos y realistas de
los que podrían ser concebidos con métodos univariados y bivariados.
 En segundo lugar, una base sólida en el pensamiento multivariante nos ayuda a
entender y evaluar la investigación de los demás; nos procura un marco más amplio
para la comprensión de la literatura.
 En tercer lugar, el pensamiento multivariable ayuda a ampliar nuestras capacidades
para informar el producto de nuestra propia labor de investigación.
 En cuarto lugar, el pensamiento multivariante permite a los investigadores examinar
grandes conjuntos de variables en un amplio e integrado análisis, controlando de este
modo la tasa de error global y teniendo en cuenta las correlaciones entre las variables.
Introducción al Análisis Multivariado en Psicología 9

 En quinto lugar, el pensamiento multivariado revela varios índices de evaluación para


determinar si el análisis macro global, al igual que una parte o microanálisis
específico, se están comportando como se esperaba.

Inconvenientes del Pensamiento Multivariado

Debido al tamaño y la complejidad de la mayoría de los diseños multivariados, se suele


asociar a estas técnicas algunos inconvenientes típicos. En términos generales, la literatura
(Harlow, 2005), resume en cinco los inconvenientes que podrían surgir cuando se piensa en
el uso de los métodos multivariantes:

 En primer lugar, los supuestos estadísticos (por ejemplo, la normalidad, linealidad y


homocedasticidad) comunes al contraste de hipótesis para el modelo lineal general se
deben cumplir para la mayoría de los métodos multivariantes.
 En segundo lugar, se requiere un número mucho mayor de participantes para probar
en forma adecuada un modelo multivariado, esto en comparación con los estudios
univariados más pequeños.
 En tercer lugar, la interpretación de los resultados de un análisis multivariante puede
ser difícil debido a que tiene varios niveles para ser examinado. Con los métodos
multivariantes, a menudo podemos examinar:
i. La importancia global para evaluar la probabilidad de que los resultados se
debieron a la casualidad;
ii. Las principales variables independientes que están contribuyendo al análisis;
iii. La naturaleza de la variable (s) dependiente que muestra significación; y
iv. El patrón específico de la relación entre las variables independientes y
dependientes pertinentes.
 En cuarto lugar, algunos investigadores especulan que los métodos multivariantes son
demasiado complejos; lo que implica una inversión importante en el tiempo necesario
para aprenderlos.
Dimas Sulbarán 10

 En quinto lugar, después de sumergirse en el pensamiento multivariado, podría ser


cada vez más difícil para el investigador justificar la construcción o el análisis de un
estudio de investigación con un abordaje reduccionista y poco realista.

Tras haber revisado algunas ventajas y desventajas del uso de este razonamiento, a
continuación se esbozan algunos temas centrales para el análisis multivariante.

Temas centrales

Los métodos multivariantes se basan en el tema de la complejidad que se mencionara en


párrafos anteriores, acompañado de varios temas adicionales. Probablemente los temas
claves para el razonamiento estadístico, ya sea para la investigación univariada, bivariada o
multivariada, implican el manejo de los conceptos fundamentales de varianza, covarianza, y
las relaciones de estos co-varianza. Además de éstos, es necesario examinar el tema de la
creación de combinaciones lineales de las variables, ya que esto es fundamental para la
mayoría de los métodos multivariantes.

Varianza

En términos formales, la varianza es el promedio de la diferencia al cuadrado entre un


conjunto de puntuaciones y su media. La varianza es lo que naturalmente se pretende analizar
con cualquier análisis estadístico; supone la efectiva existencia de diferencias que pueden ser
observadas en una determinada variable. Cuando una variable tiene una gran varianza, las
puntuaciones de la muestra tienden a ser muy diferentes; lo cual, da lugar a interrogantes
validas del tipo ¿cómo se comporta la varianza? Y ¿qué variable(s) podrían estar relacionadas
con la varianza de esta variable? En términos heurísticos y epistemológicos, la varianza es
útil para describir, explicar y predecir el comportamiento del mundo. Los métodos
estadísticos ayudan a identificar la varianza sistemática, también conocida como varianza
explicada, reconociendo que en todo modelo estará presente una cantidad de varianza
incognoscible y aquella atribuible al azar. La varianza es un tema importante y es un aspecto
clave en el pensamiento multivariable.
Introducción al Análisis Multivariado en Psicología 11

Covarianza

Como en el caso de la varianza, la covarianza es el producto de las diferencias entre las


puntuaciones conjuntas de un sujeto en dos variables con sus respectivas medias. La
covarianza en su forma tipificada se convierte en la correlación y representa la magnitud y el
sentido de una relación lineal entre dos o más variables. El tema de la covariación es
fundamental para los métodos multivariantes, porque estamos interesados en saber si un
conjunto de variables tienden a co-variar, es decir, tienden a mostrar un comportamiento
concomitante entre las variables. Los métodos multivariantes a menudo evalúan la
covarianza mediante la evaluación de la relación entre las variables teniendo también en
cuenta la covariación entre otras variables incluidas en el análisis. Por lo tanto, los métodos
multivariantes permiten una prueba más informada de las relaciones entre las distintas
variables que pueden ser analizadas con métodos univariados que suponen relaciones
separadas u ortogonales con otras variables.

Razón de co-varianza

En el interés de discriminar la varianza sistemática de la varianza de error y aleatoria, la


mayoría de los métodos estadísticos examinan la proporción de la cantidad de covarianza
existente entre las variables o grupos, con base en la cantidad de varianza relativa dentro y
entre los grupos. Cuando la varianza entre los grupos es mayor con relación a la varianza
intragrupos, por lo general se arriba a la conclusión de que los resultados son
significativamente diferentes de los que se podrían encontrar sobre la base de mero azar. La
razón de esto es que cuando hay mayores diferencias entre los grupos que los que hay dentro
de los mismos, hay indicios para sostener que la varianza sistemática compartida no es sólo
atribuible al error aleatorio.

Es interesante destacar cómo la correlación y el ANOVA, dos métodos estadísticos centrales,


bivariantes, cuantifican la relación de las variables. Sobre esta base, podemos extender este
razonamiento a los métodos multivariantes. La correlación muestra una medida de la
Dimas Sulbarán 12

covarianza entre las variables sobre la varianza dentro de las variables. Cuando la covarianza
entre variables es casi tan grande como la varianza dentro de cualquiera de las variables, esto
indica una relación más fuerte entre las variables. Por lo tanto, una gran correlación indica
que gran parte de la varianza dentro de cada variable es compartida o covaría entre las
variables.

Estas relaciones, ya sea con base en el ANOVA o el índice de correlación, se encuentran


también en los métodos multivariantes. De hecho, casi todas las pruebas de significación
estadística multivariada se basan en algún tipo de ponderación de la relación entre las
varianzas o covarianzas. Conociendo este hecho y comprendiendo la naturaleza de la relación
para cada análisis estamos en capacidad de dar mucho más sentido a nuestros resultados
estadísticos, ya sea por métodos bivariados o multivariados.

Combinaciones lineales

Un tema básico a lo largo de la mayoría de los métodos multivariantes es el de encontrar la


relación entre dos o más conjuntos de variables. Esto, generalmente, responde a la lógica que
supone que la realidad está constituida como un sistema de relaciones e interrelaciones entre
variables; por lo cual, el interés del investigador es lograr su identificación mediante la
formación de combinaciones lineales de las variables según el caso. La investigación
psicológica está saturada de trabajos que han probado la hipótesis de la combinación lineal
de variables para explicar el comportamiento de un determinado fenómeno o constructo. Es
este planteamiento el que inspira la investigación psicométrica y las estrategias de validación
del constructo.

Como se estudiará en apartados posteriores; dependiendo del método, las combinaciones


lineales se denominarán con diferentes términos, tales como: componentes, factores,
funciones discriminantes, y variables canónicas). Independientemente de la etiqueta, las
combinaciones lineales multivariables sintetizan la información presente en un conjunto
mayor de variables para generar un análisis más parsimonioso, manejable o comprensible.
Introducción al Análisis Multivariado en Psicología 13

Ahora pasaremos a revisar formas de clasificar los métodos multivariantes, utilizando


algunos criterios claves derivados de la literatura.

Una clasificación de las técnicas multivariantes

Siguiendo la literatura (Hair, Anderson, Tatham, & Black, 1999), se sugiere discriminar el
tipo de análisis multivariante en función de la respuesta a tres preguntas clave: a) con base
en los elementos teóricos, la hipótesis de relación entre las variables supone dependencia,
interdependencia o ambas? b) cuántas variables se encuentran implicadas en la relación? Y
c) ¿cuál es el nivel de medida de las variables?

Antes de abordar la clasificación de los métodos multivariados, debemos aclarar qué se


entiende por relaciones de dependencia, interdependencia o ambas. Las relaciones de
dependencia hacen referencia a los modelos que suponen procesos de causalidad o
determinación de la varianza de una o varias variables dependientes por las variaciones de
una o varias variables independientes, tal es el caso de la regresión múltiple. por su parte, las
relaciones de interdependencia se basan en modelos de interrelación en los cuales no existen
elementos teóricos que permitan sostener la hipótesis de determinación o causalidad de unas
variables sobre otras; razón por la cual no se habla de relaciones entre variables
independientes y dependientes, como es el caso de los análisis factoriales de componentes
principales. Finalmente, existen modelos en los cuales los sistemas de relación se constituyen
por una combinación de relaciones de dependencia e interdependencia, este es el caso
específico de los métodos de ecuaciones estructurales.
Dimas Sulbarán 14

Figura 1. Diagrama de rutas para la selección de las técnicas multivariantes.


Fuente: tomado de Hair, Anderson, Tatham, & Black, 1999.
Introducción al Análisis Multivariado en Psicología 15

Si bien, este diagrama expuesto en la figura 1 nos muestra un amplio conjunto de técnicas de
análisis multivariante susceptible de ser empleados en la práctica psicológica, en los
programas de la escuela de Psicología se hace referencia en forma fundamental a tres casos,
a saber: a) el análisis de correlación múltiple, b) la regresión múltiple, c) el análisis factorial
y d) las ecuaciones estructurales. A continuación, se amplía la información con relación a
cada uno de estas técnicas, pero antes revisamos algunos supuestos subyacentes al uso de
estas técnicas multivariantes.

Supuestos que subyacen al uso de las diferentes técnicas Multivariante.

Los supuestos hacen refrencia a una serie de condiciones que deben cubrir los datos para
llevar a cabo análisis estadísticos en forma válida. Siguiendo la literatura se encuentran cuatro
supuestos fundamentales que subyacen al uso de las técncias multivariantes que se ampliarán
a continuación, tales como la correlación y la regresión múltiple y el análisis factorial. Entre
estos supuestos se cuenta: a) normalidad, b) homocedasticidad, c) linealidad y d)
independencia de los errores (Gujarati & Porter, 2010). El texto a continuación describe cada
uno en términos conceptuales y muestra técnicas claves para su identificación y control.

Linealidad.

Por linealidad se entiende a las siguientes formas que pueden definir a una ecuación:
a) linealidad en las variables y/o b) linealidad en los parámetros. Como estos términos no son
independientes, las variables pueden cumplir con cualquiera de las combinaciones posibles
entre la presencia y ausencia de linealidad tanto en las variables como en los parámetros, tal
como se resume en el cuadro siguiente:

Linealidad en las variables


Si No
𝑦 =𝛽 +𝛽 𝑋 𝑦 =𝛽 +𝛽 𝑋

Linealidad en los +𝜀 +𝜀
parámetros 𝑦 =𝛽 +𝛽 𝑋 𝑦 =𝛽 +𝛽 𝑋
No
+𝜀 +𝜀
Dimas Sulbarán 16

De las dos interpretaciones de linealidad, se exige linealidad en los parámetros para


el desarrollo de los modelos de regresión lineal que se desarrollan en este curso. Por
consiguiente, cuando se hace referencia al término regresión lineal nos estamos refiriendo a
una regresión lineal en los parámetros. Lo cual significa que los parámetros (𝛽 + 𝛽 ) se
elevan sólo a la primera potencia. Aunque puede o no ser lineal en las variables explicativas
p predictoras.

Independencia de los errores.

Este supuesto se resume en el principio de que el error (ε) es una variable aleatoria
para todo valor de xi, por tanto la correlación entre estas dos variables debe ser igual a cero.
En otras palabras, se espera que rxe=0. En el caso contrario, la literatura permite sostener que
“no se podría afirmar que los valores predichos por el modelo sean independientes de los
niveles que estamos intentando predecir” (Hair, Anderson, Tatham, & Black, 1999, pág. 68);
lo cual, atenta contra la calidad del modelo que se está proponiendo.

Homocedasticidad.

Se espera que la varianza del término de error para todos los valores de xi sea
equivalente. Esta cualidad es necesaria, según el Teorema clásico de Gauss-Márkov, para
que en un modelo los coeficientes estimados sean los mejores o eficientes, lineales e
insesgados.
Cuando no se cumple esta situación, se dice que existe heterocedasticidad, que es
cuando la varianza de cada término de perturbación no es un número constante

Normalidad.

Dado que se asume que las perturbaciones del modelo o término de error para cada
valor de xi obedecen a una distribución aleatoria, se espera que esta se distribuya de manera
normal. En otras palabras, los valores de error tienden a distribuirse de la forma: 𝜀 ∼ 𝑁(𝜇, 𝜎),
dado que Ε( 𝜐 ∣ 𝑥 ) = 0, entonces la distribución de los errores debe cumplir con 𝜀 ∼
Introducción al Análisis Multivariado en Psicología 17

𝑁(0, 𝜎) . El cumplimiento de este supuesto es fundamental para los análisis con fines
inferenciales.

No colinealidad.

Este supuesto está relacionado, fundamentalmente, con los casos de los análisis de
regresión múltiple. Atendiendo al principio fundamental de parsimonia, se espera que la
incorporación de cada variable independiente o predictora al modelo se dé porque representa
un valor agregado significativo en la definición del mismo para la explicación del fenómeno
de interés. Para cumplir con este propósito se debe procurar que cada variable independiente
sea efectivamente algo “independiente” a las otras variables explicativas que se agrega a la
ecuación. En este caso, estaremos en presencia de No colinealidad. Cuando no se cumple con
este supuesto se habla de la presencia de colinealidad de que las variables incluidas en el
modelo están correlacionadas entre sí y resultan en un modelo redundante.

Pasos para la aplicación de una técnica multivariante

Las técnicas multivariantes son, en su mayoría, herramientas muy poderosas que permiten al
investigador extraer abundante información de los datos disponibles. Estas técnicas son, en
sí mismas, relativamente complejas y requieren para su utilización un conocimiento profundo
de sus fundamentos y condiciones de aplicabilidad. Sin embargo, el notable desarrollo de
programas informáticos de manejo sencillo y el invariable avance de la tecnología están
provocando que, en muchas áreas de conocimiento, y de manera especial en el campo de las
ciencias sociales, las técnicas de análisis multivariante estén siendo ampliamente empleadas.
El problema que de inmediato se presenta es que el uso indiscriminado de los paquetes
estadísticos genera, muchas veces, que no se utilicen adecuadamente, puesto que el usuario
con frecuencia carece del suficiente respaldo teórico que el escenario requiere.

En virtud de lo que precede, en este apartado se brinda una guía para la correcta aplicación
de las técnicas multivariantes y el posterior arribo a conclusiones razonables. El desarrollo
Dimas Sulbarán 18

que a continuación se expone sigue el proceso planteado por Hair, Anderson, Tatham y Black
(1999).

1. Definición del problema que se está investigando, sus objetivos y decisión sobre la técnica
multivariante que debe utilizarse: para ello se debe realizar una adecuada aproximación
teórica al problema que se aborda; esto es, analizar conceptualmente el objeto de
investigación, especificar los objetivos e identificar las relaciones fundamentales que se
pretenden investigar. Sólo después de haber realizado lo anterior, se pueden seguir los
esquemas representados en el apartado previo para seleccionar la técnica más conveniente.

2. Desarrollo del plan de análisis: una vez establecido el modelo conceptual, el énfasis debe
centrarse en aplicar correctamente la técnica elegida, por lo que será necesario observar que
la muestra posea un tamaño que permita su aplicación. También, debe asegurarse que los
instrumentos que se usan en el procedimiento de recogida de datos (e.g., cuestionarios,
escalas, tests) midan las variables con las escalas pertinentes (métricas y/o no métricas).

3. Análisis de las condiciones de aplicabilidad de la técnica elegida: tras haber recogido los
datos, es necesario evaluar las hipótesis subyacentes a la técnica multivariante, puesto que si
no se cumplen hace que carezca de sentido su aplicación. En las técnicas de dependencia, por
ejemplo, suele ser necesario que los datos verifiquen hipótesis de normalidad, linealidad,
independencia y homoscedasticidad. Además, en caso que los hubiera, debe decidirse qué
hacer con los valores perdidos.

4. Estimación del modelo multivariante y ajuste global del mismo: se aplica la técnica
multivariante elegida, luego se evalúa si el nivel de bondad del ajuste es adecuado. Si no es
así, se deberá reespecificar el modelo, incorporando o eliminando variables. Se hace notar
que no todas las técnicas tienen indicadores de bondad de ajuste.

5. Interpretación de los resultados: luego de que se logra un nivel de ajuste aceptable, se


procede a interpretar el modelo. Es necesario prestar atención a los efectos de las variables
Introducción al Análisis Multivariado en Psicología 19

individuales examinando sus coeficientes, cargas factoriales, utilidades, etc. La


interpretación puede conducir a nuevas reespecificaciones del modelo.

6. Validación del modelo: previo a la aceptación de los resultados a los que se haya llegado,
debe aplicarse una serie de técnicas de diagnóstico que aseguren que los resultados obtenidos
pueden ser generalizados al conjunto de la población.

Conclusiones

Este trabajo tuvo como propósito fundamental brindar un horizonte introductorio acerca del
análisis multivariante en el contexto de la Psicología. Se pensó en un trabajo que permitiera
presentar las nociones fundamentales para el razonamiento multivariado, sin la necesidad del
manejo de complejas nociones matemáticas. Pensado así, más como un conocimiento
interdisciplinario que disciplinario y apoyados en los importantes desarrollos
computacionales para el procesamiento estadístico de datos multivariados, el discurso estuvo
orientado básicamente a mostrarle al estudiante de Psicología las bases del pensamiento
multivariado y sus posibilidades para la investigación psicológica.

En este sentido, se hizo referencia a los principales antecedentes del análisis multivariado en
la investigación psicológica, tales como los trabajos pioneros de Spearman, Thurstone,
Eysenck, Cattell, Costa y McCrae, entre otros; en los desarrollos de emblemáticos modelos
para el estudio de la inteligencia y la personalidad. Se pretendió resaltar de este modo la
importancia de los análisis multivariados para los desarrollos de la Psicometría.

Asimismo, se comentó el crecimiento de las investigaciones en Psicología que han adoptado


la construcción de complejos modelos multivariados con base en los recursos metodológicos
del análisis de variables terciarias y la implementación de las ecuaciones estructurales.
Una comprensión del auge de las técnicas de análisis multivariantes en la investigación
psicológica no puede dejar de reconocer la importancia de los desarrollos de la tecnología
computacional para el análisis de datos estadísticos multivariados. De esta manera, los
complejos razonamientos matemáticos para el cálculo de los diferentes parámetros y pruebas
Dimas Sulbarán 20

de significación, se han reducido a sencillos heurísticos para la operación de los programas


de computadora. Sin embargo, esta aparente ventaja trae implícito el inconveniente de que,
en más ocasiones de las admisibles, la utilización de dichos análisis se lleva a cabo de manera
errónea, como consecuencia de un precario manejo de los fundamentos estadísticos
necesarios para su adecuada aplicación.

Para entender el pensamiento multivariado es necesario rescatar nociones básicas, tales como
la varianza, la covarianza y las combinaciones lineales. De esta manera se sostuvo que el
análisis multivariado es; de alguna manera, una extensión de los métodos estudiados en los
cursos de estadística univariada y bivariada, con ajustes para estimar el comportamiento
conjunto de más de dos variables. Con esto, se introduce el concepto de valor teórico,
entendido como un valor único, determinado empíricamente, que representa el
comportamiento conjunto de las variables del modelo.

Ninguna revisión de las técnicas multivariantes estaría completa sin una exposición de su
clasificación. Debido a las limitaciones de este texto, ajustado a los requerimientos de un
curso de estadística en Psicología, no se pretendió llevar a cabo una exposición exhaustiva
de las técnicas multivariantes disponibles en el mercado. No obstante, en sintonía con el
espíritu que inspira el presente trabajo se remite al lector interesado a prestigiosas referencias
que le permitirán ampliar la información que aquí se ha omitido. En tal sentido, se dejaron
ver tres grandes categorías, a saber: técnicas de dependencia, interdependencia y mixtas. De
las tres se rescatan, para su explicación los temas de correlación parcial y múltiple,
regresiones múltiples y análisis factorial de componentes principales; todos estos, temas
presentes en el programa de la asignatura estadística II.

Se presentaron los supuestos fundamentales del análisis multivariado. Tal es el caso de la


normalidad de la distribución multivariada, la ausencia de correlación con el error, la
homoscedasticidad, la linealidad y la no colinealidad, en el caso de los modelos de
dependencia. En este sentido, se mencionan las principales estrategias para su identificación
y corrección.
View publication stats

Introducción al Análisis Multivariado en Psicología 21

Finalmente, se hace un resumen de los pasos básicos para la realización de un análisis


multivariado. En concordancia con la literatura se definen seis pasos claves que cubren desde
la formulación teórica del modelo hasta el proceso de validación, pasando por la decisión con
relación a la técnica estadística apropiada, según la propuesta teórica y el nivel de medición
de las variables.

Referencias

Baron, R., & Kenny, D. (1986). The moderator–mediator variable distinction in social
psychological research: conceptual, strategic, and statistical considerations. Journal
of Personality and Social Psychology, 1173-1182.
Cattell, R. (1957). Personality and Motivation Structure and Measurement. New York:
World Book.
Eysenck, H. (1947). Dimensions of personality. Londres: Routledge y Kegan Paul.
Gujarati, D., & Porter, D. (2010). Econometría (Quinta ed.). (P. Carril Villareal, Trad.) D.F.,
México: Mc Graw Hill.
Hair, J., Anderson, R., Tatham, R., & Black, W. (1999). Análisis Multivariante. (D. Cano,
Trad.) Madrid, España: Prentice Hall.
Harlow, L. L. (2005). The Essence of Multivariate Thinking: Basic Themes and Methods.
New Jersey: LAWRENCE ERLBAUM ASSOCIATES.
MacCallum, R., & Austin, J. (2000). Applications of structural equation modeling in
psychological research. Annual review of psychology, 51(1), 201-226.
McCrae, R., & Costa, P. (1987). Validation of the five-factor model of personality across
instruments and observers. Journal of Personality and Social Psychology, 52(1), 81-
90.
Ruiz, M., Pardo, A., & San Martín, R. (2010). Modelo de Ecuaciones Estructurales. Papeles
del Psicólogo, 34-45.
Thurstone, L. (1931). Multiple Factor Analysis. Psychological Review, 38, 406-427.

Das könnte Ihnen auch gefallen