Sie sind auf Seite 1von 11

25/ Abril/ 2006

Anlisis Factorial
* Potente tradicin en Psicologa (inteligencia)
* Resuelve cuestiones de inters, la tcnica permite ordenar cuando hay alta complejidad
reduciendo variables en factores (variables subyacentes)
En el anlisis, uno parte de una matriz de correlaciones y se hace 2 preguntas: Qu
hay?, Qu subyace a la interdependencia de variables? Esto se resuelve aplicando factores
>> en la matriz existen relaciones solapadas o variables subyacentes. Se asume que la
realidad puede ser aprendida por medio de nmeros y el factorial es una forma de hacer
eso. Lo que hace el factorial es poner en evidencia el patrn d organizacin de la
informacin: conocer, poner orden, mostrar estructuras en situaciones donde hay alto
nivel de interaccin entre las variables.
Ej: en las notas de cualquier lugar del mundo se forman 3 factores: letras, ciencias y
auxiliares
Factor: variable subyacente resultado de otras variables
Factor letras: resultado de variables castellano, historia, etc.
Uso de factorial: validacin de cuestionarios >> si una encuesta est construida a partir de 3
items, al aplicar factorial a los resultados deberamos obtener 3 factores >> eso significa
que las variables estaban midiendo los items que deberan medir.
* Ocurre que los factores son variables latentes que mantienen la misma informacin
* Los factores (o dimensiones subyacentes), son descubiertos o inventados? Se defienden
ambas posiciones:
Inventados: Son producto de la aplicacin de un algoritmo a la matriz de correlaciones
Descubiertos: ej. Utilizacin en psicologa: la inteligencia ha sido medida por 500 variables
y se concluye que hay 8 factores que la determinan >> eso significa que la inteligencia
emocional, lgico matemtica, etc. son factores que estaban dentro de nosotros y haba que
descubrirlos.
* (Segn Vivanco) Es indudable que un uso abusivo de los algoritmos del factorial conduce
a creer que los factores existan previamente >> el factorial es la aplicacin sucesiva de
pasos matemticos: son inventados, o mejor dicho, construidos. (Uso abusivo: sin marco
terico)
* Factorial estudia interdependencia, interaccin
* Existen tantos factores como variables
* En la solucin factorial ingresan los factores que tienen lamda mayor que 1; por lo tanto =
se pierde informacin
* En la solucin, los factores se ordenan jerrquicamente
* Espacio de factor: particularidad de que los factores que se forman mantienen la mxima
informacin.
Matrices: Matriz individuos por variables >> Matriz de correlaciones >> Matriz de
Saturaciones >> Matriz de puntuaciones factoriales

Ecuacin factorial: R- Lamda I / = 0


Identidad
Vi = Comunalidad + Especificidad
Unicidad + Error

Matriz de Correlaciones:
* Carcter exploratorio v/s confirmatorio del anlisis factorial >> distintas formas de
extraer los factores.
Anlisis Factorial >> sperman y pearson: se fijan solo en la comunalidad, se deja de lado lo
especfico de cada variable; por eso es exploratorio, porque trabaja solo con una parte de la
realidad.
- no se pueden establecer hiptesis (por eso se usa poco)
- en la matriz de correlaciones, la comunalidad es la diagonal y va de 0 a1
* No confundir: la tcnica se llama anlisis factorial, pero el SPSS hace anlisis de
componentes principales y al hacerlo utiliza ejes principales (si queremos anlisis factorial,
tenemos que pedrselo) >> ninguno de esto conceptos son lo mismo.
Anlisis de Comp. Principales >> utiliza ejes principales, se fija en comunalidad y
especificidad (utiliza toda la informacin), por eso es de carcter confirmatorio
- ac s se pueden establecer hiptesis
- en este anlisis la diagonal de la matriz de correlaciones es 1
Por qu la diferencia de las diagonales?
Lo que se pone en la diagonal es la varianza de las variables estandarizadas. La diagonal es
la informacin asociada a cada variable (entiendo que esto es: los cruces explican la
correlacin de una variable con la otra, o sea, la explicacin que de una variable se explica
por la otra). Cuando se utiliza comunalidad y unicidad se esta utilizando toda la
informacin, por eso da 1 (lo que explica V1 de V1 = todo); en cambio, cuando se utiliza
solo comunalidad, no toda la informacin de una variable es explicada por s misma.
Nota: esto no lo entend muy bien y me tinca que Vivanco lo puede preguntar, as que si
alguien pudiera explicarlo mejor, se lo agradecera.
Lo comn de anlisis factorial y anlisis de comp. Principales
1. Cuntos factores entran en la solucin?: los que tengan lamda mayor que 1
2. Hay que bautizar los factores, para esto hay que conocer las variables asociadas a l
(a esto Vivanco le llama sentido)
3. Importancia de los factores: son jerrquicos (recordar que en principio existen
tantos factores como variables, pero a la solucin entran pocos que explican bien >>
principio de parsimonia)

Matriz de Saturacin:
De la matriz de correlaciones, pasamos a la matriz de saturacin que es una matriz de
variables v/s factores. Los valores van del -1 al +1 y revelan asociacin: aqu el signo no
importa, solo importa si el valor es cercano a (+-) 1, porque eso significa que la variable
est muy asociada al factor:
V1
V2
* V3
Vn

F1 F2
F1: muy asociado con V1 y V2
0.8 0.1
F2: muy asociado con V3 y Vn
0.9 0.2
0.1 0.7 Recordemos que la funcin discriminante se usaba para determinar que
discriminaban ms; ac el objetivo es encontrar los factores,
0.1
0.9 variables
Se analizan
las variables y se bautizan los factores
que son variables subyacentes >> por eso se bautizan

* Matriz de saturaciones es central para entender lo que pasa con los factores
F1 F2
2
ai
=
V1 comunalidad
V2
V3
Vn
ai 2 = i

Auto valor del factor


* La suma de todos los autovalores es la informacin disponible >> o sea, auto valor total
= numero de variables (suma de las varianzas de todas las variables, que son 1)
Por lo tanto: Si son 18 variables y
F1 = 18, Cuntos factores hay? >> Slo ese, porque mantiene toda la informacin
(imposible).
F1 = 1, Cuntos factores hay? >> 18, todos con auto valor 1 (no sirve)
* La importancia del factor se ve por el auto valor o de cada factor.
* Respecto de su asociacin con los factores, existe distintos tipos de variables:
- Variables simples: asociadas a un solo factor
- Variables complejas: altos pesos o pesos anlogos en ms de un factor
* A menudo la matriz de saturaciones esta llena de variables complejas y esto hace ms
difcil hablar (y/o descubrir) de variables subyacentes >> Un sr. (Vivanco no se acordaba
del nombre plantea que hay que lograr una solucin factorial simple, en la que las
variables estn asociadas a un solo factor (excluyentes):

F1
V1 0.8
V2 0.1
V3 0.9

F2
0.0
0.8
0.1

F3
0.1Esto es una matriz de saturacin que
0.1muestra una solucin factorial simple.
0.1

Para lograr una solucin factorial simple: Rotacin


Rotacin
- La hace el PC para encontrar una solucin factorial simple
- Desde el punto de vista matemtico, existen infinitas soluciones factoriales
- Estas soluciones matemticas son idnticas
* Los factores son un eje, una variable y una funcin; como funcin tiene coeficientes
que se buscan maximizar.
Ejemplo de rotacin grfica:
F1 F2
V1 0.5 0.5
V2 0.5 -0.4
V3 0.7 0.7
V4 -0.6 0.6

F2
V4
*

V3
*
V1
*
F1

V1
V2
V3
V4

F1
F2
0.7 -0.14
0.05 -0.63
0.98 -0.02
0.02 0.84
2.1
1

V2
*

* Por defecto SPSS entrega una matriz rotada


* Tambin por defecto, SPSS hace rotacin varimax
* Existen distintos tipos de rotacin:
- Varimax: maximiza la varianza en los pesos de saturacin (filas)
- Quartimax: Maximiza varianza de las variables en los distintos factores
(columnas)
- Equimax: maximiza varianza en las variables y en los factores (filas y columnas)
* Recordar que los factores son ejes ortogonales, es decir, variables independientes.
- Oblimin: se usa con ejes oblicuos (esto esta fuera del curso)

Matriz de puntuaciones factoriales


* Es una matriz anloga a la matriz de individuos por variable, porque en ella los factores
son variables.
* Es util para estudios posteriores

* Puntuaciones factoriales son las puntuaciones que obtendran los individuos de medirse
los factores directamente.
28/Abril/2006
Aplicacin de anlisis factorial: En la investigacin se deben tomar en cuenta
simultneamente los criterios estadsticos y los criterios sustantivos (perspectiva del
investigador cuando toma las decisiones)
Vivanco distingue 7 usos del factorial (parece que aqu me empec a dormir un poco)
1. Interdependencia y encontrar factores: En la matriz existen relaciones latentes que el
factorial puede desentraar >> De lo que se trata es de encontrar el orden en bases que son
puro desorden. 2 formas:
- Medir constructos no medibles (inteligencia)
- Validar instrumentos de medida
2. Simplificar o reducir datos: Sintetizar, hay 2 momentos: la doble reduccin
- Primero se reducen los individuos a la matriz individuos/ variables; esta
reduccin se hace al recoger las encuestas
- Despus reducimos la informacin a factores, los factores no conservan toda la
informacin de la matriz original, al reducir las variables, desconocen algo de
informacin >> esto se hace actuando bajo el principio de la parsimonia
3. Estructura: Uso exploratorio del factorial permite estructurar la informacin: descubrir
las lneas primarias e independientes que estructuran una realidad de la que no se nada. >>
Se define concepto segn la aplicacin del instrumento? Esto remite nuevamente a la
discusin respecto de si los factores son un descubrimiento o una invencin (resultado de la
aplicacin sucesiva de algoritmos matemticos >> la decisin sobre que algoritmos utilizar
es del investigador, en ese sentido inventados)
Rumel (o Remel, Rimel, Romel): factorial es tan importante en ciencias sociales como la
invencin del clculo diferencial integral (?) en ciencias, porque permite analizar temas
tan complejos como la inteligencia.
4.

Descripcin: El factorial agrupa variables para formar categoras descriptivas (no


explicativas)

5.

Formacin de escalas y Subescalas:

6.

Comprobacin de hiptesis: a travs del anlisis de componentes principales

7.

Transformar datos: De la matriz de datos por variable llegamos a la matriz de


puntuaciones factoriales.
Informe debiera incluir:
- Cmo se extrajo el factorial?
- Qu factores entran en la solucin?
- Sentido: bautizar el factorial

Importancia relativa de cada factor y cantidad de informacin original que


guarda la solucin.

[Parntesis: informacin original


anlogo a varianza
Hay un programa francs que a propsito de esto incorpora el concepto de entropa.
Segn Vivanco esto est mal, porque entropa implica cantidad de desorden >> deberan
utilizar concepto de negentropa.
Segn Shanon: Teora de la informacin >> informacin = entropa]
Siguiendo con el anlisis:
- Rotacin, que tipo y por qu
- Evaluacin del modelo: que tantos son los residuos >> diferencia entre matriz
terica y matriz de correlaciones.
- Si amerita, justificar el uso de puntuaciones factoriales
* Factorial v/s discriminante
Factorial: es una tcnica muy analizada, segn algunos da resultados redundantes porque
uno puede predecir sus resultados. La importancia viene dada por su larga utilizacin (lo
mismo que pasa con la regresin)
Segn Vivanco, el factorial tiene una limitacin frente al discriminante >> es mucho mas
engorroso, abstracto y menos cotidiano porque se utiliza para investigacin bsica, no para
investigacin aplicada (investigacin bsica es poco comn).
Discriminante es anloga a factorial: ambas son funciones, la diferencia es que uno es un
medio (discriminante) y el otro es un fin (factorial). Adems, ambas son ecuaciones
lineales, ejes y variables.
Factorial: qu hay detrs de la matriz de correlaciones?
Discriminante: no opera con la matriz de correlaciones (sta tiene ms que ver con el uso
de tipologas). Se debe considerar como condicin de aplicacin:
- Distribucin normal de variables
- Varianzas parecidas en los grupos
- Grupos homogneos
Informe del anlisis de discriminante:
- naturaleza de la funcin discriminante
- cuantas funciones hay, cuantas se utilizan y su justificacin
- interpretacin de las funciones: cmo se relacionan con las variables
- sentido: naturaleza de la funcin
- % de casos clasificados: evaluacin de la clasificacin
* El ordenamiento del anlisis discriminante es por medio de la funcin discriminante: se
hace por algoritmos que son distintos dependiendo de la pregunta de investigacin y de las
topologas que se utilizan

Epistemologa del factorial: cmo conoce el factorial?


El factorial permite resolver problemas de la realidad porque ordena datos (informacin)
>> parte de una matriz de correlaciones, que asume que existe relacin entre variables. La
forma de desentraar la informacin contenida all es por medio del factorial.

Desde el punto de vista de la epistemologa del factorial, 2 temas importantes: Inventado


o descubierto? y Doble reduccin.
- Inventado o descubierto: remite la discusin de si las variables subyacentes
que descubre el factorial son resultado de la aplicacin sucesiva de algoritmos
matemticos (que inventan la variable subyacente de modo que esta existe
slo por la aplicacin de los algoritmos) o si estn contenidas en la realidad
esperando ser descubiertas.
- Doble reduccin:
o Reduccin inicial: matriz tiene informacin que se pregunta en un
cuestionario: se han atomizado los individuos y se han reducido a nmeros.
o Segunda: se reduce la informacin inicial a factores (matriz individuos /
puntuacin factorial)
* En factorial uno conoce variables subyacentes o latentes; esto nos recuerda la distincin:
latente v/s manifiesto. Mr XX (Vivanco tampoco se acordaba) hace investigaciones sobre
el consumo y distingue:
- consumo manifiesto: satisfaccin de necesidades reales
- consumo conspicuo: satisfaccin de necesidades latentes (creadas)
En factorial La realidad posee:

Variables observadas o manifiestas


Variables no observables o latentes (tambin permiten
construir sentido)

* En todas las tcnicas multivariables se debe evaluar la validez de la aplicacin: los


resultados son satisfactorios? Para esto se debe comparar la matriz de correlaciones
observada con la matriz de correlaciones terica (con R de pearson), lo ptimo es la
igualdad entre ambas, porque eso significa que los factores representan bien la realidad
observada.
Condiciones de aplicacin de factorial
- Mnimo 300 casos
- Distribucin normal de las variables
- Al menos 6 variables por factor (la idea es mantener la mxima cantidad de
informacin en cada factor)
- Debe haber correlacin entre las variables, pero no demasiada
- Variables de intervalo o dicotmicas >> en esto hay perspectivas distintas.
Distintos autores se inclinan por utilizar solo variables de intervalo o variables
de intervalo y dicotmicas (R de pearson se aplica sin problema a variables
dicotmicas)
Es difcil encontrar investigaciones que utilicen solo variables de intervalo
Hay un uso impropio del factorial: se usa al servicio de salvar informacin >> cuando hay
bases de datos que no dan informacin
Segn Vivanco esto es impropio, porque el

proceso debera ser al revs: cuando se crea el cuestionario debe tomarse en cuenta el plan
de anlisis y por lo tanto se deben generan variables de intervalo o dicotmicas a propsito.
Dificultades de aplicacin e interpretacin de factorial: existen dificultades objetivas y
subjetivas que generan resultados distintos.
* Objetivas:
1. Anlisis factorial o de componentes principales?: cada procedimiento de
extraccin de factores genera resultados distintos
2. Qu tipo de rotacin utilizamos?
3. La pulcritud de los mecanismos matemticos de aplicacin de algoritmos no es tal
* Subjetivas:
1. Se interpreta distintamente la matriz de saturaciones, sobretodo en variables
complejas
variables complejas no son un error (s es un error elegir pocas
variables o variables poco relaciones o variables muy relacionadas)
2. Kayser: a la solucion factorial entran los factores con mayor que 1, pero uno
puede cambiar esto. (SPSS por defecto introduce factores con mayor que 1 y esto
tiene un fundamento).
3. Anlisis exploratorio o confirmatorio? Factorial mejor para exploratorio (excluye
especificidad) y Componentes Principales mejor para confirmatorio (incluye
comunalidad y especificidad)
04/Mayo/2006
Anlisis de Tipologas y Anlisis Factorial: Se busca acceder a la realidad, pero se
condiciona esta realidad. Se generan resultados distintos de acuerdo a:
- utilizacin de algoritmos
- decisiones del investigador
Tipologas: Busca la similaridad entre los elementos, pero similaridad no esta definido,
se define por la utilizacin de algoritmos: =/= algoritmos; =/= distancias.
Factorial: tambin se eligen procesos de extraccin de factores, procesos de rotacin >> se
generan resultados distintos.
1 generacin de resultados: lo que entrega el PC
utilizar estos resultados de manera ingenua.

Importante poner ojo en no

* Nosotros hacemos una aprehensin condicionada de la realidad: la realidad - realidad


no se alcanza.
En factorial hay una discusin en torno a esto: factores estaran esperando y en se sentido
accederemos a la realidad realidad v/s factores seran resultado de la aplicacin de
algoritmos matemticos y existiran slo por la aplicacin de los mismos.
OJO: Importante la presencia del investigador en la interpretacin de los resultados
- las tipologas generan grupo a travs de la presentacin de un grfico, as, el
investigador es quien decide cuales son los grupos.
- En factorial ocurre lo mismo

* En anlisis multivariable la precisin es un tema complejo: Segn Vivanco, la precisin


no existe, es slo un adjetivo que se asocia a la tcnica para otorgarle status >> por eso es
tan importante el investigador en la construccin de sentido al utilizar estas tcnicas.
Anlisis factorial y discriminante.
Existe una similitud entre las matrices, pero se buscan cosas distintas. Desde el punto de
vista de la lgica de clculo de las ecuaciones, hay diferencias sustantivas que tienen que
ver con lo que se busca
- discriminante: busca diferencia mxima de las medias de los grupos
- factorial: busca maximizar la informacin
En ambos ocurre que uno tiene ecuaciones (en discriminante tantas como grupos menos 1 y
en factorial tantas como grupos), en ambos hay matrices y en ambos hay puntuaciones.
Entonces, en tanto modelos matemticos tienen similitudes.
Tambin tienen similitudes en como investigar: como son ecuaciones (funciones) cabe
preguntarse: cuantas ingresan al modelo, cual es mas importante, cual es el sentido
(bautizar).
Diferencia: en anlisis discriminante: significacin de la funcin discriminante; esto no
existe en factorial.
Ambas son tcnicas interesantes que permiten ordenar informacin, pero ese orden genera
resultados que responden a preguntas de investigacin que, desde el punto de vista de las
ciencias sociales, no son exactos ni precisos; y en donde la funcin del investigador es
relevante para generar sentido. >> Por esto no utilizar ingenuamente los resultados.

Despus de esto, viene un ejemplo donde se aplica anlisis de componentes principales y


ejes principales en el un test sobre ideologa poltica y actitudes sociales de los
salamantinos. De esto, no es mucho el aporte, excepto que es un error poner de hiptesis
que existe un factor principal (general) y otros anexos.
05/Abril/2006 (ayudanta)
1. Anlisis Factorial
Tcnica multivariable de interdependencia. Se ve la estructura que subyace un conjunto de
variables: reducir las dimensiones de un conjunto de variables.
Factor: combinacin lineal de variables.
2. Objetivos:
- Confirmatorio: estructuras de relacin o conjuntos de variables a querer confirmar
- Exploratorio: busca estructuras subyacentes desconocidas en una masa terica
compleja
2.1 Usos:
- Descripciones
- Resumir informacin

Reducir constructor tericos vagos


Generar escalas y sub escalas
Insumo para otras investigaciones

Trabaja con el principio de parsimonia: pocas variables (factores) que conserven la mayor
informacin posible.
3. Condiciones de aplicacin:
- Variables de intervalo o razn: pueden ser tambin dicotmicas, pero hay que
evitarlo porque su interpretacin es poco clara.
- Tienen que haber variables correlacionadas entre s (parte de una matriz de
correlaciones)
- No puede haber multicolinialidad: variables no pueden estar muy corelacionadas
- No deben haber correlaciones espreas: variables que correlacionan a partir de una
tercera variable. Se cree que dos variables correlacionan mucho, pero en realidad es
una tercera variable la que las est correlacionando
- La matriz no debe ser singular (identidad): singular es cuando la diagonal tiene 1s y
el resto son 0s. Matriz identidad: la variable se correlaciona consigo misma.
- La muestra debe ser grande, 300 casos mnimo, 500 ptimo.
- Los valores ausentes hay que reemplazados por la media
- Los valores aberrantes (valores exageradamente extremos) hay que eliminarlos.
(disparan las varianzas)
Por qu la varianza se asimila a informacin?
Todos los anlisis factoriales buscan maximizar la varianza: una variable no puede entregar
mayor informacin que su varianza (varianza es el coeficiente que ms informacin tiene).
Interesa maximizar porque es resumir manteniendo lo ms importante de la informacin.
4. Etapas:
1.- Clculo de matriz de correlaciones.
2.- Seleccionar un procedimiento de extraccin de factores: Abstraer varianzas.
Qu es un factor?
Caractersticas relevantes de los factores:
Ortogonales: Independientes entre s.
Jerrquicos: El primero explica ms que el segundo y as sucesivamente.
Funcin (combinacin lineal de variables), eje (tienen un lugar en el hiperplano) y
variables (en cada factor se puede sacar una puntuacin).
El factor que mejor explica es aquel que mejor se proyecta en los ejes.
Cada variable tiene una varianza, y esa varianza tiene dos partes: comunalidad y
especificidad (parte de la varianza que se debe exclusivamente a la variable. Se compone de
unicidad y error)
Hay dos mtodos de extraccin de factores:
- Anlisis factorial: confirmatorio >> Lo que tienen en comn los factores.

Componentes principales (con este trabajamos): exploratorio. Considera tanto


comunalidad como especificidad.

3.- Numero de Factores en la solucin: utilizamos el criterio de Kaiser: nunca debera entrar
a la solucin un factor cuyo auto valor sea menos a 1. Si vale menos que 1 explica menos
que una variable.
4.- Rotacin de los ejes factoriales: es una maa matemtica, su objetivo es simplificar la
interpretacin. Lo que hace es maximizar an ms la varianza para hacer ms fcil la
interpretacin. Se mueven los ejes y se mantiene la misma varianza, pero se maximizan los
valores. Lo que se maximiza la saturacin, no la correlacin.
Hay dos tipos de rotaciones:
La ortogonal: Los ejes son independientes entre s; hay tres tipos:
- Varimax: Maximiza las columnas (los factores). Esta utiliza SPSS por defecto
- Quartimax: maximiza las filas
- Equimax: maximiza filas y columnas
La oblicua: no la utilizamos.
5.- Evaluar ajuste del modelo: ver la concordancia entre datos observados y valores tericos
>> si hay mucha diferencia, el ajuste no es bueno.
6.- Clculo de puntuaciones factoriales: qu valores tendran los individuos si midiramos
directamente los factores?
7.- Matriz de saturacin: presenta factores en las columnas y variables en las filas. Los
coeficientes de la matriz son las saturaciones: miden la relacin variable/factor. Mientras
ms cercano a uno la relacin de explicacin es ms ptima.
Auto valor: suma al cuadrado de cada factor >> a mayor auto valor, ms explica cada
factor.
Comunalidad: suma al cuadrado de las filas, explica cunto de la dispersin de la variable
es explicada por los factores en general.

Das könnte Ihnen auch gefallen