Beruflich Dokumente
Kultur Dokumente
SantiagodelaFuenteFernndez
AnlisisFactorial
SantiagodelaFuenteFernndez
AnlisisFactorial
INTRODUCCINANLISISFACTORIAL
Elanlisisfactorialesunatcnicadereduccindedatosquesirveparaencontrargrupos
homogneosdevariablesapartirdeunconjuntonumerosodevariables.
Losgruposhomogneosseformanconlasvariablesquecorrelacionanmuchoentresyprocurando,
inicialmente,queunosgruposseanindependientesdeotros.
Cuandoserecogenungrannmerodevariablesdeformasimultnea(porejemplo,enun
cuestionariodesatisfaccinlaboral)sepuedeestarinteresadoenaveriguarsilaspreguntasdel
cuestionarioseagrupandealgunaformacaracterstica.Aplicandounanlisisfactorialalas
respuestasdelossujetossepuedenencontrargruposdevariablesconsignificadocomnyconseguir
deestemodoreducirelnmerodedimensionesnecesariasparaexplicarlasrespuestasdelos
sujetos.
ElAnlisisFactoriales,portanto,unatcnicadereduccindeladimensionalidaddelosdatos.Su
propsitoltimoconsisteenbuscarelnmeromnimodedimensionescapacesdeexplicarelmximo
deinformacincontenidaenlosdatos.
Adiferenciadeloqueocurreenotrastcnicascomoelanlisisdevarianzaoelderegresin,enel
anlisisfactorialtodaslasvariablesdelanlisiscumplenelmismopapel:todasellasson
independientesenelsentidodequenoexisteaprioriunadependenciaconceptualdeunasvariables
sobreotras.
FundamentalmenteloquesepretendeconelAnlisisFactorial(AnlisisdeComponentesPrincipales
odeFactoresComunes)essimplificarlainformacinquenosdaunamatrizdecorrelacionespara
hacerlamsfcilmenteinterpretable.
SepretendeencontrarunarespuestaalpreguntarnosPorquunasvariablesserelacionanms
entresymenosconotras?.Hipotticamenteesporqueexistenotrasvariables,otrasdimensioneso
factoresqueexplicanporquunostemsserelacionanmsconunosqueconotros.
Endefinitiva,setratadeunanlisisdelaestructurasubyacenteaunaseriedevariables?.
CONCEPTOSPREVIOSDELANLISISFACTORIAL
Unejemploconcretodeintroduccinalconceptodevarianzacompartidayvarianzanica:Sean
unostemsdeunaescaladeactitudes,dondelapuntuacindecadasujetoencuestadoeslasumade
lasrespuestasatodoslostems,segnlaclavedecorreccindiseada:
Muydeacuerdo=5
1Melopasomuybienenmicasa,conmispadres Deacuerdo=4
..
Muydeacuerdo=1
2Algunasvecesmegustaramarcharmedemicasa Deacuerdo=2
Lavarianza 2 decadatemindicaladiferenciaquecreaenlasrespuestas.Sitodos
respondieranlomismolavarianzaseracero,nohabradiferencias.Silamitadestuvieramuy
agustoensucasaylaotramitadmuyadisgusto,lavarianzaseramxima.
SantiagodelaFuenteFernndez1
AnlisisFactorial
Cadatemovariabletienesuvarianza(diferenciasenlasrespuestas),lavarianzadecada
tempuedesercompartidaconlavarianzadeotrostems:Algunosindividuosencuestados
estnmuybienensucasaconsuspadres(tem1)ynuncapiensanirsedesucasa(tem2).
Otrosindividuosrespondernconotrasvariaciones.Enestecaso,lasrespuestassealadaa
estosdostemssoncoherentesconelsignificadopretendidodelosdostems,comparten
varianzaporquelosdostemsestnrelacionadospositivamente(estoybienencasa,nome
quieroir).
EstarelacinvieneexpresadaporelcoeficientedecorrelacinrdePearson,donder2
expresalaproporcindevarianzacomnodevariacinconjunta.Esdecir,silacorrelacin
entreestosdostemsesde0,90,estosignificaquetienenun81%devarianzacomn
(variacinenlasrespuestas).Elrestodelavarianza(19%)noesvarianzacompartida.
Lavarianzanocompartidapuededescomponerseenotrasdosfuentesdevarianza:Cada
variabletieneunavarianzaespecifica:unencuestadopuederesponderqueselopasamuy
bienconsuspadresyquelegustarairsedecasa,simplementeporquelegustaviajar.
Eltem1nocuantificanicamentelaintegracinfamiliar,tambintieneunsignificado
especficoqueparamuchosencuestadosnopuedecoincidirdeltodoconsentirsebienen
casa.
TambinhayunaVarianzadeerrordemedicin,ocasionadaporcansancio,estilos
personalesderesponder,ordenenqueseresponde,etc.
Lavarianzatotaldeuntempuededescomponerse:
Uniendolavarianzaespecficaconlavarianzadebidaaerroresdemedicin(todalavarianzanicao
nocompartidadecadatemovariable),setiene:
Varianzacompartida Varianzadeerrores
VarianzaTotal = +
ocomn demedicin
QuhaceelAnlisisFactorial?
Seencargadeanalizarlavarianzacomnatodaslasvariables.Partiendodeunamatrizde
correlaciones,tratadesimplificarlainformacinqueofrece.Seoperaconlascorrelacioneselevadas
alcuadrador2(coeficientesdedeterminacin),queexpresanlaproporcindevarianzacomnentre
lasvariables.
Encadacasilladelamatrizdecorrelacionessereflejalaproporcindevarianzacomnadostemso
variables,exceptoenladiagonalprincipal(dondecadatemcoincideconsigomismo).Enlos1dela
diagonalprincipalsereflejalavarianzaquecadatemovariablecomparteconlosdemsytambin
losquenocomparte(laespecficaonicadecadatem).
Sisedeseaanalizarexclusivamentelavarianzacompartidahabrqueeliminarlosunosdelamatriz
decorrelacionesyponerensulugarlaproporcindevarianzaquecadatemtieneencomncon
todoslosdems.
SantiagodelaFuenteFernndez2
AnlisisFactorial
EnelAnlisisFactorial,portanto,cabendosenfoques:
1. AnalizarTODAlavarianza(comnynocomn).Enestecasoutilizamoslosunosdelamatrizde
correlaciones.ElmtodomsusualeseldeAnlisisdeComponentesPrincipales.
2. AnalizarSOLOlavarianzacomn.Enestecaso,sesubstituyenlosunosdeladiagonalpor
estimacionesdelavarianzaquecadatemtieneencomnconlosdems(yquesedenominan
Comunalidades).Paralaestimacindelascomunalidadesnohayunclculonico,existen
diversosprocedimientos(correlacionesmltiplesdecadatemcontodoslosdems,coeficientes
defiabilidadsicadavariableesuntest).Elprocedimientoporelquesesustituyenlosunospor
lascomunalidadessedenominaAnlisisdeFactoresComunes.
LosdosenfoquescabenbajoladenominacingenricadeAnlisisFactorial,aunqueeselAnlisisde
FactoresComunesalqueconmspropiedadseleaplicaladenominacindeAnlisisFactorial.
Ambosenfoquesdanresultadossimilaresyseinterpretandemaneracasiidntica.
QuesunFACTOR?
Enrealidadlosfactoresnoexisten,loqueexistedecadasujetoesunasumadesusrespuestasauna
seriedetemsopreguntas,unacombinacinlinealdevariables(tema+temb+temc+).
Lasumatotaldetemssondistintosparacadasujeto,opuedenserlo,lavarianzadelostotalesnos
expresaladiversidadqueexisteentrelossujetos.
Sihaynfactores,seinterpretaqueelinstrumentooriginalsepuededescomponerenn
instrumentos(cadaunocompuestoportodoslostems),aunqueencadainstrumentolostems
tienenunpesoespecficodistintosegnseasurelacinconelfactor:
Siencontramos,porejemplo,tresfactores,estoquieredecirquepodemosdescomponer
elinstrumentooriginalentresinstrumentos;cadaunoestcompuestoportodoslostems,pero
encadainstrumentolostemstienenunpesoespecficodistintosegnseasurelacinconcada
factor:
a1a+b1b+c1c+....=TotalenelFactor1 a1eselpesoespecficodeltemaenelFactor1
a2a+b2b+c2c+....=TotalenelFactor2 a2eselpesoespecficodeltemaenelFactor2
.................................................................... ............................................................................
ana+bnb+cnc+....=TotalenelFactorn aneselpesoespecficodeltemaenelFactorn
Lasnuevaspuntuacionessonlaspuntuacionesfactorialesofactorscores.
Lospesospuedensergrandesopequeos,positivosonegativos.Generalmente,encadafactorhay
temsconpesosgrandesyotrosprximosacero;lostemsquemspesanencadafactorsonlosque
lodefinen.
Lavarianza(diversidad)detodaslasnuevasmedidasequivalealavarianzadelamedidaoriginal(no
atoda,perosalamximaqueesposibleexplicar);estosfactoresindicanlasfuentesdevarianza;si
haydiferenciasenlamedidaoriginalesporquelashayenestasnuevaspuntuaciones.
SantiagodelaFuenteFernndez3
AnlisisFactorial
Elanlisisfactorialsereducealabsquedadeestospesosparalocalizarmedidasdistintasapartirde
lasvariablesoriginales,ydemaneraque,apoderser,entretodaslasnuevasmedidasagoteno
expliquentodalavarianzapresenteenlasvariablesoriginales.
ESQUEMADEUNANLISISFACTORIAL:
FORMULACINDELPROBLEMA
ANLISISDELAMATRIZDECORRELACIN
EXTRACCINDEFACTORES
DETERMINACINDELNMERODEFACTORES
ROTACINDEFACTORES
INTERPRETACINDEFACTORES
VALIDACINDELMODELO
CLCULODEPUNTUACIONES SELECCINDELAS
FACTORIALES VARIABLESREPRESENTATIVAS
ANLISISPOSTERIORES:REGRESIN,CLUSTER...
ModelodelAnlisisFactorial
Sean(X1,X2,,Xp)laspvariablesobjetodeanlisisquesupondremosentodoloquesigue,que
estntipificadas.Sinoloestuvieranelanlisisserealizaradeformasimilarperolamatrizutilizada
paracalcularlosfactoresnoseralamatrizdecorrelacinsinoladevarianzasycovarianzas.
Elinvestigadormideestasvariablessobrenindividuos,obtenindoselasiguientematrizdedatos:
Variables ElmodelodelAnlisisFactorialviene
Sujetos X1 X2 Xp dadohabitualmenteporlasecuaciones:
1 x11 x12 x1p X1=a11F1+a12F2++a1kFk+u1
2 x21 x22 x2p X2=a21F1+a22F2++a2kFk+u2
..................
Xp=ap1F1+ap2F2++apkFk+up
n xn1 xn2 xnp
SantiagodelaFuenteFernndez4
AnlisisFactorial
Donde,(F1,F2,,Fk)(k<p)sonlosFactoresComunes,(u1,u2,,up)losFactoresnicoso
especficos,ylosCoeficientes(aij){i=1,,p;j=1,...,k}lasCargasfactoriales.
SesuponequelosFactoresComunesestnasuvezestandarizados[E(Fi)=0;Var(Fi)=1],losFactores
Especficostienenmedia0yestnincorrelados[E(ui)=0;Cov(ui,uj)=0sij;(i,j=1,,p)]yque
ambostiposdefactoresestnincorreladosCov(Fi,uj)=0,i=1,..,k;j=1,,p.
Si,adems,losFactoresComunesestnincorrelados[Cov(Fi,Fj)=0siij;j,i=1,,k]estamosanteun
modeloconfactoresortogonales.
Encasocontrarioelmodelosedicequeesdefactoresoblicuos.
Expresadoenformamatricial:
Xmatrizdedatos
x=Af+uX=FA'+U Amatrizdecargasfactoriales
Fmatrizdepuntuacionesfactoriales
Utilizandolashiptesisanteriores,setiene:
k
Var(Xi ) = a2ij + i = h2i + i (i = 1, 2, L ,p)
j=1
k
donde, h2i = Var aij Fj y i = Var(ui ) ,recibenlosnombres,respectivamente,deComunalidady
j=1
EspecificidaddelavariableXi
Enconsecuencia,lavarianzadecadaunadelasvariablesanalizadassepuededescomponerendos
partes:laComunalidad h2i querepresentalavarianzaexplicadaporlosfactorescomunesyla
Especificidad i querepresentalapartedelavarianzaespecficadecadavariable.Ademssetiene:
k k k
Cov(Xi , Xl ) = Cov aij Fj , alj Fj , = aij alj i l
j=1 j=1 j=1
porloquesonlosfactorescomuneslosqueexplicanlasrelacionesexistentesentrelasvariables.
Porestemotivo,losfactorescomunestienenintersysonsusceptiblesdeinterpretacin
experimental.Losfactoresnicosseincluyenenelmodelodadalaimposibilidaddeexpresar,en
general,pvariablesenfuncindeunnmeromsreducidokdefactores.
SantiagodelaFuenteFernndez5
AnlisisFactorial
Ejemplo.Unosestudiantessonsometidosadiversostestendistintasmateriasparamedirsus
actitudesintelectuales.Comoconsecuencia,seobtienenunaseriedepuntuacionesestandarizadas
enMatemticas(Ma),Fsica(Fi),Qumica(Qu),Ingls(In),Historia(Hi)yDibujo(Di).
E[Fi]=0i=1,2;j{Ma,Fi,Qu,In,Hi,Di}
Losfactorescomunesestn
Var[Fi]=1i=1,2;
estandarizadoseincorrelados
Cov(F1,F2)=0
Losfactoresespecficos E[ui]=0i=1,2;j{Ma,Fi,Qu,In,Hi,Di}
tienenmedia0eincorrelados Cov(u1,u2)=0ij{Ma,Fi,Qu,In,Hi,Di}
Cov(Fi,uj)=0ij{Ma,Fi,Qu,In,Hi,Di}
Ambostiposdefactoresestnincorrelados
Cov(u1,u2)=0ij{Ma,Fi,Qu,In,Hi,Di}
0,8 0,2
0,7 0,3
0,6 0,3
Lamatrizdecargasfactoriales A =
0,2 0,8
0,15 0,82
0,25 0,85
ComunalidadyEspecificidad:
Var[Ma]=1=Var[0,8F1+0,2F2+uMa]=
Matemticas =0,82Var[F1]+0,22Var[F2]+Var[uMa]+2(0,8)(0,2)Cov(F1,F2)+2(0,8)Cov(F1,uMa)+
+2(0,2)Cov(F2,uMa)=0,68+Ma
2
LaComunalidadenMatemticases hMa = 0,68 ylaEspecificidad Ma = 0,32
Var[Di]=1=Var[0,25F1+0,85F2+uDi]=
Dibujo =0,252Var[F1]+0,852Var[F2]+Var[uDi]+2(0,25)(0,85)Cov(F1,F2)+2(0,25)Cov(F1,uDi)+
+2(0,85)Cov(F2,uDi)=0,785+Di
Anlogamente,
Comunalidades
Matemticas 0,68
Fsica 0,42
Qumica 0,55
Ingls 0,215
Historia 0,36
Dibujo 0,785
o Comolaspuntuacionesestnestandarizadas,lamatrizdevarianzasycovarianzascoincide
conlamatrizdecorrelaciones:
SantiagodelaFuenteFernndez6
AnlisisFactorial
Advirtaseque,
Cov(Ma,Fi)=Cov(0,8F1+0,2F2+uMa,0,7F1+0,3F2+uFi)=
=(0,8)(0,7)Var(F1)+(0,8)(0,3)Cov(F1,F2)+(0,8)Cov(F1,uFi)+(0,2)(0,7)Cov(F2,F1)+(0,2)(0,3)Var(F2)
+(0,2)Cov(F2,uFi)+(0,7)Cov(uMa,F1)+(0,3)Cov(uMa,F2)+Cov(uMa,uFi)=0,56+0,06=0,62
Cov(Fi,Qi)=Cov(0,7F1+0,3F2+uFi,0,6F1+0,3F2+uQi)=
=(0,7)(0,6)Var(F1)+(0,6)(0,3)Cov(F1,F2)+(0,7)Cov(F1,uQi)+(0,3)(0,6)Cov(F2,F1)+(0,3)(0,3)
Var(F2)+(0,3)Cov(F2,uQi)+(0,6)Cov(uFi,F1)+(0,3)Cov(uFi,F2)+Cov(uFi,uQi)=0,42+0,09=0,51
ANLISISDELAMATRIZDECORRELACIN
Unodelosrequisitosquedebencumplirseesquelasvariablesseencuentranaltamente
intercorrelacionadas.Tambinseesperaquelasvariablesquetengancorrelacinmuyaltaentresla
tenganconelmismofactorofactores.
Enconsecuencia,silascorrelacionesentretodaslasvariablessonbajas,talveznoseaapropiadoel
AnlisisFactorial.
Existenvariosindicadoresparaanalizarlamatrizdecorrelacin:
TestdeesfericidaddeBarlett
Contrasta,bajolahiptesisdenormalidadmultivariante,silamatrizdecorrelacindelaspvariables
observadas( Rp )eslaidentidad.
Siunamatrizdecorrelacineslaidentidadsignificaquelasintercorrelacionesentrelasvariablesson
cero.Siseconfirmalahiptesisnula H0 : Rp = 1 o Rp = I ,lasvariablesnoestnintercorrelacionadas.
EltestdeesfericidaddeBarlettseobtienemedianteunatransformacindeldeterminantedela
matrizdecorrelacin.Elestadsticodeltestvienedadopor:
1 (2p + 11) p
dR = n 1 (2p + 5) log R = n
6 6
j=1
log ( j )
dondeneselnmerodeindividuosdelamuestray j (j=1,...,p)sonlosvalorespropiosdeR.
SantiagodelaFuenteFernndez7
AnlisisFactorial
Bajolahiptesisnula,elestadsticosedistribuyeasintticamentesegnuna 2
p(p1) 2
Silahiptesisnulaescierta,losvalorespropiosvaldrnuno,osulogaritmosernuloy,portanto,el
estadsticodeltestvaldracero.
Porelcontrario,siconeltestdeBarlettseobtienenvaloresaltosde 2 ,oundeterminantebajo,
hayvariablesconcorrelacionesaltas(undeterminanteprximoaceroindicaqueunaoms
variablespodranserexpresadascomocombinacinlinealdeotrasvariables).
Endefinitiva,sielestadsticodeltesttomavaloresgrandes(oundeterminanteprximoacero)se
rechazalahiptesisnulaconciertogradodesignificacin.Encasodeaceptarselahiptesisnula,las
variablesnoestnintercorreladasydeberareconsiderarselaaplicacindeunAnlisisFactorial.
Medidasdeadecuacindelamuestra
Elcoeficientedecorrelacinparcialesunindicadordelgradoderelacionesentredosvariables,
eliminandolainfluenciadelresto.
Silasvariablescompartenfactorescomunes,elcoeficientedecorrelacinparcialentreparesde
variablesesbajo,puestoqueseeliminanlosefectoslinealesdelasotrasvariables.
Lascorrelacionesparcialessonestimacionesdelascorrelacionesentrelosfactoresnicos,debiendo
serprximasacerocuandoelAnlisisFactorialesadecuado,dadoquesesuponequelosfactores
nicosestnincorreladosentres.
Endefinitiva,siexisteunnmeroelevadodecoeficientesdecorrelacinparcialdistintosdecero,se
interpretaquelashiptesisdelmodelofactorialnosoncompatiblesconlosdatos.
UnamaneradecuantificarestehechoesconlaMediadeAdecuacindelaMuestraKMOpropuesta
porKaiserMeyerOlkin:
rij2
ji i j
KMO = 0 KMO 1
ij2 + rij2(p)
r
ji i j ji i j
ElndiceKMOseutilizaparacompararlasmagnitudesdeloscoeficientesdecorrelacinparcial,de
formaquecuntomspequeoseasuvalor,mayorserelvalordeloscoeficientesdecorrelacin
parciales rij (p) y,enconsecuencia,menosapropiadoesrealizarunAnlisisFactorial.
KMO0,75Bien
KaiserMeyerOlkinpararealizarunAnlisisFactorial,proponen: KMO0,5Aceptable
KMO<0,5Inaceptable
LaexperienciaprcticaaconsejaqueesprecipitadotomarelndiceKMOcomonicamedidade
adecuacindelamuestraalashiptesisdelmodelodeAnlisisFactorial,sobretodosihayun
nmeropequeodevariablesconsideradas.
SantiagodelaFuenteFernndez8
AnlisisFactorial
Paratomarladecisindeeliminarunavariabledelestudioesaconsejablecomplementarla
informacinconotrasfuentes:lascomunalidadesdecadavariable,losresiduosdelmodelo,e
interpretarlosfactoresobtenidos.
EXTRACCINDEFACTORES
ElobjetivodelAnlisisFactorial(AF)esdeterminarunnmeroreducidodefactoresquepuedan
representaralasvariablesoriginales.
UnavezquesehadeterminadoqueelAFesunatcnicaapropiadaparaanalizarlosdatos,hayque
seleccionarelmtodoadecuadoparalaextraccindefactores.Existendiversosmtodos,cadauno
deellosconsusventajaseinconvenientes.
Rp = A A' +
Enestesentido,surgendosproblemas:
(a) ProblemasdeGradosdeLibertad.IgualandocadaelementodelamatrizRpconel
correspondientedelacombinacinlineal (A A' + ) ,resultan(pxp)ecuaciones,queesel
nmerodeelementosdeR.
p (p + 1)
Ahorabien,lamatrizRpessimtricay,enconsecuencia,estintegradapor elementos
2
distintos,queeselnmerorealdeecuaciones.Enelsegundomiembrodelaigualdad,los
parmetrosaestimarcon(pxk)elementosdelamatrizAylospelementosdelamatriz.
Enconsecuencia,paraquepuedaefectuarseelprocesodeestimacinserequierequeelnmero
p (p + 1)
deecuacionesseamayoroigualqueelnmerodeparmetrosaestimar: p (k + 1) ,olo
2
p 1
queesequivalente, k .
2
(b) NoUnicidaddelaSolucin.LassolucionesdadasporlamatrizAnosonnicas,puestoque
cualquiertransformacinortogonaldeAestambinsolucin.
Enconsecuencia,siTesunamatrizortogonal A = A T essolucin
SantiagodelaFuenteFernndez9
AnlisisFactorial
Sedefine F = F T (F*eselvectorFrotadoporlamatrizortogonalT).
SeverificaqueXyRpverificantambinlasecuacionesdelmodelo,esdecir:
Portanto,elmodeloesnicosalvorotacionesortogonales,esdecir,sepuedenrealizarrotaciones
delamatrizdelasponderacionesocargasfactorialessinalterarelmodelo.
Ejemplo.Enelmodelofactorialdefinidoanteriormente,setena:
' 1 1
F1 = 2 F1 + 2 F2 1 2 1 2
Sisedefinenlosfactores: ,siendolamatrizortogonal T =
F2' =
1
F1 +
1
F2 1 2 1 2
2 2
1 ' 1 '
F' 1 2 1 2 F1 1 2 1 2 F1' F1 F1 = F1 F2
1' = =
2 2
F 1 2 1
2 2 F2 1
2 1 2 F2' F2 F2 =
1 '
F1 +
1 '
F2
2 2
dedonde,
In = 0,71 F1' + 0,42 F2' + UIn Hi = 0,69 F1' + 0,47 F2' + UHi Di = 0,78 F1' + 0,42 F2' + UDi
verificndoseque Cov(F1' , F2' ) = 0 ,porloquelasnuevascargasfactorialessernlascorrelacionesde
losnuevosfactoresconlasvariablesoriginales.
Lascomunalidades,especificidadesymatricesdecorrelacinpermanecenigual.
SantiagodelaFuenteFernndez10
AnlisisFactorial
0,71 0,42
0,71 0,28
0,64 0,21
Lanuevamatrizdecargasfactorialesser: B =
0,71 0,42
0,69 0,47
0,78 0,42
LaformadecalcularlamatrizderotacinTyladenuevacargasfactorialesBdalugaralosdistintos
mtodosderotacinortogonales,siendolosmtodosmsutilizados:Varimax,Quartimaxy
Equamax.
MTODOSDEEXTRACCINDEFACTORES
Existendiferentesmtodosparaobtenerlosfactorescomunes,losimplantadosenSPSSson:
MtododelasComponentesPrincipales,MtododelosEjesprincipalesyMtododeMxima
Verosimilitud.
MtododelasComponentesPrincipales.Consisteenestimarlaspuntuacionesfactoriales
mediantelaspuntuacionestipificadasdelasprimeraskcomponentesylamatrizdecargas
factorialesmediantelascorrelacionesdelasvariablesoriginalescondichascomponentes.
Estemtodotienelaventajadequesiempreproporcionaunasolucin.
TieneelinconvenientedequealnoestarbasadoenelmodelodeAnlisisFactorialpuedellevara
estimadoresmuysesgadosdelamatrizdecargasfactoriales,especialmente,siexistenvariables
conComunalidadesbajas.
SantiagodelaFuenteFernndez11
AnlisisFactorial
MtododelaMximaVerosimilitud.Basadoenelmodelox=Af+uX=FA'+U,
adoptandolahiptesisdenormalidadmultivariante,aplicaelmtododelamxima
verosimilitud.
Sobrelosanteriores,tienelaventajadequelasestimacionesobtenidasnodependendela
escalademedidadelasvariables.
Porotraparte,comoestbasadoenelmtododemximaverosimilitud,tienetodaslas
propiedadesestadsticasdestey,enparticular,esasintticamenteinsesgada,eficientey
normalsilashiptesisdelmodelofactorialsonciertas.
Adems,permiteseleccionarelnmerodefactoresmediantecontrastesdehiptesis.
EstemtodotambinpuedeserutilizadoenelAnlisisFactorialConfirmatorio,dondeel
investigadorpuedeplantearhiptesiscomoquealgunascargasfactorialessonnulas,que
algunosfactoresestncorrelacionadoscondeterminadosfactores,etc.,yaplicartests
estadsticosparadeterminarsilosdatosconfirmanlasrestriccionesasumidas.
Elprincipalinconvenientedelmtodoradicaenque,alrealizarselaoptimizacindelafuncin
deverosimilitudpormtodositerativos,silasvariablesoriginalesnosonnormales,puedehaber
problemasdeconvergenciasobretodoenmuestrasfinitas.
MtodoMnimoscuadradosnoponderados.Paraunnmerofijodefactores,generauna
matrizdecoeficientesqueminimizalasumadelasdiferenciasalcuadradoentrelasmatricesde
~=A
correlacinobservadaRyreproducida R ~A~ ' ,eliminandoenlasdiferenciasloselementosde
ladiagonal.
MtodoMnimoscuadradosgeneralizados.MinimizaelmismocriterioLasumadelas
~=A
diferenciasalcuadradoentrelasmatricesdecorrelacinobservadaRyreproducida R ~A~ '
ponderandolascorrelacionesinversamenteporlavarianzadelfactorespecfico.Estemtodo
permite,adems,aplicarcontrastedehiptesisparadeterminarelnmerodefactores.
MtododeFactorizacinporimgenes.Consisteenaplicarelmtododecomponentes
~ obtenidaapartirdelaspartespredichasdelas
principalesalamatrizdecorrelacionesR
diversasregresioneslinealesdecadaunadelasvariablessobrelasdems(dichaparterecibeel
nombredeimagendelavariable).
MtodoAlfa.MaximizaelalfadeCronbachparalosfactores.
ComparacinentredistintosMtodos
o Cuandolascomunalidadessonaltas(>0,6)todoslosprocedimientostienenadarlamisma
solucin.
SantiagodelaFuenteFernndez12
AnlisisFactorial
o Cuandolascomunalidadessonbajasparaalgunasdelasvariables,elmtodode
componentesprincipalestiendeadarsolucionesmuydiferentesdelrestodelosmtodos,
concargasfactorialesmayores.
o Sielnmerodevariablesesalto(>30),lasestimacionesdelacomunalidadtienenmenos
influenciaenlasolucinobtenidaytodoslosmtodostiendenaofrecerelmismoresultado.
o Sielnmerodevariablesesbajo,tododependedelmtodoutilizadoparaestimarlas
comunalidadesydesistassonaltasmsquedelmtodoutilizadoparaestimarlas.
o Esmsrobustoutilizarunmtodoparaelmodelodefactorescomunes.Elnicoproblema
puedeserlafaltadeconvergenciadelmtodoutilizado.
DETERMINARELNMERODEFACTORES
Lamatrizfactorialpuederepresentarunnmerodefactoressuperioralnecesarioparaexplicarla
estructuradelosdatosoriginales.Generalmente,hayunconjuntopequeodefactores,los
primeros,quecontienencasitodalainformacin.Elrestodefactoressuelencontribuir
relativamentepoco.
Unodelosproblemasconsisteendeterminarelnmerodefactoresqueconvieneconservar,pues
setratadecumplirelprincipiodeparsimonia.
Existendiversasreglasycriteriosparadeterminarelnmerodefactoresaconservar,algunosdelos
msutilizadosson:
(a) Determinacinapriori.Eselcriteriomsfiablesilosdatosylasvariablesestnbienelegidos
yelinvestigadorconocelasituacin,loidealesplantearelAnlisisFactorialconunaideaprevia
decuntosfactoreshayyculesson.
(b) RegladeKaiser.CalculalosvalorespropiosdelamatrizdecorrelacionesRytomacomo
nmerodefactoreselnmerodevalorespropiossuperioresalaunidad.
EstecriterioesunaalusindelAnlisisdeComponentesPrincipalesysehaverificadoen
simulacionesque,generalmente,tiendeainfraestimarelnmerodefactoresporloquese
recomiendasuusoparaestablecerunlmiteinferior.Unlmitesuperiorsecalcularaaplicando
estemismocriteriotomandocomolmite0,7.
(c) Criteriodelporcentajedelavarianza.EsunaalusindelAnlisisdeComponentesPrincipalesy
consisteentomarcomonmerodefactoreselnmeromnimonecesarioparaqueelporcentaje
acumuladodelavarianzaexplicadoalcanceunnivelsatisfactorio(75%,80%).
Tienelaventajadequesepuedeaplicartambincuandolamatrizanalizadaesladevarianzasy
covarianzas,peronotieneningunajustificacintericaoprctica.
(d) CriteriodeSedimentacin.Setratadelarepresentacingrficadondelosfactoresestnenel
ejedeabscisasylosvalorespropioseneldeordenadas.
Losfactoresconvarianzasaltassuelendiferenciarsedelosfactoresconvarianzasbajas.Se
puedenconservarlosfactoressituadosantesdeestepuntodeinflexin.
Ensimulacioneselcriteriohafuncionadobien,tieneelinconvenientedequedependedelojo
SantiagodelaFuenteFernndez13
AnlisisFactorial
delanalista.
(e) Criteriodedivisinalamitad.Lamuestrasedivideendospartesigualestomadasalazaryse
realizaelAnlisisFactorialencadaunadeellas.
Soloseconservanlosfactoresquetienenaltacorrespondenciadecargasdefactoresenlasdos
muestras.Antesdeaplicarlo,convienecomprobarquenoexistendiferenciassignificativasentre
lasdosmuestrasenloqueserefierealasvariablesestudiadas.
PRUEBASDESIGNIFICACIN
Paraseleccionarelnmero,consisteenaplicarcontrastesdehiptesisdemodelosanidados.Este
criteriosepuedeutilizarsielmtodoempleadoparaestimarlosfactoreseseldemxima
verosimilitud.
Enlamayorpartedeloscasoexploratoriosknopuedeserespecificadoporadelantadoy,en
consecuencia,seutilizanprocedimientossecuencialesparadeterminark.
Secomienzausualmenteconk=1(valorpequeo),losparmetrosenelmodelofactorialson
estimadosutilizandoelmtododemximaverosimilitud.Sielestadsticodeltestnoessignificativo,
seaceptaelmodeloconestenmerodefactores,encasocontrario,seaumentak=2yserepiteel
procesohastaalcanzarunasolucinaceptable.
Elprincipalinconvenientedeestemtodoesqueestbasadoenresultadosasintticosyque,siel
tamaodelamuestraesgrande,secorreelriesgodetomarelvalorkexcesivamentegrande
puestoqueeltestdetectacualquierfactorporpequeoqueseasupoderexplicativo.
INTERPRETACINDELOSFACTORES
Lainterpretacindelosfactoressebasaenlascorrelacionesestimadasdelosmismosconlas
variablesoriginales.
ElmodelodeAnlisisFactorialescierto,siseverifica:
k
Corre(Xi , Fl ) = Cov(Xi , Fl ) = aij Cov(Fj , Fl ) i = 1, L , p ; l = 1, L , k
j=1
y,enparticular,silosfactoressonortogonales
Corre(Xi , Fl ) = ail i = 1, L , p ; l = 1, L , k
Comoseobserva,lamatrizdecargasfactoriales(A)tieneunpapelfundamentalenlainterpretacin.
Porotraparte,lascargasfactorialesalcuadrado (a2il ) indicansilosfactoressonortogonales,qu
porcentajedelavariableoriginal(Xi)esexplicadoporelfactorFl.
Aefectosprcticos,enlainterpretacindelosfactores,sealar:
Identificarlasvariablescuyascorrelacionesconelfactorsonlasmselevadasenvalorabsoluto.
SantiagodelaFuenteFernndez14
AnlisisFactorial
Intentardarunnombrealosfactores.Elnombreseasignadeacuerdoconlaestructuradelas
correlaciones:Cuandoespositiva(resp.negativa)larelacinentreelfactorydichavariablees
directa(resp.inversa).
Analizandoconquvariablestieneunarelacinfuerteesposible,enmuchoscasos,teneruna
ideamsomenosclaradeculeselsignificadodeunfactor.
Unaayudaenlainterpretacindelosfactorespuedeserlarepresentacingrficadelos
resultadosobtenidos.Larepresentacinsehacetomandolosfactoresdosados.Cadafactor
representaunjedecoordenadas.Aestosejesselesdenominaejesfactoriales.
Sobrelosejesfactorialesseproyectanlasvariablesoriginales.
Lascoordenadasvienendadasporlosrespectivoscoeficientesdecorrelacinentrelavariabley
elfactor,deformaquelasvariablessaturadasenunmismofactoraparecenagrupadas.Esto
puedeservirdeayudaparadescubrirlaestructuralatentedeestefactor.
Lasvariablesalfinaldeunejesonaquellasquetienencorrelacionesaltassloenesefactory,
enconsecuencia,lodescriben.
Lasvariablescercadelorigentienencorrelacionesreducidasenambosfactores.
Lasvariablesquenoestncercadeningunodelosejesserelacionanconambosfactores.
Ordenarlamatrizfactorialdeformaquelasvariablesconcargasaltasparaelmismofactor
aparezcanjuntas.
Eliminarlascargasfactorialesbajasydeestemodosuprimirinformacinredundante.El
investigadordecideapartirdequvalordebeneliminarselascargasfactoriales.
Decaraaunamayorfacilidadinterpretativa,elinvestigadorpuedeordenarlamatrizfactorialy
eliminarlascargasfactorialesbajas.
Generalmente,setomacomosignificativaslascargassuperioresa0,5envalorabsoluto.Aunque,
sielfactoresmstardooelnmerodevariablesesgrande,seelevaelvalormnimodelacarga
factorialsignificativa.
Ejemplo.Enelmodelofactorialdefinido,setena:
matriz carg as
factoriales
64 4744 8
Ma 0,8 0,2 UMa
Fi 0,7 0,3 UFi
Qu 0,6 0,3 F U Ma = 0,8 F1 + 0,2F2 + UMa In = 0,2F1 + 0,8 F2 + UIn
= + Fi = 0,7F1 + 0,3F2 + UFi Hi = 0,15F1 + 0,82F2 + UIn
1 Qu
Corr(Ma, F1 ) = Cov(Ma, F1 ) = Cov(0,8 F1 + 0,2F2 + UMa ) = 0,8 Var(F1 ) + 0,2 Cov(F2 , F1 ) + Cov(UMa , F1 ) = 0,8
Engeneral,como F1 F2 Lascorrelacionesdelascalificacionesdelostestcondichosfactores
vendrndadasporlascargasfactoriales.
SantiagodelaFuenteFernndez15
AnlisisFactorial
Observandolamatrizdelascargasfactoriales,seapreciaqueelfactor F1 estmuyrelacionadocon
lavariablesMa,FiyQu,peropocorelacionadoconIn,HiyDi.Deotraparte,elfactor F2 estmuy
relacionadoconIn,HiyDiypococonlasrestantes.
0,71 0,42
Seobservaqueelfactor F1' estmuyrelacionadocontodaslasvariablesde
formadirectay,enconsecuencia,podrainterpretarsecomounfactorde 0,71 0,28
0,64 0,21
inteligenciageneral.
B=
0,71 0,42
Porsuparte,elfactor F2' destacaenlaaptitudverbal,alestarrelacionado 0,69 0,47
deformainversaconMa,FiyQu. 0,78 0,42
CabepreguntarseCuleslainterpretacinmscorrecta?.Tododependerdelateoraquesubyace
alproblemaquellevaralanalistaahacermshincapienunainterpretacinuotra.Decualquier
modo,tendrquevalidarelmodeloelegido.
ROTACINDELOSFACTORES
Lamatrizdecargasfactorialestieneunpapelimportanteparainterpretarelsignificadodelos
factores.Cuandolosfactoressonortogonalescuantificanelgradoytipodelarelacinentrestosy
lasvariablesoriginales.
Enlaprctica,losmtodosdeextraccindefactorespuedennoproporcionarmatricesdecargas
factorialesadecuadasparalainterpretacin.
ParaacometeresteproblemaestnlosprocedimientosdeRotacindeFactoresque,apartirdela
solucininicial,buscanfactorescuyamatrizdecargasfactorialesloshaganmsfcilmente
interpretables.
EstosmtodosintentanaproximarlasolucinobtenidaalPrincipiodeEstructuraSimple(LouisLeon
Thurstone,1935),segnelcuallamatrizdecargasfactorialesdebereunirtrescaractersticas:
1. Cadafactordebetenerunospocospesosaltosylosdemsprximosacero.
2. Cadavariablenodebeestarsaturadamsqueenunfactor.
3. Nodebenexistirfactoresconlamismadistribucin,estoes,dosfactoresdistintosdeben
presentardistribucionesdiferentesdecargasaltasybajas.
Deestamanera,dadoquehaymsvariablesquefactorescomunes,cadafactortendruna
correlacinaltaconungrupodevariablesybajaconelrestodelasvariables.
Alexaminarlascaractersticasdelasvariablesdeungrupoasociadoaundeterminadofactorse
puedenencontrarrasgoscomunesquepermitanidentificarelfactorydarleunadenominacinque
respondaaesosrasgoscomunes.
Siseconsigueidentificarclaramenteestosrasgos,ademsdereducirladimensindelproblema,
tambinsedesvelalanaturalezadelasinterrelacionesexistentesentrelasvariablesoriginales.
SantiagodelaFuenteFernndez16
AnlisisFactorial
Rotacin Ortogonal
ExistendosformasbsicasderealizarlaRotacindeFactores:
Rotacin Oblicua
Seeligeunouotroprocedimientosegnquelosfactoresrotadossigansiendoortogonalesono.
Sealarqueenambasrotacioneslacomunalidaddecadavariablenosemodifica,estoes,larotacin
noafectaalabondaddelajustedelasolucinfactorial:aunquecambielamatrizfactorial,las
especificidadesnocambiany,enconsecuencia,lascomunidadespermaneceninvariantes.Sin
embargo,cambialavarianzaexplicadaporcadafactor,portanto,losnuevosfactoresnoestn
ordenadosdeacuerdoconlainformacinquecontienen,cuantificadamediantesuvarianza.
RotacinOrtogonal.Losejesserotandeformaquequedepreservadalaincorrelacinentrelos
factores.Esdecir,losnuevosejes(ejesrotados)sonperpendicularesdeigualformaqueloson
losfactoressinrotar.
Larotacinseapoyaenelproblemadefaltadeidentificabilidaddelosfactoresobtenidospor
rotacionesortogonales,deformaquesiTesunamatrizortogonalcon T T' = T' T = I ,entonces:
LamatrizGgeomtricamenteesunarotacindeF,verificandolasmismashiptesisquesta.
Realmenteloqueserealizaesungirodeejes,deformaquecambianlascargasfactorialesylos
factores.
SetratadebuscarunamatrizTtalquelanuevamatrizdecargasfactorialesBtengamuchos
valoresnulosocasinulos,yunospocosvalorescercanosalaunidaddeacuerdoconelprincipio
deestructurasimple.
Losmtodosempleadosenlarotacinortogonaldefactoresson:Varimax,Quartimax,Equamax,
ObliminyPromax.
MtodoVarimax.Esunmtododerotacinqueminimizaelnmerodevariablesconcargas
altasenunfactor,mejorandoaslainterpretacindefactores.
Elmtodoconsideraque,siselograaumentarlavarianzadelascargasfactorialesalcuadradode
cadafactorconsiguiendoquealgunasdesuscargasfactorialestiendanaacercarsea1mientras
queotrasseaproximana0,seobtieneunapertenenciamsclaraeinteligibledecadavariableal
factor.
Losnuevosejesseobtienenmaximizandolasumaparaloskfactoresretenidosdelasvarianzas
delascargasfactorialesalcuadradodentrodecadafactor.
Paraevitarquelasvariablesconmayorescomunalidadestenganmspesoenlasolucinfinal,se
efectalanormalizacindeKaiser(dividiendocadacargafactorialalcuadradoporla
comunalidaddelavariablecorrespondiente).
SantiagodelaFuenteFernndez17
AnlisisFactorial
Enconsecuencia,elmtodoVarimaxdeterminalaMatrizBdeformaquemaximicelasumadelas
varianzas:
2 2
kb pk p b2
V = p ij 2ij
i=1 j=1 h
i=1 j=1 h j j
MtodoQuartimax.Elobjetivoesquecadavariabletengacorrelacioneselevadasconun
pequeonmerodefactores.Paraello,maximizalavarianzadelascargasfactorialesalcuadrado
decadavariableenlosfactores,esdecir,setratademaximizarlafuncin:
S = k (b b )
p p
1 k 2
2
ij
2
i donde , b2i = bij
k j=1
i=1 j=1
Conello,selograquecadavariableconcentresupertenenciaenundeterminadofactor,estoes,
presenteunacargafactorialaltamientrasque,enlosdemsfactores,suscargasfactoriales
tiendenaserbajas.
Deestemodo,lainterpretacinganaenclaridadporcuantolacomunalidadtotaldecadavariable
permanececonstante,quedandomsevidentehaciaqufactorseinclinaconmsfuerzacada
variable.
Elmtodosermsclarificador,cuantomayornmerodefactoressehayancalculado.Este
mtodotiendeaproducirunprimerfactorgeneral,conocidoconelnombredetamao,yel
restodefactorespresentanponderacionesmenoresquelasdadasporelmtodoVarimax.
MtodoEquamax.Tratademaximizarlamediadeloscriteriosanteriores.Conun
comportamientosimilaraldelosmtodosanteriores.
Rotacinoblicua.EnestecasolamatrizTderotacinnotienequeserortogonal(cuando
unamatrizmultiplicadaporsutranspuestaeslamatrizidentidad T T' = I )sinonicamenteno
singular(matrizcuadradocuyodeterminantenoescero)
Deestamanera,losfactoresrotadosnotienenporquserortogonalesytener,portanto,
correlacionesdistintasdeceroentres.
Larotacinoblicuapuedeutilizarsecuandoesprobablequelosfactoresenlapoblacin
tenganunacorrelacinmuyfuerte.
Esnecesarioirconmuchaatencinenlainterpretacindelasrotacionesoblicuas,puesla
superposicindefactorespuedeconfundirlasignificacindelosmismos.
Deestaforma,elanlisisganamsflexibilidadyrealismoperoariesgodeperderrobustez,porlo
queconvieneaplicarestosmtodossielnmerodeobservacionesporfactoreselevada.
SantiagodelaFuenteFernndez18
AnlisisFactorial
Ejemplo.Enelmodelofactorialdefinido,setena:
matriz carg as
factoriales
64 4744 8
Ma 0,8 0,2 UMa
Fi 0,7 0,3 UFi
Qu 0,6 0,3 F U Ma = 0,8 F1 + 0,2F2 + UMa In = 0,2F1 + 0,8 F2 + UIn
= + Fi = 0,7F1 + 0,3F2 + UFi Hi = 0,15F1 + 0,82F2 + UIn
1 Qu
'' 4 1
F = F1 + F2
1 17 F1 = 4 17 F1
'' 17 1
Sisedefinenlosfactores: 17
F2'' =
1
F1 +
4
F2
F'' 1
2 17 4 17 F2
17 17
8
Corr(F1'' , F2'' ) = = 0,47 0 a Losnuevosfactoresestarncorrelacionados.
17
4 17 '' 17 ''
F1'' 4 17 1 17 F1
15 4 17 1 17 F1 F1
'' F1 = F1 F2
= = 15 15
F'' 1
2 17 4 17 F2 17 1 17 4 17 F2'' F2 F = 17 F'' + 4 17 F''
2 15
1
15
2
dedonde,
yassucesivamente.
4 17 17
15 4 17 1 17 15 15
Enestecaso,setienequelamatrizderotacin: T = =
17 1 17 4 17 17 4 17
15 15
matriz de c arg as
factoriales
6447448
0,82 0,00
0,69 0,14
0,58 0,17
Lamatrizdeconfiguracin: B =
0,00 0,82
0,06 0,86
0,04 0,87
SantiagodelaFuenteFernndez19
AnlisisFactorial
Lamatrizdelaestructuraseraquellaquecontienelascorrelacionesdelasvariablesoriginalescon
losnuevosfactores:
matriz estructura
64 4744 8
0,82 0,00 0,82 0,39
0,69 0,14 0,76 0,46
0,58 0,17 1 8 / 17 0,66 0,44
=
0,00 0,82 8 / 17 1 0,39 0,82
0,06 0,86 0,34 0,83
0,04 0,87 0,45 0,89
k
p p
MtodoOblimin.Buscaminimizarlaexpresin: b2is b2iq + (1 ) (b2is bs2 )(b2is bs2 )
s<q=1 i=1 i=1
k p
b2is b2iq controlalainterpretabilidaddelosfactores
s<q=1 i=1
k p
(b2is bs2 )(b2is bs2 ) controlalaortogonalidaddelosfactores
s<q=1 i=1
o Para = 1 sealcanzaelmximogradodeoblicuidad.
o Cuntomsseaproximaa0,msortogonalessonlosfactores.
Enlarotacinoblicua,comolosfactoresestncorrelacionadosentres,lascargasfactorialesno
coincidenconlascorrelacionesentreelfactorylavariable.
Porrestemotivo,lospaquetesestadsticoscalculandosmatrices:
Lamatrizdecargasfactorialesquemuestralacontribucinnicadecadavariablealfactor.
Lamatrizdeestructurafactorialquemuestralascorrelacionesentrelosfactoresylas
variables,mostrandoinformacinacercadelacontribucinnicaydelascorrelacionesentre
factores.
Ademsdeestasdosmatrices,convieneanalizarlamatrizdecorrelacionesentrefactores.
SantiagodelaFuenteFernndez20
AnlisisFactorial
Silascorrelacionesentrelosfactoressonmuypequeasesmsrobustoaplicarrotaciones
ortogonales.
Deotraparte,sidosfactoresestnmuycorrelacionadospuedeserporqueestnmidiendoelmismo
conceptoyque,portanto,hayaquereducirelnmerodefactores.
MtodoPromax.Alteralosresultadosdeunarotacinortogonalhastacrearunasolucincon
cargasfactorialeslomsprximasalaestructuraideal.
Laestructuraidealseobtieneelevandoaunapotencia(entre2y4)lascargasfactoriales
obtenidasenunarotacinortogonal.Cuantomayorsealapotencia,msoblicuaeslasolucin
obtenida.
SeaHlamatrizdecargasbuscadaporelmtodoPromax,buscaunamatrizTtalque A T = H .
CLCULODEPUNTUACIONESFACTORIALES
Habiendodeterminadolosfactoresrotados,secalculalasmatricesdepuntuacionesfactorialesF.
Sonvariadaslasposibilidadesdeanalizarlaspuntuacionesfactorialesdelossujetos:
Conocerqusujetossonlosmsrarosoextremos,esdecir,larepresentacingrficadelas
puntuacionesfactorialesparacadapardeejesfactorialesfacilitadetectarcasosatpicos.
Conocerdndeseubicanciertosgrupososubcolectivosdelamuestra(ejemplo;clasealtafrente
aclasebaja,unaprovinciafrentealasotrasprovincias,jvenesfrenteamayores,etc.)
Conocerenqufactorsobresalenunossujetosynqufactorno.
Explicar,atendiendolasinformacionesanteriores,porquhanaparecidodichosfactoresenel
anlisisfactorialrealizado.
Esnecesarioconocerlosvaloresquetomanlosfactoresencadaobservacin,puesenocasiones,el
AnlisisFactorialesunpasoprevioaotrosanlisis:RegresinMltipleoAnlisisCluster,enlosque
sustituyeelconjuntodevariablesoriginalesporlosfactoresobtenidos.
MtodosdelClculodelasPuntuaciones.ExistendiversosmtodosdeestimacindelamatrizF,
laspropiedadesdeseablesqueverificasenlosfactoresestimadosson:
Cadafactorestimadopresenteunacorrelacinaltaconelverdaderofactor.
Cadafactorestimadotengacorrelacinnulaconlosdemsfactoresverdaderos.
Losfactoresestimadossonincorreladosdosados(mutuamenteortogonalessisonortogonales).
SantiagodelaFuenteFernndez21
AnlisisFactorial
Losfactoresestimadosseanestimadoresinsesgadosdelosverdaderosfactores.
Sealarqueelproblemadeestimacinescomplejoporlapropianaturalezadelosfactores
comunes.Sepuededemostrarquelosfactoresnoson,engeneral,combinacinlinealdelas
variablesoriginales.
Porotraparte,enlamayoradelassituaciones,noexistirunasolucinexactanisiquierasernica.
Losmtodosdeestimacinmsutilizados:Regresin,Barlett,AndersonRubin
MtododeBarlett.Utilizaelmtododelosmnimoscuadradosgeneralizadosestimandolas
puntuacionesfactorialesmediante: F = (A' 1 A)1 A' 1 X
MtododeAndersonRubin.EstimaFmedianteelmtododelosmnimoscuadrados
generalizados,imponiendolacondicin F'F = I
Anlisisdelostresmtodos:
ElMtododeRegresindalugarapuntuacionesconmximacorrelacinconlaspuntuaciones
tericas.Sinembargo,elestimadornoesinsesgado,niunvocoy,encasodequelosfactores
seanortogonales,puededarlugarapuntuacionescorreladas.
ElMtododeBarlettdalugarapuntuacionescorreladasconlaspuntuacionestericas,insesgadas
yunvocas.Sinembargo,encasodequelosfactoresseanortogonales,puededarlugara
puntuacionescorreladas.
ElMtododeAndersonRubindalugarapuntuacionesortogonalesqueestncorreladasconlas
puntuacionestericas.Sinembargo,elestimadornoesinsesgadoniunvoco.
SeleccindeVariables.Elinvestigadorenocasionesdeseaseleccionarlasvariablesms
representativasdelosfactores,enlugardecalcularsuspuntuaciones.
Porejemplo,siseutilizaelAnlisisFactorialparareducirelnmerodedatos,porrazonesde
economa,sisequierenaplicarlosresultadosobtenidosaobjetosdiferentesdelosestudiadosenel
anlisis,esmsinteresanteseleccionaralgunasdelasvariablesoriginalmentemedidasdadala
dificultaddelclculodelaspuntuacionesfactorialesparalasquesenecesitaramedirtodaslas
variablesutilizadasenelestudio.
SantiagodelaFuenteFernndez22
AnlisisFactorial
Unaformadellevaracabolaseleccindevariablesesestudiarlamatrizdecorrelacionesdelas
variablesconlosfactores,seleccionandocomorepresentantedecadafactorlavariableconla
correlacinmselevadaenste,queseamsfcildemediryquetengamssentidodesdeunpunto
devistaterico.
Encualquiercaso,convieneelegirlasvariablesdeformaqueunamismavariablenoseutilicepara
medirdosfactoresdistintos.
Unavezelegidaslasvariables,selesasignapesosbasadosensucorrelacinconelfactor,yse
compruebasuvalidezestimandosucorrelacinconlosfactoresquedeseaestimarmediantela
frmula Rfs = A' W diag(Rss ) donde Rss eslamatrizdecorrelacionesdelaspuntuacionesestimadas.
VALIDACINDELMODELO.ElltimopasoenelAnlisisFactorialesestudiarlavalidezdelmodelo.
Elprocesodeberealizarseendosdirecciones:AnalizandolabondaddeajusteylaGeneralidaddelos
resultados.
BondaddeAjuste.UnasuposicinbsicasubyacentealAnlisisFactorialesquelacorrelacin
observadaentrelasvariablespuedeatribuirseafactorescomunes.
Porconsiguiente,lascorrelacionesentrevariablespuedendeducirseoreproducirseapartirdelas
correlacionesestimadasentrelasvariablesylosfactores.
Afindedeterminarelajustedelmodelo,puedenestudiarselasdiferencias(residuos)entrelas
correlacionesobservadas(matrizdecorrelacindeentrada)ylascorrelacionesreproducidas(como
seestimanapartirdelamatrizfactorial).
Elmodelofactorialesadecuadocuandolosresiduossonpequeos.
Sihayunporcentajeelevadoderesiduossuperioresaunacantidadpequeaprefijada(por
ejemplo,0,05),serunaindicacindequeelmodelofactorialestimadonoseajustaalosdatos.
Sesabeademsquehaymsestabilidadenlosresultadossielnmerodecasosporvariablees
alto.
Generalidaddelosresultados.Esconvenienterefrendarlosresultadosdelprimeranlisisfactorial
realizandonuevosanlisisfactorialessobrenuevasmuestrasextradasdelapoblacinobjetode
estudioy,encasodenoserposible,sobresubmuestrasdelamuestraoriginal.
Encadacasohabrqueestudiarqufactoresdeloscalculadossoncorroboradosenlosdistintos
anlisisllevadosacabo.
Otraposibilidadesrealizarnuevosanlisisfactorialesmodificandolasvariablesconsideradas,bien
seaeliminandoaquellasvariablesquenotienenrelacinconningnfactoroeliminandolas
variablesconrelacionesmsfuertestratandodedescubrircmosecomportaelrestodeellassin
supresencia.
Otrodelosprocedimientosmetodolgicosyestadsticosquecomplementanyprofundizanlas
interpretacionesquesededucendelanlisisfactorialconsisteenlarealizacindeotrosanlisis
factorialesenbase,noalconjuntototaldelamuestraopoblacin,sinoreferidoasubcolectivoso
gruposqueestnpresentesenlamuestrayquepuedenformarseutilizandolascategorasdelas
SantiagodelaFuenteFernndez23
AnlisisFactorial
variablesprimarias(sexo,clasesocial,tipodecentro,tipodemetodologapedaggica,tiposde
actitud,etc.).
Loquesedesprendedelostrabajoseinvestigacionesquehanutilizadoesteprocedimientoesque
generalmentelainterpretacinquesedayqueesvlidaparaelconjuntototaldesujetosdebe
modificarse,enalgunoscasossustancialmente,cuandoserefiereaesossubcolectivos.Encasode
seras,sederivaunadobleconclusin:
(a) LasvariablessecomportanenelAnlisisFactorialdedistintaformasegndequmuestra
setrate.
(b) Noexisteelsujetotiposinoqueexistendiferentestiposdesujetosenlamuestraglobal.
Finalmente,sedeberaplantearunAnlisisFactorialConfirmatorioparacomprobarlosresultados
obtenidosenlaversindeAnlisisFactorialExploratorio.
Resumen.ElAnlisisFactorialesunatcnicaestadsticamultivariantecuyafinalidadesanalizarlas
relacionesdeinterdependenciaexistentesentreunconjuntodevariables,calculandounconjuntode
variableslatentes,denominadasfactores,queexplicanconunnmeromenordedimensiones,
dichasrelaciones.
Porestemotivo,elAnlisisFactorialesunatcnicadereduccindedatosconunnmeromenorde
variablessindistorsionardichainformacin,loqueaumentaelgradodemanejoeinterpretacinde
lamisma.
SantiagodelaFuenteFernndez24
AnlisisFactorial
Ejemplo.Losdatosadjuntoscorrespondenalamedicinde17humedalesendeterminadapoca
delao.Lasvariablesmedidashansido:
1. X1:Conductividadelctrica
6.X6:Contenidoenmagnesio
2. X2:Contenidoenbicarbonatos
7.X7:Contenidoensodio
3. X3:Contenidoencloruros
8.X8:Contenidoenpotasio
4. X4:Contenidoensulfatos
9.X9:Contenidoenfosfatos
5. X5:Contenidoencalcio
Humedal X1 X2 X3 X4 X5 X6 X7 X8 X9
Caja 0,315 1,6694 5 86 55 4 4 2 1,8082
Camuas 8 3,7282 2388 7638 2123 972 1757 5 0,3228
Capacete 3,41 4,0642 732 881 218 122 379 41 74,588
Cerero 3,94 1,4585 1359 772 251 96 710 14 0,0968
Chica 2,8 4,4862 220 2510 572 20 458 7 0,0968
Dulce 1,56 2,4745 269 495 157 38 162 9 0,3228
FPSalinas 11 1,2206 3038 923 233 226 1488 11 0,0645
FPVicaria 8,75 2,6384 4325 456 234 229 2371 11 1,1947
Grande 2,6 3,3251 840 2270 609 86 284 7 0,5166
Gualdal.May 6,37 2,5483 2320 1040 1294 192 485 23 0,4843
Hoyos1 1,18 5,1966 13 499 202 20 5 18 6,7807
Lobn 0,57 1,7494 110 42 21 12 60 6 0,5812
Marcela 3,4 2,1189 1121 866 157 115 643 4 0,7426
Ratosa 3,48 1,7207 1484 554 151 151 708 7 0,1291
Redonda 4,62 1,0357 472 2964 752 160 652 34 0,1291
Salada 3,8 0,8685 1023 2274 1946 360 430 23 0,5489
Viso 0,3 1,8567 7 15 39 3 4 2 4,4882
Lasvariablesestnmedidasendistintasunidades,teniendoquetipificarensumomento
PararealizarenSPSSelAnlisisFactorialporelmtododeComponentesPrincipales:
[Analizar/ReduccindeDatos/AnlisisFactorial]
SantiagodelaFuenteFernndez
25
AnlisisFactorial
Enelbotn[Extraccin]sepuedecambiarlaopcindemtododeseado,SPSSrealizapordefectoel
mtododeComponentesprincipales.Losmtodosdisponiblesson:Componentesprincipales,
Mnimoscuadradosnoponderados,Mnimoscuadradosgeneralizados,Mximaverosimilitud,
FactorizacindeEjesprincipales,FactorizacinAlfayFactorizacinImagen.
Loprimeroqueserealizaesdeterminarla
estructurafactorialnecesaria,enlaopcin[Extraer]
seutilizaelmtododeKaiserquedeterminatantos
factorescomoautovaloresmayoresque1.Esel
mtodopordefectoquerealizaSPSS.
LaregladeKaiserproporciona
unaestructurafactorialcontres
factoresqueexplicanel81,946%
delavarianzatotal.
Noobstante,elcuartovalorseencuentramuyprximoa1,proporcionaunfactorquedeterminael
10,963%delavarianza,porloquesedecideincluirlotambinenlaestructurafactorial.
Finalmente,seeligeunaestructurafactorialdecuatrofactoresqueexplicaranel92,639%dela
varianza.EstadecisinseobservatambinenelGrficodeSedimentacin:
SantiagodelaFuenteFernndez
26
AnlisisFactorial
ElanlisisseenfocaenlasComunalidades(quemuestranqueporcentajedecadavariablees
explicadoporlanuevaestructurafactorial),yenlamatrizdeComponentesdelanuevaestructura
(eliminandolosvaloresmenoresde0,3).
Paraello,enelbotn[Extraccin]se
eligen4factores
Enelbotn[Opciones]seeligeOrdenarlascoeficientespor
tamaoySuprimirvaloresabsolutosmenoresque0,3.
ElVisordeSPSSpresenta:
LasComunalidadessonmuyaltas,loqueimplicaquetodaslasvariablesestnmuybien
representadasenelespaciodelosfactores(laComunalidadrepresentaelcoeficientedecorrelacin
linealmltipledecadavariableconlosfactores).
Laestructurafactorialnoestmuyclaraenprincipio,yaquediversosfactorescompartenvariables.
SantiagodelaFuenteFernndez
27
AnlisisFactorial
Porejemplo,lavariablePotasio(X8)estrelacionadaconlosfactoressegundo,terceroycuarto.La
variableFosfatos(X9)aparecetantoenelsegundofactorcomoeneltercero.Lomismoocurrepara
lasvariablesSulfatos(X4)yCalcio(X5)respectoalosejesprimeroytercero.
Grficamenteserepresentanlasvariablesenel
planodelosfactores(primero,tercero).Paraello,
enelbotn[Rotacin]seeligelaopcin
Grficosdesaturaciones.
EnelVisordeSPSSsaleelGrficodecomponentestridimensionaldelosfactores:
HaciendodosclickenelGrfico,obienconelbotndelaizquierdadelratnseleccionandoObjeto
GrficodeSPSS,seseleccionaPropiedades,yseeligenlasVariablesquesedeseanrepresentar.
Seobservaquelasdosvariables(Sulfatos,
Calcio)formanunnguloprximoa45o
concadaeje,locualnopermite
asociarlasaningunodeellos(las
saturacionesrepresentanenestecasolas
correlacionesdelasvariablesconcada
ejeyporlotantoelcosenodelnguloque
formanconellos).
Almismotiempo,lavariableBicarbonato
estacercadelejedecoordenadas,indica
quenoestrelacionadaconningunode
losdosejes.
SantiagodelaFuenteFernndez
28
AnlisisFactorial
Conlaideadeclarificarlaestructurafactorialsinperder
poderexplicativo,serealizaunarotacindeejes.Seeligeel
botn[Rotacin]yelmtodoVarimax(mtododerotacin
ortogonalqueminimizaelnmerodevariablesquetienen
saturacionesaltasencadafactor).
Lainterpretacinsimplificadelosfactoresoptimandola
solucinporcolumnaproducelasiguientematrizde
componentes(lascomunalidadesnovaran):
Factor1:AsociadoalasvariablesdeCloruros,Sodio,ConductividadElctricayenmenorproporcin
aMagnesio.Tieneunpoderexplicativodel44,291%delavarianzatotal(elporcentajedeinerciase
refierealosejesquesehanobtenidoenprimerlugarynotienenporqucoincidirconlos
porcentajesdeinerciaunavezrotados,aunquescoincideconeltotalexplicado,SSPSmuestrael
porcentajeenlarotacinVarimax:32,471%,29,308%,18,144%y12,716%).
LavariableConductividadElctricaquedaexplicadaporeltotaldelosfactoresenun93,6%
(Comunalidad0,936),mientrasquerepresentael84,08%(0,9172=84,08%)delavarianzatotal,
esdecir,el89,83%(0,8408/0,936=89,83%)deltotaldelespaciodelosfactores.
LaestructurafactorialcompletadeterminaalavariableClorurosunavarianzatotalde94,28%,
estoes,el98,31%deltotaldelespaciodelosfactores.
SantiagodelaFuenteFernndez
29
AnlisisFactorial
LavariableSodiotieneunaComunalidadde0,951,conun95,1%delavarianzaexplicada
(89,11%porestefactory93,7%enelespaciodelosfactores).
LavariableMagnesioquedaexplicadaporlaestructurafactorialenun92%,conmenoscarga
factorialquelasanteriores(0,447),loquerepresentacasiel20%desuvarianza(21,71%enla
estructurafactorial).
Factor2:AsociadoalasvariablesCalcio,SulfatosyMagnesio.Conunpoderexplicativode20,448%
deinercia.
LavariableMagnesio,representadaporunaestructurafactorialde92%(Comunalidadde0,92),
estmsrepresentadaporestefactor,susaturacin(cargafactorial)esde0,845,conloque
representael0,8452=71,40%desuvarianzatotal,esdecirel77,61%(0,714/0,92=77,61%)de
laexplicadaportodoslosfactores.
LavariableSulfatosquetieneunaComunalidadde0,93,unasaturacinde0,927,esexplicada
poresteejeconun85,93%(0,9272=0,8593),loqueesun92,4%enelespaciodelosfactores
(0,8593/0,93=92,397%).
LavariableCalcio,conunaComunalidadde0,915(representael91,5%),tieneunacarga
factorialde0,939,porloqueel88,17%desuvarianzatotal[0,9392=88,17%]viene
representadaporesteeje(96,36%deloexplicadoporlaestructurafactorialtotal
0,8817/0,915=96,36%)
Factor3:AsociadoalasvariablesPotasioyFosfatos,conunporcentajedeinerciaexplicadadel
17,207%.(18,144%conejesrotados).
LavariablePotasio,conunaComunalidadde0,922,yestefactoraportael89,68%,esdecir,un
97,27%deloexplicadoporlaestructurafactorial.
LavariableFosfatosestrepresentadaenelespaciodelosfactoresporunaComunalidadde
0,864,queatribuiblealtercerfactoresel65,55%,conunasaturacinde0,834,estoes,el80,5%
delespaciodelosfactores.
Factor4:RepresentadoprincipalmenteporlavariableBicarbonato,representadaporunaestructura
factorialde94,2%(Comunalidadde0,942),tieneunacargafactorialde0,956.Lavarianzaexplicada
porelfactores91,39%,loqueequivaleal97,02%delodeterminadoporloscuartofactores.
LaestructurafactorialhaquedadoclarificadaysolamentelavariableMagnesioparecequecomparte
partedesuvarianzacondosfactores.Elsiguientepasoserainterpretarentrminosgeolgicosel
significadodelosfactores,osea,intentarresumirelporquseunenesasvariableseinclusointentar
darunnombreacadafactor.
SantiagodelaFuenteFernndez
30
AnlisisFactorial
Apartirdeunamatrizdecorrelaciones,elAnlisisFactorialextraeotramatrizquereproducela
primeradeformamssencilla.Estanuevamatrizsedenominamatrizfactorialyadoptalasiguiente
forma:
1 2
1 P11 P21
2 P12 P22
3 P13 P23
.. .. ..
l P1l P2l
Cadacolumnaesunfactoryhaytantasfilascomovariablesoriginales.
LoselementosPijpuedeninterpretarsecomondicesdecorrelacinentreelfactorisimoyla
variablejsima,aunqueestrictamenteslosoncorrelacionescuandolosfactoresnoestn
correlacionadosentres,esdecir,sonortogonales.
Estoscoeficientesrecibenelnombredepesos,cargas,ponderacionesosaturacionesfactoriales.Los
pesosfactorialesindicanelpesodecadavariableencadafactor.Loidealesquecadavariablecargue
altoenunfactorybajoenlosdems.
Eigenvalues
Elcuadradodeunacargafactorialindicalaproporcindelavarianzaexplicadaporunfactorenuna
variableparticular.
Lasumadeloscuadradosdelospesosdecualquiercolumnadelamatrizfactorialesloque
denominamoseigenvalues(),indicalacantidadtotaldevarianzaqueexplicaesefactorparalas
variablesconsideradascomogrupo.
Lascargasfactorialespuedentenercomovalormximo1,portantoelvalormximoquepuede
alcanzarelvalorpropioesigualalnmerodevariables.
Sidividimoselvalorpropioentreelnmerodevariablesnosindicalaproporcindelasvarianzade
lasvariablesqueexplicaelfactor.
Comunalidades
SedenominaComunalidadalaproporcindelavarianzaexplicadaporlosfactorescomunesenuna
variable.
LaComunalidad(h)eslasumadelospesosfactorialesalcuadradoencadaunadelasfilas.
ElAnlisisFactorialcomienzasusclculosapartirdeloqueseconocecomomatrizreducida
compuestaporloscoeficientesdecorrelacinentrelasvariablesyconlascomunalidadesenla
diagonal.
SantiagodelaFuenteFernndez
31
AnlisisFactorial
Comolacomunalidadnosepuedesaberhastaqueseconocenlosfactores,esteresultaserunodelos
problemasdelAnlisisFactorial.
EnelAnlisisdeComponentesPrincipalesnosesuponelaexistenciadeningnfactorcomnla
comunalidadtomacomovalorinicial1.
Enlosotrosmtodosseutilizandiferentesmodosdeestimarlacomunalidadinicial:
Estimandolacomunalidadporlamayorcorrelacinenlafilaisimadelamatrizdecorrelaciones.
Estimandolacomunalidadporelcuadradodelcoeficientedecorrelacinmltipleentrexylas
demsvariables.(SPSSpordefecto).
Elpromediodeloscoeficientesdecorrelacindeunavariablecontodaslasdems.
Calculandoapartirdelosdoscoeficientesdecorrelacinmayoresdeesavariablelasiguiente
r r
operacin: h2 = xy xz
ryz
Lacomunalidadfinaldecadavariablevienedadapor: h2 = P12j + P22j + L + Pkj2
LaGrficatridimensionaldelasvariablesenelespaciodelosfactorespermitenvisualizarla
estructurafactorial
matrizdelascargasfactorialescorrespondientesalosfactores
SantiagodelaFuenteFernndez
32