Beruflich Dokumente
Kultur Dokumente
CA PA AT ED CL ASI PR
TEC L R E EST SAT AD A G OF ESTP
0 1 0 1 0 3 16 0 2 3 0
0 1 0 1 0 1 17 0 3 5 0
0 1 0 0 1 7 18 2 2 4 3
0 2 1 1 0 2 19 2 3 5 0
0 2 0 1 2 5 18 2 1 1 0
Los significados de cada variable son:
ASIG 0.009634422
ATE -0.690929281
CAL -0.8508779590
CLA 0.0891672163
EDAD 0.233171700
EST -0.67173527
ESTP 0.093915413
PAR -0.712555990
PC1 1.000000e+00
PC2 1.006389e-17
PC3 -5.316147e-17
PROF 0.006182726
SAT -0.120799459
TEC -0.28527228
Analizemos estas correlaciones: vemos que PC1 está fuertemente
correlacionada (más de un 0,5 por uno, o 50%) con las variables ATE
(Medida de la atención en clase, valor negativo), CAL (Calificación
obtenida, valor negativo, es la correlación más fuerte), EST (Medida de
las técnicas de estudio personales, valor negativo) y PAR (Medida de la
participación activa en clase, valor negativo), débilmente correlacionada
(entre 10-50%) con EDAD (valor positivo), SAT (Medida de la
satisfacción en clase, valor negativo) y TEC (1: aplicamos nueva técnica,
0: no lo hacemos, con valores negativos), y prácticamente nada con las
demás.
FIG 4: de diagrama de dispersión de dos componentes principales
cualesquiera no mostrará ninguna relación
Hemos podido realizar este diagrama de dispersión gracias a
haber seleccionado la opción, que añade a la hoja de datos original
las nuevas variables como columnas adicionales.
Fig. 5: R añade 3 nuevas columnas a la hoja de datos, son los
componentes principales elegidos por el usuario
Como conclusión de este estudio con componentes principales
podemos decir:
la nueva técnica de enseñanza sí que parece tener cierta influencia,
pues su variable asociada está incluida en el componente PC1 de
“buenas prácticas y buenas calificaciones”, aunque su efecto parece
ser menor (29% de correlación) en comparación a las otras buenas
prácticas: atención en clase, etc. Por otro lado la asignatura donde
se ha probado el método, que es el componente PC2, no tiene
ninguna relación (no hay correlación) con PC1, esto es bueno, nos
dice que en cualquier asignatura las “buenas prácticas” tienen los
mismos efectos. Lo mismo podemos decir del entorno familiar,
representado por PC3.
Reducir el número de variables: análisis
factorial
El análisis factorial es otra técnica diseñada para reducir el número
de variables, creando unas de nuevas, llamadas factores, por
combinación lineales de las originales, que intentan mostrar
condiciones que directamente no son fácilmente reconocibles. El
software estadístico de análisis factorial permite realizar las llamadas
“rotaciones” de variables, una transformación matemática que
pretende simplificar al máximo la nueva descripción de variables. Los
resultados no son los mismos que usando componentes principales,
pues el método matemático es distinto.
En R, vamos a Estadísticos -> Análisis dimensional -> Análisis
factorial, y escogemos todas las variables originales del problema. Nos
pregunta el número de factores a retener, probamos con 3. El
resultado es este resumen: Uniquenesses:
Nos proporciona los coeficientes de las combinaciones lineales
para cada factor (tabla Loadings) que siempre están en el
intervalo [-1, 1], la variabilidad explicada por cada factor, la
acumulada (para los tres factores sumados tenemos un 38.4% de
variabilidad explicada) y un contraste de hipótesis Chi² donde H0:
los tres factores son suficientes, H1: no lo son. Vemos que el
resultado del contraste es que el p-valor = 0.593, lo que significa
que, para los niveles de significación estándar de aceptación de
H0, 10%, 5% y 1%, aceptamos H0 (recordemos que H0 se acepta
si la significación es menor que el p-valor). Si se hubiera
rechazado la hipótesis nula, hubiéramos repetido el análisis con
un factor más.
También, para las conclusiones, podemos mirar los datos
denominados “Uniquenesses“: nos da la proporción de variabilidad
no explicada por los factores de la variable en cuestión. Por
ejemplo, para la variable ASIG es de 0.077, un 7.7% no explicada
por los factores, o sea que está bien resumida con los tres factores.
En cambio para CLA vale más del 90%, por lo cual los factores no
informan bien de esta variable.
Así pues, resumimos las 11 variables por tres factores, con la siguiente
composición:
este factor considera la asignatura y el profesor que la imparte como un
factor importante en el estudio.
este segundo factor tiene en cuenta la atención en clase, la calificación,
las técnicas de estudio y la participación activa en clase, de forma
parecida al componente principal PC1 del apartado anterior.
el tercer factor considera la relación entre calificación, clase social, edad,
técnicas de estudio, participación activa en clase y la aplicación de la
nueva técnica de estudio, en éste último caso con un peso más bien bajo,
0.158.
Las conclusiones que podemos obtener son:
En este análisis la variable TEC que estudiamos no parece desempeñar
ningún papel, sólo entra en el factor 3 con un peso del 15.8%, y además
queda no explicada en un 95.6% (Uniquenesses). Las variables
relacionadas que tienen más peso son CAL y ATE en el factor 2, lo que
sugiere que la atención en clase es la variable mas correlacionada con la
calificación obtenida; en el factor 3 la variable dominante es PAR,
participación activa, que tiene una relación más bien débil con la
calificación (38.1%) y aún más débil con las otras variables.