Sie sind auf Seite 1von 11

1.1. La base de datos trata de un estudio que pretende analizar la calidad vs.

el
precio para 35 marcas de whisky. El objeto del estudio de realizar un anlisis
factorial tomando las variables de escala X1, X2, y X4 como activas.
Por la distribucin de los datos se observa que la informacin presentada es
para un anlisis de tipo-R, ya que las variables estn ubicadas como
columnas, y los objetos, las marcas de whisky, estn ubicados en cada
registro. Todas las variables de estudio son mtricas. Sin embargo el
nmero total de casos es de 35, y la tcnica de factores se recomienda para
una muestra mayor de 50. Por otro lado, el nmero total de variables es de
estudio son 3 y la muestra es ms de 5 veces el nmero de variables
presentadas. Las variables Precio (X1), Categora(X2), y Vejez(X3) son
mtricas y resultan aceptables para este estudio.
Como anlisis exploratorio se realizan las pruebas de normalidad
Kolmogorv-Smirnov y Shapiro Wilk (vase Fig. 1). Siendo la hiptesis nula
que la poblacin est distribuida normalmente, se observa que para un
nivel de significancia del 5% los valores obtenidos no superan esta marca,
por lo que se rechaza el supuesto de normalidad, requerimiento para el
anlisis factorial.

Fig. 1
a. Segn el ejercicio, aunque no de acuerdo por no cumplir el supuesto de
normalidad, se realiza un anlisis factorial para este estudio. La Fig. 2
muestra la matriz de correlaciones para las variables activas. El
determinante de esta matriz es de 0,431 y no se considera tan bajo
como se deseara, por eso es que se pueden observar que las
correlaciones son bajas , aunque la correlacin entre precio y malta
puede ser considerada como moderada, no es tan buena tampoco. Estas
cifras son significativas porque el p-valor de cada una de ellas es menor
que el 5%.

Fig. 2

Segn la prueba de esfericidad de Barlet (Fig. 3), su p-valor es menor del 5%,
por lo que no se considera la matriz de correlaciones una matriz identidad.

Fig. 3
La medida de KMO es de 0,64 por lo que dentro de la escala de adecuacin se
considera regular, y es posible que alguna variable no debera estar en el
anlisis.
La Fig. 4 muestra la matriz anti-imagen y se observa que los valores en cada
una de sus diagonales son mayores que 0,5, por lo que ninguna de las
variables debera ser eliminada del estudio.

Fig. 4

Sin embargo, aunque segn los resultados obtenidos pareciera que existiese
alguna posibilidad seguir con el mtodo, se deja hasta aqu porque el supuesto
de normalidad no se cumpli.

Fig. 5

1.2. La base de datos es un estudio de mercadeo que mide el grado de


satisfaccin del cliente. La pregunta es se puede reducir el nmero de
variables a travs de un anlisis factorial?
Primero se comprueban los siguientes supuestos:

Normalidad
Homogeneidad
Linealidad
Multicolinealidad

En la Fig. 1 se puede observar que para todos los casos y para ambas pruebas,
el nivel de significancia super el 5% por lo que se acepta la hiptesis de
normalidad entre las variables.

Fig. 1
Por la distribucin de los datos se observa que la informacin presentada es
para un anlisis de tipo-R, ya que las variables estn ubicadas como
columnas, y las personas estn ubicadas en cada registro. Todas las
variables de estudio son mtricas. Sin embargo el nmero total de casos es
de 10, y la tcnica de factores se recomienda para una muestra mayor de
50. Por otro lado, el nmero total de variables de estudio son 5 y la
muestra solo dos veces el nmero de variables presentadas (debera ser al
menos 5 veces el nmero de variables).
La Fig. 2 muestra la matriz de correlaciones entre la variables. El
determinante de la matriz es de 0,004, lo suficientemente bajo para
indicarnos que las variables est correlacionadas.

Fig. 2
Los pares de variables con mejores correlaciones y con un p-valor bajo est
marcadas con una elipse celeste en la Fig. 2, y las de menor correlacin, en
rojo. Los valores intermedios tienden a ser bajos y moderados. La mayora de
las correlaciones son positivas, con algunas excepciones en que las
correlaciones son negativas. Tambin se advierte que las mejores correlaciones
tiene un p-valor bajo con respecto al 5% de significancia, mientras que el resto
superan este valor, por lo que no se consideran adecuados.

La Fig. 3, nos muestra un KMO de 0,376 (< 0,5) por lo q ue se considera muy
bajo, es posible que alguna variable no debera tomarse en cuenta.

Fig. 3
Segn la prueba de esfericidad de Bartlett (Fig. 3), su p-valor es menor del 5%,
por lo que no se considera la matriz de correlaciones una matriz identidad.
La variable X4 es aquella que presenta las peores correlaciones, por lo tanto se
realiza la misma prueba sin tomarla en cuenta para ver el comportamiento de
la medida KMO y la prueba de esfericidad de Bartlett. El resultado se muestra
en la Fig. 4. El KMO mejor al 0,454 aunque sigue por debajo de 0,5. Esto
puede significar que tambin puede existir otra variable que pudiera ser
necesario excluirla.

Fig. 4
Volviendo al caso de 5 variables la Fig. 5 nos muestra las matrices anti-imagen
de las covarianzas y las correlaciones. Obsrvese que los valores individuales a
la diagonal de la matriz anti-imagen de la correlaciones no es tan alta como se
deseara, esto es quizs por la falta de datos que se coment desde un
principio. Por otro lado, los valores individuales de la correlaciones a los lados
de la diagonal, deberan ser lo ms bajo posible, ojal menor que 0,1(solo hay
un valor 0,070 para las variables X1 y X3). Por lo que pudiera considerarse el
anlisis factorial podra resultar mediocre.

Fig. 5
La Fig. 6 muestra las comunalidades, que representan a la proporcin de la
varianza explicada por los factores comunes usando el anlisis de
Componentes principales. El valor de las comunalidades iniciales es siempre
igual a 1, por lo tanto, este valor no aporta nada al anlisis. Segn la tabla,
todas las variables aportan ya que sus valores son cercanos a la unidad.

Fig. 6
La Fig. 7 muestra la varianza total explicada utilizando el criterio de Kaiser.
Los factores que tienen autovalores mayores que 1 son los tres primeros,
cuyos valores son 1,970, 1,923, 1,038 respectivamente, y que a su vez
explican la variabilidad del 98% de la muestra, que se considera razonable.

Fig. 7

La Fig. 8 muestra el grfico de sedimentacin, cuyo punto de inflexin se


ubica en el 4 punto, indicndonos que no se podrn escoger ms de
cuatros factores.

Fig. 8
La Fig. 9 muestra la matriz de componentes no rotada.

Fig. 9
As, la carga o saturacin de la variable en el factor para el grado de
satisfaccin con la agilidad en los trmites al momento de recibir el servicio
(X1) sera:
AGILIDAD-TRAMITES = 0,813F 1 - 0,549F2 - 0,127F3
Y as sucesivamente con las dems variables.
La Fig. 10 muestra las correlaciones reproducidas con sus respectivos
errores residuales.

Fig. 10
El mapa factorial se muestra en la Fig. 11

Fig. 11

La Fig. 12 muestra el grfico de componentes en espacio rotado.

Fig. 12

Das könnte Ihnen auch gefallen