En el primer cuadro de anlisis lo primero que aparece es la media, desviacin estndar y en nombre de cada una de las variables entradas para los 66 bancos estudiados.
a. Determinante = 3,420E-011 Esta matriz de correlacin nos explica cmo se encuentran relacionadas cada una de las variables con otra variable. Su diagonal siempre contendr el valor de 1. Si tiene un valor 0, nos indicar que no tiene ninguna relacin con esa variable, por lo menos no lineal; es decir, pueda que tenga una relacin cuadrtica o de otro grado. Cuando la correlacin es positiva, esto nos indica que su proyeccin de la regresin lineal va a tender a crecer conjuntamente con la contra variable. Cuando la correlacin es negativa, esto nos indica que su proyeccin de la regresin lineal va a tender a decrecer conjuntamente con la contra variable. Un examen a nuestra matriz de correlaciones, indica que hay variables que se correlacionan muy alto entre si y otras que se correlacionan de forma moderada, y el resto de las correlaciones son muy bajas. Ratio 1 A.C. / A.T. Liquidez Ratio 2 (A.C. - T) / A.T. Liquidez Ratio 3 A.C. / P.E. Liquidez Ratio 4 R / P.E. Autofinanciacin Ratio 5 B.N. / A.T. Rentabilidad econmica Ratio 6 B.N. / N Rentabilidad financiera Ratio 7 B.N. / P.E. Apalancamiento Ratio 8 C.V. / V. B. Costo de ventas Ratio 9 C.F. / P.E. Efectivo (Cash)
Correlaciones Las correlaciones que se muestran a continuacin son positivas y las ms altas, por ende nos indican un crecimiento conjunto entre ellas como se mencion anteriormente. Es importante que las correlaciones sean cercanas a 1, para que el anlisis factorial conduzca a una solucin eficiente. R1Liqui1 R3Liqui3 La variable Ratio 1, Liquidez, est correlacionada positivamente con la variable Ratio 3, Liquidez R2Liqui2 R1Liqui1 La variable Ratio 2, Liquidez, est correlacionada positivamente con la variable Ratio 1, Liquidez R3Liqui3 R1Liqui1 La variable Ratio 3, Liquidez, est correlacionada positivamente con la variable Ratio 1, Liquidez R4Autof R9Cash La variable Ratio 4, Autofinanciacin, est correlacionada positivamente con la variable Ratio 9, Efectivo (Cash) R5RenEc R7Apal La variable Ratio 5, Rentabilidad Econmica, est correlacionada positivamente con la variable Ratio 7, Apalancamiento R6RenFin R5RenEc La variable Ratio 6, Rentabilidad Financiera, est correlacionada positivamente con la variable Ratio 5, Rentabilidad Econmica R8CosVen Quiebra La variable Ratio 8, Costo de Ventas, est correlacionada positivamente con la variable Quiebra R9Cash R7Apal La variable Ratio 9, Efectivo (Cash), est correlacionada positivamente con la variable Ratio 7, Apalancamiento Quiebra R8CosVen La variable Quiebra, est correlacionada positivamente con la variable Ratio, Costo de Ventas
Niveles de Significacin
1.- La variable R1Liqui1 tiene un p-value igual a 0 con la variable 2 y 3 2.- La variable R2Liqui2 tiene un p-value igual a 0 con las variables 1 y 3 3.- La variable R3Liqui3 tiene un p-value igual a 0 con las variables 1, 2 y 4 4.- La variable R4Autof tiene un p-value igual a 0 con las variables 3 y 9 5.- La variable R5RenEc tiene un p-value igual a 0 con las variables 6, 7, 8, 9 y quiebra 6.- La variable R6RenFin tiene un p-value igual a 0 con las variables 5, 7, 8, 9 y quiebra 7.- La variable R7Apal tiene un p-value igual a 0 con las variables 5, 6, 8, 9 y quiebra 8.- La variable R9CosVen tiene un p-value igual a 0 con las variables 4, 5, 6, 7, 8 y quiebra 9.- La variable Quiebra tiene un p-value igual a 0 con las variables 5, 6, 7, 8 y 9
Estos datos nos pueden dar una idea del nmero de factores adecuados al modelo factorial que estamos realizando en funcin de las correlaciones de las variables.
KMO y prueba de Bartlett Medida de adecuacin muestral de Kaiser-Meyer-Olkin. ,690 Prueba de esfericidad de Bartlett Chi-cuadrado aproximado 1466,193 gl 45 Sig. ,000
La medida de adecuacin muestral de Kaiser-Meyer-Olkin (KMO) con un valorde 0.690 cercano a uno nos indica que el anlisis factorial es adecuado. Adems la prueba de Esfericidad de Barlett contrasta la hiptesis nula de que la matriz de correlacin observada es en realidad una matriz identidad, con un p-valor de 0, rechazamos la hiptesis nula, es decir, las variables estn relacionadas entre s y por tanto tiene sentido realizar un anlisis factorial. Con esto terminamos el estudio previo y pasamos a realizar el Anlisis Factorial. Comenzamos con el mtodo de anlisis de componentes principales como mtodo de extraccin y rotacin varimax. A continuacin vamos a comentar las tablas resultantes.
a. Medida de adecuacin muestral Los valores de la covarianza anti-imagen que figuran en la diagonal representan el valor de lo que cada variable tiene como propio e individual, es decir, lo que no comparte con el resto de las variables. As, por ejemplo, la variable Quiebra presenta un valor de 0,454 de propiedad individual y nica frente al 0,141 que presenta la variable R4Autof, lo que implica que la primera comparte menos informacin con el resto que la segunda. Por lo tanto estos valores tachados a la diagonal nos representan la unicidad de cada variable en el modelo.
El proceso matemtico por el que se desarrolla la eleccin de las componentes principales de una muestra, se realiza a partir de una matriz de correlaciones, de donde, y a travs de la aplicacin del anlisis factorial correspondiente, se extrae otra que se denomina factorial. Las columnas de esta ltima matriz representan a un factor y las filas coinciden en nmero con el total de variables observadas. A cada elemento de esta matriz factorial se le denomina ponderacin factorial, y son interpretados como ndices de correlacin entre las filas y las columnas, indicando as el peso que cada variable asigna a cada factor. Esta tabla contiene la comunalidad inicial que se realiza calculando para cada variable la correlacin mltiple al cuadrado entre esa variable y las restantes incluidas en el anlisis. La comunalidad despus de la extraccin nos indica la proporcin de varianza explicada por los componentes. Toma valores entre 0 y 1. Los valores cercanos a 1 indican que la varianza queda totalmente explicada por los factores seleccionados. Los valores cercanos a 0 indican que los factores no explican la variabilidad de la variable. Con respecto a la tabla, los valores ms cercanos a 1 son las variables 1 a la 9, donde nos indica que la varianza queda totalmente explicada por los factores seleccionados. Un caso diferente es para la variable quiebra, con un valor no tan cercano a 1, con 0,433.
Varianza total explicada Componente Autovalores iniciales Sumas de las saturaciones al cuadrado de la extraccin Suma de las saturaciones al cuadrado de la rotacin Total % de la varianza % acumulado Total % de la varianza % acumulado Total % de la varianza % acumulado 1 5,092 50,923 50,923 5,092 50,923 50,923 4,709 47,085 47,085 2 2,555 25,547 76,470 2,555 25,547 76,470 2,643 26,427 73,512 3 1,108 11,080 87,549 1,108 11,080 87,549 1,404 14,037 87,549 4 ,734 7,339 94,888
5 ,331 3,312 98,200
6 ,094 ,937 99,137
7 ,060 ,603 99,740
8 ,025 ,246 99,986
9 ,001 ,014 99,999
10 5,059E-005 ,001 100,000
Mtodo de extraccin: Anlisis de Componentes principales.
Considerando la tabla anterior podemos decidir con cuantos componentes o factores nos vamos a quedar. Existen reglas para saber el nmero ms adecuado a conservar, por ejemplo, la que se conoce como Criterio de Kaiser que indica que hay que conservar los componentes principales cuyos valores propios son mayores que la unidad, aunque el criterio ms utilizado es el de observar el porcentaje de varianza total explicada por cada componente o factor, y cuando ste llega a un porcentaje acumulado considerado alto normalmente cerca del ochenta por ciento, significa que el nmero de factores es suficiente. En nuestro modelo podemos comprobar, y as lo hemos sealado, que a partir de la componente nmero tres el autovalor comienza a ser inferior a la unidad aunque en esta componente todava mantiene un valor alto. Los autovalores nos expresan la cantidad de varianza total que est explicada por cada factor. El primer factor explica un 50.92% de la varianza total, el segundo factor explica el 25.54% de la varianza, por tanto los dos primeros factores explican el 76.47% del total de varianza. Se han seleccionado tres factores correspondientes a los autovalores mayores que 1, el porcentaje total de varianza explicada por los tres factores seleccionados es del 87,54%, por lo que podemos considerar que ste puede ser un valor lo suficientemente alto para estimar que cuatro es un nmero de factores suficiente
El grfico de sedimentacin sirve para determinar el nmero ptimo de factores. Propuesto por Cattell (1966), consiste en una representacin grfica del tamao de los autovalores. Como vemos en la grfica los autovalores residuales se encuentran en la parte derecha del grfico, frente a la parte izquierda que representa una fuerte pendiente formada por los tres autovalores que explican la mayor parte de la varianza disponible. Segn este criterio se retienen todas las componentes que estn situadas previamente a la zona de sedimentacin, entendiendo por esta la parte del grfico en la que los componentes empiezan a no presentar pendientes fuertes, que como ya hemos mencionado para los datos obtenidos podemos comprobar que puede ser a partir de la componente tres.
Matriz de componentes a
Componente 1 2 3 R9Cash ,940 -,081 -,096 R7Apal ,932 -,212 ,140 R5RenEc ,928 -,219 ,168 R8CosVen -,907 ,170 -,001 R6RenFin ,887 -,261 ,300 Quiebra -,621 ,021 ,217 R1Liqui1 ,351 ,921 -,006 R3Liqui3 ,371 ,906 -,099 R2Liqui2 ,169 ,811 ,463 R4Autof ,443 ,178 -,830 Mtodo de extraccin: Anlisis de componentes principales. a. 3 componentes extrados La tabla muestra la matriz de estructura factorial. Los valores indican las correlaciones entre las variables originales y cada uno de los factores. El primer factor tiene una correlacin con las variables R9 Cash con 0,940, R7Apal con 0,932, R5RenEc con 0,928 y R6RenFin con 0,887. El segundo factor est relacionado con las variables R1Liqui1 0,921, R3Liqui3 0.906 y R2Liqui2 0.811. El tercer factor tiene una correlacin con la variable R2Liqui2 con 0,463
Mtodo de extraccin: Anlisis de Componentes principales. a. Comunalidades reproducidas b. Los residuos se calculan entre las correlaciones observadas y reproducidas. Hay 18 (40,0%) residuales no redundantes con valores absolutos mayores que 0,05. En esta tabla se muestra la matriz de correlaciones reproducidas que se obtiene a partir de la solucin factorial calculada. En la diagonal podemos observar que se encuentran las comunalidades finales. Se incluye tambin la matriz residual formada por las diferencias entre las correlaciones observadas y las reproducidas. Si el anlisis es bueno los residuos deben ser pequeos, en nuestro caso tenemos residuos del 40%. Esto puede deberse a que se hubiera extrado un nmero insuficiente de factores, y que consecuentemente la estructura factorial no fuera capaz de reproducir de forma adecuada la matriz de correlaciones observadas. Tambin pudo haber ocurrido que las correlaciones observadas estuvieran mal estimadas, o bien, el modelo factorial no es pertinente para analizar datos, es decir, pueden estar no linealmente relacionados.
Matriz de componentes rotados a
Componente 1 2 3 R6RenFin ,968 ,017 -,088 R5RenEc ,966 ,042 ,054 R7Apal ,961 ,044 ,083 R8CosVen -,895 -,052 -,215 R9Cash ,881 ,125 ,327 Quiebra -,540 -,085 -,367 R1Liqui1 ,074 ,959 ,214 R3Liqui3 ,077 ,932 ,306 R2Liqui2 ,037 ,900 -,297 R4Autof ,183 ,116 ,933 Mtodo de extraccin: Anlisis de componentes principales. Mtodo de rotacin: Normalizacin Varimax con Kaiser. a. La rotacin ha convergido en 4 iteraciones.
En la presentamos la matriz de componentes rotados, mostrando los valores situados por encima de 0,5 para as lograr una mejor exposicin de las variables iniciales obtenidas para cada componente. Una vez que se han obtenido las componentes podemos lograr definir las puntuaciones factoriales mediante una estimacin para cada uno de los sujetos en cada factor extrado, para as valorar qu situacin tiene ese sujeto frente a estas nuevas variables que hemos construido a partir de la reduccin de las variables iniciales introducidas en el anlisis. Cuando se utiliza el mtodo de extraccin de factores utilizando las componentes principales, las puntuaciones obtenidas se calculan a partir de la solucin factorial. Dicha solucin es ortogonal por lo que las puntuaciones tambin lo son. Se obtiene finalmente la matriz de coeficientes para el clculo de las puntuaciones factoriales que contiene las ponderaciones para cada variable para poder calcular las puntuaciones factoriales. Mediante estos coeficientes estimados podemos construir una ecuacin lineal para cada una de las componentes extradas, basadas en las variables y las puntuaciones factoriales.
Matriz de transformacin de las componentes Componente 1 2 3 1 ,936 ,235 ,262 2 -,275 ,953 ,126 3 ,220 ,190 -,957 Mtodo de extraccin: Anlisis de componentes principales. Mtodo de rotacin: Normalizacin Varimax con Kaiser.
Matriz de coeficientes para el clculo de las puntuaciones en las componentes
La matriz de coeficientes para el clculo de las puntuaciones factoriales que contiene las ponderaciones para cada variable para poder calcular las puntuaciones factoriales. Mediante estos coeficientes estimados podemos construir una ecuacin lineal para cada una de las componentes extradas, basadas en las variables y las puntuaciones factoriales.
Matriz de covarianza de las puntuaciones de las componentes Componente 1 2 3 1 1,000 ,000 ,000 2 ,000 1,000 ,000 3 ,000 ,000 1,000 Mtodo de extraccin: Anlisis de componentes principales. Mtodo de rotacin: Normalizacin Varimax con Kaiser. Puntuaciones de componentes.
La matriz de las covarianzas de las puntuaciones factoriales se presenta en la Tabla anterior, contiene en la diagonal principal la varianza de las puntuaciones factoriales que son iguales a uno y las covarianzas entre pares de factores. Si vale cero, eso significa que son completamente independientes entre s, es decir no existe correlacin entre ellas. En el mtodo de componentes principales se obtienen las puntuaciones factoriales reales, es decir, no son estimadas sino que se calculan directamente a partir de las variables originales.
Bondad del Modelo Como se ha comprobado, el anlisis de componentes principales nos permite descubrir y priorizar los atributos con los que deber contar una pgina en la red reduciendo la informacin redundante que pueda existir entre los mismos. La identificacin de estas componentes, nos permite conocer cules son los aspectos sobre los que se ha de incidir ms para que dicha pgina tenga una estructura adecuada y resulte eficaz, logrando as generar en los clientes potenciales mayor confianza y satisfaccin. Mediante el anlisis de componentes principales hemos comprobado que efectivamente los atributos planteados se pueden resumir finalmente en cuatro factores que eliminan la informacin redundante segn las caractersticas presentadas, obteniendo ecuaciones lineales para cada uno de ellos Identifique cuales son las variables ms importantes para determinar la situacin de quiebra Con respecto a las variables ms importantes para determinar la situacin de quiebra, se puede determinar a travs del cuadro que corresponde a las correlaciones, especficamente en la correlacin. Ah se puede observar que la variable obtiene una correlacin negativa en la mayora de las variables menos en la de Costo de Venta, es con la nica variable con la que crece conjuntamente. Con el resto de las variables existe un decrecimiento conjunto, que puede explicar el porqu de la situacin de quiebra de las empresas y cuales son aquellas variables que intervienen en este resultado.
2.- Construya un modelo que se estime mediante una regresin logstica para discriminar entre grupos. Interprete los resultados.
Resumen del procesamiento de los casos Casos no ponderados a N Porcentaje Casos seleccionados Incluidos en el anlisis 66 100,0 Casos perdidos 0 ,0 Total 66 100,0 Casos no seleccionados 0 ,0 Total 66 100,0 a. Si est activada la ponderacin, consulte la tabla de clasificacin para ver el nmero total de casos.
Muestra la tabla de resumen de procesamiento de casos, que resume el nmero de casos incluidos y excluidos en el anlisis, en total y por muestras de entrenamiento, comprobacin y reservadas. Este cuadro nos muestra los 66 casos incluidos en el anlisis, y no se muestran casos perdidos.
Codificacin de la variable dependiente Valor original Valor interno No 0 Si 1
Tabla de clasificacin a,b
Observado Pronosticado
Quiebra Porcentaje correcto No Si Paso 0 Quiebra No 38 0 100,0 Si 28 0 ,0 Porcentaje global
57,6 a. En el modelo se incluye una constante. b. El valor de corte es ,500
Variables en la ecuacin
B E.T. Wald gl Sig. Exp(B) Paso 0 Constante -,305 ,249 1,503 1 ,220 ,737
Chi cuadrado gl Sig. Paso 1 Paso 68,165 9 ,000 Bloque 68,165 9 ,000 Modelo 68,165 9 ,000
Como puede verse en la tabla de la Prueba Omnibus, el programa nos ofrece tres entradas: Paso, Bloque y Modelo. - La fila primera (PASO) es la correspondiente al cambio de verosimilitud (de -2LL) entre pasos sucesivos en la construccin del modelo, contrastando la H0 de que los coeficientes de las variables aadidas en el ltimo paso son cero. - La segunda fila (BLOQUE) es el cambio en -2LL entre bloques de entrada sucesivos durante la construccin del modelo. Si como es habitual en la prctica se introducen las variables en un solo bloque, el Chi Cuadrado del Bloque es el mismo que el Chi Cuadrado del Modelo. - La tercera fila (MODELO) es la diferencia entre el valor de -2LL para el modelo slocon la constante y el valor de -2LL para el modelo actual.
Resumen del modelo Paso -2 log de la verosimilitud R cuadrado de Cox y Snell R cuadrado de Nagelkerke 1 21,810 a ,644 ,865 a. La estimacin ha finalizado en el nmero de iteracin 11 porque las estimaciones de los parmetros han cambiado en menos de ,001.
Seguidamente se aportan tres medidas RESUMEN DE LOS MODELOS, complementarias a la anterior, para evaluar de forma global su validez: la primera es el valor del -2LL y las otras dos son Coeficientes de Determinacin (R2), parecidos al que se obtiene en Regresin Lineal, que expresan la proporcin (en tanto por uno) de la variacin explicada por el modelo. Un modelo perfecto tendra un valor de -2LL muy pequeo (idealmente cero) y un R2 cercano a uno (idealmente uno). -2 log de la verosimilitud (-2LL) mide hasta qu punto un modelo se ajusta bien a los datos. El resultado de esta medicin recibe tambin el nombre de "desviacin". Cuanto ms pequeo sea el valor, mejor ser el ajuste. La R cuadrado de Cox y Snell es un coeficiente de determinacin generalizado que se utiliza para estimar la proporcin de varianza de la variable dependiente explicada por las variables predictoras (independientes). La R cuadrado de Cox y Snell se basa en la comparacin del log de la verosimilitud (LL) para el modelo respecto al log de la verosimilitud (LL) para un modelo de lnea base. Sus valores oscilan entre 0 y 1. En nuestro caso es un valor muy discreto (0,039) que indica que slo el 3,9% de la variacin de la variable dependiente es explicada por la variable incluida en el modelo. La R cuadrado de Nagelkerke es una versin corregida de la R cuadrado de Cox y Snell. La R cuadrado de Cox y Snell tiene un valor mximo inferior a 1, incluso para un modelo "perfecto". La R cuadrado de Nagelkerke corrige la escala del estadstico para cubrir el rango completo de 0 a 1.
Tabla de clasificacin a
Observado Pronosticado
Quiebra Porcentaje correcto No Si Paso 1 Quiebra No 35 3 92,1 Si 0 28 100,0 Porcentaje global
95,5 a. El valor de corte es ,500
En la tabla de clasificacin podemos comprobar que nuestro modelo tiene una especificidad alta (92,1%). Podemos comprobar como nuestro modelo calcula unas probabilidades de Y menores de 0,5 para todos los casos, por los que los clasifica como NO (Estado de Quiebra).
En el cuadro anterior se muestran las variables que dejar en la ecuacin, sus coeficientes de regresin con sus correspondientes errores estndar, el valor del estadstico de Wald para evaluar la hiptesis nula (Pi=0), la significacin estadstica asociada, y el valor de la OR (exp(B)) con sus intervalos de confianza.