Análisis Multivariante 1

INTRODUCCIN AL ANALIS MULTIVARIADO INTRODUCCIN.
Los procedimientos multivariables constituyen un conjunto de tcnicas estadsticas de amplia aplicacin en el mundo cientfico, especialmente en los estudios de tipo emprico, adquiriendo cada da ms importancia en la investigacin Comercial y muy especialmente en el tratamiento de las encuestas. A travs del anlisis multivariante lo que hacemos es combinar todas las variables, eliminando la informacin redundante y se obtiene una nueva variable que no es observable directamente, que representa un concepto abstracto que se puede medir obtenindose un valor para cada elemento, en el caso del ejemplo lo denominamos estilo de vida. Esta situacin la podemos resumir en el siguiente esquema. Esquema
Variables observadas Anlisis multivariante Nueva variable abstracta
POR QU SE USAN LAS TCNICAS MULTIVARIANTES? Las tcnicas de anlisis multivariante se utilizan cada vez ms en la investigacin comercial por las siguientes razones: 1. Permiten el analizar un gran nmero de encuestas. Simplificando muchos datos, con la mnima prdida de informacin. Consiguiendo hacer ms comprensible la informacin para la mente humana. 2. Permiten analizar toda la informacin acerca de un determinado fenmeno, considerando simultneamente todos los factores que intervienen. 2. Permiten trabajar con cualquier tipo de variable.
REAS DE APLICACIN DEL ANLISIS MULTIVARIANTE El anlisis Multivariante es de aplicacin en la Investigacin Comercial, en las siguientes circunstancias: Reduccin de datos. Se trata de simplificar la estructura del fenmeno investigado buscando la mayor simplicidad, lo que permitir una interpretacin muy fcil. Clasificacin y agrupacin Por ejemplo las tcnicas de segmentacin y tipologa Anlisis de las relaciones de dependencia, con el fin de predecir o bien explicar En la construccin de modelos. Econometra DEFINICIN Y CLASIFICACIN DE LAS VARIABLES En las tcnicas del anlisis multivariante se entiende por variable alguna magnitud que representa la caracterstica de los elementos objeto de investigacin que tratamos de medir. En una primera clasificacin las variables las podemos clasificar en dos grupos, variables independientes (VI) y variables dependientes (VD). Las variables dependientes son aquellas cuyo comportamiento es explicado o pronosticado por una o ms variables independientes. Las variables dependientes tambin se denominan variables criterio o respuesta, mientras que las variables independientes son las que servirn para explicar el fenmeno estudiado y se en ocasiones se denominan como variables explicativas, factores o variables predictoras. En los estudios no experimentales, la situacin de las variables no siempre es clara, definindose su papel en el contexto de la investigacin. Una misma variable puede adoptar diferentes roles en funcin de situaciones. Cuando existen diferencias sistemticas en una variable dependiente (Y) asociada a diferentes niveles de variacin de la variable independiente (X) se dice que estn relacionadas. Si todas las variables desempean el mismo papel se habla de relaciones de interdependencia. En este caso no hay una variable con las que se intente explicar el comportamiento de otras. En ocasiones, al analizar el modelo la nica forma de diferenciar las variables es simplemente por donde estn situadas en la ecuacin.
TEORA SOBRE ANLISIS MULTIVARIADO. El anlisis multivariante engloba un grupo de tcnicas o mtodos estadsticos cuya finalidad es analizar simultneamente conjuntos de datos multivariantes en el sentido de que hay varias variables medidas para cada individuo u objeto estudiado. Su razn de ser radica en un mejor entendimiento del fenmeno estudiado, obteniendo informacin que los mtodos estadsticos univariantes y bivariantes son incapaces de conseguir. As, como Hair et al. (1999) dicen: Slo a travs del anlisis multivariante las relaciones mltiples de este tipo podrn ser examinadas adecuadamente para obtener un entendimiento ms completo y real del entorno que permita tomar las decisiones ms adecuadas. Ejemplo: Las mujeres y hombres de negocios de hoy no pueden seguir aproximaciones ya pasadas en las que los consumidores eran considerados homogneos y caracterizados por un nmero pequeo de variables demogrficas. En su lugar, deben desarrollar estrategias que atraigan a numerosos segmentos de clientes con caractersticas demogrficas y psicogrficas diversas en un mercado con mltiples restricciones (legales, econmicas, competitivas, tecnolgicas, etc.). Slo a travs del anlisis multivariante las relaciones mltiples de este tipo podrn ser examinadas adecuadamente para obtener un entendimiento ms completo y real del entorno que permita tomar las decisiones ms adecuadas. Es una metodologa estadstica sofisticada, mucho ms potente, que utiliza los mtodos del lgebra lineal, matricial, clculo numrico, geometra lineal, entre otras. Los mtodos de anlisis multivariante se diferencian unos de otros, segn su rea de aplicacin se refiera a una o ms problemas y segn se requiera uno o ms grupo de variables. Pueden sintetizarse en dos: 1) Proporcionar mtodos cuya finalidad es el estudio conjunto de datos multivariantes que el anlisis estadstico uni y bidimensional no pueden conseguir.
2) Ayudar al analista o investigador a tomar decisiones ptimas en el contexto en el que se encuentre teniendo en cuenta la informacin disponible por el conjunto de datos analizado.
Se pueden clasificar en tres grandes grupos: 1) Mtodos de dependencia Suponen que las variables analizadas estn divididas en dos grupos: las variables dependientes y las variables independientes. El objetivo de los mtodos de dependencia consiste en determinar si el conjunto de variables independientes afecta al conjunto de variables dependientes y de qu forma. 2) Mtodos de interdependencia Estos mtodos no distinguen entre variables dependientes e independientes y su objetivo consiste en identificar qu variables estn relacionadas, cmo lo estn y por qu. 3) Mtodos estructurales Suponen que las variables estn divididas en dos grupos: el de las variables dependientes y el de las independientes. El objetivo de estos mtodos es analizar, no slo como las variables independientes afectan a las variables dependientes, sino tambin cmo estn relacionadas las variables de los dos grupos entre s.
El tipo de relacin que est siendo examinadas es de:
Mtodos de Dependencia
Mtodos de Interdependencia.
Modelos estructurales
Varias Variables dependient es
una Variable dependiente
Variables. C.P. Anlisis Factorial Modelos loglineal.
Casos. Anlisis Cluster
Objetos. Escalamiento multidimensio nal. Anlisis de Correspondenc ias
Mtricas. Manova. Correlaci n Cannica.
Mtrica. Regresin Mltiple. Anlisis de supervivencia
No mtrica. Anlisis Discriminante. Modelos de Regresin Logstica. Anlisis Conjunto.
MODELOS A TRATAR 1. ANLISIS DE SUPERVIVENCIA El inters se centra en establecer el tiempo necesario que ha de transcurrir para que ocurra algo. Trata de describir la proporcin de casos en diferentes momentos del tiempo que permanecen en el estudio. A menudo se emplea ms de un grupo. El anlisis presenta curvas de supervivencia para cada grupo, aunque tambin es posible realizar pruebas estadsticas para comparar los grupos
ESQUEMA GENERAL DE UN ANALISIS DE SUPERVIVENCIA
EJEMPLO Es muy comn que la variable que se desea estudiar sea el tiempo que tarda en ocurrir un suceso, ya sea ste beneficioso (curacin, alta hospitalaria) o perjudicial (muerte, aparicin de efecto adverso, rechazo del trasplante) o incluso indiferente (cambio de tratamiento). El conjunto de tcnicas estadsticas que se emplean para analizar este tipo de datos se conoce en medicina como "anlisis de supervivencia", debido a que se disearon inicialmente para estudiar el tiempo hasta el fallecimiento del paciente, fundamentalmente en el campo de la oncologa. Para centrar la exposicin supongamos que el dato de inters es el tiempo hasta la aparicin de problemas microvasculares en un conjunto de pacientes diabticos tipo II hipertensos, en un estudio prospectivo durante 5 aos. Escogemos intencionadamente un ejemplo en el que el suceso no es el fallecimiento del paciente para ilustrar precisamente el uso de estas tcnicas fuera del mbito del concepto estricto de supervivencia. La caracterstica ms importante de este tipo de datos (tiempo hasta que ocurre un suceso) es que, muy probablemente, al final del periodo de observacin no todos los pacientes habrn presentado el suceso objeto de estudio. Adems puede ocurrir que algunos pacientes se hayan perdido por causas diversas, no habiendo sido posible determinar su estado. O cuando el suceso es la muerte pueden haber fallecido por causas diferentes a las que se analizan (por ejemplo en un accidente de automovilstico).
Tambin es habitual que los pacientes vayan incorporndose durante todo el periodo de observacin, por lo que los ltimos en hacerlo sern observados durante un periodo de tiempo menor que los que entraron al principio y por lo tanto la probabilidad de que les ocurra el suceso es menor. Y por ltimo, al final habr pacientes que no presentan el suceso. Es intuitivo que con este tipo de datos no podemos usar los mtodos estadsticos habituales para variables cuantitativas, como pueden ser el clculo de medias y su comparacin mediante la t de Student. As en el ejemplo planteado qu sentido tendra calcular el tiempo medio hasta la aparicin de problemas microvasculares, cuando no todos los pacientes han sido observados durante el mismo periodo y adems hay pacientes que no llegan a tenerlos? Y qu hacemos con los pacientes que no se observaron hasta el final? Precisamente esas observaciones incompletas, todos los pacientes que hasta el ltimo momento en que fueron observados (bien sea al final del estudio o antes, si se perdieron por alguna causa) y no haban desarrollado el suceso, tienen tambin importancia, y el tiempo durante el que fueron observados debe intervenir en el anlisis, denominadas observaciones "censuradas". Si todos los pacientes estudiados experimentan el suceso durante el periodo de observacin (en nuestro ejemplo todos en algn momento llegan a presentar problemas microvasculares), es fcil calcular la proporcin de pacientes que transcurrido un tiempo determinado desde que comenz su observacin no han llegado a tener problemas microvasculares. Podramos representar grficamente la proporcin de pacientes sin problemas en funcin del tiempo desde que entraron en el estudio. Funcin de Supervivencia calculada por el mtodo de KaplanMeier: Pero las cosas no son tan sencillas si no todos los pacientes presentan el suceso. Un paciente puede haber entrado a mitad del estudio, siendo observado durante 3 aos, y al finalizar ste no presentar problemas microvasculares. No sabemos entonces que habra pasado con el paciente si lo siguiramos 2 aos ms, hasta completar los 5 aos. Ahora ya no es tan simple determinar la proporcin de pacientes con problemas microvasculares a los 5 aos desde la inclusin en el estudio. Por ello se utiliza el denominado mtodo de Kaplan-Meier, que se basa en algo que es obvio: para sobrevivir un ao hay que sobrevivir cada uno de los das de ste. Calculamos entonces para cada da la proporcin de sucesos que se observan en ese da. Utilizando el concepto de probabilidad condicional decimos que para vivir 31 das hay que vivir 30 das y luego un da ms. En estadstica esto se calcula multiplicando las probabilidades. La probabilidad de vivir una semana vendr dada por
Siendo p1 la tasa de supervivencia el primer da, p2 la del segundo, etc. La tasa de supervivencia para un da dado, por ejemplo para el sptimo, se calcula como el cociente entre el nmero de pacientes vivos el da 7 (o que no experimentaron el suceso) de entre los que estaban vivos el da anterior, el 6. En nuestro ejemplo donde dice nmero de pacientes vivos leemos nmero de pacientes sin problemas microvasculares. As que la supervivencia se calcular mediante la siguiente frmula recursiva:
Para cada instante de tiempo la supervivencia se calcula como la supervivencia en el instante anterior multiplicada por la tasa de supervivencia en ese instante. En el denominador tenemos el nmero de pacientes r que continuaban en el estudio en el instante anterior (expuestos al riesgo) y en el numerador a ese valor se resta el nmero de pacientes m que presentan el suceso en ese instante. A lo largo del tiempo van saliendo del estudio los pacientes que presentan el suceso y aquellos para los que finaliza la observacin por otras causas (incompletos). Los valores de la curva de supervivencia slo hay que calcularlos para aquellos momentos en los que se produce algn suceso, ya que en el resto de casos el numerador y el denominador coinciden y por tanto el cociente vale 1 y la supervivencia es igual que en el instante anterior, no cambia.
Si hay observaciones incompletas (censuradas o prdidas) hacen que vaya cambiando el nmero de pacientes expuestos al riesgo, pero si en un instante determinado slo hay observaciones incompletas y no hay sucesos la curva de supervivencia no cambia al ser m = 0, aunque r haya cambiado, lo que se tendr en cuenta en el siguiente instante en el que se observen sucesos ya que habr menos pacientes expuestos. Aunque la tasa de supervivencia p calculada en nuestra muestra para cada instante individual es una estimacin muy burda del valor verdadero, sin embargo el producto de muchas de esas tasas constituye una estimacin bastante precisa de la curva de supervivencia.
Ejemplo de curva de supervivencia A pesar de que la informacin que proporciona la curva de supervivencia es mucho ms fiable que las tasas individuales que se han utilizado para calcularla, se pueden producir en sta grandes saltos o grandes zonas planas, cuyo intento de explicacin puede ser complicado, sobre todo si el nmero de pacientes que permanecen es pequeo. Esta advertencia cobra especial importancia en las zonas de la derecha de la curva donde el efectivo de muestra puede ser muy pequeo. Seguidamente se presenta un ejemplo de una tabla con los datos numricos de una curva de supervivencia
Tiemp o 10 25 29 39 46 47
Superviven cia 0,9836 0,9660 0,9482 0,9299 0,9113 0,8927
Err.est. S. 0,0163 0,0236 0,0292 0,0338 0,0379 0,0415
N Sucesos 1 1 1 1 1 1
Expuest os 61 56 54 52 50 49
50 51 54 60 63 64 65 66 68 136 161 253 280 297 322 624 730 836 994 1024 1350 1775
0,8547 0,8167 0,7978 0,7788 0,7598 0,7408 0,7218 0,7028 0,6838 0,6637 0,6436 0,6214 0,5992 0,5770 0,5539 0,5193 0,4822 0,4420 0,3929 0,3438 0,2750 0,2750
0,0476 0,0525 0,0546 0,0565 0,0583 0,0598 0,0612 0,0625 0,0636 0,0649 0,0659 0,0673 0,0685 0,0694 0,0704 0,0740 0,0775 0,0808 0,0854 0,0877 0,0933 0,0933
2 2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0
47 45 43 42 41 40 39 38 37 34 33 29 28 27 25 16 14 12 9 8 5 0
Se trata de una curva obtenida con datos reales que presenta intervalos de tiempo largos en los que no aparece ningn suceso. Es esta una caracterstica comn a las curvas de supervivencia obtenidas a partir de muestras de pequeo tamao (en nuestro caso comienzan el estudio 61 pacientes). Con el fin de determinar la precisin de la estimacin es posible calcular un intervalo de confianza aproximado a partir del error estndar, que se suele indicar en las salidas de ordenador. En la figura siguiente vemos representadas las bandas de confianza para el 95 % de la curva anterior
Vemos que a los 1.350 das la supervivencia cambia de 0.3438 a valer 0.275 ya que a los 1350 das quedan en el estudio (expuestos al riesgo) 5 pacientes y se observa 1 suceso por lo que el nuevo valor de supervivencia vendr dado por
que es igual a 0.275. Sin embargo se trata de una estimacin muy imprecisa ya que el lmite inferior del intervalo de confianza aproximado es de 0.092. En las curvas a veces se representa tambin mediante un punto o una pequea raya vertical los instantes para los que existen observaciones incompletas (censuradas). Los programas de ordenador calculan el error estndar de la supervivencia mediante el mtodo de Greenwood, pero si slo se dispone de la tabla de supervivencia es posible calcular el error estndar de una forma ms simple. Si en un momento determinado el valor de la curva de supervivencia es S y hay N pacientes que continan en el estudio, el error estndar de S es aproximadamente
El razonamiento para esta frmula es muy sencillo y se basa en que para que en ese momento la supervivencia sea S y continen N pacientes, es necesario que inicialmente hubiera al menos N/S pacientes. Si fuera exactamente as (no hay observaciones incompletas), la frmula anterior no es ms que la habitual del error estndar de una proporcin, basndonos en la distribucin binomial. Comparacin de curvas de supervivencia: Para comparar dos curvas de supervivencia de forma global se suele emplear la prueba denominada log-rank. El razonamiento empleado en esta prueba es bastante fcil de comprender. Si se est comparando dos grupos de pacientes, y por ejemplo en un momento del estudio del total de pacientes que permanecen 1/4 son del grupo A y el resto 3/4 son del grupo B, y no hubiera diferencias en cuanto a la supervivencia entre los grupos, es de esperar que del total de sucesos que ocurran en ese momento 1/4 correspondan al primer grupo y 3/4 al segundo. Aunque verdaderamente no hubiera diferencias en cuanto a la supervivencia, el nmero real de sucesos observados en cada momento de tiempo puede no coincidir con lo que es ms probable, y as para el grupo A unas veces el nmero de sucesos ser superior al esperado y otras ser inferior, pero a la larga esas diferencias se equilibrarn, como las series de nmeros en una ruleta. Para efectuar los clculos se ordenan cronolgicamente las observaciones de los dos grupos de forma combinada, como si de un solo grupo se tratase, al igual que se hace para el clculo de la curva de supervivencia. Para cada instante en el que se observa algn suceso se determina el nmero total de pacientes que continan en el estudio r y cuntos son del primer grupo a. Si el nmero de sucesos que se observan en ese instante es d, el nmero esperado para el primer grupo es
con el subndice i se indica que este clculo se repite para todos los instantes de tiempo en los que se produce algn suceso, pero no para aquellos en los que slo hay observaciones incompletas, que slo contribuirn a reducir el nmero de pacientes expuestos a considerar en
el siguiente momento en el que se producen sucesos. Se calcula finalmente la suma de todos los sucesos esperados para el grupo A
Si D es el nmero total de sucesos observados en el estudio, considerando ambos grupos, el nmero de sucesos esperado para el grupo B podemos calcularlo por diferencia
Para contrastar la hiptesis nula (hiptesis de que el riesgo es el mismo en ambos grupos) se calcula
que se distribuye como una chi con 1 grado de libertad. Este mtodo es tambin vlido para comparar ms de dos grupos.
2. ANALISIS DISCRIMINANTES CONCEPTO: El anlisis discriminante se utiliza para seleccionar entre diferentes grupos, mediante el anlisis de datos con una variable dependiente categrica y variables independientes medidas en escalas de intervalo. Trata de explicar la pertenencia de las observaciones a las diferentes categoras o grupos preestablecidos. EJEMPLO Variable dependiente o criterio: Marca de Refresco que toman los consumidores (Fanta, coca-cola, etc.) Variables independientes o de prediccin: Las valoraciones obtenidas a travs de una escala Diferencial Semntico. OBJETIVO DEL ANALISIS DISCRIMINATE Explicar la pertenencia preestablecidos de individuos u objetos a grupos
Desarrollar las funciones discriminantes. Se trata de combinaciones lineales de las variables independientes, que discriminan mejor entre las categoras (Grupos) de la variable dependiente.
Identificar diferencias significativas entre los grupos en funcin de las variables predictoras Determinar las variables independientes que ms contribuyen a la diferencia entre grupos. Clasificar los casos para uno de los grupos en funcin de las variables predictoras. Evaluar la exactitud de la clasificacin. CLASIFICACION DEL ANALISIS DISCRIMINANTE Las tcnicas del Anlisis Discrimnate categoras que tiene la variable criterio se clasifican por el nmero de
1. Anlisis discriminante de dos grupos: la variable criterio tiene dos categoras (Dicotmica) 2. Anlisis discriminante mltiple: la variable criterio tiene tres o ms categoras MODELO DEL ANALISIS DISCRIMINATE El modelo estadstico en que se fundamenta el AD comprende combinaciones lineales de la siguiente estructura: D = b0 + b1 x1 + b2 x2 + b3 x3 + ..+ bK xK Siendo D la calificacin discriminante B los coeficientes discriminantes X variables predictoras PASOS DEL ANALISIS DISCRIMINANTE Los pasos o fases que contiene el anlisis discriminante son: 1. Formular el problema, 2. Estimar los coeficientes de funcin discriminante,
3. Determinar la significacin discriminante, 4. Interpretar los resultados 5. Verificar la validez del anlisis discriminante.
FORMULACION DEL PROBLEMA Hemos de identificar a travs de los objetivos que perseguimos la variable criterio y las variables predictoras o independientes. La variable criterio debe establecerse en categoras mutuamente excluyentes y colectivamente exhaustivas. Las variables predictivas deben escogerse en funcin del criterio del investigador. La muestra se divide en dos partes, Una parte de la muestra se utiliza para el clculo de la funcin discriminante (Muestra de anlisis) La otra parte que se suele denominar como proposicin o muestra de validacin y se usa para validar la funcin discriminante. Cuando la muestra es grande y se divide en dos partes iguales, lo que se hace es intercambiar el papel de las mitades hacindose lo que se denomina validacin cruzada doble. ESTIMACION La muestra de anlisis la utilizamos para determinar los coeficientes de funcin discriminante. Mtodo directo. Todos los indicadores se incluyen directamente. Es decir se incluyen todas las variables sin importar su poder de discriminacin Anlisis discriminante discreto. Las variables de prediccin entran de forma secuencial, en funcin de su capacidad para discriminar entre los grupos. El primer procedimiento es apropiado cuando, por alguna causa (modelo o experiencias) el investigador quiere que la discriminacin se base en todos los indicadores. El mtodo discreto es de utilidad cuando se quiere seleccionar un conjunto o subconjunto de indicadores para su inclusin en la funcin discriminante final. DETERMINACION DEL GRADO DE SIGNIFICACION
Para probar la significacin estadstica se toma como hiptesis nula (H ) En la poblacin las medias de todas las funciones discriminantes son iguales en todos los grupos. La prueba se basa en la de Wilks La significacin se calcula con base en una transformacin de ji cuadrado Normalmente se trabaja para un contraste del nivel de significacin = 5% Rechazamos H cuando la significacin calculada sea menor que 0 INTERPRETACION La interpretacin de los coeficientes es similar a la que se realiza en el anlisis de regresin mltiple. El valor del coeficiente de un indicador concreto depende del resto de indicadores que se incluyan en la funcin discriminante. Los signos de los coeficientes indican que valores de la variable dan como resultado valores de la funcin altos y bajos as como las correlaciones con los grupos Debido a la posible multicolinealidad en las variables predoctoras, no existe ninguna medicin objetiva de la significacin relativa de los indicadores en la discriminacin entre los grupos. Podemos tener idea de la significacin relativa al examinar los coeficientes estandarizados de la funcin discriminante En la praxis, los indicadores con coeficientes estandarizados altos contribuyen ms al poder discriminante. Tambin se analiza la significacin relativa de las variables predoctoras (indicadores) analizando las correlaciones de estructura (Cargas cannicas o cargas discriminantes) Estas correlaciones simples entre el indicador y la funcin discriminante representan la varianza que la variable independiente comparte con la funcin. Tambin podemos aadir a la interpretacin de los resultados el Perfil Caracterstico, se trata de interpretar los resultados mediante la descripcin de cada grupo en trminos de las medias de los grupos para las variables de prediccin. Una comparacin entre las medias nos ayuda a comprender sus diferencias. Para una mejor comprensin de estos conceptos reseamos el siguiente ejemplo del autor Narres K. Malhotra. EJEMPLO LOS VENDEDORES SATISFECHO CONSERVAN SU TRABAJO Se utiliz el AD para determinar qu factores explicaban las diferencias entre los vendedores que permanecen en la empresa y los que la abandonaron. Las variables utilizadas pueden observarse en la tabla de resultados.
El resultado fue: La correlacin cannica, un ndice de discriminacin R = 0,4572 es Significativa de Wilk = 0,7909, F (26 - 173) = 1,7588 y p = 0,0180. Por tanto el resultado indica que las variables consideradas discriminan entre los que se fueron de la empresa y los que permanecen.
Resultados del anlisis discriminante VARIABLE COEFICIEN TES 0.0903 0.0288 0.1567 0.0086 0.4059 0.0018 -0.0148 0.0126 0.0059 0.0118 0.0003 0.0600 0.0035 0.0014 COEFICIENTE S ESTANDARIZ ADO 0.3910 0.1515 0.1384 0.1751 0.3240 0.0365 -0.3252 0.2899 0.1404 0.2526 0.0065 0.1843 0.2915 0.0138 CARGAS CANONICA S 5446 5044 4906 4824 4651 4518 4496 4484 4387 4173 3788 3780 3571 3326
1. Trabajo 2. Promocin
3. seguridad de empleos 4. Relaciones con los clientes 5. clasificacin de la compaa 6. Trabajar con otras personas 7. desempeo general 8. Manejo del tiempo y el territorio 9. Ventas producidas 10. Habilidad para la presentacin 11. Informacin tcnica 12. Prestaciones de pago 13. cuota lograda 14. Gerencia
15. Recopilacin de informacin 16. Familia 17. Gerente de ventas 18. Compaero de trabajo 19. Cliente 20. Familia 21. empleo 22. Cliente 23. Gerente de ventas 24. gerente de ventas 25. Clientes
-0.0146 -0.0684 -0.0121 0.0225 -0.0625 0.0473 0.1378 0.0060 -0.0365 -0.0606 -0.0338
-0.3327 -0.3408 -0.1102 0.0893 -0.2797 0.1970 0.5312 -0.0255 -0.2406 -0.3333 -0.1488
-3221 2909 2671 -2602 2180 2119 -1029 1004 -0499 0467 0192
Nota: El orden de clasificacin de la significancia se en la magnitud de las cargas cannicas: a Satisfaccin b Desempeo c Ambigedad d Conflicto VALIDACION Si recordamos los datos se dividan aleatoriamente en dos submuestras. Una la denominamos muestra de anlisis y la utilizamos para estimar la funcin discriminante y la segunda que llamamos muestra de validacin se utiliza para desarrollar la matriz de clasificacin. Los valores relativos discriminantes que se calculan a travs de la muestra de anlisis, se multiplican por los valores de las variables de prediccin con el objetivo de obtener las correspondientes calificaciones discriminantes (D) de la muestra de validacin. De aqu se obtiene la razn de aciertos, que es, el porcentaje de casos que se clasifican correctamente por medio del Anlisis Discriminante. Es de utilidad el comparar el porcentaje de los casos que se clasificaron de forma correcta con el AD con el porcentaje que obtendramos por la probabilidad. Cuando las dos submuestras tienen el mismo tamao el porcentaje de clasificacin por probabilidad es 0,5, en general cuando los grupos tienen el mismo tamao el porcentaje de clasificacin por probabilidad es1 dividido por el nmero de grupos. Algunos autores citan que: La exactitud alcanzada por el AD debe ser por lo menos un 25% mayor que la alcanzada por la probabilidad.
Los paquetes estadsticos utilizados habitualmente estiman una matriz de clasificacin con base en la muestra de anlisis. Dando significacin a la variacin probable de esos datos.
COMENTARIOS Podemos definir las tcnicas multivariantes como, un conjunto de mtodos estadsticos que permiten el anlisis de forma simultnea de ms de dos variables observadas en distintos y variados tipos de investigacin. Adems gracias a las distintas aplicaciones del Anlisis Multivariante podemos analizar las relaciones entre un nmero razonablemente amplio de variables (medidas), tomadas sobre cada elemento de anlisis, en una o ms muestras simultneamente., comparar resultados, tomar decisiones, etc. La razn del anlisis estadstico multivariado radica en un mejor entendimiento del fenmeno objeto de estudio obteniendo informacin que los mtodos estadsticos univariantes y bivariantes son incapaces de conseguir.
BIBLIOGRAFA http://bibing.us.es/proyectos/abreproy/11162/fichero/Proyecto+ Manuel+Sosa%252FCap%EDtulo+7.pdf http://ciberconta.unizar.es/leccion/anamul/100.HTM http://halweb.uc3m.es/esp/Personal/personas/jmmarin/esp/AMu lt/tema1am.pdf http://www.seh-lelha.org/superviv1.htm http://books.google.cl/books?id=vq_FAbd88N4C&pg=RA1PA444&dq=analisis+de+supervivencia&hl=es&ei=SBgFTp3dC 8rd0QGZsuzODQ&sa=X&oi=book_result&ct=result&resnum=2 &ved=0CDMQ6AEwAQ#v=onepage&q&f=false http://books.google.cl/books? id=IoMan8LibZgC&pg=PA257&dq=analisis+de+supervivencia &hl=es&ei=jCQFTrrZBoKq0AH57rCmAg&sa=X&oi=book_result &ct=book-
thumbnail&resnum=5&ved=0CEIQ6wEwBA#v=onepage&q&f= false http://books.google.cl/books?id=gIT184TSS4C&printsec=frontcover&dq=analisis+MULTIVARIADO &hl=es&ei=LCUFTvqpNOnn0QGIhsn0Cg&sa=X&oi=book_result &ct=result&resnum=2&ved=0CDAQ6AEwAQ#v=onepage&q&f =false

Análisis Multivariante 1

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Análisis Multivariante 1

Hochgeladen von

Copyright:

Verfügbare Formate

INTRODUCCIN AL ANALIS MULTIVARIADO INTRODUCCIN.

El tipo de relacin que est siendo examinadas es de:

Varias Variables dependient es

una Variable dependiente

Variables. C.P. Anlisis Factorial Modelos loglineal.

Casos. Anlisis Cluster

Objetos. Escalamiento multidimensio nal. Anlisis de Correspondenc ias

Mtricas. Manova. Correlaci n Cannica.

Mtrica. Regresin Mltiple. Anlisis de supervivencia

No mtrica. Anlisis Discriminante. Modelos de Regresin Logstica. Anlisis Conjunto.

ESQUEMA GENERAL DE UN ANALISIS DE SUPERVIVENCIA

Superviven cia 0,9836 0,9660 0,9482 0,9299 0,9113 0,8927

Err.est. S. 0,0163 0,0236 0,0292 0,0338 0,0379 0,0415

thumbnail&resnum=5&ved=0CEIQ6wEwBA#v=onepage&q&f= false http://books.google.cl/books?id=gIT184TSS4C&printsec=frontcover&dq=analisis+MULTIVARIADO &hl=es&ei=LCUFTvqpNOnn0QGIhsn0Cg&sa=X&oi=book_result &ct=result&resnum=2&ved=0CDAQ6AEwAQ#v=onepage&q&f =false

Das könnte Ihnen auch gefallen