Beruflich Dokumente
Kultur Dokumente
Estadstica Multivariante
Mtodos Multivariantes
MTODOS MULTIVARIANTES O MULTIVARIADO
Mtodos estadsticos que permiten la investigacin simultanea de ms de dos variables. Ej. Los consumidores que evalan los supermercados pueden tomar en cuenta la distancia de cada tienda, la limpieza que perciben, los niveles de precios y muchos otros atributos de las tiendas. Las ventas dependen de muchas variables simultneamente. Los procedimientos que comprenden variables mltiples pueden considerarse interrelaciones complejas entre variables de una manera ms eficiente que los procedimientos sencillos como las tabulaciones cruzadas. Simplifica el problema El procedimiento con mtodos multivariantes revelan relaciones que los mtodos sencillos pasan por alto. Los procedimientos se han simplificado con el uso de programas como el SPSS.
Estadstica Multivariante 2
Mtodos Multivariantes
MTODOS MULTIVARIANTES O MULTIVARIADO Anlisis en Componentes Principales [ACP] Anlisis de Clasificacin Numrica [CLUSTER] Anlisis Factorial de Correspondencia [AFC] Regresin Logstica Binaria [RLB] Anlisis DELPHI
Estadstica Multivariante
Estadstica Multivariante
Caso :
Posicionamiento de una marca ficticia de mermelada Investigacin de 5 marcas de mermeladas. Evaluacin realizada con un grupo de jueces que evaluaron cada mermelada en base a variables sensoriales.
de
la
mermelada
Estadstica Multivariante
Las variables originales (x1, x2, x3) tienen correlacin, los componentes principales (z1, z2) son ortogonales. Los nuevos componentes principales o factores sern una combinacin lineal de las variables originales, y adems sern independientes entre s. El ACP permite la reduccin de la dimensin del problema. Va a permitir visualizar an si se tienen ms de tres variables, es decir, ms de 3 dimensiones.
Estadstica Multivariante
Anlisis en Componentes Principales ACP 1. Es una Tcnica descriptiva multidimensional. Herramienta que sabe solamente describir y maneja muchas variables que deben ser cuantitativas. Eventualmente alguna variable binaria u ordinal. Matriz de datos x Deseamos obtener otras p variables relacionadas con las primeras segn:
x1 x2 x3....... xp
1 2 . . n
DESCRIPCIN DE VARIABLES
Aroma Color Sabor Textura ( 0 20 ) ( 0 20 ) ( 0 30 ) ( 0 30 )
Estadstica Multivariante
Estadstica Multivariante
Componente 1 2 3 4
Autov alores iniciales % de la Total v arianza % acumulado 2.075 51.884 51.884 1.565 39.137 91.021 .328 8.208 99.229 .031 .771 100.000
Zs
Estadstica Multivariante
11
Estadstica Multivariante
12
Z2
Aroma
Sabor
Textura Color
13
Ejemplo 1
Componente 2
-.5
Componente 1
Estadstica Multivariante
14
Ejemplo 1
1,5
1,0
,5
Marca 3
0,0
Marca 4
-,5
Color, textura
Estadstica Multivariante
15
Ejemplo 2
Earnings (Ganancias)
Liquidez
Ejemplo 2
Resultado neto de la gestin/Activos+contingente Resultado neto de la gestin/Patrimonio Gastos de Administracin /resultado despus de incobrables Gastos de Administracin/resultado de operacin bruto Utilidad Neta/Spread Efectivo
Estadstica Multivariante
17 Incobrabilidad/Spread Efectivo
Ejemplo 3
Otro Ejemplo
Resultado Esperado
R1. Cuales es la percepcin sobre las bondades (posicionamiento) de los talleres en el Proyecto?
Poblacin
Variable
Mtodo de colecta
Encuesta
Mtodo estadstico
Tamao de la Muestra
P1. 44 adolescentes hijos de reclusos de los recintos penitenciarios de Cochabamba que actualmente participan en las actividades del proyecto Casa del Adolescente
Z1: trato (Cuantitativa) Z2 mtodo (Cuantitativa) Z3 contenido (Cuantitativa) Z4 profesor (Cuantitativa) Z5 Talleres (Cuantitativa)
Estadstica Multivariante
18
Ejemplo 3
Los Datos A los beneficiarios se les ha pedido que califiquen del uno al diez, siendo uno la menor calificacin y 10 la mayor calificacin. P4. El trato que reciben en la el proyecto ______ P5. El mtodo de enseanza________ P6. El contenido del taller________ P7. Como califica al profesor________ Resultado esperado:
Cuales es la percepcin sobre las bondades (posicionamiento) de los talleres en el Proyecto?
Estadstica Multivariante
19
Ejemplo 3
Descripcin de variables: El trato que reciben 0 - 10 El mtodo de enseanza 0 - 10 El contenido del taller 0 - 10 Como califica al profesor 0 10
Estadstica Multivariante
20
Ejemplo 3
Estadstica Multivariante
21
Ejemplo 3
Trato que reciben El mt odo de enseanza Contenido del t aller Calif icacin al prof esor
Estadstica Multivariante
22
Ejemplo 3
Estadstica Multivariante
23
Ejemplo 3
Teatro
Artesanas
0,50 000
0,00 000
-0,500 00
Computacin
-1,000 00
Msica
-1,500 00
-1,000 00
24
Ejemplo 4
Calificaciones escolares Vamos a utilizar los datos que recogen las calificaciones de los 15 alumnos de una clase en diversas asignaturas: lenguaje, matemtica, fsica, ingls, filosofa, historia, qumica
Variable LENGUA MATEMTI FSICA INGLS FILOSOF HISTORIA QUMICA PC1 0,500 -0,113 -0,052 0,499 0,450 0,493 -0,073 PC2 0,085 0,555 0,575 0,037 0,122 0,064 0,574
Estadstica Multivariante
25
Ejemplo 4
Estadstica Multivariante
26
Ejemplo 5
Barmetro empresarial El Barmetro Merco, publicado por CincoDas en marzo de 2001, y que consiste en una clasificacin de las 50 empresas con ms prestigio, en funcin de su puntuacin en las siguientes variables: REF: Resultados econmico-financieros. CPS: Calidad producto/servicio. CCCL: Cultura corporativa y calidad laboral. ERSC: tica y responsabilidad social corporativa. DGPI: Dimensin global y presencia internacional. IDI: Investigacin, desarrollo e innovacin
Variable REF CPS CCCL ERSC DGPI IDI PC1 -0,015 0,053 0,582 0,626 0,245 0,454 PC2 PC3 PC4 PC5 0,743 0,296 0,250 0,538 0,066 0,855 -0,215 -0,464 -0,187 0,038 0,439 -0,063 -0,101 0,107 0,216 0,123 0,629 -0,405 -0,036 -0,614 0,056 -0,068 -0,807 0,316 Estadstica Multivariante PC6 0,093 0,021 0,654 -0,725 -0,050 0,187
27
Ejemplo 5
REF: Resultados econmico-financieros DGPI: Dimensin global y presencia internacional. Grande y rentable?
CCCL: Cultura corporativa y calidad laboral. ERSC: tica y responsabili dad social corporativa valores intangibles?
Estadstica Multivariante
28
Estadstica Multivariante
29
Estadstica Multivariante
30
Posicionamiento de una marca ficticia de paales en funcin de las caractersticas del producto Investigacin de mercado de 3 marcas paales. Evaluacin realizada a 79 consumidores Resultado esperado: Posicionamiento de 3 marcas de paales para bebe. Variables: Dos variables de tipo cualitativa Variable 1 = Marca (M1, M2, M3) Variable 2 = Caracterstica de la marca (X1 Precio; X2 calidad; X3 Precio y calidad)
Estadstica Multivariante
31
5 10 6 21
Marca M2 14 6 11 31
M3 7 15 5 27
Total 26 31 22 79
79 paps
32
y x
Ni1 ni2 ni3.nij
nij
Estadstica Multivariante
33
2. Las variables originales tiene asociacin. Si las variables son cuantitativas hay correlacin, si las variables son cualitativas hay asociacin. 3. Perfiles de fila y columna, condicionales relativas frecuencias
Estadstica Multivariante
34
Tabla de contingencia
M1 5 10 6 21
M2
Margen activ o 26 31 22 79
Estadstica Multivariante
35
Marca M1 .238 .476 .286 1.000 M2 .452 .194 .355 1.000 M3 .259 .556 .185 1.000 Masa .329 .392 .278
Resumen Proporcin de inercia Conf ianza para el Valor propio Desv iacin tpica .101 .103 Correlacin 2 -.036
Dimensin 1 2 Total
Chi-cuadrado
Sig.
9.170
.057a
a. 4 grados de libertad
Si eliminamos F2 entonces tenemos una sola variable y analizamos una lnea recta, estaramos en una situacin de ranking. Con ms de una variable ya no se puede hablar de ranking.
Estadstica Multivariante
38
a. Normalizacin Simtrica
F1
F2
39,2% de los paps eligen un paal por la calidad, la masa de precio es 32,9%. El atributo ms apreciado es la calidad.
Estadstica Multivariante
39
Puntuacin en la dimensin De los puntos a la inercia de la dimensin 1 2 .076 .659 .589 .019 .336 .322 1.000 1.000
De la dimensin a la inercia del punto 1 2 Total .732 .268 1.000 .999 .001 1.000 .961 .039 1.000
a. Normalizacin Simtrica
Estadstica Multivariante
40
M3
Dimensin 2
-.2 "precio-calidad" -.4 -.6 -.8 -.6 -.4 -.2 0.0 .2 .4 .6 .8 M1 Marca Caracterstica de la marca
Dimensin 1
Estadstica Multivariante 41
OTRO EJEMPLO
Resultado Esperado
R4. Cules son las motivaciones principales que induce a los adolescentes a participar del proyecto?
Poblacin
Variable
Mtodo de colecta
Encuesta
Mtodo estadstico
Tamao de la Muestra
P1. 44 adolescentes hijos de reclusos de los recintos penitenciarios de Cochabamba que actualmente participan en las actividades del proyecto Casa del Adolescente
Estadstica Multivariante
42
Los Datos Para aplicar ste mtodo se ha pedido a los adolescentes que respondan para cada taller en el que participan, cual es la motivacin ms importante que los hacen participar en ese taller:
Obligado por mis padres Voluntad propia Por estar con mis amigos Porque alguien me recomend que participara
Estadstica Multivariante
43
Estadstica Multivariante
44
Tabla de correspondencias Niv el de Estudio Bachiller Tcnico 268 149 108 138 1997 1415 561 417 288 331 3250 2872 6472 5322
Sexo y Departamento Hombre La Paz Hombre Cochabamba Hombre Santa Cruz Mujer La Paz Mujer cochabamba Mujer Santa Cruz Margen activ o
Estadstica Multivariante
45
Sexo y Departamento Hombre La Paz Hombre Cochabamba Hombre Santa Cruz Mujer La Paz Mujer cochabamba Mujer Santa Cruz Masa
Estadstica Multivariante
46
Sexo y Departamento Hombre La Paz Hombre Cochabamba Hombre Sant a Cruz Mujer La Paz Mujer cochabamba Mujer Santa Cruz Margen activ o
Estadstica Multivariante
47
Dimensin 1 2 3 4 5 Total
Chi-cuadrado
Sig.
3160,768
,000a
a. 30 grados de libertad
Estadstica Multivariante
48
Puntuacin en la dimensin De los puntos a la inercia de la dimensin 1 2 ,143 ,036 ,236 ,433 ,261 ,295 ,051 ,094 ,029 ,141 ,280 ,001 1,000 1,000
Contribucin De la dimensin a la inercia del punto 1 2 Total ,924 ,040 ,964 ,743 ,238 ,982 ,833 ,164 ,997 ,645 ,207 ,852 ,463 ,386 ,849 ,983 ,001 ,983
Sexo y Departamento Hombre La Paz Hombre Cochabamba Hombre Santa Cruz Mujer La Paz Mujer cochabamba Mujer Santa Cruz Total activ o
a. Normalizacin Simtrica
Estadstica Multivariante
49
Estadstica Multivariante
50
Estadstica Multivariante
51
52
Tipo de Msica Musica Disco Rock n Rol & musica americana Pop & msica inglesa Jazz & musica autoctona clsica Margen activ o
jv enes 70 45 30 0 35 180
Estadstica Multivariante
53
Estadstica Multivariante
54
CLASIFICACIN NUMRICA SEGMENTACIN DE MERCADO - CLUSTER DESCRIPCIN DEL ESTUDIO DE CASO INTERPRETACIN DE RESULTADOS
Estadstica Multivariante
55
DESCRIPCIN DEL CASO Se trata de una Compaa ficticia que se dedica a la distribucin de productos industriales. Los datos se obtuvieron de encuestas a clientes de esta empresa. Resultado esperado Realizar la segmentacin de mercado de 100 clientes de la empresa ficticia.
Estadstica Multivariante
56
DESCRIPCIN DE VARIABLES X1: Velocidad de entrega. Tiempo transcurrido entre pedido y entrega X2: Imagen del fabricante Imagen conjunta del fabricante X3: Calidad de producto Nivel de calidad percibido en un producto Pobre
Estadstica Multivariante
10 Excelente
57
EL MODELO
Subdividir un conjunto de n individuos en un nmero de clases o
grupos considerando p variables simultneamente. El CLUSTER calcula las distancias en hiperespacios multivariables y pide ayuda al ACP para visualizar
x1 x2 x3....... xp
1 2 3 . . n
x1 x2 x3....... xp
G1 G2 Gi . . GQ
Xnp
Estadstica Multivariante
58
x2 A
F
E
Ejemplo: Segmentar a nios de acuerdo al peso y talla para una campaa de nutricin
Estadstica Multivariante
x1
59
Initial Eigenv alues % of Cumulativ Total Variance e% 1,506 50,207 50,207 1,035 34,516 84,723 ,458 15,277 100,000
60
Velocidad es negativo y va hacia la izquierda. Hacia la izquierda es valorada como una empresa rpida
imagen
Extraction Method: Princ ipal Component Analy sis. a. 2 components ext ract ed.
Es el ms alto y como es positivo va hacia la derecha es valorada como buena calidad Es el que falta por bautizar, como es positivo, va arriba. Hacia arriba la imagen es valorada positivamente
velocidad
calidad
Estadstica Multivariante
61
Imagen
3 3 2 2 2 2 2 2 2 2 2 22 2
1 1
1 1 2 2 1 1 1 1 1 11 1 1 2 2
12 1 2 2
Velocidad
1 1 1 1
-1
1 1 2
2 22 2 2 2 2 2 2 22 2 22 2 2 2 2 2 2 2 4 4 4 2 2 4 22 2 22 2 4 4 2 4 2 4 4 2 2 4 2
Calidad
4 4 4
-2
-3 -2 -1 0 1 2 3
Estadstica Multivariante
62
Estadstica Multivariante
63
Estimacin de la demanda
Compra de un producto existente en el mercado Datos del ingreso, patrimonio y edad de 42 clientes.
Resultado esperado:
Estimacin de la demanda y seleccin de determinantes de demanda
Estadstica Multivariante 64
COMPRA 1
INGRESO 502
VIVIENDA 1
EDAD 43
1
0 1
703
429 485
Estadstica Multivariante
1
1 0
61
52 36
65
PRINCIPIO DEL MODELO 1. Variable dependiente de naturaleza cualitativa binaria, variables independientes, naturaleza diversa 2. Modelo de la regresin logstica binaria 3. Estimacin de probabilidades, grupo de pertenencia 4. Test de WALD, significacin de los coeficientes de regresin
Estadstica Multivariante
66
y x
1 y= 1+ e-z
y 1 1 x1 2 x2 ... p x p
Donde:
a Tabla de clasificaci n
Pronosticado Compra del serv icio 0 1 17 3 3 19 Porcentaje correcto 85.0 86.4 85.7
Paso 1
0 1
No compra = 0 Compra = 1
Estadstica Multivariante
68
Estadstica Multivariante
69
Z = 1 + 2 Ingreso+ 3 vivienda + 4 edad Z = -6.958 + 0,2 Ingreso + 2.764 vivienda 0,82 edad Aplicamos EXP o antilog a cada coeficiente (base e; e=2,71728) y obtenemos lo mismo que en la columna EXP(B) en la diapositiva anterior; ordenando: L = 0,001 + 1,02020 Ingreso + 15,85 vivienda - 0,921 edad
En el cuadro anterior observamos que la constante y la variable edad no eran estadsticamente significativos. Por tanto, ambas variables son eliminadas del modelo. Interpretacin: a cada coeficiente le podemos restar 1 y multiplicarlo por 100, entonces obtenemos la variacin porcentual en la chance de debido a un incremento de una unidad en el j-esimo regresor. Por ejemplo: 1,0202 1 = 0,02020 X 100 = 2,02%
El SPSS arroja probabilidades.
Estadstica Multivariante 70
Estadstica Multivariante
71
Estadstica Multivariante
72
Estadstica Multivariante
73
Estadstica Multivariante
74
Estadstica Multivariante
75