Sie sind auf Seite 1von 75

Estadstica Multivariante Lic. MSc. Juan Carlos Sejas Ch.

Estadstica Multivariante

Mtodos Multivariantes
MTODOS MULTIVARIANTES O MULTIVARIADO

Mtodos estadsticos que permiten la investigacin simultanea de ms de dos variables. Ej. Los consumidores que evalan los supermercados pueden tomar en cuenta la distancia de cada tienda, la limpieza que perciben, los niveles de precios y muchos otros atributos de las tiendas. Las ventas dependen de muchas variables simultneamente. Los procedimientos que comprenden variables mltiples pueden considerarse interrelaciones complejas entre variables de una manera ms eficiente que los procedimientos sencillos como las tabulaciones cruzadas. Simplifica el problema El procedimiento con mtodos multivariantes revelan relaciones que los mtodos sencillos pasan por alto. Los procedimientos se han simplificado con el uso de programas como el SPSS.
Estadstica Multivariante 2

Mtodos Multivariantes

MTODOS MULTIVARIANTES O MULTIVARIADO Anlisis en Componentes Principales [ACP] Anlisis de Clasificacin Numrica [CLUSTER] Anlisis Factorial de Correspondencia [AFC] Regresin Logstica Binaria [RLB] Anlisis DELPHI

Estadstica Multivariante

Anlisis en Componentes Principales - ACP

POSICIONAMIENTO EN EL MERCADO: Aproximacin cuantitativa


ANLISIS EN COMPONENTES PRINCIPALES ACP DESCRIPCIN DE CASOS DE ESTUDIO INTERPRETACIN DE RESULTADOS

Estadstica Multivariante

Anlisis en Componentes Principales - ACP

Caso :
Posicionamiento de una marca ficticia de mermelada Investigacin de 5 marcas de mermeladas. Evaluacin realizada con un grupo de jueces que evaluaron cada mermelada en base a variables sensoriales.

Resultado esperado: Posicionamiento ficticia

de

la

mermelada

Estadstica Multivariante

Anlisis en Componentes Principales - ACP

Las variables originales (x1, x2, x3) tienen correlacin, los componentes principales (z1, z2) son ortogonales. Los nuevos componentes principales o factores sern una combinacin lineal de las variables originales, y adems sern independientes entre s. El ACP permite la reduccin de la dimensin del problema. Va a permitir visualizar an si se tienen ms de tres variables, es decir, ms de 3 dimensiones.

Estadstica Multivariante

Anlisis en Componentes Principales ACP 1. Es una Tcnica descriptiva multidimensional. Herramienta que sabe solamente describir y maneja muchas variables que deben ser cuantitativas. Eventualmente alguna variable binaria u ordinal. Matriz de datos x Deseamos obtener otras p variables relacionadas con las primeras segn:

x1 x2 x3....... xp
1 2 . . n

Z1 a11 X 1 a12 X 2 ...... a1 p X p

Z 2 a21 X 1 a22 X 2 ...... a2 p X p . . . Z p a p1 X 1 a p 2 X 2 ...... a pp X p


Estadstica Multivariante 7

Anlisis en Componentes Principales ACP Ejemplo 1

DESCRIPCIN DE VARIABLES
Aroma Color Sabor Textura ( 0 20 ) ( 0 20 ) ( 0 30 ) ( 0 30 )

La escala de medicin utilizada: Promedio

Estadstica Multivariante

Anlisis en Componentes Principales ACP Ejemplo 1

DESCRIPCIN DE LA BASE DE DATOS


Marca Marca 1 Ficticia Don Serafn Marca 3 Marca 4 Malloa Marca 5 Aroma 10 16 13 12 12 Color 15 17 13 20 11 Sabor 18 24 20 10 14 Textura 11 16 14 25 11

Estadstica Multivariante

Anlisis en Componentes Principales ACP Ejemplo 1

SALIDAS DEL SPSS


Matri z de correlacionesCoeficientes r Correlacin AROMA COLOR SABOR TEXTURA AROMA 1.000 .176 .600 .194 COLOR .176 1.000 -.201 .863 SABOR .600 -.201 1.000 -.468 TEXTURA .194 .863 -.468 1.000
Si mejora la textura puede empeora el sabor 10

Si mejora la textura, mejora el color


Estadstica Multivariante

Anlisis en Componentes Principales ACP Ejemplo 1

SALIDAS DEL SPSS


Varianza total explicada Sumas de las saturaciones al cuadrado de la extraccin % de la Total v arianza % acumulado 2.075 51.884 51.884 1.565 39.137 91.021

Componente 1 2 3 4

Autov alores iniciales % de la Total v arianza % acumulado 2.075 51.884 51.884 1.565 39.137 91.021 .328 8.208 99.229 .031 .771 100.000

Mtodo de extraccin: Anlisis de Componentes principales.

Zs

Estadstica Multivariante

11

Anlisis en Componentes Principales - ACP Ejemplo 1

Cmo bautizo a los componentes principales (Zs)?


Los coeficientes factoriales deben ser prximos a (1 , -1). Una variable debe tener coeficientes factoriales elevados slo con un factor. No deben existir factores con coeficientes factoriales similares

SALIDAS DEL SPSS

Estadstica Multivariante

12

Anlisis en Componentes Principales - ACP Ejemplo 1 SALIDAS DEL SPSS


Z1
a Matri z de componentes

Z2

Aroma

Sabor

AROMA COLOR SABOR TEXTURA

Componente 1 2 -.011 .943 .886 .309 -.594 .740 .968 .182

Textura Color

Mtodo de extraccin: Anlisis de componentes principales. a. 2 componentes extra dos


Este es el segundo ms alto, entonces Z1 es Color Este es el ms alto, entonces Z1 es Textura Este es el ms alto, entonces Z2 es Aroma

Este es el segundo ms alto, entonces Z2 es Sabor Estadstica Multivariante

13

Anlisis en Componentes Principales ACP

Ejemplo 1

SALIDAS DEL SPSS


Grfico de componentes
1.0 sabor aroma

.5 color textura 0.0

Componente 2

-.5

-1.0 -1.0 -.5 0.0 .5 1.0

Componente 1

Estadstica Multivariante

14

Anlisis en Componentes Principales ACP

Ejemplo 1

RESULTADOS DEL POSICIONAMIENTO


Aroma, Sabor
2,0
Ficticia D on Serafn

Las coordenadas tienen 5 decimales de precisin

1,5

1,0

,5

Marca 3
0,0

Marca 4
-,5

Color, textura

Marca 1 Malloa Marca 5

-1,0 -1,0 -,5 0,0 2 ,5 1,0 1,5 2,0

REGR factor score 1 for analysis

Estadstica Multivariante

15

Anlisis en Componentes Principales - ACP

Ejemplo 2

INDICADORES FINANCIEROS C.A.M.E.L. 1998

Banco Econmico Banco Bisa Banco Unin

Banco Santa Cruz Banco Banco Bisa Unin

Earnings (Ganancias)

Liquidez

Fuente: Revista Nueva Economa. Ao 1 N 5, Marzo de 1999.


Estadstica Multivariante 16

Anlisis en Componentes Principales ACP

Ejemplo 2

INDICADORES FINANCIEROS C.A.M.E.L. 1998

Disponibilidades/obligaciones a corto plazo


Disponibilidades+inversiones temporarias/Obligaciones a CP

Resultado neto de la gestin/Activos+contingente Resultado neto de la gestin/Patrimonio Gastos de Administracin /resultado despus de incobrables Gastos de Administracin/resultado de operacin bruto Utilidad Neta/Spread Efectivo

Estadstica Multivariante

17 Incobrabilidad/Spread Efectivo

Anlisis en Componentes Principales - ACP

Ejemplo 3

Otro Ejemplo

Resultado Esperado
R1. Cuales es la percepcin sobre las bondades (posicionamiento) de los talleres en el Proyecto?

Poblacin

Variable

Mtodo de colecta
Encuesta

Mtodo estadstico

Tamao de la Muestra

P1. 44 adolescentes hijos de reclusos de los recintos penitenciarios de Cochabamba que actualmente participan en las actividades del proyecto Casa del Adolescente

Z1: trato (Cuantitativa) Z2 mtodo (Cuantitativa) Z3 contenido (Cuantitativa) Z4 profesor (Cuantitativa) Z5 Talleres (Cuantitativa)

Anlisis en No Corresponde. Componentes Censo Principales

Estadstica Multivariante

18

Anlisis en Componentes Principales ACP

Ejemplo 3

Los Datos A los beneficiarios se les ha pedido que califiquen del uno al diez, siendo uno la menor calificacin y 10 la mayor calificacin. P4. El trato que reciben en la el proyecto ______ P5. El mtodo de enseanza________ P6. El contenido del taller________ P7. Como califica al profesor________ Resultado esperado:
Cuales es la percepcin sobre las bondades (posicionamiento) de los talleres en el Proyecto?

Estadstica Multivariante

19

Anlisis en Componentes Principales ACP

Ejemplo 3

Descripcin de variables: El trato que reciben 0 - 10 El mtodo de enseanza 0 - 10 El contenido del taller 0 - 10 Como califica al profesor 0 10

Estadstica Multivariante

20

Anlisis en Componentes Principales ACP

Ejemplo 3

En base a la encuesta se ha obtenido la siguiente base de datos (cada celda es un promedio).


PROMEDIOS Taller Electricidad Computacin Artesanas Msica Teatro Dulces y Chocolates El trato que El mtodo de El contenido Calificacin reciben enseanza del taller del profesor 10,0000 9,3333 9,8000 9,1250 10,0000 10,0000 8,0000 9,0000 9,0000 9,1250 10,0000 9,2222 7,0000 9,0833 9,6000 8,6875 10,0000 8,6667 9,0000 9,5833 10,0000 9,0625 10,0000 8,8889

Estadstica Multivariante

21

Anlisis en Componentes Principales - ACP

Ejemplo 3

En base a la encuesta se ha obtenido la siguiente base de datos (cada celda es un promedio).


a Matri z de componentes

Trato que reciben El mt odo de enseanza Contenido del t aller Calif icacin al prof esor

Componente 1 2 -,011 ,994 ,889 -,043 ,986 -,087 ,839 ,160

Mtodo de extraccin: Anlisis de componentes principales. a. 2 componentes extra dos

Estadstica Multivariante

22

Anlisis en Componentes Principales - ACP

Ejemplo 3

Salidas del SPSS

Estadstica Multivariante

23

Anlisis en Componentes Principales ACP

Ejemplo 3

Posicionamiento de los Talleres de la Casa del Adolescente


Agosto de 2007
Electricidad.

Z2 El trato que reciben


Dulces y Choc.

Teatro

REGR factor score 2 for analysis 1

Artesanas

0,50 000

0,00 000

Z1 mtodo de enseanza, la calificacin del profesor y contenido del taller

-0,500 00

Computacin

-1,000 00

Msica
-1,500 00

-1,000 00

0,00 000 1,00 000 Estadstica Multivariante

24

REGR factor score 1 for analys is 1

Anlisis en Componentes Principales ACP

Ejemplo 4

Calificaciones escolares Vamos a utilizar los datos que recogen las calificaciones de los 15 alumnos de una clase en diversas asignaturas: lenguaje, matemtica, fsica, ingls, filosofa, historia, qumica
Variable LENGUA MATEMTI FSICA INGLS FILOSOF HISTORIA QUMICA PC1 0,500 -0,113 -0,052 0,499 0,450 0,493 -0,073 PC2 0,085 0,555 0,575 0,037 0,122 0,064 0,574

Estadstica Multivariante

25

Anlisis en Componentes Principales ACP

Ejemplo 4

Materias de ciencias o materias exactas

Materias no exactas o materias de letras

Estadstica Multivariante

26

Anlisis en Componentes Principales ACP

Ejemplo 5

Barmetro empresarial El Barmetro Merco, publicado por CincoDas en marzo de 2001, y que consiste en una clasificacin de las 50 empresas con ms prestigio, en funcin de su puntuacin en las siguientes variables: REF: Resultados econmico-financieros. CPS: Calidad producto/servicio. CCCL: Cultura corporativa y calidad laboral. ERSC: tica y responsabilidad social corporativa. DGPI: Dimensin global y presencia internacional. IDI: Investigacin, desarrollo e innovacin
Variable REF CPS CCCL ERSC DGPI IDI PC1 -0,015 0,053 0,582 0,626 0,245 0,454 PC2 PC3 PC4 PC5 0,743 0,296 0,250 0,538 0,066 0,855 -0,215 -0,464 -0,187 0,038 0,439 -0,063 -0,101 0,107 0,216 0,123 0,629 -0,405 -0,036 -0,614 0,056 -0,068 -0,807 0,316 Estadstica Multivariante PC6 0,093 0,021 0,654 -0,725 -0,050 0,187

27

Anlisis en Componentes Principales ACP

Ejemplo 5

REF: Resultados econmico-financieros DGPI: Dimensin global y presencia internacional. Grande y rentable?

CCCL: Cultura corporativa y calidad laboral. ERSC: tica y responsabili dad social corporativa valores intangibles?

Estadstica Multivariante

28

Anlisis Factorial de Correspondencia - AFC

POSICIONAMIENTO EN EL MERCADO: Aproximacin cualitativa


ANLISIS FACTORIAL DE CORRESPONDENCIA AFC DESCRIPCIN DEL ESTUDIO DE CASO INTERPRETACIN DE RESULTADOS

Estadstica Multivariante

29

Anlisis Factorial de Correspondencia - AFC

ANLISIS FACTORIAL DE CORRESPONDENCIA AFC


El Anlisis de Correspondencias es una tcnica estadstica que se aplica al anlisis de tablas de contingencia y construye un diagrama cartesiano basado en la asociacin entre las variables analizadas. En dicho grfico se representan conjuntamente las distintas modalidades de la tabla de contingencia, de forma que la proximidad entre los puntos representados est relacionada con el nivel de asociacin entre dichas modalidades

Estadstica Multivariante

30

Anlisis Factorial de Correspondencia AFC Ejemplo 1

Posicionamiento de una marca ficticia de paales en funcin de las caractersticas del producto Investigacin de mercado de 3 marcas paales. Evaluacin realizada a 79 consumidores Resultado esperado: Posicionamiento de 3 marcas de paales para bebe. Variables: Dos variables de tipo cualitativa Variable 1 = Marca (M1, M2, M3) Variable 2 = Caracterstica de la marca (X1 Precio; X2 calidad; X3 Precio y calidad)

Estadstica Multivariante

31

Anlisis Factorial de Correspondencia AFC Ejemplo 1 DESCRIPCIN DEL PROBLEMA


Tabla de contingencia Caractersti ca de la marca * Marca Recuento M1 Caracterstica de la marca Total
5 eligen la marca 1 por el precio Frecuencias bidimensionales. Dos variables Estadstica Multivariante

precio calidad "precio-calidad"

5 10 6 21

Marca M2 14 6 11 31

M3 7 15 5 27

Total 26 31 22 79

Frecuencias marginales que manejan solo una variable

79 paps

32

Anlisis Factorial de Correspondencia AFC Ejemplo 1

PRINCIPIO DEL MODELO

1. Estudiar la dependencia entre dos variables de tipo cualitativas, nunca cuantitativa.

y x
Ni1 ni2 ni3.nij

nij

Estadstica Multivariante

33

Anlisis Factorial de Correspondencia AFC Ejemplo 1

2. Las variables originales tiene asociacin. Si las variables son cuantitativas hay correlacin, si las variables son cualitativas hay asociacin. 3. Perfiles de fila y columna, condicionales relativas frecuencias

4. Nocin de Masa, frecuencias marginales relativas 5. Resultado final: Representacin factorial

Estadstica Multivariante

34

Anlisis Factorial de Correspondencia AFC Ejemplo 1

SALIDAS DEL SPSS


Tabla de correspondencias Caracterstica de la marca precio calidad "precio-calidad" Margen activ o Marca M3 14 6 11 31 7 15 5 27

Tabla de contingencia

M1 5 10 6 21

M2

Margen activ o 26 31 22 79

Estadstica Multivariante

35

Anlisis Factorial de Correspondencia AFC Ejemplo 1

SALIDAS DEL SPSS


Perfiles de fil a Caracterstica de la marca precio calidad "precio-calidad" Masa
19,2% de los papas que compran por el precio eligen la marca 1

Frecuencias condicionales relativas

M1 .192 .323 .273 .266

Marca M2 M3 .538 .269 .194 .484 .500 .227 .392 .342

Margen activ o 1.000 1.000 1.000

La condicin es por fila la lectura se la realiza de manera horizontal Estadstica Multivariante 36

Anlisis Factorial de Correspondencia AFC Ejemplo 1

SALIDAS DEL SPSS


Perfiles de columna Caracterstica de la marca precio calidad "precio-calidad" Margen activ o
23.8% del total de paps que han elegido la marca 1 lo hacen por el precio

Marca M1 .238 .476 .286 1.000 M2 .452 .194 .355 1.000 M3 .259 .556 .185 1.000 Masa .329 .392 .278

La condicin es por columna, la lectura se realiza de manera vertical Estadstica Multivariante 37

Anlisis Factorial de Correspondencia AFC Ejemplo 1

SALIDAS DEL SPSS


Antes en el AFC se llamaban Zs ahora son factores

Resumen Proporcin de inercia Conf ianza para el Valor propio Desv iacin tpica .101 .103 Correlacin 2 -.036

Dimensin 1 2 Total

Valor propio .334 .068

Inercia .111 .005 .116

Chi-cuadrado

Sig.

9.170

.057a

Explicada .960 .040 1.000

Acumulada .960 1.000 1.000

a. 4 grados de libertad

Si eliminamos F2 entonces tenemos una sola variable y analizamos una lnea recta, estaramos en una situacin de ranking. Con ms de una variable ya no se puede hablar de ranking.

H0: X e Y son independientes y la alternativa es H1: X e Y son dependientes

Estadstica Multivariante

38

Anlisis Factorial de Correspondencia AFC Ejemplo 1

SALIDAS DEL SPSS


Frecuencia marginal relativa calculada para una sola variable
Examen de l os puntos de fila a Puntuacin en la dimensin De los puntos a la inercia de la dimensin 1 2 .248 .422 .606 .002 .146 .576 1.000 1.000 Contribucin De la dimensin a la inercia del punto 1 2 Total .933 .067 1.000 1.000 .000 1.000 .858 .142 1.000

Caracterstica de la marca precio calidad "precio-calidad" Total activ o

Masa .329 .392 .278 1.000

1 -.502 .718 -.418

2 .296 .018 -.376

Inercia .030 .067 .019 .116

a. Normalizacin Simtrica

F1

F2

39,2% de los paps eligen un paal por la calidad, la masa de precio es 32,9%. El atributo ms apreciado es la calidad.

Los Fs son coordenadas en el plano factorial

Estadstica Multivariante

39

Anlisis Factorial de Correspondencia AFC Ejemplo 1

SALIDAS DEL SPSS


Frecuencia marginal relativa calculada para una sola variable F1 F2
a Examen de los puntos columna

Los Fs son coordenadas en el plano factorial


Contribucin

Puntuacin en la dimensin De los puntos a la inercia de la dimensin 1 2 .076 .659 .589 .019 .336 .322 1.000 1.000

Marca M1 M2 M3 Total activ o

Masa .266 .392 .342 1.000

1 .308 -.708 .573

2 -.412 .058 .254

Inercia .011 .066 .039 .116

De la dimensin a la inercia del punto 1 2 Total .732 .268 1.000 .999 .001 1.000 .961 .039 1.000

a. Normalizacin Simtrica

Estadstica Multivariante

40

Anlisis Factorial de Correspondencia AFC Ejemplo 1

SALIDAS DEL SPSS


Puntos de columna y de fila Simtrica Normalizacin
.4 .2 M2 -.0 calidad precio

M3

Dimensin 2

-.2 "precio-calidad" -.4 -.6 -.8 -.6 -.4 -.2 0.0 .2 .4 .6 .8 M1 Marca Caracterstica de la marca

Dimensin 1
Estadstica Multivariante 41

Anlisis Factorial de Correspondencia AFC Ejemplo 2

OTRO EJEMPLO
Resultado Esperado
R4. Cules son las motivaciones principales que induce a los adolescentes a participar del proyecto?

Poblacin

Variable

Mtodo de colecta
Encuesta

Mtodo estadstico

Tamao de la Muestra

P1. 44 adolescentes hijos de reclusos de los recintos penitenciarios de Cochabamba que actualmente participan en las actividades del proyecto Casa del Adolescente

W1: que me motiva a entrar al proyecto. (Cualitativa)

No Anlisis factorial de Corresponde. Censo correspondencia

Estadstica Multivariante

42

Anlisis Factorial de Correspondencia AFC Ejemplo 2

Los Datos Para aplicar ste mtodo se ha pedido a los adolescentes que respondan para cada taller en el que participan, cual es la motivacin ms importante que los hacen participar en ese taller:

Obligado por mis padres Voluntad propia Por estar con mis amigos Porque alguien me recomend que participara

Estadstica Multivariante

43

Anlisis Factorial de Correspondencia AFC Ejemplo 2

Salidas del SPSS

Estadstica Multivariante

44

Anlisis Factorial de Correspondencia AFC Ejemplo 3


Los desempleados de Bolivia

Tabla de correspondencias Niv el de Estudio Bachiller Tcnico 268 149 108 138 1997 1415 561 417 288 331 3250 2872 6472 5322

Sexo y Departamento Hombre La Paz Hombre Cochabamba Hombre Santa Cruz Mujer La Paz Mujer cochabamba Mujer Santa Cruz Margen activ o

Ninguno 147 182 415 72 57 204 1077

Primaria 1120 751 6545 902 534 5931 15783

Secundaria 908 564 5690 1646 1127 9434 19369

Univ ersitario 127 50 670 461 260 2196 3764

Maestria 94 58 877 236 127 1890 3282

Margen activ o 2813 1851 17609 4295 2724 25777 55069

Estadstica Multivariante

45

Anlisis Factorial de Correspondencia AFC Ejemplo 3


Los desempleados de Bolivia
Perfiles de fila Niv el de Estudio Bachiller Tcnico ,095 ,053 ,058 ,075 ,113 ,080 ,131 ,097 ,106 ,122 ,126 ,111 ,118 ,097

Sexo y Departamento Hombre La Paz Hombre Cochabamba Hombre Santa Cruz Mujer La Paz Mujer cochabamba Mujer Santa Cruz Masa

Ninguno ,052 ,098 ,024 ,017 ,021 ,008 ,020

Primaria ,398 ,406 ,372 ,210 ,196 ,230 ,287

Secundaria ,323 ,305 ,323 ,383 ,414 ,366 ,352

Univ ersitario ,045 ,027 ,038 ,107 ,095 ,085 ,068

Maestria ,033 ,031 ,050 ,055 ,047 ,073 ,060

Margen activ o 1,000 1,000 1,000 1,000 1,000 1,000

Estadstica Multivariante

46

Anlisis Factorial de Correspondencia AFC Ejemplo 3


Los desempleados de Bolivia
Perfiles de columna Niv el de Estudio Bachiller Tcnico ,041 ,028 ,017 ,026 ,309 ,266 ,087 ,078 ,044 ,062 ,502 ,540 1,000 1,000

Sexo y Departamento Hombre La Paz Hombre Cochabamba Hombre Sant a Cruz Mujer La Paz Mujer cochabamba Mujer Santa Cruz Margen activ o

Ninguno ,136 ,169 ,385 ,067 ,053 ,189 1,000

Primaria ,071 ,048 ,415 ,057 ,034 ,376 1,000

Secundaria ,047 ,029 ,294 ,085 ,058 ,487 1,000

Univ ersitario ,034 ,013 ,178 ,122 ,069 ,583 1,000

Maestria ,029 ,018 ,267 ,072 ,039 ,576 1,000

Masa ,051 ,034 ,320 ,078 ,049 ,468

Estadstica Multivariante

47

Anlisis Factorial de Correspondencia AFC Ejemplo 3


Los desempleados de Bolivia
Resumen Proporcin de inercia Conf ianza para el Valor propio Desv iacin tpica ,004 ,006 Correlacin 2 ,244

Dimensin 1 2 3 4 5 Total

Valor propio ,218 ,091 ,035 ,024 ,006

Inercia ,047 ,008 ,001 ,001 ,000 ,057

Chi-cuadrado

Sig.

3160,768

,000a

Explicada ,825 ,144 ,021 ,010 ,001 1,000

Acumulada ,825 ,969 ,989 ,999 1,000 1,000

a. 30 grados de libertad

Estadstica Multivariante

48

Anlisis Factorial de Correspondencia AFC Ejemplo 3


Los desempleados de Bolivia
a Examen de los puntos de fila

Puntuacin en la dimensin De los puntos a la inercia de la dimensin 1 2 ,143 ,036 ,236 ,433 ,261 ,295 ,051 ,094 ,029 ,141 ,280 ,001 1,000 1,000

Contribucin De la dimensin a la inercia del punto 1 2 Total ,924 ,040 ,964 ,743 ,238 ,982 ,833 ,164 ,997 ,645 ,207 ,852 ,463 ,386 ,849 ,983 ,001 ,983

Sexo y Departamento Hombre La Paz Hombre Cochabamba Hombre Santa Cruz Mujer La Paz Mujer cochabamba Mujer Santa Cruz Total activ o

Masa ,051 ,034 ,320 ,078 ,049 ,468 1,000

1 -,781 -1,235 -,421 ,376 ,360 ,361

2 ,253 1,082 -,290 ,330 ,508 -,016

Inercia ,007 ,015 ,015 ,004 ,003 ,014 ,057

a. Normalizacin Simtrica

Estadstica Multivariante

49

Anlisis Factorial de Correspondencia AFC Ejemplo 3


Los desempleados de Bolivia

Estadstica Multivariante

50

Anlisis Factorial de Correspondencia AFC Ejemplo 3


Los desempleados de Bolivia

Estadstica Multivariante

51

Anlisis Factorial de Correspondencia AFC Ejemplo 4


Msica y Edad Supongamos 400 tiendas de discos repartidas entre los pases de la U.E. Se clasifica a los compradores en 3 categoras distintas: Jvenes Edad Media Mayores
Los tipos de msica los clasificamos en 5 tipos: A = Msica disco B = Rocknroll y msica americana C = Pop y msica inglesa (meldicas) D = Jazz y msica autctona E = Clsica Estadstica Multivariante

52

Anlisis Factorial de Correspondencia AFC Ejemplo 4


Tabla de correspondencias compradores media edad may ores 0 0 45 30 80 5 160 0 30 20 10 60

Tipo de Msica Musica Disco Rock n Rol & musica americana Pop & msica inglesa Jazz & musica autoctona clsica Margen activ o

jv enes 70 45 30 0 35 180

Margen activ o 70 90 90 100 50 400

Estadstica Multivariante

53

Anlisis Factorial de Correspondencia AFC Ejemplo 4

Estadstica Multivariante

54

Clasificacin Numrica - Segmentacin de Mercado (CLUSTER)

CLASIFICACIN NUMRICA SEGMENTACIN DE MERCADO - CLUSTER DESCRIPCIN DEL ESTUDIO DE CASO INTERPRETACIN DE RESULTADOS

Estadstica Multivariante

55

Clasificacin Numrica - Segmentacin de Mercado (CLUSTER)

DESCRIPCIN DEL CASO Se trata de una Compaa ficticia que se dedica a la distribucin de productos industriales. Los datos se obtuvieron de encuestas a clientes de esta empresa. Resultado esperado Realizar la segmentacin de mercado de 100 clientes de la empresa ficticia.

Estadstica Multivariante

56

Clasificacin Numrica - Segmentacin de Mercado (CLUSTER)

DESCRIPCIN DE VARIABLES X1: Velocidad de entrega. Tiempo transcurrido entre pedido y entrega X2: Imagen del fabricante Imagen conjunta del fabricante X3: Calidad de producto Nivel de calidad percibido en un producto Pobre
Estadstica Multivariante

10 Excelente
57

Clasificacin Numrica - Segmentacin de Mercado (CLUSTER)

EL MODELO
Subdividir un conjunto de n individuos en un nmero de clases o
grupos considerando p variables simultneamente. El CLUSTER calcula las distancias en hiperespacios multivariables y pide ayuda al ACP para visualizar

La tcnica, agrupa filas en grupos o segmentos.

x1 x2 x3....... xp
1 2 3 . . n

x1 x2 x3....... xp
G1 G2 Gi . . GQ

Xnp

Estadstica Multivariante

58

Clasificacin Numrica - Segmentacin de Mercado (CLUSTER)

x2 A

F
E

Ejemplo: Segmentar a nios de acuerdo al peso y talla para una campaa de nutricin
Estadstica Multivariante

x1
59

Clasificacin Numrica - Segmentacin de Mercado (CLUSTER)

Salidas del SPSS


Total Variance Explained Extraction Sums of Squared Loadings % of Cumulativ Total Variance e% 1,506 50,207 50,207 1,035 34,516 84,723

Component Z 1 Velocidad Z 2 Imagen Z 3 calidad

Initial Eigenv alues % of Cumulativ Total Variance e% 1,506 50,207 50,207 1,035 34,516 84,723 ,458 15,277 100,000

Extraction Method: Principal Component Analy sis.


Autovalores: es la cantidad de informacin que se lleva cada uno de los Zs. Vamos a retener los Zs cuyo valor es mayor que uno. Estadstica Multivariante Aproxim adamen te un 15, 277 no entra

60

Clasificacin Numrica - Segmentacin de Mercado (CLUSTER)

Salidas del SPSS


Component
a Matrix

v elocidad de entrega imagen del f abricante calidad del produc to

Component 1 2 -, 813 ,384 ,267 ,940 ,880 6, 990E-02

Velocidad es negativo y va hacia la izquierda. Hacia la izquierda es valorada como una empresa rpida

imagen

Extraction Method: Princ ipal Component Analy sis. a. 2 components ext ract ed.
Es el ms alto y como es positivo va hacia la derecha es valorada como buena calidad Es el que falta por bautizar, como es positivo, va arriba. Hacia arriba la imagen es valorada positivamente

velocidad

calidad

Estadstica Multivariante

61

Clasificacin Numrica - Segmentacin de Mercado (CLUSTER)

Salidas del SPSS: Segmentacin clientes


3 3 3

Imagen
3 3 2 2 2 2 2 2 2 2 2 22 2

1 1

1 1 2 2 1 1 1 1 1 11 1 1 2 2

12 1 2 2

Velocidad

1 1 1 1

-1

1 1 2

2 22 2 2 2 2 2 2 22 2 22 2 2 2 2 2 2 2 4 4 4 2 2 4 22 2 22 2 4 4 2 4 2 4 4 2 2 4 2

Calidad
4 4 4

-2

-3 -2 -1 0 1 2 3

Estadstica Multivariante

62

REGR factor score 1 for anal ysis

Regresin Logstica Binaria - RLB

MTODO: REGRESIN LOGSTICA BINARIA

DESCRIPCIN DEL ESTUDIO DE CASO INTERPRETACIN DE RESULTADOS

Estadstica Multivariante

63

Regresin Logstica Binaria - RLB

Estimacin de la demanda

Compra de un producto existente en el mercado Datos del ingreso, patrimonio y edad de 42 clientes.

Resultado esperado:
Estimacin de la demanda y seleccin de determinantes de demanda
Estadstica Multivariante 64

Regresin Logstica Binaria - RLB

DESCRIPCIN DEL PROBLEMA

COMPRA 1

INGRESO 502

VIVIENDA 1

EDAD 43

1
0 1

703
429 485
Estadstica Multivariante

1
1 0

61
52 36
65

Regresin Logstica Binaria - RLB

PRINCIPIO DEL MODELO 1. Variable dependiente de naturaleza cualitativa binaria, variables independientes, naturaleza diversa 2. Modelo de la regresin logstica binaria 3. Estimacin de probabilidades, grupo de pertenencia 4. Test de WALD, significacin de los coeficientes de regresin

Estadstica Multivariante

66

Regresin Logstica Binaria - RLB

Modelo de Regresin Lineal Simple, RLS y Mltiple, RLM

y x
1 y= 1+ e-z

y 1 1 x1 2 x2 ... p x p

Modelo de Regresin Logstico Binario RLB


Funcin de distribucin logstica

Donde:

Z = 1 + 1X1 + 2X2 + + pXp


Estadstica Multivariante 67

Regresin Logstica Binaria - RLB

a Tabla de clasificaci n

Pronosticado Compra del serv icio 0 1 17 3 3 19 Porcentaje correcto 85.0 86.4 85.7

Paso 1

Observ ado Compra del serv icio Porcentaje global

0 1

a. El v alor de corte es .500

No compra = 0 Compra = 1

Estadstica Multivariante

68

Regresin Logstica Binaria - RLB

De una chi cuadrado


Variables en l a ecuacin Paso a 1 INGRESOS VIVIENDA EDAD Constante B .020 2. 764 -. 082 -6.958 E.T. .008 1. 181 .074 3. 864 Wald 6. 564 5. 478 1. 224 3. 242 gl 1 1 1 1 Sig. .010 .019 .269 .072 Exp(B) 1. 020 15. 856 .921 .001

a. Variable(s) introduc ida(s ) en el paso 1: INGRESOS, VIVIENDA, EDAD.

Z = 1 + 2 Ingreso+ 3 vivienda + 4 edad

Si es menor a 0,05, la variable es incluida

Z = -6.95 + 0,2 Ingreso + 2.76 vivienda 0,82 edad


Son los antilogaritmos de los coeficientes de la columna B.

Estadstica Multivariante

69

Regresin Logstica Binaria - RLB

Z = 1 + 2 Ingreso+ 3 vivienda + 4 edad Z = -6.958 + 0,2 Ingreso + 2.764 vivienda 0,82 edad Aplicamos EXP o antilog a cada coeficiente (base e; e=2,71728) y obtenemos lo mismo que en la columna EXP(B) en la diapositiva anterior; ordenando: L = 0,001 + 1,02020 Ingreso + 15,85 vivienda - 0,921 edad

En el cuadro anterior observamos que la constante y la variable edad no eran estadsticamente significativos. Por tanto, ambas variables son eliminadas del modelo. Interpretacin: a cada coeficiente le podemos restar 1 y multiplicarlo por 100, entonces obtenemos la variacin porcentual en la chance de debido a un incremento de una unidad en el j-esimo regresor. Por ejemplo: 1,0202 1 = 0,02020 X 100 = 2,02%
El SPSS arroja probabilidades.
Estadstica Multivariante 70

Escalamiento multidimensional- MDS Ejemplo 1: Turismo

Estadstica Multivariante

71

Escalamiento multidimensional- MDS Ejemplo 2: Crmenes

Estadstica Multivariante

72

Escalamiento multidimensional- MDS Ejemplo 3: geopoltica

Estadstica Multivariante

73

Escalamiento multidimensional- MDS Ejemplo 4: rendimiento en bolsas de valores

Estadstica Multivariante

74

Escalamiento multidimensional- MDS Ejemplo 5: distancias entre ciudades

Estadstica Multivariante

75

Das könnte Ihnen auch gefallen