Sie sind auf Seite 1von 47

Prof. Grabiela Montes Q.

DEFINICIN:
El anlisis multivariante es el conjunto de
tcnicas estadsticas que analizan
simultneamente ms de dos variables en
una muestra de observaciones.
Su razn de ser radica en un mejor
entendimiento del fenmeno objeto de
estudio obteniendo informacin que los
mtodos estadsticos univariantes y
bivariantes son incapaces de conseguir.
Los mtodos de anlisis multivariable se
aplican a la investigacin comercial con la
finalidad de resumir y sintetizar, amplios
conjuntos de datos, para obtener las
informaciones ms vlidas y poder
comprender mejor el problema que se est
estudiando.
APLICACIONES AL MARKETING
Permite analizar gran nmero de encuestas,
lo que suministra a las empresas gran
volumen de informacin sobre los
mercados actuales y futuros.
Hace posible comprender una gran cantidad
de datos con una mnima prdida de la
informacin, proporcionando algunas veces
imgenes grficas.
Permite analizar simultneamente toda la
informacin sobre el fenmeno,
considerando todos los factores que
intervienen en l.
Permite utilizar tanto variables continuas
como discretas, nominales u ordinales en el
anlisis.
Se pueden clasificar en dos grandes grupos:
Mtodos de dependencia y de
interdependencia.
Mtodos de dependencia:
Suponen que las variables analizadas estn
divididas en dos grupos: las variables
dependientes y las variables independientes.
El objetivo de los mtodos de dependencia
consiste en determinar si el conjunto de
variables independientes afecta al conjunto
de variables dependientes y de qu forma.
Mtodos de interdependencia:
Estos mtodos no distinguen entre variables
dependientes e independientes y su objetivo
consiste en identificar qu variables estn
relacionadas, cmo lo estn y por qu.


Se pueden clasificar en dos grandes
subgrupos segn que la variable (s)
dependiente (s) sea (n) cuantitativas o
cualitativas.
Si la variable dependiente es cuantitativa,
algunas de las tcnicas que se pueden
aplicar son las siguientes:

1. Anlisis de Regresin
Es la tcnica adecuada si en el anlisis hay
una o varias variables dependientes
mtricas cuyo valor depende de una o varias
variables independientes mtricas. Por
ejemplo, intentar predecir el gasto anual en
cine de una persona a partir de su nivel de
ingresos, nivel de estudios , sexo y edad.

2. Anlisis de Supervivencia
Es similar al anlisis de regresin pero con la
diferencia de que la variable independiente es
el tiempo de supervivencia de un individuo
objeto. Por ejemplo, intentar predecir el
tiempo de permanencia en el desempleo de
un individuo a partir de su nivel de estudios y
de su edad.
3. Anlisis de la varianza
Se utilizan en situaciones en las que la
muestra total est dividida en varios grupos
basados en una o varias variables
independientes no mtricas y las variables
dependientes analizadas son mtricas. Su
objetivo es averiguar si hay diferencias
significativas entre dichos grupos en cuanto a
las variables dependientes se refiere. Por
ejemplo, hay diferencias en el nivel de
colesterol por sexos? afecta, tambin, el tipo
de ocupacin?
4. Correlacin Cannica
Su objetivo es relacionar simultneamente
varias variables mtricas dependientes e
independientes calculando combinaciones
lineales de cada conjunto de variables que
maximicen la correlacin existente entre los
dos conjuntos de variables. Por ejemplo,
analizar cmo estn relacionadas el tiempo
dedicado al trabajo y al ocio de una persona
con su nivel de ingresos, su edad y su nivel
de educacin.
Si la variable dependiente es cualitativa, las
tcnicas que se pueden aplicar son las
siguientes:

1. Modelos de regresin logstica
Son modelos de regresin en los que la
variable dependiente es no mtrica. Se
utilizan como una alternativa al anlisis
discriminante cuando no hay normalidad.
2. Anlisis Discriminante
Esta tcnica proporciona reglas de
clasificacin ptimas de nuevas
observaciones de las que se desconoce su
grupo de procedencia basndose en la
informacin proporcionada los valores que
en ella toman las variables independientes.
Por ejemplo, determinar los ratios
financieros que mejor permiten discriminar
entre empresas rentables y poco rentables.

3. Anlisis Conjunto (Conjoint Analysis)
Es una tcnica que analiza el efecto de
variables independientes no mtricas sobre
variables mtricas o no mtricas. La
diferencia de Conjoint con el Anlisis de la
Varianza radica en que las variables
dependientes pueden ser no mtricas y los
valores de las variables independientes no
mtricas son fijadas por el analista.

Una aplicacin de la tcnica Conjoint es la
siguiente. Por ejemplo, una empresa quiere
disear un nuevo producto y, para ello,
necesita especificar la forma del envase, su
precio , el contenido por envase y su
composicin qumica. Presenta diversas
composiciones de estos cuatro factores. 100
clientes proporcionan un ranking de las
combinaciones que se le presentan. Se quiere
determinar los valores ptimos de estos 4
factores.
Se pueden clasificar en dos grandes grupos
segn que el tipo de datos que analicen sean
mtricos o no mtricos.
Si los datos son mtricos, se pueden utilizar,
entre otras, las siguientes tcnicas:
1. Anlisis Factorial (AF) y Anlisis de
Componentes Principales (ACP)
Se utiliza para analizar interrelaciones entre
un nmero elevado de variables mtricas
explicando dichas interrelaciones en trminos
de un nmero menor de variables
denominadas factores (si son inobservables)
o componentes principales (si son
observables).
As, por ejemplo, si un analista financiero
quiere determinar cul es el estado de salud
financiero de una empresa a partir del
conocimiento de un nmero de ratios
financieros, construyendo varios ndices
numricos que definan su situacin, el
problema se resolvera mediante un ACP.
Si un psiclogo quiere determinar los factores
que caracterizan la inteligencia de un
individuo a partir de sus respuestas a un test
de inteligencia, utilizara para resolver este
problema un AF.

2. Escalas Multidimensionales
Su objetivo es transformar juicios de
semejanza o preferencia en distancias
representadas en un espacio
multidimensional. Como consecuencia, se
construye un mapa en el que se dibujan las
posiciones de los objetos comparados de
forma que aquellos percibidos como similares
estn cercanos unos de otros y alejados de
objetos percibidos como distintos.
Por ejemplo, analizar, en el mercado de
refrescos, las percepciones que un grupo de
consumidores tiene acerca de una lista de
refrescos y marcas con el fin de estudiar qu
factores subjetivos utiliza un consumidor a la
hora de clasificar dichos productos.

3. Anlisis Cluster
Su objetivo es clasificar una muestra de
entidades (individuos o variables) en un
nmero pequeo de grupos de forma que las
observaciones pertenecientes a un grupo
sean muy similares entre s y muy disimilares
del resto.
A diferencia del Anlisis Discriminante, en el
Anlisis Cluster se desconoce el nmero y la
composicin de dichos grupos. Por ejemplo,
clasificar grupos de alimentos (pescados,
carnes, vegetales y leche) en funcin de sus
valores nutritivos.

Si los datos fuesen no mtricos, se podran
utilizar, adems, las siguientes tcnicas:
1. Anlisis de Correspondencias
Se aplica a tablas de contingencia y
persigue un objetivo similar al de las
escalas multidimensionales pero
representando simultneamente las filas y
columnas de las tablas de contingencia.
2. Modelos log-lineales
Se aplican a tablas de contingencia
multidimensionales y modelizan relaciones de
dependencia multidimensional de las
variables observadas que buscan explicar las
frecuencias observadas.
Las etapas de un anlisis multivariante
pueden sintetizarse en las seis siguientes:
1. Objetivos del anlisis
Se define el problema especificando
los objetivos y las tcnicas multivariantes
que se van a utilizar. El investigador debe
establecer el problema en trminos
conceptuales, definiendo los conceptos y
las relaciones fundamentales que se van a
investigar.
Se deben establecer si dichas relaciones van
a ser relaciones de dependencia o de
interdependencia. Con todo esto se
determinan las variables a observar.
2. Diseo del anlisis
Se determina el tamao muestral, las
ecuaciones a estimar (si procede), las
distancias a calcular (si procede) y las
tcnicas de estimacin a emplear. Una vez
determinado todo esto, se proceden a
observar los datos.

3. Hiptesis del anlisis
Se evalan las hiptesis subyacentes a la
tcnica multivariante. Dichas hiptesis
pueden ser de normalidad, linealidad,
independencia, homocedasticidad, etc.
Tambin se debe decidir qu hacer con los
datos missing.
4. Realizacin del anlisis
Se estima el modelo y se evala el ajuste a los
datos. En este paso pueden aparecer
observaciones atpicas (outliers) o influyentes
cuya influencia sobre las estimaciones y la
bondad de ajuste se debe analizar.
5. Interpretacin de los resultados
Dichas interpretaciones pueden llevar a
reespecificaciones adicionales de las variables
o del modelo con lo cual se puede volver de
nuevo a los pasos 3 y 4.

Matriz de Datos. Se observan p variables
numricas en un conjunto de n elementos.
(
(
(
(
(

=
np n2 n1
2p 22 21
1p 12 11
x x x
x x x
x x x
X

Vector de Medias: Es una medida de


centralizacin de los datos.
n
x
x ,
x
x
X
n
1 i
ij
j
p
1

=
=
(
(
(

=
Matriz de Varianzas y Covarianzas (S): Es
una matriz cuadrada y simtrica que
contiene en la diagonal las varianzas y
fuera de la diagonal las covarianzas entre
las variables.
( )( )
2
j j j
n
1 i
k ik j ij
j k
2
p p1
1p
2
1
s s y ,
n
x x x x
s
donde
s s
s s
S
=

=
(
(
(

Matriz de Correlaciones (R): Cada elemento


de esta matriz se obtiene de la siguiente
manera:




Donde s
i
es la desviacin estndar de la
variable X
i.

j i
ij
ij
s s
s
r =

Marcas
Caractersticas
Elegancia Comodidad Deportivo
A
B
C
D
E
F
2
3
4
5
8
9
3
2
5
5
9
7
6
4
4
4
6
7
Para los datos anteriores tenemos que el
vector de medias est dado por:
(
(
(

=
5.167
5.167
5.167
X
Y la matriz de Varianzas y Covarianzas est
dada por:
(
(
(

=
1.4723 4723 . 1 8056 . 1
4723 . 1 5.4723 5.3056
8056 . 1 5.3056 6.4722
S
Y la matriz de Correlaciones est dada por:
(
(
(

=
1 519 . 0 585 . 0
519 . 0 1 0.892
585 . 0 0.892 1
R
Este anlisis tiene como objetivo representar
la informacin contenida en una matriz de
datos de n observaciones y p variables, con
un nmero menor de variables construidas
como combinaciones lineales de las
originales.
El espacio de dimensin r que mejor
representa a los puntos viene definido por
los vectores propios asociados a los r
mayores valores propios de S.
Se calculan los valores propios o races
caractersticas,
1
,,
p
, de la matriz de
varianzas y covarianzas de las variables, S,
mediante:
0 I S =
Y los vectores propios asociados son los ai
tales que:



Los trminos
i
son nmeros reales.
Llamando Z a la matriz cuyas columnas son
los vectores de los p componentes en los n
individuos, estas nuevas variables estn
relacionadas con las originales mediante:
Z = XA
donde AA=I.
( ) 0 a I S
i i
=
Observacin:
Si las variables que se quieren estudiar estn
en diferentes unidades, se debe reemplazar
en el anlisis, la matriz de Varianzas-
Covarianzas (S) por la matriz de Correlaciones
(R).
0 3 1.59 - 0.54
0 0
0 0
0 0
1 0.52 0.58
0.52 1 0.89
0.58 0.89 1

0 I - R
ecuacin la de races las son propios valores Los
1 52 . 0 58 . 0
52 . 0 1 0.89
58 . 0 0.89 1
R
3 2
= + =
(
(
(

(
(
(

=
=
(
(
(

Las races de este polinomio son:



1
= 2.3447,
2
= 0.5508,
3
= 0.1045
La varianza total es (
1
+
2
+
3
) = 3.
El vector propio asociado a
1
nos da los
pesos de la primera componente principal.
Para calcularlo se resuelve el sistema
Ra
1
=
1
a
1
5054 . 0 a , 603 . 0 a , 622 . 0 a
: tanto lo por uno, norma tenga
vector el que imponiendo obtiene se solucin La
0
0
0
a 34 . 1 0.52a .58a 0
0.52a a 34 . 1 0.89a
0.58a 0.89a a 34 . 1
a
a
a
3447 . 2
a
a
a
1 52 . 0 58 . 0
52 . 0 1 0.89
58 . 0 0.89 1
13 12 11
13 12 11
13 12 11
13 12 11
13
12
11
13
12
11
= = =
(
(
(

=
(
(
(

+
+
+ +
(
(
(

=
(
(
(

(
(
(

(
(
(

=
5054 . 0
603 . 0
622 . 0
a
1
Y el primer componente es:

Z
1
= 0.622X
1
+ 0.603X
2
+ 0.5054X
3

Repitiendo el proceso con los otros dos autovalores
tenemos los otros dos componentes:
Z
2
= -0.29X
1
0.419X
2
+ 0.861X
3

Z
3
= 0.73X
1
0.678X
2
0.084X
3

Das könnte Ihnen auch gefallen