Sie sind auf Seite 1von 5

ANÁLISIS BIVARIADO

Prof. Oscar Tinoco

Comprende la interrelación de dos variables. Cuando las dos variables son cuantitativas
corresponde el análisis de correlación y el de regresión. Si las variables son cualitativas,
procede la prueba Chi Cuadrado, a través de tablas de contingencia.

CORRELACIÓN LINEAL

Como ejemplo, consideremos las cifras del Cuadro 1, que muestra datos mensuales de
producción y costos de operación para una empresa británica de transporte de pasajeros
por carretera (la producción se mide en términos de miles de millas-vehículo recorridas
por mes, y los costos se miden en términos de miles de libras por mes).
Cuadro 1.
Operaciones Mensuales en una Empresa de Transporte de Pasajeros.
nro cot mive Impor
1 213,9 3147 1
2 212,6 3160 2
3 215,3 3197 2
4 215,3 3173 2
5 215,4 3292 1
6 228,2 3561 1
7 245,6 4013 1
8 259,9 4244 1
9 250,9 4159 2
10 234,5 3776 2
11 205,9 3232 1
12 202,7 3141 2
13 198,5 2928 1
14 195,6 3063 2
15 200,4 3096 1
16 200,1 3096 2
17 201,5 3158 1
18 213,5 3338 2
19 219,5 3492 2
20 243,7 4019 1
21 262,3 4394 1
22 252,3 4251 2
23 224,4 3844 1
24 215,3 3276 2
25 202,5 3184 2
26 200,7 3037 1
27 201,8 3142 1
28 202,1 3159 1
29 200,4 3139 2
30 209,3 3203 1
31 213,9 3307 2
32 227,0 3585 1
33 246,4 4073 2
Para poder visualizar el grado de relación que existe entre las variables, como primer
paso en el análisis es conveniente elaborar un diagrama de dispersión, que es una
representación en un sistema de coordenadas cartesianas de los datos numéricos
observados. En el diagrama resultante, en el eje X se miden las millas-vehículo
recorridas, y en el eje Y se mide el costo de operación mensual. Cada punto en el
diagrama muestra la pareja de datos (millas-vehículo y costos de operación) que
corresponde a un mes determinado. Como era de esperarse, existe una relación
positiva entre estas variables: una mayor cantidad de millas-vehículo recorridas
corresponde un mayor nivel de costos de operación.

260,0
Costo total (miles)

240,0

220,0

200,0

3000 3500 4000

Millas vehículo

La correlación se mide a través del coeficiente de correlación de Pearson, simbolizada


como “r”, cuyos valores van desde –1 hasta 1.

REGRESIÓN LINEAL

Este análisis implica la formulación de un modelo lineal de dependencia entre las dos
variables. Una de ellas, la dependiente, se ubica en el eje vertical, y la otra, denominada
independiente, se ubica en el eje horizontal.

Y = Bo + B1 X

Bo y B1 son los coeficientes del modelo, los mismos que tienen que ser hallados a partir
de valores experimentales de las variables X e Y.

A partir de los datos del cuadro 1, tenemos:


Y = 64.96 + 0.044674 X

Podemos concluir que por cada milla adicional recorrida, los costos de operación
aumentan en aproximadamente 4.5 centavos—esto podría interpretarse como el “costo
marginal” para la empresa de recorrer una milla adicional—mientras que el coeficiente
b0 nos estaría indicando la parte del costo mensual que no varía directamente con la
cantidad de millas recorridas (aproximadamente 64,960 libras mensuales).

Ejercicio Propuesto 1

Se tienen los datos de 15 concesionarios de una conocida marca de automóviles. La


gerencia presume que si las comisiones de ventas aumentaran aumentaría el número de
autos vendidos.

nro X Y
1 3,6 11,28
2 5,2 14,74
3 5,3 18,46
4 7,3 20,01
5 5,0 12,43
6 5,2 15,37
7 3,0 9,59
8 3,1 11,26
9 3,2 8,05
10 7,5 27,91
11 8,3 24,62
12 6,1 18,80
13 4,9 13,87
14 5,8 12,11
15 7,1 23,68
En donde X comisión por ventas de autos, mientras que Y representa las ganancias netas
derivadas de las mismas ventas, en el mismo período.

a) Efectuar el análisis de correlación, tanto gráfico como analítico. Interpretar.


b) Formular y obtener el modelo de regresión lineal. Interpretar.

ESTUDIOS DE CASO

Caso Nº 1:

Un investigador de mercados está interesado en proyectar las ventas para una


distribuidora de materiales de construcción. Por su parte, el gerente de la distribuidora
cree que existe una asociación razonable entre las ventas y las licencias de construcción
otorgadas por los gobiernos locales.
Utilizar los datos de la siguiente tabla para efectuar una proyección del volumen de
ventas:

Distribuidor Volumen de ventas del Licencias de construcción


distribuidor (miles) otorgadas
1 77 86
2 79 93
3 80 95
4 83 104
5 101 139
6 117 180
7 129 165
8 120 147
9 97 119
10 106 132
11 99 126
12 121 156
13 103 129
14 86 96
15 99 108

a) Identificar la variable dependiente y la variable independiente


VD= Volumen de ventas
VI= Licencias
b) Crear el archivo de datos, nominándolo caso1.sav
c) Elaborar el diagrama de dispersión. Interpretar.
d) Obtener el coeficiente de correlación de Pearson. Interpretar.
e) Suponiendo que la tabla de datos corresponde a una muestra aleatoria, efectuar la
inferencia de la correlación. Interpretar.
f) Obtener los parámetros del modelo de regresión lineal para las variables indicadas.
g) Si un municipio ha otorgado 150 licencias de construcción ¿cuál será el volumen de
ventas?

Caso 2: Correlación de rangos

La tabla siguiente contiene la relación entre las calificaciones que otorga un gerente de
ventas a sus empleados en cuanto a su aptitud para las ventas y los años de servicio en la
empresa.
Empleado Calificación de aptitud para las ventas Años de servicio
1 3 5
2 5 11
3 1 1
4 4 3
5 8 5
6 3 4
7 6 13
8 2 6
9 5 9
10 7 10

Obtener e interpretar:
a) El coeficiente de correlación de Spearman
b) El coeficiente de correlación de Kendall
Caso Nº 3:
El mercado de la oferta nacional para fruta exportable está compuesto por cuatro
empresas, una de las cuales es Expofrut S.A. Las ambiciosas metas de crecimiento de
Expofrut S.A. la han llevado a tener la intención de formar un fondo de inversiones, a
fin de consolidarse como la empresa más grande de exportación frutícola del mercado.
Para conocer el comportamiento futuro de la demanda de exportación de cajas de frutas,
se dispone de la información histórica relacionada con diferentes mercados destino.

Año Canadá Argentina Uruguay


1 15 10 20
2 20 10 25
3 25 15 20
4 15 5 30
5 30 20 15
6 35 25 10
7 40 30 25
8 45 35 30

Considere el total de exportaciones como variable dependiente del tiempo y formule y


obtenga los parámetros correspondientes de un modelo de regresión:
a) Lineal simple
b) Cuadrático
c) Cúbico

¿Cuál de ellos “ajusta” mejor el conjunto de datos?.

Caso Nº 4:

Proyectar la demanda en función del ingreso utilizando el método de la regresión


parabólica, teniendo como demanda histórica lo siguiente:

Ingreso Demanda
1.2 4.5
1.8 5.9
3.1 7.0
4.9 7.8
7.1 6.8
8.6 4.5

Compararlo con los resultados para un modelo lineal o cúbico.