Sie sind auf Seite 1von 18

2EPRVARIABLES ESTADSTICAS BIDIMENSIONALES 43

2 VARIABLES ESTADSTICAS BIDIMENSIONALES



1 Se ha medido el volumen, X, y la presin, Y, de una masa gaseosa y se ha obtenido:
X (litros) 165 103 074 061 053 045
Y (Kg/cm
2
) 05 10 15 20 25 30
a) Dibujar el diagrama de dispersin.
b) Estudiar las distribuciones marginales.
c) Calcular la covarianza y el coeficiente de correlacin.
d) Obtener las dos rectas de regresin y representarlas sobre la nube de puntos.
e) Qu presin correspondera a un volumen de 1 litro?
f) Qu volumen correspondera a una presin de 08 Kg/cm
2
?
g) Cmo de bueno es el ajuste?


REGRESIN LINEAL CON EXCEL

1. Introducir los datos.
En una columna introducir los valores de X. En la columna siguiente introducir
los valores de Y.

2. Hacer clic en Asistente para grficos (o bien Insertar-Grfico).

3. Ejecutar los cuatro pasos siguientes (para avanzar de un paso a otro pulsar
Siguiente)

Paso 1 Tipo de grfico
Seleccionar XY (Dispersin) y el primer subtipo Dispersin.
Compara pares de valores.
Paso 2 Datos del grfico
Rango de datos: definir las celdas de las dos columnas donde
estn los datos (los valores de X y los de Y)
Series en: escoger Columnas
Paso 3 Opciones de grfico
Ttulos
Escribir Ttulo deseado para el grfico, as como para el Eje de
valores de X y el Eje de valores de Y
Lneas de divisin
Seleccionar slo Lneas de divisin principales en el eje Y
Leyenda
Desactivar Mostrar leyenda

Paso 4 Colocar el grfico
Como objeto en: Hoja 1

Finalizar

4. Se pueden efectuar modificaciones sobre el grfico el Formato de puntos de
datos. En Tramas se selecciona Borde y rea, etc.


44 ESTADSTICA J. Snchez M. S. Snchez



2EPRVARIABLES ESTADSTICAS BIDIMENSIONALES 45





46 ESTADSTICA J. Snchez M. S. Snchez




En el grfico anterior se presenta la tabla de la distribucin bidimensional {(x
i
, y
i
);n
i
=1}
completada con las columnas de x
i
2
, y
i
2
y x
i
y
i
que permitiran efectuar todos los


2EPRVARIABLES ESTADSTICAS BIDIMENSIONALES 47
clculos manualmente, pero la intencin ahora es usar la Hoja de Clculo EXCEL y
sus funciones estadsticas. stas proporcionan todos los resultados requeridos (y
mucho ms).

RECTA DE REGRESIN EN EL GRFICO (Lnea de tendencia)

Para empezar, una vez obtenido el grfico, le hemos incorporado la recta de regresin
mnimo cuadrtica de Y sobre X y el cuadrado del coeficiente de correlacin de
PEARSON. Para ello se hace clic con el botn derecho sobre uno de los puntos del
diagrama de dispersin. Aparece un cuadro de dilogo en el que seleccionamos
Agregar lnea de tendencia:



En Tipo, seleccionaremos Lineal. En Opciones seleccionaremos Presentar ecuacin
en el grfico y/o Presentar el valor de R cuadrado en el grfico:



El resultado es el que se observa en la figura citada (pg. 46).



48 ESTADSTICA J. Snchez M. S. Snchez
Escribiendo aparte las columnas A y B en el orden Y, X y procediendo como antes
podemos obtener el diagrama de dispersin con los ejes cambiados y aadirle la
ecuacin de la recta de regresin de X sobre Y, como muestra el segundo grfico.

DISTRIBUCIONES MARGINALES, CONJUNTA Y REGRESIN

Haciendo clic en Funcin f
x
, o bien en Insertar Funcin, seleccionamos la categora de
Estadsticas, dentro de la cual elegimos la funcin que necesitamos como se explica a
continuacin. (Cada vez que se marca una funcin, abajo aparece su sintaxis y una
explicacin de lo que hace.)



Para la media aritmtica de X e Y empleamos, respectivamente:

=PROMEDIO(A3:A8) y =PROMEDIO(B3:B8)

Para la desviacin tpica de X e Y empleamos, respectivamente:

=DESVESTP(A3:A8) y =DESVESTP(B3:B8)

Para la covarianza empleamos =COVAR(A3:A8; B3:B8).

Para las rectas de regresin, podemos copiarlas de los grficos como se explic antes,
o bien determinar sus coeficientes as:

R. de regresin de Y sobre X: y = mx + b
m es devuelto por =ESTIMACION.LINEAL(B3:B8;A3:A8)
b lo es por =TENDENCIA(B3:B8;A3:A8;0)



2EPRVARIABLES ESTADSTICAS BIDIMENSIONALES 49
R. de regresin de X sobre Y: x = My + B
M es devuelto por =ESTIMACION.LINEAL(A3:A8;B3:B8)
B lo es por =TENDENCIA(A3:A8;B3:B8;0)







50 ESTADSTICA J. Snchez M. S. Snchez
Para obtener el coeficiente de regresin de Y sobre X, m (pendiente de la recta de
regresin de Y sobre X, y = mx + b), utilizamos la funcin
=ESTIMACION.LINEAL(B3:B8;A3:A8)
que lleva dos argumentos: B3:B8, que contiene los valores de la variable Y,
considerada aqu dependiente, y A3:A8, que contiene los valores de la variable X,
considerada aqu independiente.

Para obtener la ordenada en el origen, b, de la recta de regresin de Y sobre X,
utilizamos la funcin
=TENDENCIA(B3:B8;A3:A8;0)
que lleva tres argumentos: B3:B8 y A3:A8, con el significado anterior, y 0, lo que
significa que b es el valor que el ajuste asigna a x
0
= 0; esto es, la ordenada del punto
de interseccin de dicha recta con el eje de ordenadas.


Para obtener el coeficiente de regresin de X sobre Y, M (inverso de la pendiente
de la recta de regresin de X sobre Y, x = My + B), utilizamos la funcin
=ESTIMACION.LINEAL(A3:A8;B3:B8)
que lleva dos argumentos: A3:A8, que contiene los valores de la variable X,
considerada ahora dependiente, y B3:B8, que contiene los valores de la variable Y,
considerada ahora independiente.

Para obtener la abscisa en el origen, B, de la recta de regresin de X sobre Y,
utilizamos la funcin
=TENDENCIA(A3:A8;B3:B8;0)
que lleva tres argumentos: A3:A8 y B3:B8, con el significado anterior, y 0, lo que
significa que B es el valor que el ajuste asigna a y
0
= 0; est es, la abscisa del punto de
interseccin de dicha recta con el eje de abscisas.


La ecuacin de la recta de regresin de Y sobre X es y=-1,9015x+3,3378, luego:

) / ( , , , ) (
2
0 0
cm Kg 4363 1 3378 3 1 9015 1 y litro 1 x = + = = a

La ecuacin de la recta de regresin de X sobre y es x=-0,4360y+1,598, luego:

) ( , , , , ) / ( , litros 2492 1 598 1 8 0 4360 0 x cm Kg 8 0 y
0
2
0
= + = = a

Esto est tambin recogido en la figura de la pg. 40 como Estimaciones:

0 0
y litro 1 x ) ( a = = TENDENCIA(B3:B8;A3:A8;1) = 1,4363 (Kg/cm
2
)

0
2
0
x cm Kg 8 0 y ) / ( , a = = TENDENCIA(A3:A8;B3:B8;0,8) = 1,2492 (litros)

Puesto que el coeficiente de correlacin 1 9105 0 = , , la correlacin (negativa)
es muy fuerte, y las estimaciones anteriores son muy fiables.


2EPRVARIABLES ESTADSTICAS BIDIMENSIONALES 51

2. Se han anotado las calificaciones de un test de aptitud, X, obtenidas por seis
aspirantes a agentes comerciales, y las ventas del primer ao de prueba, Y, en cientos de
euros:
X 25 42 33 54 29 36
Y 42 73 50 90 45 48
a) Dibujar el diagrama de dispersin.
b) Estudiar las distribuciones marginales.
c) Calcular la covarianza y el coeficiente de correlacin.
d) Obtener las dos rectas de regresin y representarlas sobre la nube de puntos.
e) Qu venta se puede predecir a un aspirante que ha obtenido una nota de 50?
f) Si un aspirante ha vendido 6500 euros, qu nota se le puede predecir?
g) Cmo de fiables son las predicciones?




52 ESTADSTICA J. Snchez M. S. Snchez


3 Se ha medido la dureza, X, y el porcentaje de nquel, Y, en ocho barras de una
aleacin de acero:
(Dureza) X 36 41 42 43 44 45 47 50
(%Nquel) Y 25 27 28 29 30 32 33 35
a) Dibujar el diagrama de dispersin.
b) Estudiar las distribuciones marginales.
c) Calcular la covarianza y el coeficiente de correlacin.
d) Obtener las dos rectas de regresin y representarlas sobre la nube de puntos.
e) Qu porcentaje de nquel se puede predecir a una barra de dureza 39?
f) Si una barra tiene 31% de nquel, qu dureza se le puede predecir?
g) Cmo de fiables son las predicciones?





2EPRVARIABLES ESTADSTICAS BIDIMENSIONALES 53
4 Clasificados 100 jvenes por su edad, X, y su salario, Y, en cientos de euros,
se obtiene la siguiente distribucin:


Y
X

]45; 75]

]75; 105]

]105; 135]
20 10 3 2
21 5 15 5
22 2 20 15
23 0 13 10

a) Estudiar las distribuciones marginales.
b) Calcular la covarianza y el coeficiente de correlacin.
c) Obtener las dos rectas de regresin.
d) Qu salario se puede predecir a un joven de 24 aos?
e) Qu edad se puede predecir a un joven que tiene un salario de 1200 ?
f) Cmo de fiables son las predicciones?

Completamos la tabla de doble entrada con los clculos necesarios:



Las medias, varianzas, desviaciones tpicas, covarianza y coeficiente de correlacin
resultan:
68 21
100
2168
X , = = 45 9
100
945
Y , = =
9776 0 68 21
100
47100
X Var
2
, ) ' ( ) ( = = 2075 4 45 9
100
9351
Y Var
2
, ) , ( ) ( = =
9887 0 9776 0 X Var
X
, , ) ( = + = + = 0512 2 2075 4 Y Var
Y
, , ) ( = + = + =
9240 0 45 9 68 21
100
20580
Y X Cov
XY
, ) , ( ) , ( ) , ( = = = ; 4556 0
0512 2 9887 0
9240 0
,
) , )( , (
,
= =


54 ESTADSTICA J. Snchez M. S. Snchez
La recta de regresin (mnimo-cuadrtica) de Y sobre X tiene por ecuacin:

r
Y/X
: ) ( X x Y y
2
X
XY
=


) , (
,
,
, 68 21 x
9776 0
9240 0
45 9 y =
r
Y/X
: ) , ( ) , ( 0413 11 x 9452 0 y =

Se emplea para predecir el valor de Y para un valor de X. Para un joven de x
0
= 24
aos predice un salario de

, ) ( , ) , ( ) , ( 35 1164 100 6435 11 0413 11 24 9452 0 y
o
= = =

La recta de regresin (mnimo-cuadrtica) de X sobre Y tiene por ecuacin:

r
X/Y
: ) ( Y y X x
2
Y
XY
=



r
X/Y
: ) , (
,
,
, 45 9 y
2075 4
9240 0
68 21 x =

r
X/Y
: ) , ( ) , ( 6047 19 y 2196 0 x + =

Se emplea para predecir el valor de X para un valor de Y. Para un joven que tenga un
salario de y
0
= 1200 = 12 (100 ) predice una edad de

aos 24 22 6047 19 12 2196 0 x
o
, ) , ( ) , ( = + =

Puesto que el coeficiente de correlacin est muy alejado de +1, las predicciones son
poco fiables. El ajuste no es bueno.




OBSERVACIN:

Hemos realizado los clculos atenindonos a la disposicin en que venan los datos:
en una tabla de doble entrada. A veces tal tabla se convierte en una de entrada
simple o de datos apareados, como se muestra a continuacin. Esta forma es ms
conveniente para su tratamiento en EXCEL, pues permite dibujar el diagrama de
dispersin de burbujas en el que el punto de coordenadas (x
i
, y
i
) viene representado
por un crculo (burbuja en EXCEL) de rea proporcional a su frecuencia n
i
.




2EPRVARIABLES ESTADSTICAS BIDIMENSIONALES 55




Para ello, en el Asistente de Grficos se selecciona Burbujas y el primer subtipo como
se muestra a continuacin.




56 ESTADSTICA J. Snchez M. S. Snchez




A continuacin, en Rango de datos se seleccionan las filas y las tres columnas de la
tabla que contienen los valores de X, de Y y de las frecuencias absolutas:


2EPRVARIABLES ESTADSTICAS BIDIMENSIONALES 57



OBSERVACIN:

Un inconveniente de la representacin anterior es que no podemos incorporar las
rectas de regresin (lneas de tendencia en EXCEL).

Un modo de salvar esta limitacin de EXCEL consiste en escribir en las dos primeras
columnas de la hoja las coordenadas x
i
e y
i
en tantas filas como indica su frecuencia
n
i
.

Por ejemplo escribimos 20 en la celda A1 y 6 en la celda B1; marcamos ambas celdas
y las propagamos 10 veces hacia abajo. Para ello, una vez marcadas, colocamos el
cursor sobre el ngulo inferior derecho de la celda B1 hasta que se convierte en un +.

A continuacin pinchamos con el ratn y arrastramos hasta la fila 10. As continuamos
hasta tener las N = 100 filas con las coordenadas (x
i
, y
i
).

Despus procedemos como en los ejercicios anteriores.



58 ESTADSTICA J. Snchez M. S. Snchez


Si copiamos la columna A sobre la C e insertamos grfico igual que antes, pero
seleccionando en rango de datos las columnas B y C, en lugar de las A y B,
dispondremos de la recta de regresin de X sobre Y.



2EPRVARIABLES ESTADSTICAS BIDIMENSIONALES 59

5 El encargado de obra de cierta compaa constructora ha obtenido la siguiente
tabla de doble entrada con los datos relativos a 100 de los trabajadores. X representa
la edad de los obreros e Y los das de baja mdica que solicitan al ao.

Y
X

]0; 20]

]20; 40]

]40; 60]
]20; 30] 28 2 0
]30; 40] 26 15 4
]40; 50] 6 14 5

a) Calcular la edad modal.
b) Calcular entre qu valores est el 50% central del nmero de das de baja.

a) La distribucin marginal de la edad, X, viene dada por la tabla:

I
i
x
i n
i
]20; 30] 25 30
]30; 40] 35 45
]40; 50] 45 25
100

Puesto que todos los intervalos tienen la misma amplitud, en el histograma se
tomaran por alturas las propias frecuencias absolutas, el intervalo modal es el de
mayor altura: ]30; 40]. Entonces:
. , , aos 29 34 29 4 30 10
20 15
15
30 a e Mo
1
2 1
1
1 i
= + =
+
+ =
+

+ =



b) Consideremos la distribucin marginal de Y. Se trata de calcular los cuartiles
primero y tercero:

I
j
]0; 20] ]20; 40] ]40; 60]
y
j
10 30 50
n
j
60 31 9 100
N
j
60 91 90

25
4
100
4
N
= = [ , [ 20 0 Q
1

das 33 8 20
0 60
0 25
0 a
N N
N
4
N
e Q
i
1 i i
1 i
1 i 1
, =

+ =

+ =



75
4
100 3
4
N 3
=

= [ , [ 40 20 Q
3

das 68 29 20
60 91
60 75
20 a
N N
N
4
N 3
e Q
i
1 i i
1 i
1 i 3
, =

+ =

+ =

Das könnte Ihnen auch gefallen