Beruflich Dokumente
Kultur Dokumente
) , (
,
,
, 68 21 x
9776 0
9240 0
45 9 y =
r
Y/X
: ) , ( ) , ( 0413 11 x 9452 0 y =
Se emplea para predecir el valor de Y para un valor de X. Para un joven de x
0
= 24
aos predice un salario de
, ) ( , ) , ( ) , ( 35 1164 100 6435 11 0413 11 24 9452 0 y
o
= = =
La recta de regresin (mnimo-cuadrtica) de X sobre Y tiene por ecuacin:
r
X/Y
: ) ( Y y X x
2
Y
XY
=
r
X/Y
: ) , (
,
,
, 45 9 y
2075 4
9240 0
68 21 x =
r
X/Y
: ) , ( ) , ( 6047 19 y 2196 0 x + =
Se emplea para predecir el valor de X para un valor de Y. Para un joven que tenga un
salario de y
0
= 1200 = 12 (100 ) predice una edad de
aos 24 22 6047 19 12 2196 0 x
o
, ) , ( ) , ( = + =
Puesto que el coeficiente de correlacin est muy alejado de +1, las predicciones son
poco fiables. El ajuste no es bueno.
OBSERVACIN:
Hemos realizado los clculos atenindonos a la disposicin en que venan los datos:
en una tabla de doble entrada. A veces tal tabla se convierte en una de entrada
simple o de datos apareados, como se muestra a continuacin. Esta forma es ms
conveniente para su tratamiento en EXCEL, pues permite dibujar el diagrama de
dispersin de burbujas en el que el punto de coordenadas (x
i
, y
i
) viene representado
por un crculo (burbuja en EXCEL) de rea proporcional a su frecuencia n
i
.
2EPRVARIABLES ESTADSTICAS BIDIMENSIONALES 55
Para ello, en el Asistente de Grficos se selecciona Burbujas y el primer subtipo como
se muestra a continuacin.
56 ESTADSTICA J. Snchez M. S. Snchez
A continuacin, en Rango de datos se seleccionan las filas y las tres columnas de la
tabla que contienen los valores de X, de Y y de las frecuencias absolutas:
2EPRVARIABLES ESTADSTICAS BIDIMENSIONALES 57
OBSERVACIN:
Un inconveniente de la representacin anterior es que no podemos incorporar las
rectas de regresin (lneas de tendencia en EXCEL).
Un modo de salvar esta limitacin de EXCEL consiste en escribir en las dos primeras
columnas de la hoja las coordenadas x
i
e y
i
en tantas filas como indica su frecuencia
n
i
.
Por ejemplo escribimos 20 en la celda A1 y 6 en la celda B1; marcamos ambas celdas
y las propagamos 10 veces hacia abajo. Para ello, una vez marcadas, colocamos el
cursor sobre el ngulo inferior derecho de la celda B1 hasta que se convierte en un +.
A continuacin pinchamos con el ratn y arrastramos hasta la fila 10. As continuamos
hasta tener las N = 100 filas con las coordenadas (x
i
, y
i
).
Despus procedemos como en los ejercicios anteriores.
58 ESTADSTICA J. Snchez M. S. Snchez
Si copiamos la columna A sobre la C e insertamos grfico igual que antes, pero
seleccionando en rango de datos las columnas B y C, en lugar de las A y B,
dispondremos de la recta de regresin de X sobre Y.
2EPRVARIABLES ESTADSTICAS BIDIMENSIONALES 59
5 El encargado de obra de cierta compaa constructora ha obtenido la siguiente
tabla de doble entrada con los datos relativos a 100 de los trabajadores. X representa
la edad de los obreros e Y los das de baja mdica que solicitan al ao.
Y
X
]0; 20]
]20; 40]
]40; 60]
]20; 30] 28 2 0
]30; 40] 26 15 4
]40; 50] 6 14 5
a) Calcular la edad modal.
b) Calcular entre qu valores est el 50% central del nmero de das de baja.
a) La distribucin marginal de la edad, X, viene dada por la tabla:
I
i
x
i n
i
]20; 30] 25 30
]30; 40] 35 45
]40; 50] 45 25
100
Puesto que todos los intervalos tienen la misma amplitud, en el histograma se
tomaran por alturas las propias frecuencias absolutas, el intervalo modal es el de
mayor altura: ]30; 40]. Entonces:
. , , aos 29 34 29 4 30 10
20 15
15
30 a e Mo
1
2 1
1
1 i
= + =
+
+ =
+
+ =
b) Consideremos la distribucin marginal de Y. Se trata de calcular los cuartiles
primero y tercero:
I
j
]0; 20] ]20; 40] ]40; 60]
y
j
10 30 50
n
j
60 31 9 100
N
j
60 91 90
25
4
100
4
N
= = [ , [ 20 0 Q
1
das 33 8 20
0 60
0 25
0 a
N N
N
4
N
e Q
i
1 i i
1 i
1 i 1
, =
+ =
+ =
75
4
100 3
4
N 3
=
= [ , [ 40 20 Q
3
das 68 29 20
60 91
60 75
20 a
N N
N
4
N 3
e Q
i
1 i i
1 i
1 i 3
, =
+ =
+ =