Beruflich Dokumente
Kultur Dokumente
EJERCICIOS RESUELTOS DE
ESTADÍSTICA BIDIMENSIONAL
EJERCICIOS RESUELTOS DE VARIABLE ESTADÍSTICA BIDIMENSIONAL
X\ Y 1 2 4 6
1 2 0 1 1
3 3 1 0 1
5 0 1 0 5
Se pide:
3 4 3 4
a) nij b) f23 , f34 , f21 c) ni y nj d) f (xi / Y 2) y f (yj / X 3)
i1 j1 i1 j1
e) a10 y a01 f) a11 g) sxy
Solución:
a)
3 4 3
nij ni1 ni2 ni3 ni4 n11 n12 n13 n14 n21 n22 n23 n24 n31 n32 n33 n34
i1 j1 i1
2 0 1 1 3 1 0 1 0 1 0 5 15
b) Cada n representa la frecuencia absoluta del par (x , y ) , la frecuencia relativa se define f nij
,
ij i j
ij
34 N
donde N nij 15
i1 j1
n23 0
f 0 n34 5 n21 3
23 f34 f21
N 15 N 15 N 15
c)
X\ Y 1 2 4 6 ni
1 2 0 1 1 4
3 3 1 0 1 5
5 0 1 0 5 6
nj 5 2 1 7 15
3 34
ni n1 n2 n3 4 5 6 15 nij
i1 i1 j1
4 34
X\ Y 1 2 4 6 ni
1 2 0 1 1 4
3 3 1 0 1 5
5 0 1 0 5 n3 6
nj 5 n2 2 1 7 15
n(xi / Y 2)
X n(xi / Y 2) f (x / Y 2)
i
n2
1 0 0
2 1 1/2
3 1 1/2
n2 2 1
n(yj / X 3)
n(yj / X 3) f (y / X 3)
Y j
n3
1 0 0
2 1 1/6
4 0 0
6 5 5/6
n3 6 1
e)
3 4 3
xinij xi ni1 ni2 ni3 n14
a i1 j1 i1
1
x n x n x n x n
10 1 11 1 12 1 13 1 14
N N N
x2 n21 x2 n22 x2 n23 x2 n24 x3 n31 x3 n32 x3 n33 x3 n34
1.2 1.0 1.1 1.1 3.3 3.1 3.0 3.1 5.0 5.1 5.0 5.5 49 3,26
15 15
xini
3
4
yjnj
j1 1.5 2.2 4.1 6.7 55
a 3,6
01
N 15 15
f)
34
xi y j nij
a11 i1 j1
N
1.1.2 1.2.0 1.4.1 1.6.1 3.1.3 3.2.1 3.4.0 3.6.1 5.1.0 5.2.1 5.4.0 5.6.5 205 13,66
15 15
2. Las calificaciones obtenidas por un grupo de alumnos en Estadística (E) y Macroeconomía (M):
E 3 4 6 7 5 8 7 3 5 4 8 5 5 8 8 8 5
M 5 5 8 7 7 9 10 4 7 4 10 5 7 9 10 5 7
Solución:
a) La variable E (Estadística) toma seis valores diferentes. La variable M (Macroeconomía) toma siete
valores distintos, por lo que para formar la tabla bastará hacer el recuento de las veces que se repite
cada par.
E\M 4 5 6 7 8 9 10 ni
3 1 1 2
4 1 1 2
5 1 4 5
6 1 1
7 1 1 2
8 1 2 2 5
nj 2 4 0 5 1 2 3 17
b)
6 6
Eini
99 E in i 629 37
2
Ea i1
5,82 a i1 s2 a a2 37 5,822 3,13
10 20 E 20 10
N 17 N 17
Distribución Marginal de Macroeconomía:
7 7
M j nj 119 M2j n j 903
M a j1 7 a j1 53,11 s2 a a2 53,11 72 4,11
01 02 M 02 01
N 17 N 17
67
Ei Mjnij
3.4.1 3.5.1 4.4.1 4.5.1 5.5.1 5.7.4 6.8.1 7.7.1 7.10.1 8.5.1 8.9.2 8.10.2
a11 i1 j1
N 17
739
a11 43,47 sxy a11 a10 a01 43,47 5,82.7 2,73
17
3. Dada la tabla de correlaciones. Hallar n21 para que las dos variables sean estadísticamente
independientes y calcular su covarianza en este caso.
X\ Y 5 7
100 8 4
200 n21 6
Solución:
X\ Y 5 7 ni
100 8 4 12 nij ni nj
Por ser independientes: . i, j
200 n21 6 n21 6 N N N
nj n21 8 10 n21 18
X\ Y 5 7 ni
100 8 4 12
covarianza: sxy a11 a10 a01
200 12 6 18
nj 20 10 30
2
xi ni 100.12 200.18
2
yjnj 5.20 7.10
a10 x i1 160 a01 y j1
5,67
N 30 N 30
22
xi yjnij
i1 j1 100.5.8 100.7.4 200.5.12 200.7.6 27200
a 906,67
11
N 30 30
X\ Y 1 2 3
‐1 0 1 0
0 1 0 1
1 0 1 0
Solución:
X\ Y 1 2 3 ni
Las variables X e Ynson n n
independientes
cuando se verifica ij i j
‐1 0 1 0 1
0 1 0 1 2 i, j
N N
1 0 1 0 1 N
nj 1 2 1 4
No son independientes porque no se verifica la relación: 0 2 . 2 n22 n2 n2
N
4 44 N N
33
xi yjnij 1
a i1 j1 1.2.1 1.2.1 0
11
N 4
3 3
xini 1 1.1 0.2 1.1 0
i1 x ini
2
1 2
a10
x i1
N 4
a
20
(1)2.1 0.2 12.1 0,5
N 4 4
y2j nj
3 3
yjnj
a
01
y j1
1
1.1 2.2 3.1 2 a
02
j1
1
1 .1 2 .2 3 .1 18 4,5
2 2 2
N 4 N 4 4
s y a 02 a01 4,5 22 0,5 a s y
2 2
0,5 0,7
a) Calcular la covarianza entre el gasto y el ingreso. A la vista de este resultado, ¿puede afirmar que
las variables sean dependientes e independientes?
b) Para estas 6 familias ¿Qué variable se distribuye de forma más homogénea, el gasto en móvil o en
los ingresos totales?
Solución:
a)
6 6
yi 41 y2i 351 s2y a 02 a201 58,5 6,832
y 6,83 a02 i1 58,5
a01 i1
N 6 N 6
6 6
xi 60
x2i 760 s2x a 20 a210 126,67 102
a10 x i1 10 a20 i1 126,67
N 6 N 6
6
xi.yi 504 sxy a11 a10 .a01 84 10.6,83 15,7 covarianza
a i1
84
11
N 6
b)
sy 3,44
y 6,83 s 3,44 CV 0,5037 (50,37% de dispersión)
11,85
y 6,83
y y
s 5,16
x 10 s 5,16 CV x 0,516 (51,6% de dispersión)
x 26,67 x
x 10
Solución:
sxy
a) La validez de la afirmación se obtendrá en función del coeficiente de correlación: r
sx sy
Como no hay pares repetidos se entiende que son 15 pares de la forma (xi, yj) que representará
xi : edad e yi : número respuestas inadecuadas de modo que la frecuencia de cada par es la unidad.
xi 2 3 4 4 5 5 6 7 7 9 9 10 11 11 12
yi 11 12 10 13 11 9 10 7 12 8 7 3 6 5 5
15
xi yi 2.11 3.12 4.10 L 11.5 12.5 789
a i1 52,6
11
N 15 15
15
xi 2 3 4 4 5 L 11 11 12 105
a x i1 7
10 15 15
N
15
yi 11 12 10 13 L 6 5 5 129
a y i1 8,6
01 15 15
N
En consecuencia, sxy a11 a10 a01 52,6 7.8,6 7,6
x i
2
22 32 42 42 52 L 112 112 122 877
a20 i1 58,46
N 15 15
15
y i
2
112 122 102 132 L 62 52
1237 82,46
a02 i1
52
N 15
15
s2x a 20 a10
2 58,46 72 9,46 a s
x 9,46 3,07
La validez solicitada es del 85% en correlación inversa, es decir, a medida que aumenta la edad del
niño (X) disminuye las respuestas inadecuadas (Y).
b) Para poder predecir el número de respuestas para cada edad determinada (caso de María) será
necesario hallar la ecuación de regresión de Y (nº respuestas inadecuadas) sobre X (edad del niño):
sxy sxy
yy (x x) pendiente de la recta coeficiente de regresión: b yx
s2x s2x
En consecuencia, para la edad de María (x 10,5) el número de respuestas inadecuadas que se puede
predecir será:
c) La varianza residual s2 s2 (1 r 2 )
r y
2
2,35875
% variaciones no explicado 100 r s 2100 27,75%
sy 8,50
7. De una variable estadística bidimensional (X, Y) se conoce sx 3 :
1
Recta de regresión de Y sobre X: y 2 x
2
Recta de regresión de X sobre Y: x 4 2 y
Solución:
1
a) La recta de regresión de Y sobre X: y 2 x puede escribirse:
2
1 1
y2 x a y 0 (4 x) byx 1
2 2 2
x 4 2 y a x 0 2 (2 y) bxy 2
sxy 1 sxy 1
b sxy 4,5
yx sx 2
2
9 2
Sabemos que s 4,5
b xy 2 a s2 2,25 a s
2,25 1,5
4,5
2a
xy s2y s2y y 2 y
sxy
r 4,5
1 con lo que existe una dependencia funcional, cosa que no es de extrañar por
sx sy 3 . 1,5
y 2 1 x
tratarse de única recta de regresión. Adviértase que las rectas: 2 son la misma recta,
x 4 2 y
basta con multiplicar la primera recta por 2 y despejar la x:
1
x 4 x a x 4 2 y
2y 2 2
2
1 1 2
x}
y 2 x a 1
b) y 2 x a y2 23
2 2 2
sxy a11 a11 a01 a 4,5 a11 2.3 a a11 4,5 6 10,5
8. En una experimentación sobre el sector turístico se han observado dos caracteres cuantitativos (X,
Y), obteniéndose los siguientes resultados:
Solución:
a) Como no hay repetición de los pares, la tabla de doble entrada de frecuencias absolutas vendrá
dada de la forma:
X\Y 2 6 14 ‐2 10 ni
0 1 1
1 1 1
3 1 1
‐1 1 1
2 1 1
nj 1 1 1 1 1 5
xi 0 1 3 ‐1 2 yj 2 6 14 ‐2 10
ni 1 1 1 1 1 nj 1 1 1 1 1
b) Para estudiar la correlación se forma la tabla adjunta, donde no figura la columna de las
frecuencias absolutas por ser la unidad para todos los pares
xi yi xi yi x2i y2i
0 2 0 0 4
1 6 6 1 36
3 14 42 9 196
‐1 ‐2 2 1 4
2 10 20 4 100
5 30 70 15 340
5
xi yi
70
a i1
14
11
N 5
5 x
i
5
x2i 2 2 2
5 15 sx a20 a10 3 1 2 sx 2 1,41
x a10 i1 1 a20 i1
3
N 5 N 5
5 y
i
5
y2i 2 2 2
30 340 sy a02 a01 68 6 32 sy 32 5,66
68
i1
y a01 6 a02 i1
N 5 N 5
sxy
8
sxy a11 a10 a01 14 1.6 8 r 1
2.32
s2x sy 2
Como el coeficiente de correlación es igual a 1, indica que existe una dependencia funcional entre las
variables (X, Y) estudiadas.
c) Para completar el par (‐3, ) hay que hallar la ecuación de la recta de regresión de Y sobre X.
Análogamente, para completar el par (, 4) hay que hallar la ecuación de la recta de regresión de X
sobre Y.
sxy sxy
yy 2
(x x) , donde el coeficiente de regresión byx (pendiente de la recta)
sx s2x
sxy 8
x1 y6 b 4
yx 2
sx 2
sxy
y y 2 (x x) y 6 4(x 1) a y24x
a s
x
sxy sxy
xx (y y) , donde el coeficiente de regresión b xy (pendiente de la recta)
s2y s2y
sxy 8 1
x1 y6 b
xy
s2y 32 4
sxy 1
xx (y y) a x 1 (y 6) a 1
x ( 2 y)
s2y 4 4
1 1
El par (, 4) se completa: x 2 4 1 , 4
4 2 2
9. Se desea estudiar la relación que existe entre la variable X (porcentaje de la población urbana en
las distintas provincias) e Y (renta media por hogar). La tabla adjunta contiene datos referentes a
treinta provincias:
X\Y 1 ‐ 16 16 ‐ 31 31 ‐ 46 46 ‐ 60
10 ‐ 19 1 1 1
19 ‐ 28 8 3
28 ‐ 37 3 7 1
37 ‐ 45 2 3
Solución:
a)
X\Y 1 ‐ 16 16 ‐ 31 31 ‐ 46 46 ‐ 60 ni
10 ‐ 19 1 1 1 3
19 ‐ 28 8 3 11
28 ‐ 37 3 7 1 11
37 ‐ 45 2 3 5
nj 1 14 14 1 30
xini 864,5
4 4
i i 26729,25
x
2
n
x a10 i1 28,81 a20 i1 890,975
N 30 N 30
s2 a a2 890,975 28,812 60,959 sx 60,959 7,807
x 20 10
4 4
yjnj 929,5 y 2nj j 31364,25
ya j1 30,98 a j1
1045,475
01 02
N 30 N 30
s2 a a2 1045,475 30,982 85,7146 s 85,7146 9,258
y 02 01 y
La distribución conjunta
4
xi yinii 14,5.8,5. 1 14,5.23,5.1 14,5.38,5.1 23,5.23,5.8 L 41.38,5.3 27589,5
a11 i1 919,65
N 30 30
sxy 27,1162
Recta de regresión de Y sobre X: y y (x x) a y 30,98 (x 28,81)
s2x 60,959
y 18,30 0,44 x
m11 27,1162
Coeficiente de regresión: b 0,44 0 (recta de regresión creciente)
yx
2x 60,959
sxy 27,1162
Recta de regresión de X sobre Y: x x (y y) a x 28,81 (y 30,98)
s2y 85,7146
x 19,20
0,31y
sxy 27,1162
Coeficiente de regresión: b 0,31 0 (recta de regresión creciente)
xy 2
s y 85,7146
10. Justifique las razones por las cuales debe aceptarse o rechazarse que las dos rectas siguientes
sean, respectivamente, las líneas de regresión mínimo‐cuadráticas de Y sobre X y de X sobre Y de una
serie de observaciones.
Solución:
Solución:
De otra parte, el coeficiente de correlación: r byx .bxy 2. 5 3,16 , resultado absurdo cuando
el coeficiente de correlación 1 r 1 , concluyendo que no pueden ser rectas de regresión.
12. El coeficiente de correlación entre dos variables X e Y es 0,6. Sabiendo además que,
x 10 sx 1,5 y 20 sy 2
a) Hallar las rectas de regresión de Y/X y de X/Y
b) Calcular la varianza residual para las dos regresiones anteriores
Solución:
sxy sxy
Recta de regresión de Y sobre X: y y (x x) a byx 2 (coeficiente regresión)
s2x sx
sxy sxy
Recta de regresión de X sobre Y: x x (y y) a bxy 2 (coeficiente regresión)
s2y sy
sxy
El coeficiente de correlación: r byx .bxy sxy a 0,6 a sxy 1,8
sx .sy 1,5.2
Y / X s2 s2 1 r 2 Y/X ss
1 r2
b) Varianza residual
r y
Error típico estimación
r y
X / Y s2 s2 1 r 2 X / Y s s
1 r2
r x
r x
r
Y / X s2 22 1 0,62 a s2
r 2,56 sr 2,56 1,6
por tanto,
X / Y s2 1,52 1 0,62 a s2 1,44 s
1,44
1,2
r r r
13. En una distribución bidimensional se conoce:
Obtener:
a) Media de X
b) Recta de regresión de Y/X
c) Varianza de Y
d) Covarianza de ambas variables
Solución:
X 0,6 0,44 Y
a) Recta de regresión de X sobre Y: X 0,6 0,44 Y a
X 0,6 0,44. 4 2,36
a 0,6
siendo X 0,6 0,44 Y a
bxy 0,44
0,72
r2 byx .bxy a 0,72 byx . 0,44 a byx 1,114
0,44
byx
}
sxy
con lo cual, la recta de regresión de Y sobre X: y y (x x) será: y 4 1,114 (x 2,36)
s2x
y 1,370 1,114 x
m s
byx 11 a 1,114 xy a sxy 1,114.1,22 1,604
2x 1,22
Solución:
byx
}
sxy
a) Se trata de encontrar la recta de regresión de Y sobre X: y y (x x)
s2x
a01 y
y 2886,4 17,82
a02
y2 172291,2 1063,526
N
N 162 162
s2 a a2 1063,526 17,822 745,97
y 02 01
Adviértase que la pendiente de la recta ( 0,729) en el signo depende de la covarianza (sxy ) , al ser
negativa la recta de regresión será decreciente, esto es, a medida que aumenta los valores de la
variable X (PIB per cápita) disminuyen los valores de la variable Y (tasa natural de crecimiento
demográfico).
sxy 52,46
b 0,07
xy 2
s y 745,97
a) Calcular la distribución marginal de las dos variables. ¿Son independientes los ingresos familiares
y el tamaño de la vivienda donde habitan?
b) Obtener la distribución de la superficie de la vivienda condicionada al intervalo modal de los
ingresos familiares.
c) Calcular la distribución de los ingresos condicionada al intervalo mediano de la vivienda familiar.
Solución:
a)
ni
X/ Y < 60 60 ‐ 80 80 ‐ 100 100 ‐ 150 > 150 ni fi
N
50 ‐ 100 20 18 2 1 0 41 0,155
100 ‐ 200 25 40 30 2 1 98 0,370
200 ‐ 350 5 10 15 25 3 58 0,219
350 ‐ 500 0 5 15 20 8 48 0,181
> 500 0 1 2 7 10 20 0,075
nj 50 74 64 55 22 N= 265 1
nj j
f 0,189 0,279 0,242 0,208 0,083 1
N
N N
N
n43 n4 n3
No son independientes porque 15 48 64
a
N 4 N 265 265 265
DISTRIBUCIÓN MARGINAL DE LA VARIABLE X
ni Ni n
Intervalos xi ni ci f Ni F hi i
i
i
N N ci
50 ‐ 100 75 41 50 0,155 41 0,155 0,82
100 ‐ 200 150 98 100 0,370 139 0,525 0,98
200 ‐ 350 275 58 150 0,219 197 0,744 0,39
350 ‐ 500 425 48 150 0,181 245 0,925 0,32
> 500 ‐‐‐‐‐ 20 ‐‐‐‐‐ 0,075 265 1 ‐‐‐‐‐
265 1
N/2=132,
60 ‐ 80 70 74 20 0,279 124 0,468 3,7
80 ‐ 100 90 64 20 0,242 188 0,71 3,2 mediano
100 ‐ 150 125 55 50 0,208 243 0,918 1,1
> 150 ‐‐‐‐‐ 22 ‐‐‐‐‐ 0,083 265 1 ‐‐‐‐‐
265 1
Con los datos disponibles no se puede calcular el intervalo modal de la variable X, al no poder calcular
todas las densidades de frecuencias marginales, es imposible hacerlo en el tramo (> 500) que tiene
una amplitud ilimitada.
X/Y < 60 60 ‐ 80 80 ‐ 100 100 ‐ 150 > 150 Intervalos ni3 (ni / 80 100)
50 ‐ 100 20 18 2 1 0 50 ‐ 100 2
100 ‐ 200 25 40 30 2 1 100 ‐ 200 30
200 ‐ 350 5 10 15 25 3 200 ‐ 350 15
350 ‐ 500 0 5 15 20 8 350 ‐ 500 15
> 500 0 1 2 7 10 > 500 2
Y / X Y 3 2X
16. Se conocen las regresiones
: X 2 0,3Y
X/Y:
Sabiendo además que sxy 3,2 . Obtener la varianza residual de las dos rectas de regresión.
Solución:
b ,2
s xy 3
Y / X : Y 3 2X
a b 2 a yx sxy / s x s2x 3,2 / 2 1,6
2
yx
,2
X / Y : X 2 0,3Y bxy 0,3
s xy 3
bxy sxy / s2y s2y 3,2 / 0,3 10,67
Y / X : s2 s2 1 r2 s2 10,67 1 0,6 4,268
r y r
Varianza residual
X / Y : s 2 s 2 1 r2 s2 1,6 1 0,6 0,64
r x r
17. Sean las siguientes ecuaciones las rectas de regresión de una variable bidimensional (Y, X; nij)
X 2Y 3
X 4Y 2
Solución:
a)
X 3 2Y
a a 3
Sea X 2Y 3 recta regresión X / Y
bxy 2 a signo (b ) signo (b )
regresión Y / X
a' 1/2 xy yx
X 4Y 2 1 1
r ecta
Y
X a
2 4 bxy 1/ 4
1
Coeficiente de determinación r2 bxy .byx 2. 0,5 1
4
3 1
Y X
a a 3/2
b
Sea X 2Y 3 recta regresión Y / X
2 2 y 1/2 a signo (b ) signo (b )
x
recta regresión X / Y a' 2 yx xy
X 4Y 2 X 2 4Y a
bxy 4
1
Coeficiente de determinación r2 byx .bxy . 4 2 1 cosa que no es posible (0 r2 1)
2
X/ Y : X 3 2Y
En consecuencia
1 1
Y X
Y / X : 2 4
18. En una distribución bidimensional (Xi, Yj , nij) se conoce x 10 y sxy 10 . Ambas rectas de
regresión pasan por el punto (0, 0). ¿Cuál es el grado de bondad del ajuste?.
Solución:
Las rectas de regresión de Y/X e X/Y se cortan en (x, y) , en este caso en el punto (10, y) .
Por otra parte, según el enunciado se cortan en (0, 0), por lo que se puede concluir que ambas rectas
coinciden al tener dos puntos distintos en común.
19. A partir de un conjunto de datos sobre las variables X e Y se ha calculado la regresión de Y sobre
X, obteniéndose los siguientes resultados:
Y 10 0,45X r2 0,9 x 20
Solución:
0,45
byx
}
De otra parte, y a b . x y
a
b
.x y 10 0,45 . 20 19
bxy b
} }xy
Análogamente, x a' b' . y x
a
'
b
'.y a' x b' . y a' 20 2.19 18
Solución:
a 3
Y / X : Y 3 4X a signo ) signo (bxy )
byx 4 0 a
(byx
r2 byx .b 4.1 4 1 contradicción
X / Y : X 2 Y a a' 2 xy
bxy 1 0
a3
Y/ X : Y 3 2X a byx 2 0
a signo(b ) signo(b ) contradicción
yx xy
X / Y : X 2 0,3Y a a' 2
bxy 0,3 0
a3
Y/X: Y 3 2X a byx 2 0 ) signo (bxy )
a signo(byx coeficientes coherentes
b
2
X / Y : X 2 0,2 Y a a' 2 yx .bxy 2. 0,2 0,4 1
bxy 0,2 0
r
21. Comprobar si son coherentes los resultados obtenidos al ajustar la recta de regresión:
a) Y A bX a sxy 20 s2x 10 y8 x4 a3
2
b) Y A bX a s2 y 4 sxy 4 sry 0,4 s2x 5
Solución:
a)
sxy 20 2
b byx 2
s x 10 Los datos no corresponden
Y A bX a a la recta de regresión
y abx a a y bx 8 2.4 0 3
22. En una distribución bidimensional (X, Y) se ha ajustado una regresión lineal entre las dos
variables. Se sabe que r 0,8, sx 4, y 2 y que la recta de regresión de X sobre Y ajustada es
Y 4X . Se pide:
Solución:
a)
sxy
x x 2 (y y)
Recta de regresión de X sobre Y sy
Y 4X X 1 Y x a' b'y a' 0
b' bxy 1/ 4 (pendiente recta)
4
b
} b'
}
1
2 2 b .
covarianza (s ) r byx .bxy a 0,8 yx 4 a byx 2,56
xy } b
b sxy a s b .s2 a s (2,56).42 40,96
xy sx
2 xy
yx x xy
}b' sxy s 40,96
Varianza Y (s2y) bxy a sy2 xy a s2y 163,84
2
sy bxy 1/ 4
r
Ex Ea'b'y a x a'b'y
1
Media X (x) x a'b'y x 0 . 2 0,5
4
b)
bbyx
}
s
Recta de regresión de Y sobre X y y xy (x x) a y a bx
sx
2
40,96
y 2 (x 0,5) a y 0,72 2,56x
4 2
2 2
c) Varianza residual de X: srx s2x (1 r 2 ) a srx 16 (1 0,64) 5,76
23. Se desea estudiar la repercusión que tiene los días de lluvia en el número de visitas al zoo. Para
ello, se observaron las siguientes variables, durante los últimos diez años, siendo Y="nº visitas
anuales, en miles" y X="nº de días de lluvia al año":
Año 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003
X 18 26 30 33 38 39 42 44 46 49
Y 107 105,5 105 104,4 104,3 104 103,7 103,4 103,1 103
Solución:
Distribución marginal de X
10 xi 10 x2
2 2 2
365 i 14171 sx a20 a10 1417,1 36,5 84,85
a10 x
i1
36,5 a20 i1 1417,1
N 10 N 10 84,85 9,21
sx
Distribución marginal de Y
10 10
yi 1043,4 y i 108881,96 10888,196
2
a y i1 104,34 a i1
01 02
N 10 N 10
s2 a a2 10888,196 104,342 1,36
y 02 01
s y 1,36 1,17
Covarianza ‐ Coeficientes regresión lineal ‐ Coeficiente correlación lineal
10
xi.yi 37978,2
a i1
3797,82
11
N 10
Covarianza: sxy a11 a10 .a01 3797,82 36,5 . 104,34 10,59
}b s
Y/ X : byx xy2 10,59 0,125
s 84,85
Coeficientes regresión lineal: b'
} sx 10,59
X/ Y : bxy xy2 7,79
sy 1,36
d) La varianza residual de la Y:
2 2
sry s2y(1 r2) a sry 1,36(1 0,9862) 0,0378 (3,78% causas ajenas a la regresión)
NOTA.‐ Para representar conjuntamente en EXCEL las dos rectas de regresión (Y/X, X/Y) se han de
introducir dos series: Serie1 (X, Y), Serie2 (X, Ŷ)
24. Las notas en Estadística (X) y en Matemáticas (Y) obtenidas por 10 alumnos elegidos al azar en un
grupo de primer curso de la Facultad de Ciencias Económicas y Empresariales han sido las siguientes,
según el orden de selección de la muestra:
Nº orden 1º 2º 3º 4º 5º 6º 7º 8º 9º 10º
X 9 7 3 6 7 5 10 8 3 5
Y 8 5 4 2 9 6 10 9 1 5
Solución:
a)
Nº orden 1º 2º 3º 4º 5º 6º 7º 8º 9º 10º
xi 9 7 3 6 7 5 10 8 3 5 63
yi 8 5 4 2 9 6 10 9 1 5 59
xi.yi 72 35 12 12 63 30 100 72 3 25 424
x2i 81 49 9 36 49 25 100 64 9 25 447
y2i 64 25 16 4 81 36 100 81 1 25 433
Distribución marginal de X
10 10
xi 63 x2i 447
s2x a20 a210 44,7 6,32 5,01
a10 x i1
6,3 a20 i1 44,7 5,01 2,24
sx
N 10 N 10
Distribución marginal de Y
10 10 2 s2 a a2 43,3 5,92 8,49
yi 59
yi 433
y 02 01
a01 y i1
5,9 a02 i1 43,3 8,49 2,91
s y
N 10 N 10
s 5,23
b byx xy2 5,01 1,044 0
Parámetros regresión lineal Y/X sx
Y abX a Y 0,677 1,044X y a a y bx 5,9 1,044 . 6,3 0,677
abx
2 sxy sxy 5,23
r 2 . 2 5,23. 0,643 a r 0,643 0,80
s x s y 5,01 8,49
c)
sxy 5,23
b' bxy s2 8,49 0,616 0
Parámetros regresión lineal X/Y y
X a'b' Y a X 2,665 0,616Y x a'b' y a a' x b'y 6,3 0,616 . 5,9 2,665
2 sxy sxy 5,23
r 2 . 2 5,23 . 0,643 a r 0,643 0,80
sx s y 5,01 8,49
X 9 7 3 6 7 5 10 8 3 5
Y 8 5 4 2 9 6 10 9 1 5
Ŷ 10,28 7,04 0,54 5,41 7,04 3,79 11,91 8,66 0,54 3,79
e) Varianzas residuales
2 2
Varianza residual de Y/X: r2 0,643 s2y 8,49 sry s2y (1 r2) a sry 8,49 (1 0,643) 3,03
2 2
Varianza residual de X/Y: r2 0,643 s2y 5,01 srx s2x (1 r2) a srx 5,01 (1 0,643) 1,79
f) Un alumno con un 7 en Matemáticas (,7) para pronosticar la nota en Estadística habría que
recurrir a la recta de regresión de X/Y: X 2,665 0,616Y
g) Un alumno con un 4 en Estadística (4, ) para pronosticar la nota en Matemáticas habría que
recurrir a la recta de regresión de Y/X: Y 0,677 1,044X