Sie sind auf Seite 1von 5

Univ. de Alcala. Fac.

de Biologa Grados en Biologa y Biologa Sanitaria


Dpto. de Matematicas Estadstica, 2013-2014
Hoja de Ejercicios 7.
Regresion lineal.
Calculo de la recta de regresi on y del coeciente de correlacion
1. Esta tabla recoge mediciones de las temperaturas de un recinto cerrado y los correspondientes
ritmos cardacos de un lagarto ubicado en ese recinto:
Temp (

C) 22 22 24 24 26 26 28 28 30 30
Latidos/minuto 20.8 22.3 24.1 25.6 25.7 27.2 27.3 28.8 29.4 31.9
Temp (

C) 32 32 34 34 36 36 38 38 40 40
Latidos/minuto 32.4 33.8 32.8 34.1 32.4 37.9 38.0 36.5 39.0 41.0
Calcular (a) la recta de regresion del n umero de latidos por minuto en funcion de la temperatura
medida, (b) el coeciente de correlacion de los datos (interpretarlo) y (c) el n umero de latidos
esperado a una temperatura de 33 grados.
2. Durante una hora se administra por perfusion endovenosa continua un medicamento. Al nalizar
la perfusion se determinan las concentraciones plasmaticas de medicamento y los resultados son los
siguientes:
Tiempo (h) 1 1.5 2 3 6 15
Concentracion (pg/ml) 11.8 11.0 10.9 10.1 9.6 5.7
a) Dibuje el diagrama de dispersion (nube de puntos) de los datos anteriores.
b) Determina, a partir de la forma de 1a nube, si el modelo de regresion lineal es adecuado. En
caso positivo, encuentre la ecuacion de la recta de regresion que relaciona la concentracion con
el tiempo.
c) Estime el valor de la concentracion a las 9 horas.
d) Calcule el coeciente de correlacion e interpretelo.
3. Se han realizado 9 tomas de presion intracraneal en animales de laboratorio. Por un metodo estandar
directo y por una nueva tecnica experimental indirecta, obteniendose los resultados siguientes, en
mm de Hg:
X 9 12 28 72 30 38 76 26 52
Y 6 10 27 67 25 35 75 27 53
a) Dibuja el diagrama de dispersion (nube de puntos) de los datos anteriores.
b) Encuentra la ecuacion de la recta de regresion correspondiente.
c) Calcula el coeciente de correlacion e interpretalo.
4. En un ensayo clnico realizado tras el posible efecto hipotensor de un farmaco, se ha evaluado
la tension arterial diastolica (TAD) en condiciones basales (X), y tras 4 semanas de tratamien-
to (Y), en un total de 14 pacientes hipertensos. Se han obtenido los siguientes valores de TAD:
Paciente 1 2 3 4 5 6 7 8 9 10 11 12 13 14
X 95 100 102 104 100 95 95 98 102 96 106 96 110 99
Y 85 86 87 94 85 86 88 87 90 85 93 87 102 89
a) Obten el modelo lineal que expresa la TAD despues del tratamiento en funcion de la TAD
basal.
b) Haz un comentario sobre la bondad del modelo lineal, a partir del coeciente de correlacion.
c) Cual sera la TAD despues del tratamiento que correspondera a una TAD basal de 106?
Indica el valor del residuo de esta estimacion.
1
d) Cual sera la TAD despues del tratamiento que correspondera a una TAD basal de 92?
Cabra hacer alguna objecion a esta ultima estimacion? En caso armativo exponla:
e) Estima, con este modelo, el valor de Y para X = 106.
5. La siguiente tabla muestra las cantidades de metil mercurio consumidas al ingerir pescado conta-
minado, X, y las correspondientes cantidades totales de mercurio en sangre, Y, de 12 individuos
participantes en un estudio sobre los efectos de la contaminacion marina:
Individuo 1 2 3 4 5 6 7 8 9 10 11 12
X (g Hg/da) 180 200 230 410 600 550 275 580 105 250 460 650
Y (g) 90 120 125 290 310 290 170 375 70 105 205 480
a) Obten la expresion matematica del modelo lineal que relaciona las cantidades de metil mercurio
consumidas al ingerir pescado contaminado con las cantidades totales de mercurio en sangre.
b) Indica el valor del coeciente de correlacion e interpretelo.
c) Cual sera la cantidad de mercurio en sangre que correspondera a una persona que hubiera
consumido 275 g Hg/da? Cual es el residuo de la estimacion anterior?
6. Los pesos y estaturas de una muestra de 10 estudiantes universitarios son:
Peso X (kg) 82 75 70 68 44 63 80 70 54 54
Estatura Y (cm) 185 185 180 178 159 170 190 172 162 165
a) Visualiza la nube de puntos. Indica si el modelo lineal de ajuste le parece adecuado.
b) Obten las rectas de regresion de Y/X y de X/Y.
c) Determina el valor del coeciente de correlacion de las dos variables. Interpretelo.
d) Cual es la estatura esperada para un estudiante que pesa 63 kg? Y el peso estimado para
uno que tiene una estatura de 175 cm?
e) Cuanto vale el residuo de la estimacion correspondiente a X = 63 kg?
7. Se realiza un estudio para establecer una ecuacion mediante la cual se pueda utilizar la concentra-
cion de estrona en saliva, X, para predecir la concentracion del esteroide en plasma libre, Y . Se
extrajeron, en pg/ml, los siguientes datos de 14 varones sanos:
X 7.4 7.5 8.5 9.0 9.0 11.0 13.0 14.0 14.5 16.0 17.0 18.0 20.0 23.0
Y 30.0 25.0 31.5 27.5 39.5 38.0 43.0 49.0 55.0 48.5 51.0 64.5 63.0 68.0
a) Obten el modelo lineal que relaciona la concentracion del esteroide en plasma libre con la
concentracion de estrona en saliva.
b) Haz un comentario sobre la adecuacion del modelo a los datos, a partir del coeciente de
correlacion.
c) Cual sera la estimacion de la concentracion del esteroide en plasma libre que correspondera
a una concentracion de estrona en saliva de 17.7 pg/ml?
d) Cual sera la estimacion de la concentracion del esteroide en plasma libre que correspondera
a una concentracion de estrona en saliva de 26.3 pg/ml?
Cabra hacer alguna objecion a estas estimaciones? En caso armativo, exponla.
e) Utiliza R para obtener un vector con los valores estimados por el modelo para las concentra-
ciones del esteroide en plasma libre y otro con los residuos correspondientes.
8. Se han tomado cinco muestras de la misma cantidad de glucogeno y se les ha aplicado una cantidad
de glucogenasa, X, (en milimoles/litro) anotando en cada caso la velocidad de reaccion, Y , (en
micromoles/minuto). Se han obtenido los siguientes datos:
X 0.2 0.5 1 2 3
Y 8 10 18 35 60
a) Se puede deducir a partir de estos datos que la velocidad de reaccion aumenta linealmente
con la concentracion de glucogenasa? En caso armativo, encuentra la expresion matematica
del modelo de ajuste.
2
b) Si a una de las muestras le hubiesemos aplicado una concentracion de 2.5 milimoles/litro de
glucogenasa, Cual habra sido la velocidad de reaccion? Es able esta prediccion?
9. Dada la distribucion de valores:
x 0,72 1,31 1.95 2.58 3.14
y 2.16 1.61 1.16 0.85 0.5
Obtener la recta de regresion y estudiar la bondad del ajuste.
10. El chero adjunto contiene cuatro conjuntos de pares de datos (x, y). Calcula, para
cada uno de estos conjuntos de datos,
a) la recta de regresion.
b) el coeciente de correlacion.
A continuacion, examina los gracos en los que se representa la nube de puntos y la recta conjun-
tamente. Que conclusiones extraes? Que fenomenos aparecen en cada uno de los casos?
Respuestas
1. (a) La recta es y = 1.46+0.955 x. O, usando t para temperatura y l para latidos, l = 1.46+0.955 t.
(b) 0.972 Este valor de r es compatible con (aunque no demuestra) un buen ajuste de la recta a los
datos (c) Sustituimos t = 33 en la recta y se obtiene el valor predicho l 32.95.
2. (a)
(b) Con muestras tan peque nas, es muy difcil juzgar la validez de un modelo de regresion lineal.
En este caso, ademas, el punto (15, 5.7) es un valor atpico, as que sera necesario estudiar si es
inuyente. La recta es
y = 11.77 0.4033x
La pendiente es negativa, como corresponde a una recta decreciente.
(c) El valor a las 9 horas se obtiene sustituyendo x = 9 en la recta, y resulta ser y 8.136.
(d) El coeciente es r 0.9895. Es compatible con (pero, insistimos, no demuestra) un buen
ajuste, y su signo se corresponde (como sucede siempre) con el de la pendiente de la recta.
3
Anscombe.csv
4. (a) La recta que se obtiene es y = 0.7602 +0.8822x. (b) El diagrama de dispersion, con la recta, es:
Y el coeciente de correlacion es r 0.8543. No es un coeciente bajo, pero el ajuste de la recta a
los puntos no resulta muy convincente.
De hecho el punto (110, 102) parece que podra ser un punto inuyente, cosa que podemos conrmar
calculando su distancia de Cook, que es mayor que 2. Eso punto requerira un analisis particular,
para saber si queremos retenerlo dentro del modelo. En cualquier caso, siempre existe la posibilidad
de indicar que se trata de un punto inuyente, y hacer dos modelos, uno que los incluya, y otro que
lo excluya. En este segundo modelo, el coeciente de correlacion desciende hasta 0.74, como parece
sugerir el diagrama: los puntos de valores mas bajos muestran una correlacion debil. A falta de mas
informacion, podemos poner bajo sospecha el modelo de regresion lineal.
(b) Al sustituir x = 106 en la recta se obtiene y 94.28. Ese es el valor que la recta predice para
x = 106 (atencion: este valor era uno de los valores de x observados, pero el correspondiente valor
observado de y era 93). El residuo correspondiente a x = 106 es
(valor observado) (valor recta) = y
11
y
11
(93 94.28) 1.277.
(c) El rango de valores de la x va de 95 a 110. EL valor 92 no pertenece a ese rango, por lo
que en ning un caso debe utilizarse la recta para predecir el valor y correspondiente. Eso sera
extrapolacion.
El valor que pide el apartado (e) ya se ha obtenido en el (c).
6. (a) El diagrama de dispersion es:
y parece apuntar a una relacion lineal bastante bien denida entre la x y la y. A primera vista no
se aprecian valores atpicos ni claramente inuyentes.
(b) La recta y = b0+b1x es y = 120.0+0.8274x. La recta x =

b
0
+

b
1
x, que se obtiene intercambiando
los papeles de la x y la y, es x = 125.9 + 1.100y. En R ambas rectas se obtienen simplemente
4
haciendo lm(y~x) para la primera y lm(x~y) para la segunda.
(c) El coeciente de correlacion r (que, por cierto, no depende del orden de las variables) vale
r 0.9536. Es compatible con un buen ajuste lineal.
(d) Para cada una de las predicciones usamos la recta correspondiente:
y = 120.0 + 0.8274 63 172.1
Mientras que:
x = 125.9 + 1.100 175 66.44
(e) El residuo es
(valor observado) (valor recta) = y
6
y
6
(170 172.1) 2.118.
5

Das könnte Ihnen auch gefallen