Sie sind auf Seite 1von 14

PRÁCTICA DE REGRESIÓN Y CORRELACIÓN

1.-
Dosis (mg) 0.50 0.75 1.00 1.25 1.50 1.75 2.00 2.25 2.50 2.75 3.00 3.25

Reducción 10 8 12 14 14 10 16 20 17 20 15 20

Presión sangre

Solución:
a.- Determine el tipo de ecuación que usaría para asociar funcionalmente ambas
variables.

Efecto de una droga en la disminución


de la presión sanguínea en adultos
hipertensivos
25
y = 3.7483x + 7.6387
20 R² = 0.6655
Presión Sangre

15

10

0
0 0.5 1 1.5 2 2.5 3 3.5
Dosis (mg)

Entonces el tipo de ecuación a utilizar será una regresión simple lineal, esto es debido a
que existe una relación lineal entre los datos ya que el coeficiente de determinación es
de R=0.8158 = 81.58% y se acerca al 100%.
b.-
X Y X*Y X2 Y2
0.5 10 5 0.25 100
0.75 8 6 0.5625 64
1 12 12 1 144
1.25 14 17.5 1.5625 196
1.5 14 21 2.25 196
1.75 10 17.5 3.0625 100
2 16 32 4 256
2.25 20 45 5.0625 400
2.5 17 42.5 6.25 289
2.75 20 55 7.5625 400
3 15 45 9 225
3.25 20 65 10.5625 400
22.5 176 363.5 51.125 2770
n∑XY − ∑X∑Y
b=
n∑X 2 − (∑X)2

12 ∗ 363.5 − 22.5 ∗ 176


b=
12 ∗ 51.125 − 22.52

𝐛 = 𝟑. 𝟕𝟒𝟖𝟑

∑Y − b∑X
a=
n
176 − (3.7482) ∗ 22.5
a=
12
𝐚 = 𝟕. 𝟔𝟑𝟖𝟕

 Entonces la ecuación será:


Y= a + bX
𝒀 = 𝟕. 𝟔𝟑𝟖𝟕 + 𝟑. 𝟕𝟒𝟖𝟑𝑿

 Error estándar:

∑𝑌 2 − 𝑎∑𝑌 − 𝑏∑XY
𝑆𝑋/𝑌 = √
𝑛−2

2770 − 7.6387 ∗ 176 − 3.7483 ∗ 363.5


𝑆𝑋/𝑌 = √
10

𝑺𝑿/𝒀 =2.5116

c) Calcule e interprete una medida de correlación.


∑𝑌 2
𝑆𝑦 2 = − 𝑌̅ 2
𝑛

2770
𝑆𝑦 2 = − 14.672
12

𝑺𝒚 𝟐 =15.6244
𝑺𝑿/𝒀 𝟐
𝑹=𝟏−
𝑺𝒚 𝟐
𝟐. 𝟓𝟏𝟏𝟔
𝑹=𝟏−
𝟏𝟓. 𝟔𝟐𝟒𝟒

𝑹 = 𝟎. 𝟖𝟑𝟗𝟐
INTERPRETACION: Significa que el 83.92% de variación de la presión sanguínea
estaría condicionado por la dosis de la droga en miligramos, y el resto de porcentaje
estaría condicionado por otros factores.

2.-

a) solución:

concentración de éter y el aumento progresivo de


volumen de aire corriente en pacientes anestesiados
600
Volumen de aire (cm3)

500

400

300

200

100

0
0 1 2 3 4 5 6
Concentración de éter (%)

Rpta: Debido a que no se puede presentar una regresión lineal, no se puede establecer
una función por lo tanto no presenta ninguna relación.
b) Rpta: No es procedente hacer un análisis de correlación lineal ya que el coeficiente
de correlación lineal es una medida en que ambas variables X e Y están asociadas a
través de una línea recta, pero para este caso no se establece una relación lineal.

3.-
Renta en miles de $ 7 10 15 20 25 30
N° de trastornos
gástricos 2 4 8 14 20 30
X: renta en miles de $
Y: N° de trastornos gástricos
a)

Nivel de renta y el número de trastornos gástricos


observados en promedio en varias personas

35
y = 1.1846x - 8.1262
30
R² = 0.9691
N° de trastornos gástricos

25
20
15
10
5
0
0 5 10 15 20 25 30 35
Renta en miles de $

La función es una lineal directa por lo tanto será:


X Y X*Y X2 Y2
7 2 14 49 4
10 4 40 100 16
15 8 120 225 64
20 14 280 400 196
25 20 500 625 400
30 30 900 900 900
107 78 1854 2299 1580

n∑XY − ∑X∑Y
b=
n∑X 2 − (∑X)2
6 ∗ 1854 − 107 ∗ 78
b=
6 ∗ 2299 − 1072
𝐛 = 𝟏. 𝟏𝟖𝟒𝟔
∑Y − b∑X
a=
n
78 − 1.1846 ∗ 107
a=
6
𝐚 = −𝟖. 𝟏𝟐𝟓𝟒
RPTA: LA FUNCIÓN ADECUADA SERA:
Y= a + bX
𝒀 = −𝟖. 𝟏𝟐𝟓𝟒 + 𝟏. 𝟏𝟖𝟒𝟔𝑿
b)

∑𝑌 2 − 𝑎∑𝑌 − 𝑏∑XY
𝑆𝑋/𝑌 = √
𝑛−2

1580 − (−8.1254) ∗ 78 − 1.1846 ∗ 1854


𝑆𝑋/𝑌 = √
4

𝑺𝑿/𝒀 = 𝟐. 𝟎𝟗𝟑𝟔
∑𝑌 2
𝑆𝑦 2 = − 𝑌̅ 2
𝑛

1580
𝑆𝑦 2 = − 132
6
𝑺𝒚 𝟐 = 𝟗𝟒. 𝟑𝟑𝟑𝟑

CORRELACION SERÍA:
𝑺𝑿/𝒀 𝟐
𝑹=𝟏−
𝑺𝒚 𝟐
𝟐. 𝟎𝟗𝟑𝟔𝟐
𝑹=𝟏−
𝟗𝟒. 𝟑𝟑𝟑𝟑

𝑹 = 𝟎. 𝟗𝟓𝟑𝟓
El grado de correlación es de 95.35%

4. Dar respuesta a las siguientes proposiciones.


a) ¿La presencia de un alto coeficiente de correlación, indica siempre la existencia de
una relación causa? ¿Por qué?
No siempre, una relación causal de dos eventos existe si la ocurrencia del primero
causa el otro. Una correlación entre dos variables no implica causalidad. Por otro
lado, si hay una relación causal entre dos variables, éstas deben estar correlacionadas.
b) ¿En qué casos se debe usar el análisis de regresión, correlación y en qué casos no
debería usarse?
- El análisis de regresión consiste en determinar una relación entre variables (x, y), con
el fin de que se pueda preceder el valor de una variable en base a la otra. Una variable es
la dependiente y la otra la independiente. Utilizado para la predicción y previsión.
- La correlación consiste en determinar la variación conjunta de dos variables, su grado
de relación y su sentido (positivo o negativo). La medida del grado de relación se
denomina coeficiente o índice de correlación.
- El uso de la correlación tiene superposición sustancial en el campo de aprendizaje
automático. También puede utilizarse para inferir relaciones causales entre las variables
independientes y dependientes pero con cuarta precaución.
- La correlación se utiliza para medir el grado de relación de dos variables siempre y
cuando ambas sean cuantitativas.
c) ¿Si el coeficiente de determinación entre el peso del recién nacido y la edad
cronológica de la madre es R2 = 90%? Interpretar.
Es un modelo cuyas estimaciones se ajustan bastante bien a la variable real. Aunque
técnicamente no sería correcto, se puede decir que el modelo explica en un 90% a la
variable real.
d) Describa una situación en su área de interés particular donde sería útil un análisis de
regresión simple. Utilice datos reales o realistas y haga un análisis de regresión
completo.
Ejemplo de Regresión Lineal:
Aplicar el método de mínimos cuadrados para determinar el costo de una jornada de
trabajo de 52 horas, conociendo la siguiente información.
MES TIEMPO (t) COSTO (S/.) (x)(y) x2
Enero 12 400 4800 144
Febrero 10 390 3900 100
Marzo 40 1200 48000 1600
Abril 50 1900 95000 2500
Mayo 36 950 28500 900
TOTAL 142 4840 180200 5244

y = ax + b
5 (180200) − 142 (4840)
a=  35.29
5 (5244) −(142)2
(4840) (5244) − 142 (180200)
b=  34.25
5 (5244) −(142)2

 y = 35.29x + 34.25
5.-
a) Construya un diagrama de dispersión para estos datos, y decidir si una línea recta es
un modelo de regresión apropiado de SBP(Y) sobre la Edad (X).

PRESIÓN SANGUÍNEA SISTÓLICA EN MUJERES, DENTRO DEL


INTERVALO DE EDAD CRONOLÓGICA 20-82 AÑOS
250

200

150
SBP

100

50

0
0 10 20 30 40 50 60 70 80 90
Edad

Modelo de regresión: y = ax + b
b) Estimar los parámetros de regresión del modelo propuesto en (a).
SISTEMA DE ECUACIONES NORMALIZADAS
∑ 𝑦 = a∑ 𝑥 + nb …..…. (1)
∑ 𝑥𝑦 = a∑ 𝑥 2 + ∑ 𝑥 …. (2) REEMPLAZANDO.
(1)… 5110 = a (1719) + 36(b)

∑ 𝑦 = 5110 (2)… 254317 = a (91145) + 1719

∑ 𝑥 = 1719 De (2) se obtiene:

N = 36 a = 2.7

∑ 𝑥𝑦 = 254317 Reemplazando en (1) se obtiene:

∑ 𝑥 2 = 91145 5110 = 2.7 (1719) + 36b


b = 13.01

 a = 2.7  b = 13.01  PARÁMETROS


 y = 2.7(x) + 13.01
c) Calcular el error estándar de la ecuación de regresión.

∑ 𝑦 2 − 𝑎 ∑ 𝑦−𝑏 ∑ 𝑥𝑦
𝑆𝑦⁄ = √ 767753−13.01 (5110)−2.7 (254317)
𝑥 𝑛−2 𝑆𝑦⁄ = √
𝑥 34
2
∑ 𝑦 = 767753
𝑺𝒚⁄ = 429.8
𝒙

d) Construir un intervalo del 95% de confianza para el intercepto y el coeficiente de


regresión de la recta de regresión.
 = 0.05
Para la pendiente

𝑆2
𝑎̂ ± 𝑡(1−∝⁄2, 𝑛−2) √∑(𝑥
𝑖 − 𝑥̅ )2

 a = 2.7  2.7 ± 𝑡(0.975,


184728.04
34) √ 9149.24
 𝑥̅ = 46.2
 ∑(𝑥𝑖 − 𝑥̅ )2 = 9149.24 2.7 ± (2.0322) (4.49)
 2.7 ± 9.12
 S = 429.8
𝑆 2 = 184728.04 - 6.42 ≤ a ≤ 11.82
 𝑛 = 36

1 𝑥̅ 2
𝑏̂ ± 𝑡(1−∝⁄2, 𝑛−2) S√𝑛 + ∑(𝑥
𝑖 − 𝑥̅ )2

1 46.22
 a = 13.01  13.01 ± 𝑡(0.975, 34) (429.8)√36 + 9149.24
 𝑥̅ = 46.2 13.01 ± (2.0322) (429.8) (0.26)
 ∑(𝑥𝑖 − 𝑥̅ )2 = 9149.24  13.01 ± 228.2
 𝑛 = 36
 S = 429.8 - 215.19 ≤ b ≤ 241.21

e) Calcular un intervalo del 95% de confianza para la media de Y en X=24 años.

𝑏̂ + 𝑎𝑥 𝑛𝑢𝑒𝑣𝑎 ± 𝑡(1−∝⁄2, 𝑛−2) S (b + 𝑎𝑥 𝑛𝑢𝑒𝑣𝑎 )


  = 0.05
 b = 13.01
 a = 2.7
 𝑥 𝑛𝑢𝑒𝑣𝑎 = 24
 𝑛 = 36

 13.01 + 2.7 (24) ± (2.0322) (429.8) (13.01 + 2.7 (24))


 77.81 ± (2.0322) (429.8) (77.81)
 77.81 ± 67962.33216

 - 67884.52 ≤ b + 𝒂𝒙𝒏𝒖𝒆𝒗𝒂 ≤ 68040.14

10.-

Solución:

a) μx= 12.9929
Sx=6.2770
μy=45.25
Sy=15.537
La fórmula de la covarianza es
Sxy = [Σ(x-μx)*(y-μy)] /n
Sxy=87,0704
El coeficiente de correlación lineal es
r=Sxy/(Sx.Sy)
r=87.0704/(6.277*15.537)
r=0.8928

El coeficiente es alto e indica un buen ajuste lineal. Además 0.89282 = 0.7971, lo que
indica que el 79.71% de la variabilidad se explica por la recta de regresión.

b) y=a+bx

b=r (Sy/Sx)

b=0.8928 (15.537 / 6.277 )

b=2.2099

a=μy-(b.μx)
a=45.25-(2.2099*12.9929)

a=16.537

La recta es: y=16.537+2.2099x

c) El coeficiente b determina como varia Y por unidad de X, es decir como varía la


concentración del esteroide en plasma libre por unidad de concentración de
estrona en saliva, es decir hay una variación de 2.2099 de los esteroides por unidad
de concentración de estrona en saliva.
A continuación, se muestra la gráfica:

y=16.537+2.2099x
r2=0.7978

10) Solución:
a) Llamamos Y a los datos del hierro y X a los del plomo. Ahora calculamos, las
medias (X, Y) y desvaciones (SX, SY) de cada serie:
X = 35,7

SX=17,8776

Y=66,1

SY=31,2104

Ahora calculamos la covarianza

∑XY
SXY= – (X.Y)
𝑛
SXY = 469,13

El coeficiente de correlación lineal es

r=SXY/(Sx.Sy)

r=0,8407

Es un valor elevado lo que sugiere un buen ajuste lineal, por lo que el modelo

lineal parece ser idóneo.

b) Y=a+bX

b=r(SY/SX)

b=1,4678

a=Y-bX

a=66,1 – (1.4678*35.7)

a=13.6995

La recta es

Y=13.6995+1.4678X

c) X=15 de Plomo

Y=13.6995+(1.4678*15)

Y=35.7165 de Hierro
12.
a) Hallar el coeficiente de determinación para ambas variables.

EFECTO DE LAS AGUAS RESIDUALES DE LAS


ALCANTARILLAS QUE AFLUYEN A UN LAGO
700
Monitoreo por Método Automático

600

500

400

300

200

100

0
0 100 200 300 400 500 600 700
Monitoreo por Método Manual

 y = 0.9322x + 26115
 R2 = 0.9561

b) Comprobar la idoneidad del modelo lineal de regresión. Si el modelo es apropiado,


hallar la recta de regresión de Y sobre X y utilizarla para predecir la lectura que se
obtendría empleando la técnica automática con una muestra de agua cuya lectura
manual es de 100.
y = 0.932x – 26.11
y = 0.932 (100) -26.11
y = 119.31
13.
a) Hállese la expresión de la ecuación lineal que mejor exprese la variación de la
creatinina, en función de los días transcurridos tras la diálisis, así como el grado de
bondad de ajuste y la varianza residual.

ACLARAMIENTO DE CREATININA EN PACIENTES TRATADOS


CON CAPTOPRIL TRAS LA SUSPENSIÓN DEL TRATAMIENTO
CON DIÁLISIS
6

5
Creatinina (mg/dl)

0
0 5 10 15 20 25 30 35 40
Días tras la diálisis

 y = -0.0616x + 5.5414
 R2 = 0.9571
b) ¿En qué porcentaje la variación de la creatinina es explicada por el tiempo
transcurrido desde la diálisis?
 R2 = 0.9571
 Porcentaje de variación de la Creatinina = 95.7 %

c) Si un individuo presenta 4'1 mg/dl de creatinina, ¿cuánto tiempo es de esperar que


haya transcurrido desde la suspensión de la diálisis?
 y = -0.0616x + 5.5414
 x = (5.5414 - y) (0.0616)
x = (5.5414 – 4.1) (0.0616)
x = 23.4
14.
a) ¿Existe relación lineal entre la TAD basal y la que se observa tras el tratamiento?

ESTUDIO DEL POSIBLE EFECTO HIPOTENSOR DE UN


FÁRMACO
120

100
TAD mediante Tratamiento

80

60

40

20

0
94 96 98 100 102 104 106 108 110 112
TAD en Condiciones Basales

 y = 0.0121x2 – 1.3028x + 96.739


 R2 = 0.5603
 Se verificó que los datos tienen relación positiva en un 0.56; es decir, si existe una
relación.

b) ¿Cuál es el valor de TAD esperado tras el tratamiento, en un paciente que presentó


una TAD basal de 95 mm de Hg?
 y = 0.012x2 – 1.302x - 96.73
y = 0.012(0.56)2 – 1.302(0.56) + 96.73
y = 96.005

Das könnte Ihnen auch gefallen