Beruflich Dokumente
Kultur Dokumente
Y REGRESIN
BIOESTADSTICA
Bio.Est. Wilver Rodrguez Lpez. M.Sc.
Introduccin
En muchas ocasiones surge la necesidad de estudiar la
relacin que existe entre dos variables cuantitativas que tienen
distribucin aproximadamente normal.
Por ejemplo si la dosis de cierta droga (en ml) est
relacionada con el tiempo de reaccin a un estmulo en
segundos.
Antes de establecer un modelo que relacione a ambas
variables, es necesario averiguar si estas dos variables esta
correlacionadas entre s; es decir realizar una anlisis de
correlacin.
n Y
n Yt X t Yt X t
2
Yt
n X
2
t
X t
1 rx , y 1
4
DIAGRAMA DE DISPERSIN
Correlacin positiva
Correlacin negativa
Ausencia de
correlacin
Coeficiente de correlacin
lineal
El Coeficiente de Correlacin (r)
requiere variables medidas en escala de
intervalos o de razn
Vara entre -1 y 1.
Valores de -1 1 indican correlacin perfecta.
Valor igual a 0 indica ausencia de correlacin.
Valores negativos indican una relacin lineal
inversa y valores positivos indican una relacin
lineal directa
6
Moderada
correlacin
negativa
Fuerte
correlacin
negativa
-1
Dbil
correlacin
positiva
Dbil
correlacin
negativa
-0.5
Fuerte
correlacin
positiva
0.5
Contraste de la Hiptesis 0
Este es el contraste de hiptesis que con mas
frecuencia se realiza.
Las hiptesis que se plantean son las siguientes:
Ho : = 0 (No hay correlacin entre las variables)
H1 : 0 (Si hay correlacin entre las variables)
Contraste de la Hiptesis 0
El estadstico de contraste es:
t exp =
Contraste de la Hiptesis 0
Decisin
Para un determinado nivel de significancia ,
y un tamao de muestra especfico se
rechaza Ho si el valor del t exp es menor o
igual que el valor - t (n-2); /2 o si es mayor o
igual al valor t (n-2); /2
Ejemplo:
Uno de los objetivos de un estudio es analizar si existe una
relacin lineal entre la presin sangunea sistlica (mmHg),
(SIS), y la presin sangunea diastlica (mmHg), (DIA), en los
habitantes de una ciudad. Se selecciona al azar una muestra de
diez personas y se mide la SIS y la DIA. Los resultados
obtenidos son los siguientes:
Persona: 1
2
3
4
5
6
7
8
9
10
SIS(X) : 130 125 145 150 132 133 145 160 150 140
DIA(Y): 85 70 80 90 65 70 90 100 95
85
x =1410 y = 830 xy = 17,990 x2 = 199,888
y2 = 70,100
Grfico de dispersin
Tensin Arterial
Diastlica
Grfico N
Relacin entreTensin Arterial Sistlica(TAS) y la
Tensin Arterial Diastlica(TAD) en una muestra
de personas en una ciudad.
120
100
80
60
40
20
0
0
50
100
Tensin Arterial Sistlica
150
200
r =
r =
n x
n xy x y
2
x n y y
2
Anlisis de Regresin
El anlisis de regresin lineal simple es til para
estudiar la forma probable de la relacin entre
dos variables (Y: variable dependiente y X:
variable independiente), y su objetivo final es
predecir o estimar el valor de la variable
dependiente, conociendo un valor especfico de
la variable independiente.
18
y=0+1x+
Ecuacin de regresin
E(y)=0+1x
Parmetros desconocidos
0.1
Datos de la muestra
x
x1
x2
.
.
.
xn
y
y1
y2
.
.
.
yn
b0 y b1
Ecuacin estimada de
regresin
proporcionan estimados
Estadsticos de la muestra
0 y 1
y=b0+b1x
b0.b1
19
Seccin B
Relacin lineal negativa
Ey
Ey
Lnea de regresin
Seccin C
No hay relacin
Ey
La pendiente 1
es negativa
La pendiente 1
es 0
*
La pendiente 1
es positiva
Lnea de regresin
Lnea de regresin
* Ordenada al origen 0
20
PASOS EN UN ANLISIS DE
REGRESIN LINEAL SIMPLE
Tomar una muestra de n observaciones en las que
se consideran dos variables, una variable x
independiente, considerada libre de error es decir
una variable fijada de antemano y una variable y,
variable dependiente, considerada variable
aleatoria, o sea una de las posibles respuestas de la
variable y a la variable x. Se tienen entonces un
conjunto de n pares de la forma (x,y)
21
PASOS EN UN ANLISIS DE
REGRESIN LINEAL SIMPLE
Realizar un diagrama de dispersin de las
variables (x,y) en un sistema de
coordenadas cartesianas, ya visto
anteriormente y calcula el coeficiente de
correlacin.
22
PASOS EN UN ANLISIS DE
REGRESIN LINEAL SIMPLE
En base a la informacin anterior y si se
considera apropiado un modelo de recta,
encontrar la ecuacin de la recta que mejor
ajuste (o represente) a todos los puntos del
diagrama. A travs de esta ecuacin es
posible predecir el valor de y para un
determinado valor de x.
23
PASOS EN UN ANLISIS DE
REGRESIN LINEAL SIMPLE
Estimar la recta de regresin:
24
PASOS EN UN ANLISIS DE
REGRESIN LINEAL SIMPLE
25
PASOS EN UN ANLISIS DE
REGRESIN LINEAL SIMPLE
26
27
28
29
30
EJEMPLO
31
32
Anlisis de Regresin.
33
Y estimado
e =Y-Y estimado
0,657
0,117649
7,5625
0,8
0,97465
0,03050262
5,0625
1,8
1,2923
0,25775929
3,0625
1,4
1,60995
0,044079
1,5625
2,1
1,9276
0,02972176
0,5625
1,8
2,24525
0,19824756
0,0625
2,2
2,5629
0,13169641
0,0625
2,88055
0,0142683
0,5625
2,75
3,1982
0,20088324
1,5625
3,51585
0,26610122
3,0625
4,1
3,8335
0,07102225
5,0625
4,9
4,15115
0,56077632
7,5625
suma
1,92270699
35,75
34
35
36
37
38
39
40
41