Sie sind auf Seite 1von 41

ANLISIS DE CORRELACIN

Y REGRESIN
BIOESTADSTICA
Bio.Est. Wilver Rodrguez Lpez. M.Sc.

Introduccin
En muchas ocasiones surge la necesidad de estudiar la
relacin que existe entre dos variables cuantitativas que tienen
distribucin aproximadamente normal.
Por ejemplo si la dosis de cierta droga (en ml) est
relacionada con el tiempo de reaccin a un estmulo en
segundos.
Antes de establecer un modelo que relacione a ambas
variables, es necesario averiguar si estas dos variables esta
correlacionadas entre s; es decir realizar una anlisis de
correlacin.

ANALISIS DE CORRELACIN DE DOS


VARIABLES CANTITATIVAS

En este proceso de anlisis es de inters


obtener una medida que indique la
intensidad de la relacin entre dos variables.
El coeficiente utilizado para indicar esta
intensidad es el coeficiente de correlacin
lineal de Pearson ( r ). Este coeficiente se
determina por la siguiente relacin:
3

n Y

n Yt X t Yt X t
2

Yt

n X

2
t

X t

Las sumatorias en la frmula anterior se realizan sobre las n


observaciones, tomadas como muestra.
En coeficiente de correlacin de Pearson se encuentran entre 1 y 1, esto
es

1 rx , y 1
4

DIAGRAMA DE DISPERSIN

Correlacin positiva

Correlacin negativa

Ausencia de

correlacin

Coeficiente de correlacin
lineal
El Coeficiente de Correlacin (r)
requiere variables medidas en escala de
intervalos o de razn

Vara entre -1 y 1.
Valores de -1 1 indican correlacin perfecta.
Valor igual a 0 indica ausencia de correlacin.
Valores negativos indican una relacin lineal
inversa y valores positivos indican una relacin
lineal directa
6

Interpretacin del Coeficiente de


Correlacin
Correlacin
negativa perfecta
Correlacin
positiva
perfecta
Ninguna
correlacin
Moderada
correlacin
positiva

Moderada
correlacin
negativa
Fuerte
correlacin
negativa

-1

Dbil
correlacin
positiva

Dbil
correlacin
negativa

-0.5

Fuerte
correlacin
positiva

0.5

Significancia Estadstica del


Coeficiente de Correlacin
Una vez obtenido el coeficiente de correlacin
con los datos de la muestra, interesa saber si
en la poblacin muestreada: 0

Contraste de la Hiptesis 0
Este es el contraste de hiptesis que con mas
frecuencia se realiza.
Las hiptesis que se plantean son las siguientes:
Ho : = 0 (No hay correlacin entre las variables)
H1 : 0 (Si hay correlacin entre las variables)

Contraste de la Hiptesis 0
El estadstico de contraste es:

t exp =

r (n-2) / (1- r2)

t exp tiene distribucin t de Student con


n-2 grados de libertad

Contraste de la Hiptesis 0
Decisin
Para un determinado nivel de significancia ,
y un tamao de muestra especfico se
rechaza Ho si el valor del t exp es menor o
igual que el valor - t (n-2); /2 o si es mayor o
igual al valor t (n-2); /2

Ejemplo:
Uno de los objetivos de un estudio es analizar si existe una
relacin lineal entre la presin sangunea sistlica (mmHg),
(SIS), y la presin sangunea diastlica (mmHg), (DIA), en los
habitantes de una ciudad. Se selecciona al azar una muestra de
diez personas y se mide la SIS y la DIA. Los resultados
obtenidos son los siguientes:
Persona: 1
2
3
4
5
6
7
8
9
10
SIS(X) : 130 125 145 150 132 133 145 160 150 140
DIA(Y): 85 70 80 90 65 70 90 100 95
85
x =1410 y = 830 xy = 17,990 x2 = 199,888

y2 = 70,100

Grfico de dispersin

Tensin Arterial
Diastlica

Grfico N
Relacin entreTensin Arterial Sistlica(TAS) y la
Tensin Arterial Diastlica(TAD) en una muestra
de personas en una ciudad.
120
100
80
60
40
20
0
0

50

100
Tensin Arterial Sistlica

150

200

Frmula para el coeficente de


correlacin (r) Pearson
r

r =

r =

n x

n xy x y
2

x n y y
2

10( 117,990) - (1410) (830)


_____________________________________________
[ 10(199,888) (1410)2 ] [10(70,100 ) (830)2 ]
0.833

Significancia Estadstica del


Coeficiente de Correlacin
Planteamiento de hiptesis
Ho : = 0
H1 : 0
Nivel de significancia
= 0.05

Significancia Estadstica del


Coeficiente de Correlacin
El estadstico de contraste:
t exp =
texp

r (n-2) / (1- r2)

= 0.833 (10-2) / (1- 0.833 2)


= 4.26

Significancia Estadstica del


Coeficiente de Correlacin
Decisin:
Los puntos crticos de la t de Student con 8 grados de
libertad, para un contraste bilateral con = 0.05, son
-2.306 y +2.306
Como el texp = 4.26 es mayor que el punto crtico +2.306,
se rechaza Ho : = 0
Conclusin: Si existe correlacin lineal entre TAS y la
TAD y es fuerte y positiva, con un nivel de significancia
de 0.05

Anlisis de Regresin
El anlisis de regresin lineal simple es til para
estudiar la forma probable de la relacin entre
dos variables (Y: variable dependiente y X:
variable independiente), y su objetivo final es
predecir o estimar el valor de la variable
dependiente, conociendo un valor especfico de
la variable independiente.
18

Proceso de estimacin de la regresin lineal simple


Modelo de regresin

y=0+1x+

Ecuacin de regresin

E(y)=0+1x

Parmetros desconocidos

0.1

Datos de la muestra

x
x1
x2
.
.
.
xn

y
y1
y2
.
.
.
yn

b0 y b1

Ecuacin estimada de
regresin

proporcionan estimados

Estadsticos de la muestra

0 y 1

y=b0+b1x
b0.b1

19

Lneas posibles de regresin en la


regresin lineal simple
Seccin A
Relacin lineal positiva

Seccin B
Relacin lineal negativa
Ey

Ey
Lnea de regresin

Seccin C
No hay relacin
Ey

La pendiente 1
es negativa

La pendiente 1
es 0
*

La pendiente 1
es positiva

Lnea de regresin

Lnea de regresin

* Ordenada al origen 0
20

PASOS EN UN ANLISIS DE
REGRESIN LINEAL SIMPLE
Tomar una muestra de n observaciones en las que
se consideran dos variables, una variable x
independiente, considerada libre de error es decir
una variable fijada de antemano y una variable y,
variable dependiente, considerada variable
aleatoria, o sea una de las posibles respuestas de la
variable y a la variable x. Se tienen entonces un
conjunto de n pares de la forma (x,y)
21

PASOS EN UN ANLISIS DE
REGRESIN LINEAL SIMPLE
Realizar un diagrama de dispersin de las
variables (x,y) en un sistema de
coordenadas cartesianas, ya visto
anteriormente y calcula el coeficiente de
correlacin.

22

PASOS EN UN ANLISIS DE
REGRESIN LINEAL SIMPLE
En base a la informacin anterior y si se
considera apropiado un modelo de recta,
encontrar la ecuacin de la recta que mejor
ajuste (o represente) a todos los puntos del
diagrama. A travs de esta ecuacin es
posible predecir el valor de y para un
determinado valor de x.
23

PASOS EN UN ANLISIS DE
REGRESIN LINEAL SIMPLE
Estimar la recta de regresin:

24

PASOS EN UN ANLISIS DE
REGRESIN LINEAL SIMPLE

25

PASOS EN UN ANLISIS DE
REGRESIN LINEAL SIMPLE

26

Estimacin de la recta de regresin por el


mtodo de mnimos cuadrados

27

SIGNIFICANCIA ESTADSTICA DEL


COEFICIENTE DE REGRESIN

28

SIGNIFICANCIA ESTADSTICA DEL


COEFICIENTE DE REGRESIN

29

Intervalo de confianza para el


coeficiente de regresin:

30

EJEMPLO

31

32

Anlisis de Regresin.

33

Significancia estadstica del coeficiente


de regresin
Antes veamos algunos clculos auxiliares
(X-media)2
Y

Y estimado

e =Y-Y estimado

0,657

0,117649

7,5625

0,8

0,97465

0,03050262

5,0625

1,8

1,2923

0,25775929

3,0625

1,4

1,60995

0,044079

1,5625

2,1

1,9276

0,02972176

0,5625

1,8

2,24525

0,19824756

0,0625

2,2

2,5629

0,13169641

0,0625

2,88055

0,0142683

0,5625

2,75

3,1982

0,20088324

1,5625

3,51585

0,26610122

3,0625

4,1

3,8335

0,07102225

5,0625

4,9

4,15115

0,56077632

7,5625

suma

1,92270699

35,75

34

35

36

37

38

39

El coeficiente de determinacin es (0.939) 2 =


0.882, es decir el porcentaje de variaciones
observadas en el tiempo de reaccin al
estmulo que es explicado por las variaciones
de la dosis de la droga es del 87.1%. El
porcentaje de variacin del tiempo de
reaccin al estmulo que no es explicado por
la dosis de la droga es del 0.118 [1 R 2 ]

40

Anlisis de Regresin con el


MegaStat

41

Das könnte Ihnen auch gefallen