Sie sind auf Seite 1von 32

1

Tema: Correlacin y prueba de hiptesis


Curso: Estadstica Aplicada a la Investigacin
Cientfica
Dr. NARCI SO FERNNDEZ SAUCEDO
DISTRIBUCIONES BIDIMENSIONALES O
BIVARIADAS
Se trata de estudiar simultneamente ms de
una caracterstica asociada a cada observacin.
El caso de dos caractersticas es:
{(X
1,
Y
1
), (X
2,
Y
2
),..,( X
n,
Y
n
)}
En el caso de tres caractersticas es:
{(X
1,
Y
1,
Z
1
),( X
2,
Y
2,
Z
2
),..,( X
n,

Y
n,
Z
n
)}
Ejm: Se desea estudiar simultneamente la correlacin
entre peso y talla de una poblacin o muestra de
estudiantes.

2
DISTRIBUCIONES BIDIMENSIONALES
DE DATOS NO CLASIFICADOS
Dadas las observaciones bivariadas {(X
1,
Y
1
),
(X
2,
Y
2
),....,( X
n,
Y
n
)} que
son los datos de las dos variables en estudio,
luego se aplican la covarianza, la correlacin
lineal o de regresin
si deseamos estudiar el grado de relacin entre
las variables estamos frente a un problema de
correlacin. Para estudiar el grado y tambin el
tipo de relacin funcional entre las variables,
estamos frente a un problema de regresin



ANLISIS DE CORRELACIN
Es un grupo de tcnicas estadsticas usadas
para medir la intensidad de la relacin entre dos
variables.
ejemplo, un investigador desea determinar la asociacin entre la
biomasa marina y la cantidad de clorofila. El investigador por
tanto, saca repetidas muestras de agua de un lugar de muestreo
en un lago y mide la cantidad de clorofila y la biomasa en cada
muestra repetida. En esta situacin el investigador no tiene
control sobre una u otra variable, puesto que ambos valores
encontrados en las muestras sern los que la naturaleza provee.
Por ello, estas variables son aleatorias y la correlacin es el
procedimiento estadstico adecuado.

4
5
CORRELACIN ENTRE VARIABLES
La correlacin puede ser:

De al menos dos variables (X.Y) (correlacin
simple)

De ms de variables independientes
( correlacin mltiple).
6
CORRELACIN LINEAL ENTRE 2 VARIABLES
Es el proceso que permite medir el grado de
relacin que puede existir entre dos variables, de la
forma (a,b) obtenindose un conjunto de puntos
llamado diagrama de dispersin o nube de
puntos, indicando la tendencia que sigue para
determinar si existe o no solucin de la variables.
Ejemplos:
Relacin entre edad y maduracin mental.
Relacin entre el tiempo de estudio y
rendimiento acadmico.
7
COEFIENTE DE CORRELACIN
Es un valor cuantitativo de la relacin entre dos o
ms variables.
El coeficiente de correlacin puede variar desde -
1 hasta -1.
La correlacin de proporcionalidad directa o
positiva se establece con los valores positivos y
de proporcionalidad inversa o negativa.
No existe relacin entre las variables cuando el
coeficiente es cero (0).
-1
1
0 Relacin positiva Relacin negativa
No existe relacin
8
FRMULA DE COEFIENTE DE CORRELACIN DE PEARSON
EJEMPLOS
9
(1)X (2)(Y)
(3)
) (
2
x
(4)
) (
2
y

(5)(XY)
18 82 324 6724 1476
15 68 225 4624 1020
12 60 144 3600 720
9 32 81 1024 288
3 18 9 324 54

= 57 X

= 260 Y

= 783
2
x

=162
2
y

= 3558 XY

(

=
) 260 ( ) 57 (
2 2
) 16296 ( 5 ) 783 ( 5
) 260 )( 57 ( ) 3558 )( 5 (
r

) 67600 81480 )( 3249 3915
14820 17790


= r



98 , 0
4 , 3040
2970
9244060
2970
) 1380 )( 666 (
2970
= = = = r
10
Existe relacin entre la Masa corporal y la fuerza en los alumnos
universitarios?. Si existe, Qu tipo de correlacin?
Alumno Masa Corporal(Kg) Fuerza(Kp)
Carmen 60,00 100,00
Pedro 65,00 105,00
Juan 70,00 102,00
Lus 75,00 135,00
Ana 80,00 95,00
Carlos 85,00 125,00
Elena 90,00 140,00
Rosa 95,00 130,00
Lus 100,00 148,00
Variable X Variable Y
11
UNA VARIABLE INDEPENDIENTE Y DOS DEPENDIENTES
Relacin positiva
Relacin negativa
12
REPRESENTACIN GRFICA CON SPSS
Sean las variables:
X= Masa Corporal
Y= Fuerza
Pasos para representar:
Ingresar al paquete estadstico
SPSS.
Definir las variables antes
mencionados.
Ingresar los datos presentados
en la tabla anterior.
Grficos/Interactivos/
Diagrama de dispersin/
13
COEFICIENTE DE CORRELACIN
14
COEFICIENTE DE CORRELACIN = r de PEARSON
15
COEFICIENTE DE CORRELACIN = r
EJERCICIOS
1. Encuentre si existe o no correlacin entre
los siguientes datos de las variables:
Edad X: 21, 18, 28, 12, 14, 23
Coeficiente de inteligencia
Y: 140, 90, 120, 108, 89, 138
2.

16
ANLISIS DE REGRESIN
Es un procedimiento estadstico que estudia la relacin
funcional entre variables. Con el objeto de predecir una
funcin de las otras.
Regresin lineal: La funcin es una combinacin lineal
de los parmetros.
Coeficiente de correlacin lineal: Requiere variables
medidas en escala de intervalos o de proporciones.
Vara entre -1 y 1.
Valores de -1 o 1 indican correlacin perfecta.
Valor igual a 0 indica ausencia de correlacin.
Valores negativos indican una relacin lineal inversa y
valores positivos indican una relacin lineal directa.

18
ECUACIN DE REGRESIN
La frmula para una ecuacin de regresin
lineal es:
Y = bX +a
Donde:
Y: Es el valor calculado
a: Es el intercepto
b: Es la pendiente de la lnea
X: Es el predictor
19
ECUACIN DE REGRESIN
a puede ser calculado a partir de la
frmula:
a = M
y
bMx
Donde:
My es la media de Y
Mx es la media de X.
b puede ser calculada a partir de la
frmula:
b = r (S
y
/S
x
)
Donde:
S
y
es la desviacin estndar de Y.
S
x
es la desviacin estndar de X.
20
ECUACIN DE REGRESIN
Mx My Sx Sy r
80 120 13,6906394 19,7104334 0,771130895
21
ECUACIN DE REGRESIN
ANLISIS DE VARIANZA
Anlisis de varianza (ANDEVA,
ANOVA): Se usa para establecer si
existen diferencias significativas en las
medias entre dos o ms muestras. Su
nombre deriva del hecho que las
varianzas son usadas para establecer
las diferencias entre las medias.

22
23
Significancia estadstica: Prueba de hiptesis
El valor de coeficiente de correlacin (r) determina
una relacin lineal entre las variables. Sin embrago,
no indica si esta relacin es estadsticamente
significativa.
Para ello, se aplica la prueba de hiptesis de
parmetro (rho). Como en toda prueba de
hiptesis, la hiptesis nula H
0
establece que no
existe una relacin, es decir, que el coeficiente de
correlacin es igual a 0. Mientras que la hiptesis
alterna H
1
propone que s existe una relacin
significativa, por lo que debe ser diferente a 0.
Ho: = 0 H
1
: = 0
24
Significancia estadstica: Prueba de hiptesis

Hiptesis Nula (H
o
) : No existe relacin entre la Masa
corporal y la fuerza en los alumnos universitarios
H
o
: = 0
Hiptesis Alterna (H
1
) : Existe relacin entre la Masa corporal
y la fuerza en los alumnos universitarios
H
1
: = 0
25
Significancia estadstica: Prueba de hiptesis
El estadstico de prueba que revela, si la hiptesis nula H
o
es
o no verdadera es el siguiente:


Ejemplo: Para el caso presentado
n 2 = 9 2 = 7 y r = 0,77
26
Dos colas y
o=0,05
27
Significancia estadstica: Prueba de hiptesis
T
obtenido
= 3,19 valor calculado
T
crtico
= 2,365 valor que se obtiene de la tabla
t-Student, con n-2=7 grados de libertad
Contrastacin:
Si T
obtenido
> T
crtico
entonces se rechaza
la hiptesis nula (Ho); como
consecuencia se acepta la hiptesis
alterna (H
1
).

28
Significancia estadstica: Prueba de hiptesis
En un da de primavera en que la temperatura fue subiendo
se midieron el nmero de chirridos por minutos de los grillos:
X 4 8 9 10 12 13 14 29 30 15 16
Y 41 42 85 80 83 59 61 112 120 62 70
17 18 19 25 28 22 23
85 85 90 90 110 90 85
X: La temperatura Y: Nmero de chirridos por minuto.
Cul es la hiptesis alterna ? Cul es la hiptesis nula?
Existe correlacin entre X e Y?. Halle la ecuacin de la recta de
regresin lineal. Realice la prueba de hiptesis correspondiente;
utilice o=0,05
2colas
29
Significancia estadstica: Prueba de hiptesis
Se obtienen las medidas de peso y estatura de 15
estudiantes de la localidad de Huachipa y los resultados
son:
X 50 40 45 60 58 65 56 59 63 68 55
Y 1,30 1,20 1,50 1,30 1,20 1,43 1,25 1,60 1,56 1,55 1,43
X: Peso Y: Estatura.
Cul es la hiptesis alterna ? Cul es la hiptesis nula?
Existe correlacin entre X e Y?. Halle la ecuacin de la recta de
regresin lineal. Realice la prueba de hiptesis correspondiente; utilice
o=0,05
2colas

30
Coeficientes de correlacin de orden de rangos de Spearman Rho (r
S
)
Se utiliza una o ambos variables son solo de escala ordinal.
La frmula sencilla para el clculo de rho cuando no existen
empates, o existen unos cuantos empates, con respecto al
nmero de parejas de datos es:
N N
D
r
i
S

=

3
2
6
1
Di : Diferencia entre el i-simo par de rangos = R(X
i
)-R(Y
i
)
R(X
i
): es el rango del i-simo dato X
R(Y
i
): es el rango del i-simo dato Y
N: es el nmero de parejas de rangos
31
Coeficientes de correlacin de orden de rangos de Spearman Rho (r
S
)
Supongamos que una gran corporacin de colegios catlicos
est interesada en calificar a 15 aspirantes a Director segn
su capacidad de liderazgo. Se contrata a dos psiclogos
para realizar ese trabajo. Como resultado de sus exmenes
y entrevistas, cada uno de los psiclogos, de manera
independiente, han clasificado a los aspirantes segn su
capacidad de liderazgo. Las escalas de calificacin van de 1
a 12, donde 1 representa el nivel mximo de liderazgo. Los
datos aparecen en la siguiente tabla. Cul es la correlacin
entre las clasificaciones de los dos psiclogos?
Sujeto

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Psiclogo A
6 5 7 10 2,5 2,5 9 1 11 4 8 12 4 10 3
Psiclogo
B
5 3 4 8 1 6 10 2 9 7 11 12 5 9 5
32
Coeficientes de correlacin de orden de rangos de Spearman Rho (r
S
)
88 . 0
3360
375
1
15 15
) 5 , 62 ( * 6
1
* 6
1
3 3
2
= =

=

N N
D
r
i
S
Sujeto Psiclogo A Psiclogo B D
i
D
i
2
1 6 5 1 1
2 5 3 2 4
3 7 4 3 9
4 10 8 2 4
5 2,5 1 1,5 2,25
6 2,5 6 -3,5 12,25
7 9 10 -1 1
8 1 2 -1 1
9 11 9 2 4
10 4 7 -3 9
11 8 11 -3 9
12 12 12 0 0
13 4 5 -1 1
14 10 9 1 1
15 3 5 -2 4
N=15 (D
i
2
)= 62,5

Das könnte Ihnen auch gefallen