Sie sind auf Seite 1von 29

TEORÍA DE

CORRELACIÓN
INTRODUCCIÓN

Al analizar los datos en ciencias de la salud, con


frecuencia resulta conveniente saber algo acerca de la
relación que existe entre dos variables.

Es posible que se quiera estudiar la relación entre la


presión sanguínea y la edad, la estatura y el peso, el
nivel de consumo de nutriente y la ganancia de peso,
la intensidad de un estímulo y el tiempo de reacción, o
bien, el ingreso total familiar y los gastos médicos.

Correlación se define como el grado de relación


existente entre dos variables.

Dr. Paúl Gareca López 2


INTRODUCCIÓN

La relación entre dos variables se la puede clasificar de


la siguiente forma:

 Interdependencia. Cuando la influencia entre las dos


variables es recíproca, sería un caso de dependencia
bilateral.

 Dependencia causal unilateral. Cuando una de las


variables influye en la otra, pero no al contrario.

 Dependencia indirecta. Las variables presentan


correlación a través de una tercera.

Dr. Paúl Gareca López 3


INTRODUCCIÓN

 Concordancia. Cuando se puede determinar la


correlación que existe entre dos variables
independientes.

 Covariación casual. Cuando la correlación entre las


dos variables es casual o accidental.

La naturaleza e intensidad de las relaciones entre


variables como éstas puede estudiarse por medio de la
técnica estadística del análisis de correlación de
variables.

Dr. Paúl Gareca López 4


MODELO DE CORRELACIÓN

Cuando tanto x como y son variables aleatorias, se


tiene lo que se conoce como el modelo de correlación.

Bajo el modelo de correlación, se obtiene


observaciones de la muestra seleccionando una
muestra al azar de las unidades de asociación
(personas, lugares, animales o cualquier otro elemento
sobre el cual se toma dos medidas) y tomando una
medida de x y una medida de y sobre cada una.

Dr. Paúl Gareca López 5


MODELO DE CORRELACIÓN

La correlación, que comprende dos variables, implica


una relación entre las variables que pone a ambas
sobre un mismo terreno y no las distingue, refiriéndose
a una como la variable independiente (causa,
representada en el eje x de un plano cartesiano) y a la
otra como la variable dependiente (efecto,
representada en el eje y).

Bajo el modelo de correlación, se supone que x y y


varían juntas.

Dr. Paúl Gareca López 6


MODELO DE CORRELACIÓN

Supongamos que queremos conocer la relación entre


edad (en meses) y talla (en cm) de niños con edades
de 3 a 9 meses, a partir de una muestra de 12 niños
con los siguientes datos disponibles:
Niño 1 2 3 4 5 6 7 8 9 10 11 12
Edad 3 6 5 5 3 4 9 8 9 7 6 5
Talla 55 68 64 66 62 65 74 75 73 69 73 68

La relación de estos datos puede ser representada de


manera gráfica (diagrama de dispersión) o analítica
(coeficiente de correlación).

Dr. Paúl Gareca López 7


DIAGRAMA DE DISPERSIÓN

El gráfico más adecuado para apreciar la relación entre


dos variables numéricas es el denominado diagrama
de dispersión, también conocido como diagrama de
desparramiento, de esparcimiento o nube de puntos.

El diagrama de dispersión es una herramienta gráfica


que permite demostrar la relación entre dos clases de
datos y cuantificar la intensidad de dicha relación.

Se utiliza para conocer si hay correlación entre dos


magnitudes o parámetros de un problema y, en caso
positivo, de qué tipo es la correlación.

Dr. Paúl Gareca López 8


DIAGRAMA DE DISPERSIÓN

En un plano cartesiano, se presentan tantos puntos


como pares de observaciones se tenga, a cada punto
corresponde un par de observaciones. En algunos
casos, esos puntos están condensados alrededor de
una línea que representa al conjunto, en otros,
presentará dispersión.

Existe correlación entre variables si cada vez que


aumenta el valor de x aumenta proporcionalmente el
valor de y (correlación positiva) o si cada vez que
aumenta el valor de x disminuye en igual proporción el
valor de y (correlación negativa).

Dr. Paúl Gareca López 9


DIAGRAMA DE DISPERSIÓN

Las características principales son:

 Impacto visual. Muestra la posibilidad de la existencia


de correlación entre dos variables de un vistazo.

 Comunicación. Simplifica el análisis de situaciones


numéricas complejas.

 Guía de investigación. El análisis de datos mediante


esta herramienta proporciona más información que el
análisis matemático, sugiriendo posibilidades y
alternativas de estudio, basadas en la necesidad de
conjugar datos y procesos en su utilización.

Dr. Paúl Gareca López 10


DIAGRAMA DE DISPERSIÓN

La desventaja es de ser muy subjetivo, por lo tanto, el


resultado dependerá de la persona que haga el
análisis, para lo que se debe tomar en cuenta los
siguientes aspectos:

 Observar cuidadosamente la forma que toma el


conjunto de puntos.

 La línea debe reflejar la mejor posible tendencia de los


puntos en el gráfico.

 La línea debe representar al conjunto de puntos, por lo


tanto, debe pasar por el centro de esa nube y ser lo
más sencilla posible.
Dr. Paúl Gareca López 11
DIAGRAMA DE DISPERSIÓN

Para elaborar un diagrama de dispersión se debe


seguir estos pasos:

1. Elaborar una teoría admisible y relevante sobre la


supuesta relación entre dos variables.

2. Obtener los pares de datos correspondientes a las


dos variables.

3. Determinar los valores máximo y mínimo para cada


una de las variables.

Dr. Paúl Gareca López 12


DIAGRAMA DE DISPERSIÓN

4. Decidir sobre qué eje se representará a cada una de


las variables.

5. Trazar y rotular los ejes horizontal y vertical.

6. Marcar sobre el diagrama los pares de datos.

7. Rotular el diagrama.

Dr. Paúl Gareca López 13


DIAGRAMA DE DISPERSIÓN
Relación entre edad y talla de niños de 3 a 9 meses

80

75
Talla (centímetros)

70

65

60

55

50
0 1 2 3 4 5 6 7 8 9 10

Edad (meses)

Dr. Paúl Gareca López 14


DIAGRAMA DE DISPERSIÓN

Correlación positiva fuerte

Dr. Paúl Gareca López 15


DIAGRAMA DE DISPERSIÓN

Correlación negativa fuerte

70

60

50

40

30

20

10

0
0 1 2 3 4 5 6 7

Dr. Paúl Gareca López 16


DIAGRAMA DE DISPERSIÓN

Correlación positiva débil

Dr. Paúl Gareca López 17


DIAGRAMA DE DISPERSIÓN

Correlación negativa débil

60

50

40

30

20

10

0
0 1 2 3 4 5 6 7

Dr. Paúl Gareca López 18


DIAGRAMA DE DISPERSIÓN

Sin correlación

70

60

50

40

30

20

10

0
0 1 2 3 4 5 6 7 8 9 10

Dr. Paúl Gareca López 19


COEFICIENTE DE CORRELACIÓN

El coeficiente de correlación (r) es un valor cuantitativo


que expresa la relación de naturaleza y fuerza entre
dos o más variables.

El coeficiente de correlación puede variar desde -1


hasta +1.

La correlación de proporcionalidad directa o positiva se


establece con los valores +1 y de proporcionalidad
inversa o negativa con -1.

Dr. Paúl Gareca López 20


COEFICIENTE DE CORRELACIÓN

La relación será perfecta cuando r es igual a +1 o -1,


no existe relación entre las variables cuando el
coeficiente es cero (0) o menor a 0,30.

Por lo tanto: -1 ≤ r ≤ +1

-1 0 +1
Relación No existe Relación
negativa o relación positiva o
indirecta directa

Dr. Paúl Gareca López 21


COEFICIENTE DE CORRELACIÓN

El signo denota la naturaleza de la relación, mientras


que el valor denota la fuerza.

Si el signo es positivo, significa que la relación es


directa (un incremento en una variable está asociado
con el incremento de la otra variable; una disminución
de una variable está asociado con la disminución de la
otra variable).

Si el signo es negativo, significa una relación inversa o


indirecta (significando que el incremento en una
variable está asociado con una disminución de la otra
variable).

Dr. Paúl Gareca López 22


COEFICIENTE DE CORRELACIÓN

Clasificación del grado de correlación:


 Correlación perfecta, cuando r = +1 = -1
 Correlación excelente, cuando r es mayor de 0,90 y
menor de 1 (-1 < r < -0,90)
 Correlación aceptable, cuando r se encuentra entre
0,80 y 0,90 (-0,90 < r < -0,80)
 Correlación regular, cuando r se encuentra entre 0,60
y 0,80 (-0,80 < r < -0,60)
 Correlación mínima, cuando r se encuentra entre 0,30
y 0,60 (-0,60 < r < -0,30)
 No hay correlación para r menor de 0,30 y mayor a 0
(-0,30 < r < 0)

Dr. Paúl Gareca López 23


COEFICIENTE DE CORRELACIÓN

Su cálculo se realiza mediante la aplicación de varias


fórmulas, con las que se llega al mismo resultado.

𝑛 𝑥𝑦 − ( 𝑥)( 𝑦)
(1) 𝑟=
𝑛 𝑥 2 − ( 𝑥)2 𝑛 𝑦 2 − ( 𝑦)2

𝑛 𝑥𝑦 − ( 𝑥)( 𝑦)
(2) 𝑟=
𝑛 𝑥 2 − ( 𝑥)2 𝑛 𝑦 2 − ( 𝑦)2

𝑦𝑖 𝑥𝑖 − 𝑛𝑥 𝑦
(3) 𝑟=
𝑥𝑖2 − 𝑛𝑥 2 𝑦𝑖2 − 𝑛𝑦 2
Dr. Paúl Gareca López 24
COEFICIENTE DE CORRELACIÓN

Ejemplo 1. Las edades (años) y peso (kilogramos) de


seis niños son mostradas en la muestra siguiente. Se
pide hallar la correlación entre edad y peso.

Niño Edad Peso xy x2 y2


1 7 12 84 49 144
2 6 8 48 36 64
3 8 12 96 64 144
4 5 10 50 25 100
5 6 11 66 36 121
6 9 13 117 81 169
Total 41 66 461 291 742

Dr. Paúl Gareca López 25


COEFICIENTE DE CORRELACIÓN

Ejemplo 1.
𝑛 𝑥𝑦 − ( 𝑥)( 𝑦)
𝑟=
𝑛 𝑥 2 − ( 𝑥)2 𝑛 𝑦 2 − ( 𝑦)2

6 461 − 41 (66)
𝑟=
6 291 − 1681 6 742 − 4.356

2.766 − 2.706 60 60
𝑟= = = = 𝟎, 𝟕𝟓
65 96 6.240 78,99

Grado de correlación: regular

Dr. Paúl Gareca López 26


COEFICIENTE DE CORRELACIÓN

Ejercicio 1. Encontrar la relación entre el nivel de


ansiedad y el puntaje obtenido en exámenes.

Estudiante Ansiedad Puntaje xy x2 y2


1 10 2
2 8 3
3 2 9
4 1 7
5 6 6
6 5 5
Total 32 32

Dr. Paúl Gareca López 27


COEFICIENTE DE CORRELACIÓN

Ejercicio 1. Encontrar la relación entre el nivel de


ansiedad y el puntaje obtenido en exámenes.

Estudiante Ansiedad Puntaje xy x2 y2


1 10 2 20 100 4
2 8 3 24 64 9
3 2 9 18 4 81
4 1 7 7 1 49
5 5 6 30 25 36
6 6 5 30 36 25
Total 32 32 129 230 204

Dr. Paúl Gareca López 28


COEFICIENTE DE CORRELACIÓN

Ejercicio 2. Determinar la relación entre masa corporal


(kg) y fuerza (kp) en 9 alumnos de bioestadística.
Alumno Masa Fuerza xy x2 y2
1 60 100
2 65 105
3 70 102
4 75 135
5 80 95
6 85 125
7 90 140
8 95 130
9 100 148
Total
Dr. Paúl Gareca López 29

Das könnte Ihnen auch gefallen