Beruflich Dokumente
Kultur Dokumente
TRABAJO ENCARGADO Nº 1
TEMA: CORRELACIÓN.
La relación entre dos variables nos conduce a un nuevo concepto: correlación. Ésta puede ser
representada en diagramas de dispersión e informa acerca de la forma, dirección e intensidad de
la relación entre dos variables.
En ocasiones nos puede interesar estudiar si existe o no algún tipo de relación entre dos
variables aleatorias. Así, por ejemplo, podemos preguntarnos si hay alguna relación entre las
notas de la asignatura Estadística I y las de Matemáticas I. Una primera aproximación al
problema consistiría en dibujar en el plano R 2 un punto por cada alumno: la primera coordenada
de cada punto sería su nota en estadística, mientras que la segunda sería su nota en matemáticas.
Así, obtendríamos una nube de puntos la cual podría indicarnos visualmente la existencia o no
de algún tipo de relación (lineal, parabólica, exponencial, etc.) entre ambas notas. En particular,
nos interesa cuantificar la intensidad de la relación lineal entre dos variables.
En particular, nos interesa cuantificar la intensidad de la relación lineal entre dos variables. El
coeficiente que nos da tal cuantificación es el coeficiente de correlación lineal de Pearson r,
cuyo valor oscila entre –1 y +1.
n n n
n xi y i ( xi )( y i )
r i 1 i i 1
n n
2
n n
2
i i i yi )
2 2
n x ( x ) n y (
i 1 i 1 i 1 i 1
• •
• • •
• • • • •
• • • • •
• • •
•• •••
X X X
• Y Y
•••• • • • • ••
• • •• ••• • • •
• • • •• • •
• •• • • • • ••
•• •• ••
•
• ••
X X X
(d) Curvilínea inversa (e) Lineal inversa con (f) Ninguna relación
más dispersión
La relación que pueden guardar ambas variables puede determinarse mediante el coeficiente
de correlación de Pearson. Para ello es condición indispensable que ambas variables estén
medidas en escala de intervalo (se cumple dicho supuesto). Por tanto, sólo queda aplicar la
ecuación antes propuesta. Organicemos los datos de la siguiente forma:
X Y X2 Y2 XY
2 6 4 36 12
2 6 4 36 12
3 6 9 36 18
4 8 16 64 32
5 10 25 100 50
6 14 36 196 84
7 14 49 196 98
7 14 49 196 98
9 16 81 256 144
10 18 100 324 180
ƩX =55 ƩY = 112 ƩX2 = 373 2
ƩY = 1440 ƩXY = 728
n
i 1
xi (
i 1
xi ) n
i 1
y 2
i (
i 1
yi ) 2
1120
0.979
1143 .88
1. En primer lugar la correlación obtenida es positiva lo cual indica que mayor número de
horas de estudio mayor calificación en el examen. Era de prever, no obstante, que se
obtuviese tal resultado.
2. El valor obtenido está muy cercano a 1. Ello significa que la relación entre ambas variables
es muy importante y que, por tanto, sería necesario implementar un análisis de regresión
con el objetivo de predecir valores de la variable criterio, en este caso calificación en el
examen.
Los visualizan una relación lineal positiva entre las horas de estudios y las calificaciones
obtenidas.
Analizar > Pruebas no paramétricas > Cuadro de diálogos antiguos > K - S de una muestra
Horas_Estudio calificaciones
N 10 10
Media 5.50 11.20
Parámetros normalesa,b
Desviación típica 2.799 4.541
Absoluta .114 .231
Diferencias más extremas Positiva .114 .174
Negativa -.106 -.231
Z de Kolmogorov-Smirnov .361 .731
Sig. asintót. (bilateral) .999 .659
Dado que los valores de Sig. Asntót (Bilateral ) 0.999 y 0.659 son ambas mayores que
α = 0.05, se acepta que la distribución de las horas de estudios y las calificaciones se
distribuyen como una normal.
Correlaciones
Horas_Estudio calificaciones
N 10 10
Correlación de Pearson .979 1
N 10 10
Candidato A B C D E F G H I J
Personalidad : (X) 2.96 2.46 3.36 3.40 2.43 2.12 2.85 3.12 3.20 2.75
Conocimiento: (Y) 529 506 591 610 474 509 550 600 575 540
Sugerencia. Utilice el Software SPSS para desarrollar los incisos a), b) y c).
Correlación de rangos de Spearman. Medida de la relación entre dos variables que han sido
clasificadas originalmente de más bajo a más alto (o de más alto a más bajo)
La correlación de Spearman, es una aplicación del coeficiente de correlación de Pearson a “n”
pares de observaciones cuyos valores son números de orden.
Supongamos que se toma una muestra aleatoria (x1, y1),…, (xn , yn) de n pares de observaciones.
Si las xi y las yi se ordenan en sentido ascendente (o en sentido descendentes) y no hay empates,
se calcula la correlación muestral de estos rangos mediante
n
6 d 2
donde: rs 1 i 1
rs = coeficiente de n(n 1) 2
El campo de variación del coeficiente de Spearman es el intervalo [-1; 1]. Cuando toma el valor
de -1 representa una correlación inversa perfecta. Si toma el valor de 1 representa una
correlación directa perfecta. Cuando rs = 0 indica que no existe relación o correlación entre las
variables.
Ejemplo 2. El año pasado, Amco Tech, un fabricante microchips para computadora en Estados
Unidos, contrato a siete técnicos en computación. A los técnicos se les practicó un examen
diseñado para medir sus conocimientos básicos. Después de un año de servicio, a su supervisor
se le pidió clasificar el desempeño laboral de cada técnico. Los puntajes del examen y las
clasificaciones del desempeño para los siete empleados aparecen en la siguiente tabla.
7
Datos sobre los técnicos de Amco Tech
Técnico Puntaje en el Clasificación del desempeño
examen
J. Smith 82 4
A. Jones 73 7
D. Boone 60 6
M. Lewis 80 3
G. Clark 67 5
A. Lincoln 94 1
G. Washintong 89 2
El jefe de operaciones desea determinar si existe alguna relación entre los puntajes del examen y
el desempeño laboral.
Vale la pena observar que aunque el puntaje del examen es una medida cuantitativa de los
conocimientos de los técnicos, la clasificación del desempeño es simplemente una medida
ordenada por el supervisor para saber cuáles técnicos se estaban desempeñando laboralmente
bien. Por tanto, el jefe de operaciones decide utilizar la correlación de rangos de Spearman para
determinar si existe alguna relación entre los puntajes del examen y el desempeño laboral. El
jefe de operaciones debe desarrollar la clasificación para los puntajes del examen. Tales
clasificaciones, junto con algunos cálculos necesarios aparecen en la siguiente tabla
rs = 0.857, sugiere una relación fuerte, entre el puntaje del examen del técnico y su clasificación
del desempeño laboral
Puntaje Desempeño
Coeficiente de correlación 1.000 -.857
Puntaje Sig. (bilateral) . .014
N 7 7
Rho de Spearman Coeficiente de correlación -.857 1.000
Desempeño Sig. (bilateral) .014 .
N 7 7
rs = - 0.857
Ejercicio 2. A un grupo de 10 estudiantes de una escuela superior se les aplico una prueba de
conocimientos en matemáticas (x) y una de lógica (y). Se obtuvieron las siguientes
puntuaciones:
Estudiante x y
8
A 84 52
B 75 39
C 98 48
D 70 32
E 75 40
F 80 36
G 83 38
H 75 37
I 84 50
J 90 46
Se pide determinar el grado de semejanza entre las calificaciones obtenidas por los estudiantes
en las pruebas x e y. Es decir se pide determinar e interpretar el coeficiente rs.
Sugerencia. Primero debe comprobar la normalidad de las variables X e Y mediante la prueba de Kolmogorov-
Sminorv. Si se cumple la normalidad, determine el coeficiente de correlación paramétrico r de Pearson. Si en el caso
de que en la prueba de Kolmogorov – Sminorv indica que no se cumple la normalidad, entonces determine el
coeficiente de correlación no paramétrico rs Spearman.