Beruflich Dokumente
Kultur Dokumente
700
140
600
JUNIO
157
157
NO APTO
500
120
Mujeres
100
400
40
80
300
367
508
508
200
60
Hombres
68
APTO
50
40
62
20
100
124
60
30
NO APTO
Educativa
APTO
FEBRERO
Sujeto
12
15
10
Tabla 1. Puntuacin de 5
sujetos en dos pruebas X e Y
10
20
24
22
32
35
38
Tabla 4. Calificaciones de 6
sujetos en un examen de Anlisis
de Datos (Y) y sus puntuaciones
en una prueba de conocimientos
matemticos previos (X)
Y
7
9
1
3
5
Industrial
ITINERARIO CURRICULAR
X
0
1
3
4
2
Tabla 7
Clnica
CP
25
15
CA
15
25
Sujetos
X
Y
Antonio
1
5
Beatriz
2
4
Carlos
1
1
Diana
2
2
Enrique
4
6
Ftima
3
6
Tabla 5. Puntuaciones de seis
alumnos en dos test X e Y
SI
NO
Aprobados
7
3
Suspensos
3
7
Tabla 8. Datos de 20 alumnos, donde:
SI = utilizan cursos virtuales
NO = No utilizan cursos virtuales
Sujetos
X
Y
A
1
6
B
3
5
C
5
4
D
7
3
E
9
2
F
11
8
Tabla 3. Puntuaciones de
5 sujetos en dos pruebas X
eY
Y1 = 0
Y2 = 1
X1 = 0
X2 = 1
10
X3 = 2
Tabla 6. Distribucin de
dos variables X e Y.
X
0
1
3
4
2
Tabla 9
Y
7
9
1
3
5
-1-
12
14
10
12
N sujeto
X
Y
Z
U
Sexo
Estudios
Nota
Inteligencia
1
H
C
2
4
2
H
C
6
2
3
M
C
4
8
4
M
L
4
4
5
H
L
8
8
6
M
C
8
4
7
H
C
10
2
8
M
L
4
6
9
H
C
12
8
10
H
C
12
4
Tabla 12. Informacin de cuatro variables observadas en diez alumnos. X: Sexo; Y: Estudios de
ciencias o letras; Z: Nota en un examen de matemticas; U: Puntuacin obtenida en una prueba de
inteligencia
1) Cul es el valor del coeficiente de correlacin de Pearson para los datos de la Tabla 1? A) 0.577 B)
0.654 C) 0.702
En la siguiente tabla reflejamos los clculos necesarios para averiguar cuanto vale el coeficiente de
correlacin de Pearson. Si tenis una calculadora que trabaje con dos variables estadsticas, tardarais
en resolver esta cuestin aproximadamente 20 segundos.
X
5
7
9
12
15
48
X2
25
49
81
144
225
524
Y
8
6
8
7
10
39
Y2
64
36
64
49
100
313
XY
40
42
72
84
150
388
rxy =
n XY X Y
n X ( X )
2
n Y ( Y )
5 388 48 39
5 524 482 5 313 39 2
= 0.577
2) Suponiendo que para los datos representados en la Figura 1, el coeficiente de contingencia vale
0.4527, cul ser el valor aproximado de chi-cuadrado de Pearson? A) 298 B) 254 C) 237
Conociendo el coeficiente de contingencia, hemos de deducir el valor de chi cuadrado. La relacin entre
ambos es:
C=
2
2 + n
Y despejando 2
-2-
C=
2
2 + n
C2 =
2
2 + n
C2 2 + n = 2
C2 2 + C2 n = 2 C2 n = 2 C2 2
C2 n = 2 1 C2 2 =
C2 n
1 C2
Finalmente:
2 =
C2 n
0.4527 2 1156
=
= 297.97 298
1 C2
1 0.4527 2
Tambin podramos haber llegado a la deducir cul es la respuesta correcta por el cuento de la vieja.
Sabemos que el coeficiente de contingencia vale 0.4527 y el nmero total de observaciones es igual a
1156, luego probamos los diferentes valores de las opciones de respuesta y comprobamos cul es el
correcto.
Probamos con el resultado ofrecido en la Opcin A.
C=
2
=
2 + n
298
= 0.4527
298 + 1156
Con lo que comprobamos que la opcin verdadera es A. Efectivamente, si probamos la solucin B, vemos
que es errnea:
C=
2
=
2 + n
254
= 0.4244 0.4527
254 + 1156
C=
2
=
+n
2
237
= 0.4124 0.4527
237 + 1156
XY X Y = 388 48 39 = 2.72
n
Y como podemos observar en el formulario, las transformaciones aplicadas a las variables X e Y en este
caso no afectan al valor de la covarianza entre H e V, por lo que la covarianza entre H y V ser igual a
2.72
4) De acuerdo con los datos representados en la Figura 1, cul sera el nmero esperado de alumnos que
obtienen APTO en las dos pruebas presenciales, si ambas pruebas fueran independientes? A) 222.56 B)
301.44 B) 268.44
-3-
Segn pudimos comprobar tras el examen en el que apareca la Figura 1, sta es difcil de interpretar.
Quizs el problema est en identificar las variables, que son las semanas de FEBRERO Y JUNIO. Cada
una de estas variables toma dos valores APTO Y NO APTO. A continuacin presentamos los datos de la
Figura 1 en una tabla. Comparad ambas y comprobad que nos ofrecen los mismos datos
JUNIO
FEBRERO
No Apto
Apto
157
367
508
124
Apto
No Apto
Una vez que tenemos los datos en una tabla, calculamos las frecuencias marginales:
FEBRERO
No Apto
Apto
157
367
508
124
665
491
Apto
No Apto
JUNIO
524
632
1156
Y finalmente, para calcular el nmero esperado de alumnos que obtienen Apto en las dos convocatorias:
491 524
= 222.56
1156
5) En un colegio hay dos grupos con igual nmero de alumnos (A y B) en 1 de ESO, a los cuales se les
administra una prueba de comprensin lectora. El grupo A obtiene una media de 80 y el grupo B obtiene
una media de 90, siendo la varianza conjunta de ambos grupos 36. Cul ser, en valor absoluto, la
relacin que hay entre la puntuacin obtenida y el hecho de pertenecer a uno u otro grupo? A) 0.38 B)
0.83 C) falta conocer el tamao de cada grupo, y por lo tanto no se puede calcular
Tenemos una variable continua (Prueba de Comprensin Lectora) y otra dicotmica (Grupo de
Pertenencia con valores A y B), luego el coeficiente de correlacin ms adecuado es el biserial puntual.
Los datos son:
n A = nB
X B = 90
X A = 80
S x2 = 36
rbp =
X (Y =1) X (Y = 0 )
Sx
pq =
90 80
0.5 0.5 = 0.83
6
6) Cul es el ndice ms adecuado para cuantificar la relacin entre las variables de la distribucin
conjunta representada en la Figura 1 A) el coeficiente biserial puntual B) el coeficiente phi C) el
coeficiente de correlacin de Spearman
Phi, puesto que tenemos dos variables dicotmicas
7) Cundo pueden ser iguales el coeficiente de correlacin de Pearson y la covarianza? A) nunca B)
cuando las desviaciones tpicas de las variables X e Y coinciden C) cuando las desviaciones tpicas de X
e Y son iguales a 1
La relacin entre el coeficiente de correlacin de Pearson y la covarianza es:
rxy =
S xy
Sx S y
Luego para que sean iguales, las dos desviaciones tpicas han de ser igual a 1
-4-
8) Cul es el valor de la prueba Chi-cuadrado aplicado a los datos de la Tabla 2?: A) no se puede
calcular B) 10 C) 11
Las frecuencias observadas son:
CP
CA
P
5
15
20
M
25
25
50
S
15
5
20
45
45
90
CP
CA
P
10
10
20
M
25
25
50
S
10
10
20
45
45
90
10
= 10
9) Cul de las siguientes afirmaciones representa una caracterstica de la covarianza como ndice de
relacin entre variables cuantitativas? A) Puede tomar cualquier valor B) es un nmero adimensional
que permite la comparacin de la intensidad de la relacin entre distintas variables C) no puede tomar
valores negativos
La opcin correcta es A. En principio la covarianza puede tomar cualquier valor
10) Cul es el ndice de correlacin que debe calcularse cuando se dispone de variables medidas con
escala ordinal? A) el coeficiente phi B) el coeficiente de correlacin biserial-puntual C) el coeficiente
de correlacin de Spearman
Con tan slo consultar el formulario comprobamos que la opcin correcta es C
11) Qu ndice de asociacin hay que calcular para interpretar la intensidad de la relacin entre las
variables recogidas en la Tabla 2? A) la prueba chi-cuadrado B) el coeficiente Phi C) el coeficiente de
correlacin biserial-puntual
Tenemos dos variables nominales, luego descartamos la opcin C, y Phi no puede ser porque la variable
Nivel de Estudios no es dicotmica, luego la respuesta correcta es A
12) Cul de las siguientes afirmaciones representa una de las caractersticas de la correlacin de Pearson
como ndice de relacin entre variables cuantitativas? A) Puede tomar cualquier valor B) es un nmero
adimensional que permite la comparacin de la intensidad de la relacin entre distintas variables
C) no puede tomar valores negativos
La respuesta correcta es B, que a las malas deducimos por eliminacin, porque Pearson est acotado
entre -1 y +1 (descartamos A) y puede tomar valores negativos (cuando la relacin entre las dos
variables es inversa)
13) Cunto vale el coeficiente de correlacin de Pearson entre las variables X e Y de la Tabla 3? A) 0
B) -0.89 C) -1
Mero clculo, que como vamos con prisas no detallamos. La respuesta correcta es A. Y ya sabis que con
una buena calculadora y sabindola manejar, habrais tardado menos
-5-
S H2 = S x2 + S y2 2 S xy S H2 = S x2 + S y2 2rxy S x S y
Y si dos variables son independientes, rxy =0, por lo que nos queda
S H2 = S x2 + S y2 2 rxy S x S y S H2 = S x2 + S y2
Luego la respuesta correcta es A
17) Cul es la covarianza de las puntuaciones tpicas de X e Y para los datos de la Tabla 4?: A) 14.667
B) 6.754 C) 0.903
El valor de la covarianza de las puntuaciones tpicas coincide con el coeficiente de correlacin de
Pearson, puesto que en puntuaciones tpicas la varianza es igual a uno. La respuesta correcta es C
18) Si se quiere determinar la relacin que existe entre el sexo y el nmero de errores de sintaxis
detectados en un texto escrito, cul es el coeficiente ms adecuado para cuantificarla? A) coeficiente de
correlacin de Spearman B) coeficiente de correlacin biserial-puntual C) coeficiente de contingencia
Tenemos una variable dicotmica y otra cuantitativa, luego el coeficiente de correlacin ms adecuado
es el biserial-puntual
19) Dos profesores evalan a un grupo de diez alumnos por sus caractersticas para representar el papel
protagonista en una funcin teatral de fin de curso. Las diferencias entre los rangos asignados han sido:
{-9; -5; -3; 0; 4; 3; 2; 6; 1; 1}. La correlacin entre las preferencias de los dos profesores es: A)
-0.21 B) -0.10 C 0.90
Tenemos dos variables ordinales, luego tenemos que aplicar el coeficiente de correlacin de Spearman.
Calculamos la suma de los cuadrados de las diferencias entre los rangos:
2
d = ( 9 ) + ( 5) + ( 3) + (0) + (4 ) + (3) + (2 ) + (6) + (1) + (1) = 182
2
6 d2
6 182
=1
= 0.103 0.10
2
n (n 1)
10(102 1)
20) Con los datos de la Tabla 5, cunto vale el coeficiente de correlacin de Pearson entre los dos test?
A) 0 B) 0.65 C) -0.57
De nuevo una pregunta de mero clculo. La respuesta es B
21) En la Tabla 5, cunto vale la correlacin entre el sexo y el test Y? A) 0 B) 0.65 C) -0.57
-6-
Aqu hemos de calcular el coeficiente de correlacin biserial puntual. Hallamos en primer lugar la media
en el test de los hombres y de las mujeres:
X Hombres =
5 +1+ 6
=4
3
X Mujeres =
4+2+6
=4
3
Y no hace falta seguir, porque si las medias son iguales el coeficiente de correlacin biserial-puntual
ser igual a cero
22) Si suponemos que para los datos representados en la Figura 2, el valor de chi-cuadrado valiese 9.1,
cunto valdra el coeficiente de correlacin Phi? A) 0.17 B) 0.04 C) 0.4
Muy fcil. Simplemente aplicamos la frmula:
2
n
9.1
= 0.17
310
23) En la Tabla 5, cmo se interpreta la correlacin entre el sexo y las puntuaciones en el test Y? A) no
existe correlacin B) existe una correlacin media y positiva entre el sexo y las puntuaciones en el test
Y C) existe una correlacin entre el sexo y las puntuaciones en el test Y, de forma que los nios obtienen
puntuaciones ms altas en el test
Hemos deducido en la pregunta n 21 que el coeficiente de correlacin entre el sexo y las puntuaciones
en el test Y es igual a cero, luego no existe relacin entre ambas variables
24) Cul es el ndice ms adecuado para cuantificar la relacin entre las variables que se representan en
la Figura 2? A) biserial-puntual B) coeficiente de contingencia C) Spearman
Tenemos dos variables nominales, luego, de las tres opciones slo podemos aplicar el coeficiente de
contingencia. Recordamos que para aplicar biserial-puntual necesitamos una variable cuantitativa y otra
dicotmica, y para aplicar Spearman dos variables nominales
25) Con los datos reflejados en la Figura 2, cul sera el nmero esperado de alumnos varones que
seleccionan la opcin de Psicologa Educativa, si las dos variables fuesen independientes? A) 33.34 B)
37.25 C) 39.22
Mujeres
Hombres
Educativa
50
30
80
Clnica
68
62
130
Industrial
40
60
100
158
152
310
152 80
= 39.22
310
26) Decimos que una correlacin es espuria cuando: A) es prxima a cero B) no establece una relacin
causal C) se debe a la presencia de una tercera variable
Pgina 308 del libro de texto
27) Sean X, Y, V tres variables donde: V = X + Y. Sabiendo que S v2 = 355 , S x2 = 100 , S y2 = 225 ,
podemos afirmar que: A) rxy = 0.20 B) rxy = - 0.20 C) rxy = 0.10
Sustituyendo los datos del enunciado en la frmula:
-7-
6d2
n n 1
2
6 4
= 0.8
5 52 1
= 1
29) Con los datos de la Tabla 7, el coeficiente de correlacin de Pearson vale: A) -0'8 B) -1 C) 0'8
Problema de clculo. La solucin es A
30) Si calculamos Chi cuadrado con los datos de la Tabla 6, la frecuencia terica esperada en caso de
independencia, para los valores X2 = 1 e Y1 = 0 vale: A) 8 B) es igual a la frecuencia observada C)
las dos opciones anteriores son correctas.
Hemos visto varios problemas similares. La frecuencia esperada en este caso vale 5, que coincide con la
observada
31) Cul de los siguientes ndices es el ms adecuado para medir la relacin entre dos variables
cualitativas? A) Chi cuadrado B) Spearman C) Biserial puntual.
Muy fcil: Chi cuadrado
32) Si Zx y Zy son las puntuaciones tpicas de dos variables estadsticas, podemos afirmar que la
covarianza entre Zx y Zy es igual al coeficiente de correlacin de Pearson entre X e Y? A) si B) no C)
depende del valor de las medias.
Ya lo vimos anteriormente. La respuesta correcta es A
33) Tenemos dos variables X e Y para las que X = Y = 10, X2 = Y2 =30, XY = 29, rXY = 0,9
cunto vale n? A) 5 B) 6 C) 7.
Sustituyendo los datos del enunciado en la frmula del coeficiente de correlacin de Pearson
rxy =
n XY X Y
n X 2 ( X )
n Y 2 ( Y )
0.9 =
n 29 10 10
n 30 10 2 n 30 10 2
Y ahora despejamos n
0.9 =
n 29 10 10
0.9 (n 30 100 ) = n 29 10 10 27 n 90 = 29n 100
n 30 10 2
27 n 90 = 29n 100 29n 27 n = 100 90 2n = 10 n = 5
-8-
rbp =
X (Y =1) X (Y =0 )
pq =
Sx
86
0.5 0.5 = 0.25
4
36) Con los datos de la Tabla 9. Cunto vale la covarianza?: A) -3.2 B) 0'8 C) -0'8
Simplemente aplicar la frmula de la covarianza. El resultado es -3.2
37) Cual de los siguientes ndices NO es adecuado para calcular la relacin entre dos variables
cualitativas: A) Ji cuadrado B) coeficiente de contingencia C) Biserial-puntual
Biserial puntual, para el que necesitamos una variable cuantitativa y otra dicotmica
38) Para los datos de la Tabla 8, el valor de Ji cuadrado es: A) 3'2 B) 1'6 C) 0'37
Las frecuencias observadas son:
Aprobados
Suspensos
SI
7
3
10
NO
3
7
10
10
10
20
Y como todas las frecuencias marginales son iguales, tambin lo sern todas las frecuencias esperadas:
Aprobados
Suspensos
2 =
SI
5
5
10
NO
5
5
10
10
10
20
= 3.2
-9-
Al preguntarnos por la magnitud de la relacin, nos quedamos con el valor absoluto de Phi, y la
respuesta correcta es A
45) Si convirtiramos las variables X e Y de la Tabla 11 en variables ordinales, asignando a cada
variable por separado un rango ascendente (es decir, 1 al menor valor, 2 al siguiente, y as
sucesivamente), cul sera el valor del ndice de correlacin adecuado a esta nueva situacin de medida?
A) 0.543 B) no se puede calcular un ndice de correlacin a partir de datos transformados C) 0.6
Dando rangos a las variables X e Y de la Tabla 11, tenemos:
X
4
6
9
12
14
Y
6
5
10
12
8
Rangos en X
1
2
3
4
5
Rangos en Y
2
1
4
5
3
d
-1
1
-1
-1
2
d2
1
1
1
1
7
8
Y aplicando Spearman
rs = 1
6d2
68
= 0.6
2
1
) = 1 5(5
n n2 1
46) Un profesor est interesado en determinar si el gnero (masculino - femenino) est relacionado con
la puntuacin que se obtiene en una prueba de matemticas bsicas. Qu ndice debera emplear para
determinar dicha relacin?: A) Coeficiente de Spearman B) Coeficiente Biserial Puntual C) Coeficiente
de Contingencia
Tenemos una variable dicotmica (sexo) y otra cuantitativa (prueba de matemticas), luego biserialpuntual
47) Con los datos de la Tabla 11, cul es el valor del coeficiente de correlacin de Pearson? A) 0.656
B) 0.358 C) 0.567
Otra vez lo mismo. Aplicando Pearson obtenemos un valor igual a 0.656
48) Con relacin a los datos de la Tabla 12, qu coeficiente se debe aplicar para obtener la correlacin
entre el tipo de estudios y la nota en la prueba de matemticas? A) phi B) biserial-puntual C)
Spearman
- 10 -
Esta tambin se repite con frecuencia. Tipo de estudios tiene dos valores (ciencias y letras), luego es
dicotmica y la prueba en matemticas es cuantitativa, luego la respuesta es biserial-puntual
49) Con relacin a los datos de la Tabla 12, cmo interpretara la correlacin entre el sexo y el tipo
de estudios A) la correlacin indica que los hombres tienden a elegir los estudios de ciencias ms
que las mujeres B) no existe correlacin, las mujeres seleccionan ciencias igual que los hombres C)
existe correlacin en el sentido de que las mujeres tienden a elegir estudios de ciencias ms que los
hombres.
Tenemos dos variables dicotmicas, y comenzamos elaborando una tabla de doble entrada para dichas
variables
Hombres
5
1
6
Ciencias
Letras
Mujeres
2
2
4
7
3
10
E interpretamos que hay relacin entre ser hombre y elegir estudios de ciencias
50) Con relacin a los datos de la Tabla 12, la intensidad de la correlacin entre el tipo de estudios y la
nota en la prueba de matemticas vale: A) 0.32 B) 0.18 C) 0.28
Hemos de aplicar el coeficiente de correlacin biserial puntual. Comenzamos calculando las medias en
la nota en matemticas en funcin del tipo de estudios, y la desviacin tpica total:
X Ciencias =
2 + 6 + 4 + 8 + 10 + 12 + 12
= 7.71
7
Sx =
X
n
X2 =
X Letras =
4+8+4
= 5.33
3
604
7 2 = 3.38
10
rbp =
X (Y =1) X (Y =0 )
Sx
pq =
7.71 5.33 7 3
= 0.32
3.38
10 10
51) Cul de las siguientes afirmaciones es VERDADERA A) Una correlacin de -0.78 entre dos
variables X e Y, tiene la misma intensidad que otra correlacin de +0.78 entre otras variables U y V
B) Una correlacin de 0.60 indica el doble de correlacin que otra de 0.30 C) encontrar una relacin
entre dos variables cuantitativas significa que existe una relacin causa-efecto
La relacin entre X e Y es directa, y entre U y V es inversa, pero ambas tienen la misma intensidad. La
respuesta B no es cierta, lo veremos ms claro despus de estudiar el tema 1, y por ltimo, hemos de
tener claro que una coeficiente de correlacin, por elevado que sea, no significa necesariamente que
exista una correlacin causa-efecto
52) Sin haber hecho ningn experimento previo para contrastarlo, entre cul de los siguientes ejemplos
piensa que existir una correlacin lineal positiva? A) longitud del cabello y sinceridad B) la actitud ante
una asignatura y el rendimiento acadmico C) el peso y la altura de un grupo homogneo de personas
adultas
La opcin A es absurda. En la B nos hara falta saber qu tipo de actitud se tiene ante una asignatura,
- 11 -
rxy =
S xy
S xy
rxy =
S xy = 30 rxy
65
SxS y
Es decir, que a medida que aumenta Pearson aumenta la covarianza y viceversa. Como el valor mnimo
que puede tomar Pearson es -1, el valor mnimo que puede tomar la covarianza es: Sxy = 30(-1) = -30, y
como el valor mximo que puede tomar Pearson es +1, el valor mximo que puede tomar la covarianza
es +30, por lo que la respuesta correcta es C
54) Con relacin a la Tabla 12, cunto vale la correlacin entre los datos obtenidos en las prueba de
matemticas y prueba de inteligencia? A) 0.026 B) -0.3 C) 0.5
De nuevo calcular un coeficiente de correlacin de Pearson:
N Sujeto
1
2
3
4
5
6
7
8
9
10
X
2
6
4
4
8
8
10
4
12
12
70
Y
4
2
8
4
8
4
2
6
8
4
50
XY
8
12
32
16
64
32
20
24
96
48
352
X2
4
36
16
16
64
32
20
24
144
144
604
Y2
16
4
64
16
64
16
4
36
64
16
300
rxy =
n XY X Y
n X ( X )
2
n Y ( Y )
2
10 352 70 50
10 604 70 2 10 300 50 2
= 0.026
- 12 -