Beruflich Dokumente
Kultur Dokumente
Psicometria diferencial
mq
Editorial Trillas
76
Capltulo 5
1
52
CIZ
C18
...
...
..
Cl(
. ..
C1n
5-1
GULLIKSEN,
H., (1950). Theory of mental tests. Nueva York: Wiley.
HORST,
P. (1963). Matrix algebra for social scientists. Nueva York: Holt, Rinehart
& Winston.
I
I
Para que 10s datos obtenidos con diferentes tipos de instrumentos de medici6n puedan usarse en situaciones pricticas, Cstos deben satisfacer ciertas
condiciones. Primero, el instrumento de medida que se usa en un cam y
con un prop6sito dados debe realmente medir el rasgo que se intenta medir. Segundo, el instrumento debe dar medidas confiables, de manera que
se obtengan 10s mismos resultados a1 volver a medir el rasgo, bajo condicioI& similares del objeto 6-duo'en
cuesti6nJ Los datos deben ser confiables desde dos puntos de vista: deben ser sipificativos y reproducibles.
El primer requisito impuesto a1 instruments de medida, que 10s resultados realmente se refieran a1 r a g 0 que se intenta medir, es obvio. No hay
problemas cuando se miden propiedades fisicas de 10s objetos; es completamente evidente que si usamos una cinta mitrica de manera corrects,
medimos la longitud de un objeto, per0 ya no es tan claro cuando usamos
un cuestionario de cierto tipo para medir el grado de neurotismo de un
individuo. No podemos convencernos de inmediato de que 10s datos obtepidos con este instrumento realmente expresen el grado de neurotismo del
individuo. En psicologia diferencial muchos instrumentos fueron construidos
para medir ciertos rasgos y empleados con este propbsito; se desacreditaron
m6s tarde cuando un examen cuidadoso revelb que otras variables eran las
que determinaban 10s resultados individuales. Es necesario, por consiguiente,
probar empiricamente que el instrunlento mide la variable que se intenta
medir en cada caso especifico. A esto se le llama investigar la validez del
instrumento y es una fase importante en el trabajo de construcci6n de nuevos instrumentos en psicologia diferencial. El conocimiento del grado de
valida del instrumento es necesario para que 10s datos obtenidos con 61
puedan usarse significativamente.
El segundo requisito de 10s instrumentos de medida, mencionado a1 principio de esta secci6n, fue que 10s resultados obtenidos con el instrumento
78
CONFlABlLlDAD
5-2
en una determinada ocasibn, bajo ciertas condiciones, deben ser reproducibles, es decir, 10s resultados dcben scr 10s mismos si volvemos a medir el
mismo rasgo en condiciones iddnticas. Este aspect0 de la exactitud de un
instrumento de medida es su con!irlbilidad en la acepci6n tCcnica de este
t6rmino. Aqui la confiabilidad es la exactitud de la medici6n,..independjeenentcmente de que uno
.
estk realmerite midiendo lo gu.e-ha querido-medir;Por G
e
m
uno prueba la confiabilidad de un test de aptitud escolar,
la medida que uno obtiene de la prueba empirica de la confiabilidad, es
una medida de la capacidad del test para dar 10s mismos resultados en
repetidas pruebas, sin importar si estc resultado tiene que ver o no con la
aptitud de 10s niiios para la escuela.
Como en el caso de la validez, la confiabilidad debe ser investigada
empiricarnentc para cada instrumento. El conocimiento de la confiabilidad
es necesario para que 10s datos dc 10s instrumentos de la psicologia diferencial puedan usarsc correctamentc.
5-2
5-2
79
Los valores obtenidos con una cinta mktrira elistica serin afectados no
solamente por la distancia medida, sino tambidn por otros factores. En este
caso, el instrumento de medici6n es sensible a las fluctuaciones intraindividuales y a las diferencias interindividuales expresadas por Cste en la extensi6n de la cinta de medir en diferentes ocasiones.1-La inconfiabilidad es un
resultado de la sensibilidad del instrumento a 10s factores que no afectan
el tamaiio de las medidas sistemiticamente, per0 cambian de una situaci6n
de medida a otraLfn un capitulo posterior tratarema la naturaleza d e 10s
factores de er& q e deben tenerse en cuenta a1 hacer mediciones en psicologia diferencial.
El grado de acuerdo entre medidas hechas en diferentes ocasiones puede computarse por medio de 10s mktodos de correlaci6n. El coeficiente de
correlaci6n para el acuerdo entrc medidas repetidas bajo condiciones similares, constituye el valor numErico de la confiabilidad de 10s datos que
- pueden obtenerse con un instrumento dado. Este coeficiente de correlaci6n es
/llamado coeficiente d e cenfiabilidad, y pugde?Toma_r~ a 5 r e se n 5 c g r o - f
~ & ; v r o ~ n $ ~ e ~ - n e g a t i (vcr
v o t&bikn p6gs. 80-01) .--E e l instrument~
i es insensible a 10s factorcs debidos a1 azar, 10s puntajes del individuo en
medidas sucesivas serin idfnticos, y sus posicioncs cn las distribuciones que
podemos construir cn cada ocasi6n de inedida ser6n las mismas, por lo
que la correlaci6n entre las distribuciones s e r 5 . a l a s medidas que puedcn
hacerse con tal instrumento son completamente confiablcs.
Cuando medimos las caracteristicas de un objeto con la ayuda de instrumentos fisicos (cintas mktricas, balanzas, e t ~ . ) ~
, o d e m o svolver a medir
el mismo objeto con el mismo instrumento para obtener valores sobre dos
distribuciones, como se hace cuando deseamos establecer la confiabilidad
de un instrumento. Esto puede hacerse mientras la magnitud del rasgo que
se esti midiendo no cambia para el objeto en cuesti6n (por ejemplo, el
resultado de aplicar el instrumento de medida a1 objeto), y mientras el valor
cuya magnitud va a ser esdmada permanczca sin cambiar.
Cuando las variables psicol6gicas son medidas por 10s mktodos usados
en psicologia diferencial a menudo es dificil estimar la confiabilidad del
instrumento de esta mancrx; una ra76n cs que 10s individuos que fueron
sometidos a la prueba son alcctados por la primera aplicacih del instrumento; este efecto es diferente para cada individuo. Como resultado, 10s
-valores relativos de 10s individuos cn la variable mcdida en la primera o z s16n, serin un tanto diferentcs en la segunda ocasi6n de medidas, simplemente porque el material ya ha sido presentado una vez. Si hay un espacio
de tiempo entre las dos aplicaciones, 10s individuos pueden haberse desarrollado de diferentes maneras; esto tambikn conduce a la medida de valores
objetivos cambiados. No es necesario, sin embargo, repetir las medidas con
-
90
CONFlABlllDAD
5-3
5 .'2
81
5-3
5-3
83
Test
I
M,=O
Fig. 5-1. \'arias tests paralelos 1, 2, '3, . . . , g, todor con el mismo puntaje verdadero
(TI)
pero con tliferentes puntajes error, e l , , ell, etc., independientes entre si, para
el individuo j.
L a ecuaci6n (5-3) establece que la media de 10s puntajes error es cero.
Esto es cierto a) para un nrimcro infinito d e individuos en el mismo test,
sin importar sus puntajes verdaderos, y b ) para 10s puntajes error d e un
individuo en un nlimero infinito d e tests paralelos (ver figura 5 - 1 ) .
La ecuaci6n ( 5 - 4 ) establecc que la correlaci6n entre 10s puntajes error
cn difercntcs aplicaciones dcl test cs ccro para un nlimem infinito de individuos. Esto cs ra-/onable si 10s puntajcs crror son considerados como errores
a1 azar.
L a ecuaci6n (5-5) establccc quc la correlaci6n entre 10s puntajes verdaderos y 10s puntajes error cs ccro. Esta suposici6n ha sido muy discutida
y serP tratada con mhs detalle cn cl s i p i c n t e capitulo. DeLeri observarse,
sin embargo, que una implicacih d e la suposici6n de que la correlaci6n
entre 10s puntajcs verdaderos y de error es cero - 4 s decir, que la direcci6n de 10s crrores es independientc del tamafio de 10s puntajes verdaderos
L a varianza total dcl test ( s f ) cs igual para 10s tcsts paralelos; la varianza de 10s puntajes vcrdaderos ( s ? ) cs tanlbiCn i p a l para 10s tcsts paralelos, puesto que cada individuo contribuye exactamente con el misnio
puntaje a las diversas distribucioncs de puntajes vcrdadcros. Por lo tanto,
la distribucidn d e error t a m b i h ticnc la misma varianza para tests paralelos; per0 mientras que 10s individuos tienen 10s mismos puntajes en las
diversas distribuciones d e puhtajcs vcrdadcros, el tamaiio y la direcci6n dc
sus puntajes error variari a] azar dc un test paralelo a otro.
'
84
LA D E F I N I C I ~ NESTADkTlCA DE CONFlABlLlDAD
CONFlABlLlDAD
85
Los terminos segundo y tercero serin cero (ver phg. 82), ya que las
direcciones de 10s puntajes vcrdaderos y de crror sc han supucsto que son
independientes entretsi; el cuarto tdrmino cs tnmbikn cero porque de
acuerdo con las suposiciones hechas, 10s errores no cstin correlacionados
entre si.
Como se supuso que 10s dos tests eran paralelos, las desviaciones estindar de 10s puntajes en dichos tests son igualcs:
5-4
(e) y
de
Pero sl, = s;
- s,2, luego
rtt = 1 (5-8)
.
--- _.
Con las suposiciones clisicas que hemos hecho, la confiabilidad puede
entonces definirse como la proporci6n entre la varianza verdadera y la
varianza total. El coeficiente de confiabilidad para la relaci6n entre dos
tcsts paralelos da el valor numdrico de la proporci6n entre In varianza de
la distribucibn de 10s puntajes verdaderos y la varian~ade la distribuci6n
de 10s puntajes obtenidos en 10s tests.
Ahora volvamo<'a la figura 5-2. Cuando la varianza de la distribuci61-1
total (1) ticne un tamalio dado, la confiabilidad esti determinada por la
magnitud de la varianza de 10s puntajes verdaderos. Si el puntaje de cada
individuo en la distribuci6n total cs el mismo que su puntaje verdadero,
entonces la varianza de la distribucih total seri la misma que la varianza
de 10s puntajcs verdaderos y la confiabilidad seri 1.0. Si este es el caso, la
medici6n ha expresado exactamente el puntaje verdadero de cada individuo,
y la varianza error es cero.
La ecuaci6n (5-8) es la base dc la afirmaci6n no probada hecha anteriormente, de que el coeficiente de correlaci6n, que expresa la relaci6n
86
5-5
CONFlABlLlDAD
T ~ T
(5-9)
+ ~eT/Ns,s~.
(510)
(T/JI.
(5-1 1)
5-6
87
L a raiz cuadrada del coeficicnte de confiabilidad nos d a cntonccs la correlaci6n entre 10s puntajes observados y 10s puntajes vcrdadcros del test. Este
valor es llamado cornGnmcntc indicc dc confiabilidacl clcl tcst.
5-6
Pcro d e la ccuaci6n ( 5 - 7 )
S;/S~
Tfr.
(5-12)
(5-13)
5.6
La varianza de 10s dos tests es la misma y la correlaci6n entre las dos mitadcs paralelas del test da el coeficiente de confiabilidad para cualquiera
de ellas. Esto nos conduce a la siguiente expresi6n para la varianza de un
test despuEs que el nGmero de items es doblado:
89
igual tamaiio, ya que las varianzas son igualcs para tests paralelos. Puesto
que tenemos n de estos tkrminos obtenemos
2s; = t1s;
J
La varianza del test total para un test compuesto de n tests paralelos (sit)
puede escribirse ahora
B.
Varianza verdadera
TanlbiEn examinaremos aqui lo que le sucede a la varianza verdadera cuando se dobla el nGmero de items. La varianza de la distribuci6n de 10s
puntajes verdaderos, la cual se obticne combinando 10s puntajes verdaderos
individuales en las subdistribuciones, puede escribirse
Cuando la longitud del test sc dobla, la varianm clc 10s puntajes verdaderos scri cuatro vcces la dcl tcst original.
La ecuaci6n (5-17) cs un case cspcrial dc una ecuaci6n m i s general
para el incremento en la varianza dc la distribuci6n de 10s puntajes verdaderos, cuando se aumenta cl ndmcro de itcms del tcst.
Del mismo mod0 que para la varianza total, podemos agrupar en una
matriz varianza-covarianza 10s difercntes tknninos de varianza para la varianza verdadera de n tests paralelos. La tabla 5-2 muestra la suma de 10s
tkrminos de varianza para cada rcng1611, es drcir, para cada test paralelo,
5-6
junto con la varianza total vcrdadera de 10s n tests paralelos. Puesto que
la varianza vcrdadcra es la misma para tests paralelos, obtenemos
Tabla 5-2. TCrminos dc varianza-covarianza para 10s puntajes vcrdaderos cn n tests paralelos.
~ I c In 111nlris
(~O~IIIIIII~
\.n1.in11/n-(.t,\.nria11sa)
Varianza de error
91
J:,, = ZS: + Z Z r e , , e r . ~ r , ~ e h .
(5-21)
2 s : = ns;.
sic = ns;
En general, la varianza verdadera se incrc~nentacomo el cuadrado d e n
cuando la longitud del test se aumenta n vcces.
Hemos supucsto aqui que 10s tests adicionales han sido paralelos a1 test
original, y quc ha habido: a) una correlaci6n de 1.0 para 10s puntajes
(5-22)
92
CONFlABlLlDAD
5-6
0.00
,I
1
6
7
Nhero
93
La derivaci6n de la f6rmula de Spearman-Brown (ecuaci6n 5-23) supone que 10s items aiiadidos a1 test original son similares a 10s items iniciales
5 -7
5-7
EL COEFICIENTE DE CONFlABlLlDAD
95
para una muestra con varianza total conocida. Si ahora examinamos una
muestra m b homoghea de individuos, la varianza de la distribucibn de
puntajes verdaderos i s menor. La varianza total se habri reducido, mientras la varianza de error permaneccri sin cambio. Vemos inmediatamente
el efecto de este carnbio en la ecuaci6n (5-8)-el coeficiente de confiabilidad
se reduciri. Suponiendo la misma varianza de error en diferentes niveles
del test, podemos derivar una ecuaci6n para computar la confiabilidad de
un test cuando se usa en una muestra cuya varianza total es diferente a la
de la muestra en la que se comput6 el coeficicnte original de confiabilidad.
Si representamos por u la muestra en la que se va a estimar la confiabilidad, obtenemos la siguiente exprcsi6n para la confiabilidad del test en este
2.
5.
-- 3.
U n test compuesto de 40 itcrns con una confiabilidad de 0.64 h a de agrandarse hasta que tenga una confiabilidad de 0.80. i C d n t o s nuevos items del misrno
tipo quc 10s originales deben a ~ r e g a r s e ?
'8.
9.
'
10. En una deterrninada situacibn un grupo de diez evaluadores tienen una confiabilidad entre si de 0.30. Usando la ecuaci6n de Spearman-Brown, calcular el
nbmero dc evaluadores requeridos para obtener una confiabilidad de 0.90. Discuts. la factibilidad de esta acci6n.
11:
13.
~ C u a les su confiabilidad?
6.
12.
Lecturas sugeridas
G H I S ~ L L I ,E. E. (1964). T h e o r y oj psychological tnearuretnent. Nueva York:
McGraw-Hill.
LORD,F. M. (1959). An approach to mental test theory. Prychotnetrika, n6m. 24,
paginas 283-302.
y S. M ~ S S I C K
(1960). Inferring the examinee's score. En I. H. GULLIKSEN
(Eds.) Psychological scaling. Nueva York: Wiley.
THORNDIKE,
R. L. (1951). Reliability. En E. F. LINDQUIST(Ed.) Educational
measurement. Washington, D. C.: Am. Council on Educ.
WOODBURY,
M. A. (1963). The stochastical model of mental testing theory and an
application. Psychometrika, n6m. 28, pigs. 39 1-394.