Construcción de Pruebas (Brown)

Construccton de pruebas psicologicas
Brown, F. (1980) Medicin en

Psicologa"I y Educacin. Mxico: El
Manual Moderno
'(
,'J
"JU ~
Definicion del
rasgo
'~ . ,~. ,,' Antes de iniciar el analisis de la construccion de pruebas psicologicas,
~"f:-.~.,t..~"-=
..1
es preciso hacer hincapie en dos puntos evidentes, que se pasan por alto con
,I" demasiada frecuencia. Enprimer lugar, en muchas situaciones, una prueba es
s610 uno de entre varies metodos posibles de obtencion de la informacion
deseada, Por ejemplo, si dcseamos medir los conocimientos de maternaticas
if.o de un estudiante de secundaria, Ie podemos aplicar un examen. Alternativamente, podrfamos utilizar sus calificaciones en los cursos de matematicas
o pedirles a los maestros que calificaran sus conocimientos. Si hay algun
~. r- 'otro metodo mas preciso 0 practico para obtener fa informacion deseada se
, 1\:;.-( de'beIi utilizar de preferencia un examen 0 una prueba.
'l;;il~'1 ':e .
,
,
~funu~
~
Anilisis d8lu8stos
Identificaci n de los
critarios V 10' rasgos
componentes
I
Elaboracion de los reactivos
Revi'iones
I.,
,
. En este capitulo se presentara una revision general del proceso de
'" :,:' ,de~ono de pruebas psicologicas, para mostrar en forma ampIia el modo
, en que se ajustan las etapas, unas a otras, A continuation, en los capltulos
que siguen, tomareinos en consideration las etapas individuales. Durante
toda la exposicion, es preciso recordar que el proceso de desarrollo de
J}rUebas psicologicas es una ciencia y un arte. Utiliza tanto el razonamiento
'estadfstico como el logico y equilibra las consideraciones practices con las
teo'ncas. La meta es la de desarrollar un instrumento tecnicamente apropiado,dentro de las limitaciones practicas.
I
Delineacion del
contenldo y las
habilidades
'se
I
Traducclfm de la finalidad en terminos operacionales
,."
I
~,,,
.. '.
d\'~'.jLos procedimientos utilizadospara construir pruebas psicologicas tienen
"," , como fin asegurar que estas alcancen sus finalidadys y metas deseadas. Esto
~ <1: se logra mediante la aplicacion de los principios de rnedicion analizados en el
capftulo 11. Aun cuando el proceso exacto varfa.idependiendo del tipo de
',\ prueba 'psicologica, se puede establecer una secuencia general en los pasos
":: de construcci6n de las pruebas psicologicas, que incluyen la especificacicn
de su fmalidad, la construccion y la cornprobacion de reactivos, el ensamblaje'd'e'la forma final de la prueba, el analisis y estandarizacion de las calificacionesde la prueba psicologica. En la construccion de cualquier prueba
1 ",
especffica, se pueden omitir algunas de las etapas. Puede variar su orden
18 h1 0 'pueden llevar a cabo varias etapas de manera simultanea. Sin embargo,
'~',',!; esp'osible identificar una frecuencia general (ver la fig. 2-1).
,;
I Especiticaciones de la finalidad I
2 ...
CONSTRUCCION DE PRUEBAS
PS~COlOG'ICAS: GENERAllDADES
2'
Comprobacion V aOlilisis de los reactivos

Discriminacibn
Djficultad
Alternativas apropiadas
V~lidacion cruzada
I Estructuracibn de la formafinal de la prueb~
I
Estandarizacion
Aplic~cibn
Lineamientos
Limites de tiempo
Calificacicnes
I
Anilisis tecnico de la prueba
Confiabilioad
Validez
Normas
Prueba lista parautilizarse

Fig. 2-1. Etapas en la construcclon de una prueba.
En segundo lugar, existen pruebas publicadas disponibles en la mayorta

de. ,lOS campo~ de la actividad psicologica (Buros, I974a). Asi, podemos
u tihzar con trecuencia una prueba existente, en lugar de construir otra
nue~a. Por supuesto, las ventajas del usa de una ya existente es el ahorro
de tlemp~. y esfu~rzo de construccionde la prueba y 13 disponibilidad de la
informacion previa respecto a la eficacia de 13 prueba y el significado de
22
Construccion de pruebas psicol6giCtU
[Capitulo 2)
sus calificaciones. EI mayor inconveniente es el de que puede no haber

pruebas publicadas que sean optimas para la situacion dada.
LO QUE REPRESENT AN LAS PRUEBAS

PSICOLOGICAS
Las funciones de las pruebas psicologicas se pueden ver a partir de
En el capitulo I, analizamos varias clasificaciones
'posibles de las pruebas. Otro plan de clasificacion que nos ayudara a comprender el proceso de su construccion establece una distincion entre 10 que
representan y 10 que predicen las pruebas psicolegicas. Desde este punto de
vista una prueba psicol6gica es una representaci6n cuando sus reactivos
son similares a las conductas que nos interesa medir y es predictor, cuando
se enfoca en alguna conducta, no considerada en la prueba que deseemos
predecir.
Para ilustrar el concepto de la prueba psicologica como representacion,
supongamos, por ejemplo, que deseamos medir la capacidad de un nino
para sumar numeros de tres dfgitos, Podriamos pedirle al nirto que resolviera un gran numero de problemas de suma de dos numeros de tres dfgi'tos; sin embargo, esto daria como resultado una prueba sumamente prolongada. En lugarde ello, podriamos escoger una muestra de problemas y
.pedirle al nino que los resolviera. En base a su ejecuci6n en esos problemas,
seria posible inferir hasta que punta podria obtener buenos resultados
en toda la gama de problemas posibles. La exactitud de nuestra inferencia
dependerfa de 10 bien que hicieramos el muestreo de los reactivos incluidos
en la prueba psicologica, a partir de todo el conjunto potencial de reactivos.
Si por algiin error de muestreo escogieramos muchos reactivos faciles,
sobreestimarfamos su capacidad; si los problemas dificiles estuvieran representados en exceso, su capacidad sesubestlmaria. No obstante, el metodo
de selecci6n de reactivos esta claro. Hacemos un muestreo sistematico de
reactivos del conjunto total de reactivos potenciales. La muestra de reactivos
incluida en la prueba representa, por 10 tanto, el dominio 0 universo de
reacti\l'bs posibles.
Aun cuand~ las pruebas de ejecuci6n tales como la aritrnetica y de
vocabulario, proporcionan los ejernplos mas claros de las pruebas como
representaci6n, este concepto se puede aplicar tambien a otros campos.
Supongamos que deseamos medir la honestidad de los nines de la escuela
prirnaria. Uno de los modos posibles de hacerlo serfa escoger una muestra
de situaciones en las que un nii'\o tenga oportunidad de demostrar su hones'ti~iad, 0 su falta de ella, Y observar si, en esas situaciones, es realmente
honesto. Podrfamos dejar que el nino corrigiera su propia hoja de examenes,
permitirle ver las respuestas para un examen inminente 0 darle Ia oportunidad de sacar a escondidas de la clase algun objeto valioso, AI observar su
i diversas perspectivas.
.>
JI
Construccton de pruebas pstcologicas
23
conducta en esta muestra de situaciones, podr iamcs hacer inferencias respecto a su honestidad.
Goodenough (1949) hizo otra distinclon dentro de 13 c1ase de pruebas
representativas. Las clasific6 como muestras y como signos, La base primordial de su distinci6n es la claridad con la que se pucde definir el universo
muestreado, En su clasificacion, una prueba es una muestra cuando los
reactivos son obtenidos de un universo clararnente definido; es un signa.
cuando el universo es abierto y no esta definido claramente. La irnplicaci6n del termino "signo" es que la prueba indica 0 senala la naturalcza del
universo, objeto del muestreo. As! pues, las pruebas que son muestra sc
considera que describen el universo, mientras que las de signos, 10 explican.
La idea de una prueba como un signo se puede aclarar por medio de
dos ejernplos, Tomemos en consideraci6n la creatividad , que es un concepto
muy utilizado; pero que se define raramente con c1aridad. Un buen metodo
para abordar el estudio de la creatividad podria ser el desarrollo de una
prueba de aptitudes y de resolucion de problemas que parezcan medir la
capacidad creativa.
A continuacion, relacionariamos las calificaciones
obtenidas en esas medidas con otros indices de creatividad, tales como las
clasificaciones hechas por jueces expertos, La obtencion de premios por
realizaciones creativas 0 el exito en ocupaciones que requieren capacidades
de creacion. Si esos estudios dernuestran que las cahficaciones obtenidas
en esa prueba se relacionan con esos resultados, habremos contribuido a
definir 10 que se entiende por creatividad. En esencia, nuestra prueba psicologica habra servido como un "signo" que indique la presencia de capacidades creativas.
o bien, tomemos en consideracion la inteligcncia. Uno de los modos

de definir la "inteligencia" es mediante los tipos de (areas incluidas en las
pruebas de in teligencia. AI utilizar el concepto de pruebas psicologicas
como signos, la consabida frase de "inteligencia es 10 que mide una prueba
de inteligencia", que', se cita con frecuencia, no es simple mente una definicion circular.' Mas bien, indica que la buena ejecuci6n de las tareas incluidas en una prueba de inteligencia es una indicacion de que la persona en
cuestion es .inteligente. ,
En general, el concepto de muestreo es mas apropiado para las pruebas
de rendimiento, en las que se especifican, por 10 comun con c1aridad, el
contenido y las habilidades que se deben medir. Sin embargo, al medir
construcciones utilizadas en las teorias psicologicas, el universo se suele
definir de modo incompleto. En este caso, es mucho mas apropiado cor.siderarlas como pruebas de signos.
PRUEBAS PSICOLOGICAS PREDICfIVAS
En muchas situaciones, nos interesa una prueba debido a que sus
calificaciones nos perrniten predecir el modo en que se desempefiara una
Construccion de pruebas pstcolozicas
24
[Capitulo 2)
persona en una situacion cualitativamente diferente. Por ejernplo, aunque

#t.~una 'prueba de adrnision a la universidad puede incluir muchos reactivos
, ' 1 de:. vocabulario, no nos interesa en sf mismo el vocabulario del alumno;
eri,'l~gar de ello, deseamos conocer la caIificaci6n obtenida por cad a estudianteen el vocabulario, debido a que predice su rendimiento en la universidad. El interes se enfoca en 10 que se predice y no en el predictor. Nos
interesa el rendimiento de un alumno en la prueba tan solo porque predice
alguna .otra conducta, 0 caracteristicas ,de interes, Asi, el hecho de si los
1, readivos de una prueba son un muestreo adecuado de un universe dado 0
:.;;~; rto,;tien:~, relativamente poca importancia.
_
l
." ....... '!.'
-.....,
. .'
':".' ":'El'elemento esencial en' una prueba predictiva es que sus calificaciones
.,' \ se relacionan con. el, comportamiento de interes (el criterio), Hasta donde
s~iecCi6n, dereactlvos para esa prueba se base en la exactitud con la que
~i.~~,p,~~tce:u~a conducta externa, se podran incluir en ella, reactivos que pa", 'rezeanno .tener ninguna relaci6n 16gica con la conducta que se este tomando
, em .consideracion. Por eiemplo, en un inventario de intereses se puede
- , U;cl~. un reactivo en el que se Ie pregunte a la persona si Ie gusta [ugar al
",' go'tr. L6gicamente, este reactive puede tener muy poca relacion con cualquier elecci6n vocacional, con la excepcion posible de la de un golfista
pm.f~si~;n.~l. "Sin embargo, si se puede demostrar q~e el agrado por ~l go~f
I I " est4relacionado con los intereses por otras ocupaciones, se podria incluir
" estelieactivo
en laprueba, ya que vaticinarfa los intereses en esas ocupaJ" _ ,
clones,
i f ~ .' .;,'~.': ::,'
-vb:;'
R,tr:
,j.
I.
,~""'0:'1\';.
totE
1'~,:
REPRESENTACION POR PREDICCION
ICJI,kf.,:)i;(iUI ,:)~
III "ril6bDU'~dlstfh'ci6n entre las pruebas representativas y las de prediccion se

!1\\r
:$i los reactivos de la prueba y la conducta relevante, no contenida
tp:;~lEit'elta,:lso'nsiJnilareso'diferentes.Si 13 prueba y laconducta no contenida
!t:$>!I'~t\~lellil'so'n"esen'cialmentesimilares , se dice que la ptl1eba"rep'resenta la
'1:~'-~oli(fJ'cta:' reievarife; slsondfferentes, la prueba es d~ 'pi'edicci6n.. Elpro-~8~E1aesihono'deia'pniebU'variar4 dependiendo de si 'fUrlCi.orlata como
'ihhi'tnu'estn: un signo o unapredicclon. Cuando la pruebase construye
para muestra, se seleccionaran reactivos tornados slstematicamente de un
unlverso definido y' la. evaluacion consistira en detenninar 10 adecuado del
muestreo. Por otra parte, cuando una prueba espredictora, la etapa crucial
k;.'!iI. :seralla.de establecer, empfricamente, que existe una relaci6n entre el reactive
,y.::la -conducta que se intenta predecir.
reriere"a
Construccion de pruebas psicologicas
predecir el exito academico en una carrera de ingenierfa. Asi, la misma prueba sirve 10 mismo como muestra (del rendimiento en matematicas de secundaria) que como predictor (del exito en ingenierta); sir. embargo, el proceso
de construccion de pruebas variara, depeudiendo de las iunciones primordiales de ellas, Si la meta principal es la de desarrollar una prueba que mida
el rendimiento en matematicas, el muestreo representative del universo de
los problemas de maternaticas sera una condicion sine qua non para la seleccion de reactivos; si la exactitud de la prediccion es 10 mas importante, la
representatividad del muestreo ' se subordinara al poder predictive como
base para la seleccion de los reactivos. As! pues, aun cuando la prueba
puede servir para ambos fines, se resaltara uno u otro en el proceso de construccion.
FINALIDAD
DE
LA
PRUEBA
Desde un punta de vista pragmatico, el constructor de pruebas tiene

que tomar dos decisiones irnportantes: determinar el contenido de la prueba
y su formato. 0 sea que debe determinar las conductas, los conocimientos
o las habilidades que cubrira esta y como se presentaran los reactivos. Sin
embargo, antes de poder tomar esas decisiones, deberan hacerse dos preguntas previas: .. i,para que fines servira laprueba?" y "i,qu~ grupo de sujetos
seran sometidos al examen?". Las respuestas a estas dos preguntas estableceran lfmites y sugeriran c6mo seguir adelante en el proceso de construcci6n
de la prueba.
La pregunta relativa a la finalidad es predorninante. Comunrnente, se
desarrolla una pruebq para alguna cornbinacion de usos y finalidades, mas
que para un solo proposito. Aun cuando este proposito se define por 10
comun, al menos de m)lnera implicita, es muy conveniente una declaraci6n
explicita y completa de sus fines.Por ejemplo, la flnalidad de la College
Entrance Examination Board's Scholastic Aptitude Test (SAT) Prueba de
Aptitudes Escolares del Conse]o de Examenes de Admisi6n a la Universidad
se describe como sigue:
Puesto que las escuelas secundarias difieren muche en sus cursos, sus normas
academicas y sus practicas de calificacion, los funcionarios encargados de la
admision a la universidad necesitan con tar con a1guna medida estandar de
capacidad para comparar las solicitudes de los candidates procedentes de
distintas escuelas.
t'-;
La distincion no es una dicotomia clara, ya que la misma prueba

puede ser de muestra y de predicci6n. Como ilustraci6n de esto, podemos
decir que se podrfa desarrollar una prueba mediante el muestreo de reactivos
enseflados en los cursos de matematicas de secundaria. AI administrar esa
prueba a los alumnos que ingresan a la preparatoria, se pod ria utilizar para
25
Una prueba utilizada como predictor es una muestra de conducta, en un sentido

amplio, puesto que los reactlvos que flguran en el son s610 una muestra de todes
los posibles en eJ universo.
26
( Can itulo 2)
>I!! ,
.EI SAT es una prueba objetiva con duracicn de tres horas, destinada
"",.a proporcionar una medida estandar de las capacidades verbales y materna\
\,'> ~-ticas de
candidates a ingresar a la universidad. Lassecciones verbales del
': "- r: )'. SAT pondran a prueba Ia capacidad para comprender las relaciones entre
~~ ";IP.Wt1as paIabras y las ideas y entender 10 que se lee. Las secciones maternatlcas
',' 0: 'tryr;npoilen:aproeb'a Ia capacidad para comprender simbolos matematicos y utilite \' \'0 o.zarlos en Ia resolucion de problemas (College Entrance Examination Board,
...
'
" ' J " [.,.1971. pags. 5,6).
"
~tfo"'f;'~~)JJ':"rr'-",T I ' : " " ' ! ! . ' - 1 "
[I"
~~"r
,
;!-:-:": :~:: . La otra consideraci6n primordial es la de la composiciony las caracte"OW::-;
~ -;;r,t";"'.
',:10
0 (,"
'"
"",~ i[~HE~tdel grupo
<.
-:;'
' . '
,_...'
at que se destina la prueba. En este caso, el constructor de
27
leyendo tareas y materiales cubiertos durante las cIases. Adernas de especificar el contenido, el constructor de una prueba debe especificar tarnbien
las ~abiIidades ~~~ se van a medir (por ejernplo, los conocimientos, las aplicaciones, los analisis y las evaluaciones).
los
., " , i ... -Observese que esta declaracion no s610 explica la finalidad de la prueba
~~":~llit5:qtinubrayael contenido. "
."..,
.".""
Construccion de pruebas pslcologicas
Si ~a .prueb~ p~ic?logica se desarrolla para medir algun rasgo 0 alguna

En
primer lugar, debera definir, de modo tan expJicito como Ie sea posible el
rasgo ~ue se rnedira. A continuacion, tendra que indicar las condudtas
a traves de las cuales se manitestara el rasgo, Es decir, que describira las
conductas observables, las habilidades 0 las aptitudes que sean indicadoras
del rasgo que se medira.
ca~actenst1ca psicologica dada, la tarea del constructor sera distinta.
~rlCitlN,l~ p.R;l.~b,a; debe to~ar, ~n consideracion ~ariables tales co.mo la ed~d de
" . qutenes 10 tomaran, nivel intelectual, educacion, or/genes socloeconcmicos y

",:, culturales y nivel de lectura. Por supuesto, las variables que seran pertinentes
'.''.\ en' circunstancias especfficas dependeran del tipo y las finalidades de la
"nrueba.
Por ejernplo, puesto que el SAT se disef'16 para los solicitantes a
. .,v.l~~~
.
.1:lii }ngresar a las preparatorias, las universidades de E.U.A., la gran mayorfa de
. . las personas que se someten a ella son egresados de secundaria y preparatoria,
" 'de:l'(a 18 anos de edad y se han visto cxpuestos a un nucleo cornun de
~~periencia~, educativas. ASl pues, seran mas hornogeneos que la poblaci6n
geit'eral
en su nivel de desarrollo intelectual. Por consiguiente, los reactivos
(,'
que figuran en la SAT estan disetlados tenlendo en cuenta la dificultad y
extension apropiada para este grupo especial.
CONTENIDO DE LAS PRUEBAS

, Para proceder a la elaboration de la prueba psicol6gica, el constructor
debeni traducir sus propositos en terminos operacionales. Es decir, que
d~be espeCificar las operaciones' que utilizani para 5U construcciOn. Esta
,eSI;ecificaci6n cubre una vez mas dos grandes I1reas: contenido y formato.
l..asproebas representativas
i
En el caso de las pruebas de rendimiento, la primera etapa consiste en
bosquejar el contenido y las habilidades que cubre la prueba. 2 Una prueba
puede cubrir los sonetos de Shakespeare, las leyes de las permutaciones,
los facto res sociales y econ6micos que estuvieron a la base del auge del
partido nazi 0 los principios de construcci6n de pruebas de rendimiento. EI
contenido se puede especificar todav!a mas, en relaci6n a algunos materiales
dados; por ejemplo, en un examen en las aulas, el contenido se puede definir
~:~ Otto metodo altemativo, que se esta haciendo cada vez mas comun. es el de disei'lar
proebas psicologlcas para medir el alcance de una lista especificada de objetivos

conductuales. Esto 10veremos en los capitulos 13 y 14.
Pruebas de predicci6n
. Cuando se des~rrolla una prueba psicologica con fines predictivos, la
pnmera etapa consiste en efectuar un analisis sistematico de la ejecucion
~ue se t~~ta de predecir. En otras palabras, se Heva a cabo un analisis de
~uestos . .Los resultados de ese analisis deben indicar una medida apropiada de cn.terio. ~ identifi~ar los rasgos y las conductas .que se necesitan
para que la eJeCUClOn sea satisfactoria.
. Un criterio es una medida del exito, 0 sea, la conducta que debe predecir .I~ ~rueba, Se debe definir 10 que constituye una ejecucion apropiada,
especificandose un Indice de exito. Por ejernplo, el exito como ensamblador
de regulador~s. se puede definir como el numero de unidades ensambladas
por hora, el exito de un vendedor por su volumen de ventas, el de un alumno
por e~ pro~edio de ~ali.ficaciones, etc. Una medida adecuada de criterio
debe~a medir el rendimiento apropiado y estar libre de desviaciones tendenciosas,
'
Otra de las finali~ades del analisis de puestos es identificar las conductas
por ende, I~s ra~gos.:~ue parezcan tener relacion con el exito en el trabajo.
SI un empleo Implicara la instalaci6n de resortes pequei'los en el mecanismo
d~ .un relo), el con~tructor de Ia prueba podria suponer que la destreza
dlglta! era una .capacldadpecesaria; si unos de los componentes de un empleo
fue,ra el lIevar. lnventarios, podrla suponer que uno dc, los requisitos previos
sena la capacldad ~ara la aritmetica; si el trabajo consistiera en cortar baldosa~ p~ra que st:. aJustar~n a superficies de pisos de formas irregulares, el
cnteno pnmord~al. po?na ser el de la representaci6n espacial. Despues de
establecer una hlpotesls respecto a las aptitudes, las habilidades 0 los rasgos
que se nect:slta~ para real~zar el trabajo, ci constru..:tor de Ia prueba podra
escoger los rcaCllVOS que mldan esas &ptitudes y esas habilidades.
y:
Los planes de Ulla prueba psicol6gica

EI vehicu~o utilizado para especificar la amplitud de una prueba es
el plan de la nllsma. Este no es mas que una tabla que muestra los topicos
que se cubren y las habilidades que se mediran en la prueba, junto con la
28
(Capttulo 2)
Construcci6n de pruebas psico/6gicas
Prueba de.estadfsticas descriptivas

"
"
,0
! '
'f
alternativas, como en los reactivos de comparacion, elecclon multi.

pie 0 verdadero y falso. En los reactiv03 de respuesta libre, el
suieto proporciona una respuesta, como en cODipletamiento de
frases, respuestas cortas 0 preguntas de ensayo.
1'10.
~ I
Conceptos
<:Mculo
Interpretacion
10%
10%
15%
15%
10%
10%
5%
0%
5%
5%
5%
10%
Distribuciones
'Tendenda central
,
,Variabilldad
Correlacion
"
2.
Fig. 2-2. Elemplo de plan d! prueba.
lmportancia relativa que se atribuye a cada categoria de contenido de

las habilidades. En 1a fig. 2-2 se da un ejernplo simple del plan de, una
.. , ,proeba para una unidad de estadistica descriptiva. Observese que las are~s
C:,h\;'~, d'e.'con'tenido que se cubren se indican en un eje, mientras que las c~p.acIdades que se miden estan en el otro. Los porcentaies dentro de las ca~ll1a~
indican la proporcion de reactlvos de la prueba psicologica qu.e se de~lcara
~ "cada tema. Esas proporciones deben refleiar la importancia r:lahva de
cada area. Por supuesto, el plan de una prueba para un examen mas prolongado 0 amplio tendda que ser mas extenso.
, E1 plan de una prueba psicol6gica sirve .para dos ~ines. En la etapa
de' elaboracion de los reactivos, indica la cantidad y el tipo .de .ello~ ,que es
continuacion
pI rredactar
e cA
s
o . , se puede comparar 1a distribucion
. direal
de los reactlvos en la forma final de la prueba con las proporciones 10 rcada~e'n el plan, para determiner si los reactivos sirven de hecho para efectuar
un muestreo adecuado del universe de que se trate.
FORMATO DE LA PRUEBA
E1 constructor de una prueba debe determiner tambien el mo~o.en que
se presentaran los reactivos. ~Utilizara una prueba de papel y lapiz o se
requerira algun tipo de aparato? ~Tendrlin que reconocer sim.~leme~t~ los
sujetos la respuesta correcta, como en las preguntas de elec.clOn mu1t~ple,
~. deberan dar la respuesta correcta por si mismos? ~Que importancia se
concedera a la velocidad de respuesta? A continuaci6n se dan algunos de los
formatos de pruebas mas comunes.
ALGUNAS DIMENSIONES COMUNES DE

FORMATOS DE PRUEBAS
1.
Respuesta a1temativa vs. libre. En un reactivo de respuesta a1t~r

nativa, e1examinando escoge la respuesta apropiada de entre vanas
29
Pruebas de velocidad vs. pruebas de poder, En una prueba de velocidad los reactivos suelen ser muy sencillos: perc existe un tiernpo
limite estricto; asi, la calificacion es un indice de la velocidad de
las respuestas. Una prueba de poder sc com pone de reactivos de
dificultad variable y tiene un limite de ticrnpo que permite dar
respuesta a todos ellos. En esa forma, la calificacion refleja el
nivel de dlficultad de los reactivos a los que puede responJer el
suieto.
3.
Ejecuci6n maxima vs. eiecucten tipica. '~n las pruebas de ejecucion maxima, el sujeto recibe in~trucciones de tratar de obtener
la rnejor calificacion que pueda. En las pruebas de ejecucion
t ipica, nos interesa conocer su comportamiento habitual 0 normal.
En general, las pruebas de rendimiento y de aptitudes son medidas
de ejecucion maxima en tanto que las de personalidad, son medidas de ejecucion tfpica.
4.
Papel y lapiz vs. ejecucion. Esta distincion se refiere al modo en

que se presentan los reactivos de una prueba y como se dan las
respuestas. Las pruebas de eiecucion implican, con frecuencia,
la manipulacion de algun aparato u objeto.
5.
Aplicaci6n colectiva vs, individ ual, Las pruebas colectivas sc

pueden aplicar a mas de un solo individuo a la vez, por 10 que
suelen ser de papel y lapiz. Las pruebas individuales se pueden
aplicar solo a una persona cada vez y pueden ser de ejecucior,
o verbales.
6.
Pruebas e~,tructuradas vs, proyectivas. En una prueba est rueturada, se especifican con claridad los estimu'os y las tareas del
sujeto; en una prueba proyectiva, los estimulcs y las tareas son
ambiguos. Las pruebas estructuradas frecuentemente se les llama
objetivas, aun cuando est a distincion se refiere, de manera mas
adecuada, a los procedimientos de caIificacion (ver las pags,
31-33).
Cualquier prueba combinara varias de esas dimensiones; es dccir,

puede ser una prueba de velocidad, de papel y lapiz, utilizando reactivos
de reconocimiento. Ademas, una prueba puede incluir varios tipos diferentes de reactivos; por ejemplo, los examenes de clase incluyen con frecuencia tanto preguntas de eleccion alternativa (como las de elec~ion multiple
o las de verdadero y falso) como de respuesta libre (tales como las de ensayo
o respuestas cortas).
,3D
ItI'
;~l_
Construccion de pruebas psicologtcas
(Capitulo 2)
Como en la mayoria de los casos, cualquier reactivo puede presentarse

'en varios fonnatos; el problema es elegir el "meior", Hay dos consideraci~nes que ayudan a tomar una decision entre fonnatos posibles: las caracteristicas de sujetos que han de tomar la prueba y ciertos factores practices.
, Elpapel de la composicion del grupo examinado se puede ilustrar mediante
" ja'practica deadrninistrar examenes orales a los niflos pequenos y las personas' con capacidades limitadas para la lectura, y el uso de pruebas con un
contenido verbal minima para las personas con deficiencias de lenguaje, Las
'consideraciones practicas se ilustran mediante el empleo de reactivos de
,'efecci6n multiple en las pruebas a nivel nacional de adrnision a las universi'aa'des'donde, debido al volumen de las priiebas aplicadas el unico rnetodo
'facHble de calificarlas es el de utilizar maquinas electronicas de alta velocidad.
CONSTRUCCION DE
ELABORACION DE LOS
LA PRUEBA
REACfIVOS
L,
"
Despues de tomar esas decisiones preliminares, quien desarrolla la prue:
,L
,.,:~:. f1.f" l-1?a:,e~lara:listo, para comenzar a redactar! los react~vos. ?6na Ivezrmas, tendra
,
"varias opciones para actuar.
Tomemos en consideraci n as uentes que
.L' \'podrian utilizarse para desarrollar reactivos individuales. "Para un examen

.. ;."
'en ,~Iase, el maestro puede utilizar libros de texto, t~eas: de lectura, expo-
31
desarrolladas por los editores de pruebas comerciales. Hay grupos de especialistas, que trabajan a partir del plan de la prueba, para escribir reactivos que
cubran las areas de contenido y habilidades que se requieren. Al principio,
se escribcn muchos mas reactivos de los que se necesitaran, debido a que
seran nurnerosos los que se eliminen mediante los analisis sucesivos. A
continuacion, se revisan y corrigen las primeras redacciones de las preguntas,
tanto POI parte de los escritores originales como por otras personas. La
correccion irnplica la elirninacion de la redaccion ambigua, el fortalecimiento de las alternativas debiles y la exclusion de reactivos duplicados y,
par ende, inutiles.
ANALISIS Y COMPROBACION
DE
REACTIVOS
Los reactivos que sobreviven a esta seleccion inicial se combinan, a

continuacion, en una 0 mas formas de prueba previa. Estas pruebas previas
se aplican a una muestra de personas similares a las que se exarninara con la
prueba terminada. Por ejernplo, para una prucba de rendimiento, las pruebas previas se aplicaran a los alumnos del mismo nivel escolar y Que tengan
los mismos antecedentes de informacion que requiera la prueba. 1...:1 meta
de la comprobacion previa es obtener informacion sobre como reaccionan
los aJumnos ante los reactivos. Esta prueba consistira en comentarios cualitativos, tales como los de ambigl.iedades percibidas en los reactivos, e indices
cuantitativos de la dificultad y el poder de discrirninacion de los reactivos .
1.'
':J$idoit'es f debates en clase, como fuentes para las preguntas, En contraste,

ren las 'p'mehas de rendimiento desarrolladas para usarse en diversas escuelas,
los redactores de los reactivos no toman solarnente en ,consideracion un
texto , sino varios utilizados ampliarnente; no. emplean
las opiniones de un
,.",
iOl<):maestro,smo lasde una gran variedad de maestros y expertos en planes
ra~ estudios. Las preguntaso reactivos de los Inventarios de personalidad los
, sugleren por 10 cornun las teorfas de personalidad, los vocables y las frases
ltiUei~e utilizan para 'descrlblr la personalidad, las declaraclones que se encuen'trait en loshistoriales clfnicos, las palabras que usan las personas para descri'6Ifie a'sf mismas e incluso las preguntas 0 los reactlvos de otros inventarios
de personalidad.
_.
>
EI procesode desarrollo de buenosreactivos es la redacci6n, correcci6n,
prueba y revision, A'continuacion, se repiten estas etapas hasta desarrollar

reactivos satisfactorios. Por ejernplo, tomemos en consideracion las pruebas
t~rmino de "redaccion de reactivos" para referirnos aI
proceso de construcclon de los reactivos de pruebas, algunos de estos (como los
que se incluyen en las pruebas de ejecuci6n) pueden tener componentes no verbales y, por ende, en terminos estrictos, no se escriben ni se redactan.
:s Aun cuando utilizaremos el
La dificultad de los reactivos es el porcentaje de personas que responden a elias correctamente. EI conocer la dificultad de ellos es importante
para que el constructor de la prueba pueda estructurar un examen de cierto
nivel de dificuitad. Por ejernplo, se puede desear una prueba dificil si se
destina a seleccionar estudiantes para una educacion 0 un adiestramiento
avanzado. Aunque-e] concepto de dificultad tiene sentido en el caso de que
los reactivos tenganrespuestas correctas (pruebas de ejecuci6n maxima), su
significado puede no ser tan claro en reactivos en que no haya respuestas
"correctas", tales como en las pruebas de personalidad. Sin embargo, en
el caso de los reactlvos de eiecucion tfpica, podemos desear cierto patron
de respuesta (por ejernplo, el porcentaje de acuerdo con una afirmacion).
EI Indice mas importante es el del poder discriminative de los reactivos,
Este analisis estadistico indica la amplitud con la que el reactivo mide 10
que debe medir. Idealmente debera disponerse de un criterio externo de
medida, con el fin de que se pueda determinar empiricamente si las personas que respondieron correctamente a un reactive obtuvieron tam bien
calificaciones elevadas en el criterio. En la practica, esas medidas externas
frecuentemente no se encuentran djsponibles. Como substituto de ellas,
se utiliza la calificacion total en la prueba como medida de criterio y se
cornparan las respuestas a los reactivos individuates con las caiificaciones
32
Construccian de pruebas psicologicas
(Capitulo 2)
,qS}" -totales, con el ~in de detennin~ si las personas q~e obtuvieron caIificaciones
~ . .;ele:vadas~ ell' la'[prueba respondleron a un reactive en forma correcta con
i;'~\ mayor frecuencia que las que obtuvieron calificaciones mas baias, Cuando
..
lIl..1: ~;(' ~~s.toJocurre,.se
dice que el reactivo discrimina. Observese que, en est a situadiscriminacion se refiere al hecho de efectuar distinciones entre
: personas que tengan conocimientos 0 habilidades mayores 0 menores en el
.,)<1 . ~~a medida por la prueba.
'vi! .~i~nila
33
Despues de efectuar los cambios editoriales finales que se consideren

oportunos, se imprime la prueba. Ahora, por primera vez, la prueba existira como entidad clara. Hasta este momenta tenemos una coleccion de
buenos reactivos, perc no necesariamente una buena prueba. EI hecho de
si la prueba sera buena 0 mediocre depende de su estandarizacion y de
analisis tecnicos posteriores.
~r in" .j'j.')!;:fEb' las medidas de'~jecubion tfpica, el procedimiento an'Alogo detennina

id.:rSl ;'las',:re'spuesta$ estande acuerdo con las respues'tas del grupo designado
1
Por ejemplo, los reactivos en ~na medida (te,ldominancia",
ANALISIS
1tI r. cOmo; criterio.

~: (h,',
se.cornpararan con las respuestas de personas que, por algun metoda inde-
,.:,.
pendiente, han side identificadas como dominantes.
~~
El tercer tipo de informacion obtenida mediante un analisis de reactivos

es el.,del" numero de. personas que seleccionan cada una de las respuestas
~~t~~~tivas'para un reactive. Las alternativas que son muy poco frecuentes
,po que.no se escogen nunca se deberan revisar, ya que no contribuyen en nada
fa'-', eficiencla
. "" del reactivo.
: :'Jor En " situaciones especiflcas, se pueden realizar otros analisis,

Si la
prueba tiene como fln medir s610 un rasgo hornogeneo, se necesitara alguna
medida de las interrelaciones entre los reactivos. a bien, si es importante
la velocidad, se podra hacer un analisis de los efectos de diversos limites de
.~empo~, "~I
, Puesto que los analisis estadisticos derivados de diferentes muestras

varian debido a los errores de muestreo, los analisis de reactivos se llevan a
cabo, con .frecuencia en .dos muestras independientes. Este proceso, deno)\I'~ ,\,minado de ,validaci6n cruzada,
que se reduzcan las probabilidades de
". i' ".tomar decisiones basadas en procedimientos estadfsticos que retlejen solo
.las fluctuaciones aleatorias, en lugar de las verdaderas diferencias,
nace
,:~:.
',i
ENSAMBLAJE DE LA PRUEBA
La etapa que sigue es la de preparar la 0 las fonnas finales de la prueba.
Los, resultados de los analisls de reactivos se utilizan para seleccionar los
reactivos que proporcionen la mejor discriminaci6n, tengan la dificultad
apropiada y no posean ambiguedades ni alternativas deficientes. Esta seleccion requiere equilibrio y ajuste reciproco, puesto que quiza sea necesario
~.c~:uir.menos reactivos, discriminativos para asegurar el balance conveniente
~!lV ,~n,. el contenido.. Si se construyen fonnas equivalentes de la prueba, el
constructor tendra a su cargo la tarea adicional de equiparar las form as en
terminos de contenido, dificultad y poder de discriminacion, asf como
tarnbien en fun cion de otras dimensiones pertinentes.
DE
LA
PRUEBA
EST ANDARIZACION
En 13 medicion al administrar una prueba, la meta es obtener una
estimacion tan precisa como sea posible de la ejecucion de los sujetos.
La estimacion precisa en las pruebas psicologicas, igual que en otros procedimicntos cicnt ificos, depende del control de los errores -0 sea, de la
minimizacion de la intluencia de factores irrelevantes para los fines de la
medicion. Esto se logra, haciendo que la situacion de prueba sea 10 mas
sernejante posible para todos los individuos,
EI proceso de desarrollo de esos con troles se denornina estandarizaci6n .
Este terrnino tiene distintos significados para los diferentes autores. Todos
estan de acuerdo en que la estandarizaci6n implica que a cada sujeto le sean
presentados IuS mismos reactivos (0 equivalentes) y que existan reglas
especificas para la administraclon y la calificacion de la prueba. Otros
autores ai'laden el requisito de que se disponga de normas de ejecucion. La
definicion de estandarizacion que adoptamos en este libro incluye solo la
necesidad de un contenido de reactivos comun y procedimientos estandar
de administracion y calificacion. En otras palabras, la estandarizaciori se
referira a los procedirnientos para obtener calificaciones y no a los requisitos necesarios para interpretar los datos."
Contenido
EI primer elemento esencial es el conjunto de reactivos cornunes que
se aplican a todos los sujetos que se someten a la prueba, A menos que se
pruebe a todas las personas utilizando reactivos iguales (0 equivalentes),
no sera posible comparar directamente su ejecucion, ya que los resultados
se basaran en diferentes muestras de reactivos. Debido a que gran parte
4
Aunque cualquier prueba que satisfaga estos criterios se podra considerar como una
"prucba estandarizada", cste ultimo tcrrnino se refiere For 10 cornun a las pruebas
publicadas comercialmente que esten estandarizadas 'j, adernas, pronorcionan datos
normativos,
34
(Capttuio 2)
de, la exposicion anterior se ha centrado en el modo en que se desarrolla

este conjunto estandar de reactivos, no parece necesario hacer comentarios
adicionales al respecto.
Aplicaci6n
Aun cuando se aplicaron los mismos reactivos a todos los sujetos, las
calificaciones no sedan comparables a men os que se aplicaran en las mismas
condiciones. Por supuesto, la comparabilidad total es imposible, debido
a que una prueba se aplicara a diferentes personas, en diversos tiempos y
Jugares y por diferentes examinadores. Sil!. embargo, es posible eliminar
gran parte de la variabilidad extrana, utilizando instrucciones prescritas
para la aplicaci6n de las pruebas, limites de tiempo estandar y metodos
objetivos de calificacion.
Por 10 comun se requieren dos conjuntos de instrucciones: uno para
quien se sornete a la prueba y otro para quien la aplica. En el primero se
!kn" debeexplicar, en forma tan clara y simple como resulte posible, el modo
eli que el sujeto debe responder a los reactivos. Esas instrucclones se irnprimen at comienzo de la prueba," de preferencia en una pagina separada, Y
pueden ir desde las instrucciones mas simples, de una sola frase para los
examenes en el salon de clase hasta las clausulas mas cornplejas sobre exarnenes estandarizados (ver la fig. 2-3). Las indicaciones dadas a los sujetos
I"
deben indicar .el modo en que se elegira una respuesta, como marcarla
(por ejernplo, en el librito de la prueba 0 en una hoja de respuestas por
separado) y los limites de tiempo. En muchas pruebas, las instrucciones
lncluiran tarnbien una indicacion relativa a como responder cuando no se
,.este~.seguro. Por 10 cornun, es conveniente tambien incluir varios reactivos
'!-;>o ~. de muestra. La inclusi6n de estos ultlmos es esencial, cuando el formato
sea desconocido para los suietos.
"
Las indicaciones para quien aplica la prueba se imprimen en un manual
por separado. Estas direcciones incluyen las que se dan at sujeto, con una
explicacion mas amplia sobre sus derivaciones. Estas instrucciones incluyen
tam bien detalles sobre aspectos tales como la disposici6n del salon de examenes, la distribucion de rnateriales, el registro del tiempo y de las calificaciones. Tambien se deberan dar instrucciones sobre como manejar los
problemas y las preguntas que se presenten durante la sesi6n de examen.
Uno de los aspectos preponderantes de cualquier procedimiento de
medici6n es el de los lfrnites de tiempo. En muchos casos, dichos limites se
deb~n en parte a restricciones practices, tales como la duracion de los perfo.n':H1,i ,aBS-de 'clase, No 'obstante, es preferible que los lfrnltes de tiempo esten
:r'
detenninados por consideraciones psicometricas y las finalidades de la
~''''. ,'p'tiieba m i s m a .
.
s 51 una prueba tiene varias s~cciones (subpruebas) que requieren diferentes indicaclones, se deberan incluir lineamientos separados at comienzo de cada secclon.
35
A. Indicaciones para un examen en el salon de clase (resctivos de elec-
cion multiple).
Seleccionen la alternativa correcta para cada reactivo y marquen
su letra en el lugar apropiado de la hoja de respuestas.
B. Direcciones para una prueba de aptitudes.
1. VOCABULARIO
Cada palabra de prueba, en mayusculas, va seguids por cmco respuestas posibles,
La respuesta correcta es la palabra que signlfique casi exactamente 10 mismo que la
palabra de.la prueba. Haga una linea Ilena con el lapiz en el espacio que queda entre
el par de lineas de puntos, a la derecha, que corresponda a la respuesta correcta. Ejemplo:
Frecuente: A) siempre B) a menudo
C) nunca D) muy E) pronto
r:
.. I .. ..
"A ~enudo" es 10 que mas se acerca en significado a "frecuente", por 10 que se trazo
una linea continua entre las lineas de puntos de la derecha, bajo la B.
Marquen una respuesta para cada palabra. Si no conccen el significado de una palabra
hagan la mejor eleccion que puedan.
'
Dispondran de tres minutes para completar esta prueba,
NO DEN VUELTA A LA PAGINA HASTA QUE SE LES

INDIQUE QUE LO HAGAN
Fig. 2-3. Ejemplo de las direcciunes de prvebas.
La mayoria de':las medidas de eiecucion tfpica se administran sin limite

d.e tiempo; sin embargo, cuando se mide rendimiento 0 aptitudes, la velocldad. s~ele ser un fa~tor importante. Se puede establecer un continuo para
d.e,scnblr las pruebas, b~sado en el papel que juega la velocidad en la ejecucl~n. Por un lado existen pruebas estrictamente depoder en los que al
sujeto se Ie da tiempo ilimitado para responder a reactivos presentados en
orden creciente de dificultad. Por consiguiente, las calificaciones indican
el nurnero de reactivos a las que se respondio de manera correcta 0 bien
dicho de otro modo, el nivel de dificultad alcanzado. Por otro lado 5~
encuentr~n las prueba~ de limite de tiempo 0 velocidad. En las pruebas
de velocidad, los reactivos son tan sencillos que cualquiera pueda respon De E. E. Cureton y sus colaboradores, The Multi-Aptitude Test, Nueva York: The
Psychological Corporation, 1955.
J6
Construccion de pruebas psicologtcas
(Capttulo 2)
" ;~\ ~~,rlps con facilidad, en el caso de que cuente con un tiempo suficiente
para ello; sin embargo, se establecen lfmites de tiempo para que sean pocas
.
personas, las que puedan concluir la prueba, en el caso de que haya alguna.
En ese caso, las calificaciones reflejan diferencias en la velocidad de respuestas y no en la dificultad.
La mayoria de las pruebas caen entre esos dos extremos. Una buena.
regia practica, que se utiliza con frecuencia en las pruebas de rendimiento y
aptitudes, es establecer limites de tiempo que permitan que aproximadamente 90% de los sujetos concluyan en el tiernpo permitido. Adernas, si
'isei,disponen .105 reactivos en orden de dificultad creciente, la mayor ia de
!~~.,Jlers6nas podran completar todos aquellos a los que puedan responder de
~d a,Pl"(\anera:.correcta. Las ventajas administrativas de este procedimiento son
evidentes.

CRITERIOS DE CALIFICACION Y EJEMPLOS DE
RESPUESTAS: VOCABULARIO
.
En general, es aceptable cualquier significado reconocido de la palabra,
sin tomar en cuenta la elegancia de la expresion. Sin embargo, la pobreza
de contenido se castiga hasta cierto punto; la indicacion de que se tienen
conocimientos vagos del sentido de la palabra no permite obtener la maxima
calificacion, Las respuestas a las palabras 1-3 se califican con 2 6 0, mientras que todas las dernas se califican con 2, I 6 O. Damos a continuaci6n
principios generales para calificar las respuestas a los reactivos del vocabulario.
2 Puntos
I. Un buen sin6nimo.
2. Un u'~o importante .
3. Una 0 mas caracterfsticas primarias 0 definitivas.
4 Clasificacion general a la que pertenece la palabra.
5. Varias caracterfsticas descriptivas correctas que no son precisamente definitivas pero que indiquen acumulativamente la
cornprension de la palabra.
6. Para los verbos, un ejernplo definido de la accion 0 relacion
causaL
Cali1icaciones
. EI tercer elernento de la estandarizacion es el de las calificaciones
objetivas. La objetivldad implica un acuerdo entre dos 0 mas calificadores
at { .competentes (preparados), De modo ideal, el acuerdo entre diferentes
callflcadores tiene que ser perfecto. En la practica, sobre todo en el caso
de-reactivos de respuestas libres, dicho acuerdo sera mucho menos completo.
Una regia empirica consiste en considerar la calificaci6n como objetiva
,: ~'" slel acuerdo promedio entre pares de calificadores competentes es de 90%
'~nlo(mas, S610 en el caso de que la calificacion sea objetiva se podran atribuir
-:.~ ... [as, diferencias entre las calificaciones a las diferencias existentes entre los
tlr5l\t.sujetos exarninados,'
'.' z ' :
',. , .
c.
,.
Punto
, j _ . .
"
I. Una respuesta que no sea incorrecta; pero que tenga pobreza de

contenido.
.
2. Un sinonimo vago 0 inexacto.
3. Un uso menor, poco desarrollado 0 mal explicado.
4. ~tributos,que sean correctos: pero que no scan deflnitivos 0 no
incluyan caracteristicas distintivas,
5. Un ejernplo en el que se utilice la palabra rnisma, sin desarrollo.
6. ~efinici6~, ~o.rr:~ta de una forma relacionada de la palabra; por
ejernplo, pnsa en lugar de "apresurado"; "obstruccion" en
lugar de "obstruido" .
~*I'..l'..!..-L~Un: cuando se dispone de una gran cantidad de tecnicas de cali fica~~tr'Ci6t\;lde'sdemanualeshasta las que utilizan maquinas califlcadoras electro1.'::1.'" nieas de alta velocldad, los requerimientos de la ::calificici6n objetiva se
,
, pueden reducir a tres etapas baslcas. La primera es la del registro inmediato
ycarente de arnbiguedades de la respuesta. Tanto si el sujeto efectua una
mlirCa en tina hoia de respuesta IBM, como si escribe una letra, una palabra,
un numero, una frase 0 un ensayo, 0 responde en forma oral, su respuesta
se ;registrara de manera inmediata y completa. Este registro perrnanente
evita las distorsiones posibles debidas a perdldas de la memoria y propor.;<u;
ciona.las bases para Ia clasiflcacion de las respuestas.
-f", "). :
I"
P:
37
I.
EI segundo requisito es una Iista de respuestasestandar 0 correctas

osea, u~a clave d~. califlcacien, Para un examen deelecciones multiples,
esta clave tiene que incluir el numero 0 la letra de la respuesta correcta
acada pregunta; para los reactivos de respuestas cortas se tratara de una
Iista de las respuestas correctas y las variaciones aceptables; para un ensayo,
se da un bosquejo de los puntos que se deben tocar. En el caso de un inventario de la personalidad, la clave designata las respuestas que indiquen la
presencia (Q la ausencia) del rasgo 0 la caracterfstica que se mida. Si res-
Puntos
I. Respuestas claramente erroneas.
2. Verbalismos; por ejernplo, "Reparar un automovil", cuando la
encuesta demuestre que no hay una comprension real.
Fig. 2-4.
Ejemplo de un manual de califi~acione.: Escala de inteligencia de Wechsler

para adultos (WAIS).
38
n:
'
Construccion de pruebas pstcologicas
(Capitulo 2)
Construccton de pruebas psicologtcas
39
3. Las-respuestas con una gran pobreza de contenido 0 que sean

muy vagas, incluso despues de hacer preguntas al respecto.
puestas diferentes reciben pesos diferentes, estos pesos deberan indicarse

en la clave.
Para los reactivos especfficos, se muestra un criterio general de calificaci6n para cada palabra, al nivel de 2 puntos, dando a continuaci6n varios
ejemplos de respuestas. En algunos casos, se da un criterio general para las
calificaciones de I punto y 0 puntos, con varios ejernplos. Para otros reactivos no hay una generalizaci6n apropiada a los niveles de credito que van mas
al!Ade los proporcionados por los criterios generales de calificaci6n y s610
sei dan ejernplos de respuestas, Por supuestoj- esaslistas contienen s610 unas
cuantas de las numerosas respuestas que son posibles 0 que puedan dar los
sujetos. No obstante, tienen como finalidad complementar las definiciones
dadas en los diccionarios y los principios generales de calificaci6n, de tal
modo que se facilite la tarea de calificar la prueba con exactitud.
EI tercer requisito es un procedimiento para comparar las respuestas

dadas por el sujeto con las que figuran en la clave esto es, un procedimiento
para c1asificar objetivamente las respuestas. En los reactivos de elecci6n
alternativa, tales como los de elecciones multiples, este procedimiento es
directo y evidente, Cuando el buen juicio del calificador puede ser uno de
los factores irnportantes, como sucede al calificar exarnenes de ensayos,
es preciso desarroIIar indicaciones detalladas para la asignacion de las calificaciones. En el manual de (WAIS) Escala de Inteligcncia Wechsler para
Adultos (ver la fig. 2-4), se da un ejernplo excelente de especificaciones
para la calificacion. Este manual de calificaciones proporciona ilustraciones de las respuestas aceptables y las variaciones permitidas. EI calificador cornpara las respuestas dadas por un individuo con los ejernplos
proporcionados en el manual de calificaciones y, a continuaclon, asigna
a cada respuesta la calificacion de la respuesra muestra que mas se acerque.
Aun cuanJo este procedimiento no asegura un acuerdo perfecto en tre los
calificadores, logra que la calificaci6n sea objetiva .
EJEMPLOS DE RESPUESTAS; VOCABULARIO*
1. Silla
.? puntas - un mueble para sentarse: asiento
sentarse... scntarse para comer
1 punta - mueble hecho de madera
opuntas - asentarse... objeto suave... estar en una reuni6n
2. Enero
2 puntas - primer mes del ano

un meso .. el primer meso .. un mes de invierno frio
1 punta - despues de diciembre... comienza el afio... Afio Nuevo
es el 1 de enero
opuntos - un dios romano
3. Construcci6n
2 puntos - edificar 0 constituir algo; algo edificado sistematicamente construir... erigir algo.. unir mediante un plan
1 punto - construir un edificio... hacer... procesar una casa
opuntos - dividir... apretar, reunir... utll
Fig. 2-4. Ejemplo de un manual de calificaciones: Escala de inteligencia de Wechsler
para adultos (WAIS) (cont.l.
Para preservar la seguridad del WAIS, no se utilizaron los reactivos reales. Los vocablos
hipoteticos ernpleados son similares a los reales de la subprueba de vocabulario y el
fonnato del manual de calificaclones es identico aI del manual del WAIS. Reproducida
con autorizacion, Copyright 1955 by the Psychological Corporation, Nueva York,
N.Y. Derechos reservados,
AN A.L1SIS PSICOMETRICO
La apucacion de los procedirnientos analiz ados antes, solo asegurara
una cosa: que la calificacion dada a un individuo rcfleje sus capacidades
o sus caractcr isticas de pel sonalidad , y no las peculiaridades 0 las vicisitudcs
de la situacion de prueba. No proporcionan Una respuesta para las preguntas
irnportantes como: i.hasta que punta son consistentes las calificaciones de
la prueba? ;,Que es 10 que rnide la prueba? i.Que inf'erencia se puedc sacar
de las calificaciones de la prueba? i.Como se pueden interpretar las calificaciones de la prueba? A estas preguntas sole se pucde dar una respuesta
mediante un analisis adicional, del que nos ocuparernos brevemente a continuacion, Sin embargo, la importancia se indica por el espacio que sc II.:
dcdica en cap itulos posteriores de este libro, y no por e l enfasis que hacernos
aqui.
Confiabilidad
A menos que una prucba proporcione medidas consistentes, se podra

tener muy poca fe en la exactitud de sus calificacione s Es decir un individuo debera obtener, aproxirnadamente, las misrnas calificaciones en cada
aplicacion de una prueba. Sin consistencia, estas mcdiciones Son analoga
a la medicion de distancias con una regla de caucho. Se obtendrian resultados difercntes en cada ocasi6n (medtclon). depcnd ier.do de 10 que se estirnru
la regia.
.
40
Construccion de pruebas psicologicas ,
(Capttulo 2)
La estimacion del grado de consistencia de una medicion, 10 que se
"
conoce como confiabilidad de la prueba, requiere ya sea la aplicacion de

la prueba dos veces, la aplicaci6n de formas equivalentes de la prueba 0 el
analisis de su estructura interna. En la practica, esto significa que el constructor debe obtener una muestra representativa de sujetos, aplicar uno de
los procedimientos mencionados y calcular un coeficiente de confiabiIidad.
Puesto que hay diferentes tipos de confiabilidad, apropiados en situaciones
diferentes, el constructor de la prueba debera reunir varios tipos de pruebas
de confiabilidad en diversas muestras (ver los capftulos 5 y 6).
Validez
La caracteristica mas importante de una prueba es su validez -0 sea,
la extension con la que la prueba debe medir. Sin pruebas de la validez
de una prueba no sabremos 10 que mide en realidad; asi, no sera posible
interpretar 0 dar un significado a las calificaciones.
Puesto que los reactivos que constituyen la prueba se seleccionaron
parcialmente sobre la base de su poder discriminative, tendrernos la segur idad de que las calificaciones tendran cierta validez. Sin embargo, puesto
que la prueba como un total puede ser algo mas que una suma de sus partes
(los reactivos), es necesario reunir datos de validez, utilizando la prueba
en su forma final. Esto significa que es preciso utilizar la prueba en varias
situaciones, en una gran varied ad de grupos y determinando su eficacia
(ver los capitulos 7 y 8). Puesto que la validez es una situacion especifica,
la recopilacion de los datos de validez es esencialmente un proceso interminable. La obligaci6n del constructor de la prueba es la de proporcionar
datos suficientes para saber que caracteristicas mide y que criterios predice
Datos normativos
Los resultados de las pruebas tienen por si mismos poco significado.
S610 alcanzan un significado cuando se compara una calificaci6n individual
con los resultados obtenidos por otras personas en la misrna prueba, Al
comparar las calificaciones de un individuo con las de otras personas en una
. poblaci6n especificada (que se llama grupo normative), obtenemos una
indicaci6n de su desernpefio relativo en cornparacion al de otros de la misma
poblaci6n. Asi, el constructor de la prueba puede reunir datos que muestran
el desempeno de un grupo pertinente de personas. Puesto que, en la mayorfa
de los casas, deseamos cornparar las calificaciones de los individuos con las
de varies grupos diferentes, el que desarrolla la prueba debe proporcionar
datos utiles para varios grupos normativos. Por otra parte, puesto que las
calificaciones en las pruebas psicologicas se expresan por 10 cornun en escalas
que no son de calificaciones brutas, el constructor de la prueba debe desarrolIar tam bien escalas apropiadas para cxpresar las calificaciones (ver los capftulos 10 y 1 I).
41
Hemos indicado ya que para que la prueba se pueda aplicar a mas de

un grupo se necesitaran datos normativos para cada g~po, puesto que
,
.,
. A' . m es precise obrener datos
todos tendran vartaciones entre S1.
SI mlS 0., .
: .
adicionales de validez y confiabilidad, puesto que una prueba que es valida
(0 confiable) en una situacion , no 10 sera necesari~~ente en otra: aun~lue
sea muy similar. Por ende, la reunion de [nformacion ~~bre u~la prueba es
un proceso continue, que se debe seguir en tanto se utilice el ll1strumento.

Construcción de Pruebas (Brown)

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Construcción de Pruebas (Brown)

Hochgeladen von

Copyright:

Verfügbare Formate

Construccton de pruebas psicologicas

Brown, F. (1980) Medicin en

'~ . ,~. ,,' Antes de iniciar el analisis de la construccion de pruebas psicologicas,

Comprobacion V aOlilisis de los reactivos

I Estructuracibn de la formafinal de la prueb~

Prueba lista parautilizarse

En segundo lugar, existen pruebas publicadas disponibles en la mayorta

Construccion de pruebas psicol6giCtU

sus calificaciones. EI mayor inconveniente es el de que puede no haber

LO QUE REPRESENT AN LAS PRUEBAS

Construccton de pruebas pstcologicas

o bien, tomemos en consideracion la inteligcncia. Uno de los modos

Construccion de pruebas pstcolozicas

persona en una situacion cualitativamente diferente. Por ejernplo, aunque

." ....... '!.'

REPRESENTACION POR PREDICCION

III "ril6bDU'~dlstfh'ci6n entre las pruebas representativas y las de prediccion se

Construccion de pruebas psicologicas

Desde un punta de vista pragmatico, el constructor de pruebas tiene

La distincion no es una dicotomia clara, ya que la misma prueba

Una prueba utilizada como predictor es una muestra de conducta, en un sentido

Construccion de pruebas psicologicas

~tfo"'f;'~~)JJ':"rr'-",T I ' : " " ' ! ! . ' - 1 "

"",~ i[~HE~tdel grupo

at que se destina la prueba. En este caso, el constructor de

Construccion de pruebas pslcologicas

Si ~a .prueb~ p~ic?logica se desarrolla para medir algun rasgo 0 alguna

~rlCitlN,l~ p.R;l.~b,a; debe to~ar, ~n consideracion ~ariables tales co.mo la ed~d de

" . qutenes 10 tomaran, nivel intelectual, educacion, or/genes socloeconcmicos y

CONTENIDO DE LAS PRUEBAS

proebas psicologlcas para medir el alcance de una lista especificada de objetivos

Los planes de Ulla prueba psicol6gica

Construccion de pruebas pslcologicas

Construcci6n de pruebas psico/6gicas

Prueba de.estadfsticas descriptivas

alternativas, como en los reactivos de comparacion, elecclon multi.

Fig. 2-2. Elemplo de plan d! prueba.

lmportancia relativa que se atribuye a cada categoria de contenido de

ALGUNAS DIMENSIONES COMUNES DE

Respuesta a1temativa vs. libre. En un reactivo de respuesta a1t~r

Papel y lapiz vs. ejecucion. Esta distincion se refiere al modo en

Aplicaci6n colectiva vs, individ ual, Las pruebas colectivas sc

Cualquier prueba combinara varias de esas dimensiones; es dccir,

Construccion de pruebas psicologtcas

Como en la mayoria de los casos, cualquier reactivo puede presentarse

Despues de tomar esas decisiones preliminares, quien desarrolla la prue:

"varias opciones para actuar.

Tomemos en consideraci n as uentes que

.L' \'podrian utilizarse para desarrollar reactivos individuales. "Para un examen

Construccion de pruebas pslcologicas

Los reactivos que sobreviven a esta seleccion inicial se combinan, a

':J$idoit'es f debates en clase, como fuentes para las preguntas, En contraste,

EI procesode desarrollo de buenosreactivos es la redacci6n, correcci6n,

prueba y revision, A'continuacion, se repiten estas etapas hasta desarrollar

:s Aun cuando utilizaremos el

Construccian de pruebas psicologicas

Construccion de pruebas psicologicas

lIl..1: ~;(' ~~s.toJocurre,.se

Despues de efectuar los cambios editoriales finales que se consideren

~r in" .j'j.')!;:fEb' las medidas de'~jecubion tfpica, el procedimiento an'Alogo detennina

1tI r. cOmo; criterio.

pendiente, han side identificadas como dominantes.

El tercer tipo de informacion obtenida mediante un analisis de reactivos

: :'Jor En " situaciones especiflcas, se pueden realizar otros analisis,