Sie sind auf Seite 1von 35

DISEO Y

ELABORACIN DE
LOS TEST
Lewis R. Aiken (1996)

DISEO Y
ELABORACIN
DE LOS TEST
Definicin
de la
prueba

Eleccin
del mtodo
de
escalamien
to

Elaboraci
n de los
reactivos

Anlisis de
los
reactivos

Revisin de
la prueba

Publicacin
de la
prueba

Definicin de la
prueba

Planeaci
n de un
test

La elaboracin de test requiere la


identificacin
de
propsitos
especficos,
puesto
que
el
proceso de elaboracin vara de
acuerdo con el propsito que se
pretenda lograr.
De manera ideal, la elaboracin
de una prueba u otro instrumento
psicomtrico comienza con la
definicin de las variables o
constructos
que
van
a
medirse y con el esbozo del
contenido propuesto.

Cules son los


temas y
materiales
sobre los que
se examinar a
los
estudiantes?

Planeacin
de un test

Cmo debe
calificarse y
evaluarse la
prueba
resuelta?

Cundo,
dnde y cmo
debe
administrarse
la prueba?

Para
planificar las
pruebas de
rendimiento
de un saln
de clases:

Qu tipos de
preguntas
deben
elaborarse?

Qu formatos
o esquemas de
reactivo y
pruebas deben
utilizarse?

Qu debe medir?

Definicin
de la
prueba

En qu debe diferenciarse de
las pruebas existentes?
Cmo podra una nueva prueba
hacer una contribucin til al
campo?

Definicin
de la
prueba

Kaufman y Kaufman (1983), en


su propuesta de la Bateria de
Evaluacin
para
Nios
describieron el objetivo de
manera explcita y plantearon un
nuevo enfoque para la medicin
de la inteligencia mucho antes
de que empezaran a elaborar los
reactivos de la prueba.

La
psicometr
a se
organiza
en 3
bloques
abarca lo relativo a
la fundamentacin
terica
de
la
medicin.

Teora de
la
medicin

incluye lo relativo
al
proceso
de
construccin
de
escalas de medida,
es
decir,
los
mtodos para la
construccin
de
escalas
psicolgicas
y
psicofsicas.
Escalamie

nto

incorpora
lo
relativo a cmo
evaluar
esas
escalas y a cmo
utilizarlas
para
medir objetos o
sujetos, es decir, la
lgica y modelos
matemticos
subyacentes a la
construccin y uso
Teora
de
de los test.

los Tests

El objetivo de usar teoras


es para estimar la fiabilidad
y la validez de los tests, lo
cual es imprescindible para
poder usar los tests de
forma rigurosa y cientfica.
Teoras psicolgicas
Teoras estadsticas

Teora de
la
medicin

Las escalas de medicin en


psicologa
es
utilizar
los
procedimientos matemticos para
asignar nmeros e identificar
atributos fsicos y psicolgicos
que permitan poner en claro las
diferencias individuales.
Una escala de medida permite al
investigador determinar el tipo de
anlisis estadsticos que deber
utilizar para examinar una prueba
y as poder considerarla como
buena.

La
medicin y
las teoras
psicolgic
as.

Existen diversas teoras que


tratan sobre la razn por la cual
las personas se comportan como
lo
hacen.
Algunos
tericos
centran el nfasis en la herencia
y el ambiente como modeladores
del comportamiento humano.
Las teoras de los tipos, de los
rasgos,
psicoanalticas,
fenomenolgicas, etc., son tiles
como gua hacia la medicin y
comprensin de la personalidad.

Eleccin del
mtodo de
escalamiento

Eleccin
del
mtodo de
escalamie
nto

El propsito inmediato de la medicin


psicolgica es asignar nmeros a las
respuestas en una prueba, de modo
que pueda juzgarse si el examinado
posee la caracterstica medida en
mayor o menor grado.
Los constructores de las pruebas
seleccionan el mtodo de escalamiento
que se adapte de manera ptima a la
forma en que conceptualizaron el rasgo
o rasgos medidos por su instrumento.

Mtodos de
escalamiento
(representativ
os)
Ordenamiento
de Expertos

Los mtodos de escalamiento


diferentes niveles de medicin:

producen

Ordenamiento
de Expertos

Mtodos de
intervalos
aparentemente
iguales

Mtodo de
escalamiento
absoluto

Escalas Likert

Escalas de
Guttman

Mtodo de
clave emprica

Ordenamiento de expertos
Ejemplo:
Suponga que queremos medir la profundidad del estado de coma en
pacientes que sufrieron una lesin enceflica reciente que los dej
inconscientes. Una escala de profundidad del estado de coma sera muy
importante para predecir el curso de la mejora, porque es bien sabido
que un periodo prolongado de inconciencia entraa un mal pronstico
para la recuperacin final. Adems, el personal de rehabilitacin tiene la
necesidad prctica de saber si un paciente est sumido en un coma
profundo o en un estado parcialmente comunicativo de semiconciencia.
Una aproximacin al escalamiento de la profundidad del coma sera
confiar en los ordenamientos conductuales de los expertos. Por
ejemplo, podramos pedir a un grupo de neurlogos que incluyeran en
una lista los comportamientos del paciente asociados a diferentes
niveles de conciencia. Despus de que los expertos hayan presentado
una larga lista de conductas diagnsticas, los creadores de la prueba (de
preferencia, expertos en lesiones de la cabeza) podran ordenarlas en un
continuo de conciencia que va del coma profundo a la orientacin bsica.
Teasdale y Jennett (1974) hicieron un uso preciso de este enfoque para
elaborar la Escala de Coma de Glasgow.

observando al paciente
y
observando
al
paciente y asignando el
nivel
ms
alto
de
funcionamiento en cada
una
de
las
tres
subescalas. En cada
subescala se supone
que el paciente exhibe
todos los niveles de
conducta por debajo del
nivel
calificado.
Por
consiguiente, desde el
punto
de
vista
psicomtrico, la escla
consta
de
tres
subescalas
(ojos,
respuesta
verbal
y
respuesta motriz), cada
una de las cuales

Adems
de
los
ordenamientos, es
posible calcular la
puntuacin general
que es algo ms
que una escala
ordinal.
La
puntuacin total en
la Escala de Coma
de Glasgow predice
la
recuperacin
posterior con un
grado muy alto de
precisin (Jennett,
Teasdale y KnillPruebas
Jones, 1975).
psicolgicas
bastante
sencillas
obtenidas
por
medio
de
los
mtodos
ms
simples
de
escalamiento

Mtodo de intervalos aparentemente iguales


L. L. Thurstone en 1929 propuso un mtodo para la construccin de escalas
de nivel intervalar a partir de afirmaciones de actitud. La metodologa real de
la construccin de intervalos aparentemente iguales es algo compleja , pero
la lgica que subyace es sencilla de explicar (Ghiselli, Campbell y Zedeck,
1981).
Pasos implicados en la elaboracin de una escala de actitudes hacia la
pertenencia a la iglesia.
Ejemplo: p. 135 y 136 Gregory

Mtodo de escalamiento absoluto


En 1925 Thurstone desarroll tambin el mtodo de escalamiento
absoluto, un procedimiento para obtener una medida de la
dificultad absoluta del reactivo a partir de los resultados de
examinados de diferentes grupos de edad.
La metodologa: en esencia, se aplica un conjunto comn de
reactivos a dos o ms grupos de edad. La dificultad relativa de esos
reactivos para los distintos grupos de edad es la base para hacer
una serie de comparaciones entrelazadas para todos los reactivos y
todos los grupos de edad, uno de los cuales funciona como grupo
base.
La dificultad del reactivo se mide en unidades comunes como las
unidades de desviacin estndar de habilidad para el grupo base.
Es muy utilizado en la evaluacin grupal de aprovechamiento y
aptitud (Donlon, 1984).
Ejemplo: p. 136 Gregory (2012)

Escalas Likert
En 1932 Likert propuso un mtodo sencillo para el escalamiento de
actitudes que todava se utiliza ampliamente en la actualidad. Una escala
Likert presenta al examinado cinco respuestas ordenadas sobre un
continuo de acuerdo/desacuerdo o de aprobacin/desaprobacin.
Ejemplo: un reactivo de una escala que evala la actitudes hacia la
pertenencia a la iglesia podra ser:

Los servicios religiosos me dan inspiracin y me ayudan a dar lo


mejor de mi durante la siguiente semana.
Est usted:
Totalmente
De
Indeciso
En
Totalmente
De acuerdo de la acuerdo
Dependiendo
redaccin de un reactivo individual, una respuesta
externa
desacuerdo
de Totalmente en
de desacuerdo
acuerdo o totalmente en desacuerdo indicar
la respuesta ms favorable en la actitud subyacente medida en el
cuestionario. Likert (1932) asign una puntuacin de 5 a esta respuesta
extrema, 1 al extremo opuesto, y 2, 3, y 4 a las respuestas intermedias.
Para obtener la puntuacin total de la escala se suman las puntuaciones de
los reactivos individuales, de ah que una escala Likertse conoce tambin
como una escala sumativa.

Escalas de Guttman
Los participantes que apoyan una afirmacin tambin coinciden con
afirmaciones ms moderadas relacionadas con el mismo continuo
subyacente (Guttman, 1947). Es decir, si se conoce la afirmacin ms
externa del continuo con que puede coincidir un examinado, tambin
es posible reconstruir las propuestas intermedias.
Beck (1988) utiliz el escalamiento tipo Guttman para producir los
reactivos individuales de su inventario de depresin:
( ) a veces me siento triste o melanclico.
( ) a menudo me siento triste o melanclico.
( ) la mayor parte del tiempo me siento triste o
melanclico
( ) siempre me siento triste o y no puedo soportarlo.

Se pide a los clientes que en cada grupo marquen la afirmacin que


sientan que mejor los describe. Es casi seguro que un cliente que
muestra su aprobacin por la alternativa extrema (por ejemplo,
siempre me siento triste o y no puedo soportarlo) tambin estar
de acuerdo con afirmaciones ms moderadas.

Mtodo de clave emprica


Tambin es posible construir pruebas que se basan por completo en
consideraciones empricas que no dependen de la teora o de un
juicios expertos. En el mtodo de clave emprica los reactivos de una
prueba se selecciona segn lo bien que distinguen a un grupo criterio
de una muestra normativa. Por ejemplo, a partir de un conjunto de
preguntas de un inventario de personalidad del tipo verdadero o falso
podra determinarse una escala de depresin del siguiente modo:
Ejemplo: p. 137 Gregory (2012)
El mtodo de clave clnica puede solicitar algunas sorpresas
interesantes un hallazgo comn es que algunos reactivos elegidos
para una prueba no exhiben una relacin evidente con el constructo
medido. Por ejemplo, la prueba de depresin podra incluir un
reactivo como bebo mucho agua (que en la clave se codifica como
verdadero) por la sencilla razn de que el reactivo funciona. Desde
luego, los investigadores enfrentan el reto de determinar por qu
funciona. Sin embargo, desde el punto de vista prctico de la
construccin emprica de la prueba, las consideraciones tericas son
de importancia secundaria.

Construccin racional de la escala


(consistencia interna)

El enfoque racional a la construccin de la prueba mtodo comn


en el desarrollo de inventarios de autoinforme de personalidad.
En este mtodo los reactivos de la escala tienen una correlacin
positiva entre s Y con la puntuacin total del escala.
Ejemplo: p. 138 Gregory (2012)
El enfoque racional para la elaboracin del instrumento produce
simplemente una prueba homognea pensada para medir un
constructo especfico. Se necesitarn estudios adicionales con
nuevas muestras de sujetos para determinar la confiabilidad y
validez de la nueva prueba.

Niveles de
medicin

Segn
Stevens
(1946), todos los
nmeros
derivados
de
cualquier tipo de
instrumento de
medicin pueden
colocarse en una
de
cuatro
categoras
jerrquicas que
definen un nivel
de medicin (del
menos al ms
informativo):

Nomina
l
Ordinal
De
Interval
o
De
Razn

Nominal

Los nmeros solo fungen como nombres de categoras.


Ej. Mujeres 1, Hombres 2

Constituye una forma de ordenamiento o clasificacin.


No ofrece informacin sobre la fuerza relativa de los
Ordinal
ordenamientos.

Niveles de
medicin

Ofrece informacin acerca del ordenamiento, pero


tambin una medida para calcular las diferencias entre
ordenamientos. Podemos tambin hacer la suposicin de
que los intervalos entre los puntos de esta escala son
De
aproximaciones entre iguales. Se basa en el supuesto de
Intervalo
que la escala subyacente cuanta con unidades o
intervalos de igual tamao.

Posee todas las caractersticas de una escala de


intervalo, pero tambin tiene un punto cero
De Razn conceptualmente significativo en el que hay una
ausencia total de la caracterstica medida.

Niveles de
Medicin

Los niveles de medicin son importantes para la


elaboracin de las pruebas porque los
procedimientos estadsticos paramtricos ms
poderosos (como la r de Pearson, el anlisis de
varianza y regresin mltiple) slo deben usarse
en puntuaciones derivadas de mediciones que
cumplen los criterios de las escalas de intervalo
o de rango. En el caso de las escalas que solo
son nominales u ordinales deben emplearse
procedimientos estadsticos no paramtricos que
son menos poderosos (chi cuadrada, correlacin
de rangos ordenados y las pruebas de mediana).
En la prctica, se supone que la medicin que
emplea la mayora de los instrumentos
importantes de la evaluacin psicolgica (en
especial las pruebas de inteligencia y las escalas
de personalidad) se aproxima al nivel de
intervalo, aunque en realidad es muy difcil
demostrar la igualdad absoluta de los intervalos
para estos instrumentos (Bausell, 1968 en
Gregory 2012).

Elaboracin
de Reactivos

ESTRUCTUR
A DE LOS
REACTIVOS
SEGN SU
TIPO

una estructura diferente segn su tipo


comparten entre ellos ciertos elementos.
Algunos presentan una base o pregunta
que se ofrece a travs de un texto,
imagen o grfica, que dota de un
contexto a la informacin que se
pretende tratar y, sobre la cual el alumno
trabajar para resolver algn problema
cognitivo.
Otros
parten
solamente
del
planteamiento o pregunta y pueden
ofrecer o no, opciones de respuesta.
Entre los tipos de reactivos que presentan
opciones, se encuentran los reactivos de
opcin mltiple, los de falso y verdadero
y los de correlacin.
Los reactivos que evitan ofrecer opciones,
entre ellos los de respuesta breve y los
de ensayo, pueden estructurarse de una

Tipos de
reactivo
segn su
estructura

de
correlacin
o relacin
de
columnas

de
respuesta
breve,
complemen
to o canev

de
jerarquizaci
n u
ordenamien
to

reactivos
de base
comn o
multitem

de falso y
verdadero

de opcin
mltiple o
simple

eleccin de
elementos
de un
listado

Tipos
de
reactiv
os

reactivos
de ensayo o
composici
n por temas

Das könnte Ihnen auch gefallen