Sie sind auf Seite 1von 19

Anlisis de

Reactivos y
estandarizacin
de Pruebas
Docente: Ps. Jos Luis Corts

ANALISIS DE REACTIVOS Y
ESTANDARIZACIN DE
PRUEBAS
Anlisis

de reactivos se centra en el funcionamiento


de reactivos individuales, mientras que la
estandarizacin de pruebas se ocupa de la
interpretacin normativa de los resultados de la
prueba en su conjunto o de algunas de las partes o
subpruebas que la integran.

Se

deben analizar las respuestas de esa muestra


piloto para determinar si los reactivos estn
funcionando de manera adecuada.
Cualquiera que sea el tipo de prueba,
estandarizada o elaborada por el maestro, de
habilidad o de personalidad, un anlisis post mortem
o post hoc de los resultados es necesario.

Validez de reactivo
A

fin de evaluar la utilidad de un reactivo como


medida de las diferencias individuales en cuanto
a las caractersticas de habilidad o de
personalidad, se requiere un criterio externo de
medida de dicho rasgo.

La

validez de un reactivo para predecir una


posicin con base en un criterio externo puede
determinarse al correlacionar las calificaciones
de un reactivo (0 para los errores y 1 para los
aciertos) con las calificaciones de la medida de
criterio.

Se

han usado distintos tipos de coeficientes de


correlacin para este propsito; el ms comn
es el coeficiente biserial puntual,

nt = la cantidad total de examinados.


np = la cantidad de examinados que resuelven correctamente el
reactivo
Yp = la media de las calificaciones de criterio de quienes pasan el
reactivo,
Y = la media de todas las calificaciones de criterio,
s, = la desviacin estndar de todas las calificaciones de criterio.

Conclusin de peso en
evaluacin.
Mayor

correlacin entre reactivo y criterio= ms


preciso ser el reactivo como predictor del
criterio.
Coef. de .20 o menores pueden contribuir a
predecir el criterio, se prefieren coeficientes ms
elevados.
No solo correlacin entre reactivo y criterio, sino
tambin de la correlacin del reactivo con otros
reactivos de la prueba.
Son mejores los reactivos que tienen correlaciones
elevadas con el criterio, pero bajas con otros
reactivos, porque representan una contribucin
ms independiente a la prediccin de
calificaciones de criterio.

No

hay un criterio externo fcilmente disponible


contra el cual validar los reactivos de las pruebas
de aprovechamiento en el aula: entonces
usamos consistencia interna.

El

procedimiento ms breve consiste en dividir a


los examinandos en tres grupos segn sus
calificaciones en la prueba como un todo: un
grupo superior formado por el 27% que obtuvo las
calificaciones ms altas, un grupo inferior
compuesto por el 27% que tuvo las calificaciones
ms bajas, y el restante 46% incluido en un grupo
intermedio, luego se realiza el siguiente clculo.

Up y Lp son la cantidad de individuos que hay en los


grupos superior e inferior, respectivamente, y que
aciertan en el reactivo; U y L son el nmero total de
personas en los grupos superior e inferior (obsrvese
que U = L), respectivamente. Al valor de p se le
conoce como ndice de dificultad del reactivo y al
de D como ndice de discriminacin del reactivo.

Slo porque la forma como se responde un reactivo


vara de grupo a grupo no quiere decir necesariamente
que un reactivo est sesgado en contra de alguno de
los grupos. Tcnicamente, un reactivo se considera
sesgado slo cuando mide algo distinto una
caracterstica o rasgo diferente en un grupo con
respecto a otro.

A pesar de sus desventajas, los ndices de dificultad y de


discriminacin de reactivos proporcionan informacin
til sobre el funcionamiento de los reactivos individuales.
En general, se ha descubierto que el anlisis de reactivos
produce mejoras considerables en la eficacia de las
pruebas. En particular, el ndice de discriminacin de
reactivos es una medida bastante adecuada de la
calidad del reactivo.

ESTANDARIZACIN Y NORMAS
DE LAS PRUEBAS.

Los datos sobre el desempeo de un grupo numeroso


de individuos, como aquellos en quienes se basa el
diseo de un instrumento, son tiles para propsitos de
interpretacin de calificaciones.

La estandarizacin tambin incluye aplicar la prueba a


una muestra grande de personas (la muestra de
estandarizacin) aleccionada como representante de
la poblacin meta a la que est destinada la prueba.

Toda prueba estandarizada tiene instrucciones


estndar de aplicacin y calificacin que deben
seguirse estrictamente, sin dejar lugar a la
interpretacin personal o al sesgo.

El

principal propsito de estandarizar una prueba


es determinar la distribucin de puntuaciones
eradas en la muestra de estandarizacin (grupo
norma). Las calificaciones crudas obtenidas se
transforman entonces en alguna forma de
calificaciones derivadas o normas.

Los

principales tipos de normas son equivalentes


de edad, de grado, rangos de percentilares y
calificaciones estndar.

Este

mtodo de interpretacin con referencias a


normas, las normas obtenidas no funcionan como
estndares del desempeo deseado, sino
simplemente como un marco de referencia para
interpretar calificaciones.
Normas indican la posicin de una persona en la
prueba con respecto a la distribucin de las
calificaciones obtenidas por personas de la misma
edad cronolgica, grado, sexo u otras
caractersticas demogrficas.

Seleccin de una muestra de


estandarizacin

Muestreo aleatorio sencillo, cada uno de los miembros


de la poblacin meta tiene la misma oportunidad de
ser seleccionado, pero aleatoriedad no garantiza que
haya representatividad.

Muestreo aleatorio estratificado, se reduce la


probabilidad de elegir una muestra atpica o sesgada,
categorizar, o estratificar, la poblacin de una serie de
variables demogrficas (sexo, edad, nivel
socioeconmico, regin geogrfica y similares) que
presumiblemente estn relacionadas con las
calificaciones de la prueba. Entonces la cantidad de
individuos seleccionados al azar de cada categora o
estrato es proporcional al nmero total de personas de
la poblacin que caen en ese estrato.

El

muestreo por grupos: dividir una regin


geogrfica designada o alguna otra
entidad relevante en bloques o grupos
luego elige al azar un porcentaje
especificado de los grupos y dentro de
cada uno se selecciona aleatoriamente
una cantidad determinada de
subunidades (escuelas, residencias, etc.).

Normas de calificacin
estndar
A

diferencia de los rangos percentilares,


las calificaciones estndar representan la
medicin en una escala de intervalos.

Las

normas de calificacin estndar son


puntuaciones convertidas que tienen
cualesquier media y desviacin estndar
deseadas.

Calificaciones z

X es una puntuacin cruda dada, X es la media


aritmtica, y s es la desviacin estndar de las
puntuaciones crudas.

Transformar puntuaciones crudas en calificaciones z


produce una distribucin de calificaciones con la
misma forma, pero con una media y desviacin
estndar distintas a la distribucin de la puntuacin
cruda (X).

Media de las calificaciones z es 0, y la desviacin


estndar es 1.

Calificaciones Wechsler.

Las puntuaciones crudas en las subpruebas de las

escalas de inteligencia de Wechsler se transformaron


para tener una media de 10 y desviacin estndar de
3. No obstante, las puntuaciones verbales, de

ejecucin y de escala total (CIs de desviacin) en las


pruebas de Wechsler se convirtieron a una distribucin

con una media de 100 y desviacin estndar de 15


(vea las ltimas dos lneas de la figura 4.3).

Otra

escala de calificacin es la calificacin


estanina (nueve estndar).
En esta escala estndar normalizada, que tiene
una media de 5 y desviacin estndar de
aproximadamente 2, hay nueve rangos distintos, o
estaninas.
Calificacin estanina no es una verdadera escala
de calificaciones estndar, porque la primera y la
novena estanina estn abiertas.
Equilibrar la tendencia a considerar las
calificaciones de pruebas como medidas precisas,
invariables, de las diferencias individuales.

Otro

procedimiento que tiene el mismo efecto


es registrar no slo el rango percentilar o la
calificacin estndar correspondiente a una
puntuacin cruda dada, sino tambin un rango
percentilar o un intervalo de calificacin
estndar dentro de los cuales pueda esperarse
razonablemente que caiga la verdadera
posicin.

Das könnte Ihnen auch gefallen