Clase 2 - D - Análisis de Reactivos y Estandarización de Pruebas

Anlisis de
Reactivos y
estandarizacin
de Pruebas
Docente: Ps. Jos Luis Corts
ANALISIS DE REACTIVOS Y
ESTANDARIZACIN DE
PRUEBAS
Anlisis
de reactivos se centra en el funcionamiento

de reactivos individuales, mientras que la
estandarizacin de pruebas se ocupa de la
interpretacin normativa de los resultados de la
prueba en su conjunto o de algunas de las partes o
subpruebas que la integran.
Se
deben analizar las respuestas de esa muestra

piloto para determinar si los reactivos estn
funcionando de manera adecuada.
Cualquiera que sea el tipo de prueba,
estandarizada o elaborada por el maestro, de
habilidad o de personalidad, un anlisis post mortem
o post hoc de los resultados es necesario.
Validez de reactivo
A
fin de evaluar la utilidad de un reactivo como

medida de las diferencias individuales en cuanto
a las caractersticas de habilidad o de
personalidad, se requiere un criterio externo de
medida de dicho rasgo.
La
validez de un reactivo para predecir una

posicin con base en un criterio externo puede
determinarse al correlacionar las calificaciones
de un reactivo (0 para los errores y 1 para los
aciertos) con las calificaciones de la medida de
criterio.
Se
han usado distintos tipos de coeficientes de

correlacin para este propsito; el ms comn
es el coeficiente biserial puntual,
nt = la cantidad total de examinados.

np = la cantidad de examinados que resuelven correctamente el
reactivo
Yp = la media de las calificaciones de criterio de quienes pasan el
reactivo,
Y = la media de todas las calificaciones de criterio,
s, = la desviacin estndar de todas las calificaciones de criterio.
Conclusin de peso en
evaluacin.
Mayor
correlacin entre reactivo y criterio= ms

preciso ser el reactivo como predictor del
criterio.
Coef. de .20 o menores pueden contribuir a
predecir el criterio, se prefieren coeficientes ms
elevados.
No solo correlacin entre reactivo y criterio, sino
tambin de la correlacin del reactivo con otros
reactivos de la prueba.
Son mejores los reactivos que tienen correlaciones
elevadas con el criterio, pero bajas con otros
reactivos, porque representan una contribucin
ms independiente a la prediccin de
calificaciones de criterio.
No
hay un criterio externo fcilmente disponible

contra el cual validar los reactivos de las pruebas
de aprovechamiento en el aula: entonces
usamos consistencia interna.
El
procedimiento ms breve consiste en dividir a

los examinandos en tres grupos segn sus
calificaciones en la prueba como un todo: un
grupo superior formado por el 27% que obtuvo las
calificaciones ms altas, un grupo inferior
compuesto por el 27% que tuvo las calificaciones
ms bajas, y el restante 46% incluido en un grupo
intermedio, luego se realiza el siguiente clculo.
Up y Lp son la cantidad de individuos que hay en los

grupos superior e inferior, respectivamente, y que
aciertan en el reactivo; U y L son el nmero total de
personas en los grupos superior e inferior (obsrvese
que U = L), respectivamente. Al valor de p se le
conoce como ndice de dificultad del reactivo y al
de D como ndice de discriminacin del reactivo.
Slo porque la forma como se responde un reactivo

vara de grupo a grupo no quiere decir necesariamente
que un reactivo est sesgado en contra de alguno de
los grupos. Tcnicamente, un reactivo se considera
sesgado slo cuando mide algo distinto una
caracterstica o rasgo diferente en un grupo con
respecto a otro.
A pesar de sus desventajas, los ndices de dificultad y de

discriminacin de reactivos proporcionan informacin
til sobre el funcionamiento de los reactivos individuales.
En general, se ha descubierto que el anlisis de reactivos
produce mejoras considerables en la eficacia de las
pruebas. En particular, el ndice de discriminacin de
reactivos es una medida bastante adecuada de la
calidad del reactivo.
ESTANDARIZACIN Y NORMAS
DE LAS PRUEBAS.
Los datos sobre el desempeo de un grupo numeroso

de individuos, como aquellos en quienes se basa el
diseo de un instrumento, son tiles para propsitos de
interpretacin de calificaciones.
La estandarizacin tambin incluye aplicar la prueba a

una muestra grande de personas (la muestra de
estandarizacin) aleccionada como representante de
la poblacin meta a la que est destinada la prueba.
Toda prueba estandarizada tiene instrucciones

estndar de aplicacin y calificacin que deben
seguirse estrictamente, sin dejar lugar a la
interpretacin personal o al sesgo.
El
principal propsito de estandarizar una prueba

es determinar la distribucin de puntuaciones
eradas en la muestra de estandarizacin (grupo
norma). Las calificaciones crudas obtenidas se
transforman entonces en alguna forma de
calificaciones derivadas o normas.
Los
principales tipos de normas son equivalentes

de edad, de grado, rangos de percentilares y
calificaciones estndar.
Este
mtodo de interpretacin con referencias a

normas, las normas obtenidas no funcionan como
estndares del desempeo deseado, sino
simplemente como un marco de referencia para
interpretar calificaciones.
Normas indican la posicin de una persona en la
prueba con respecto a la distribucin de las
calificaciones obtenidas por personas de la misma
edad cronolgica, grado, sexo u otras
caractersticas demogrficas.
Seleccin de una muestra de

estandarizacin
Muestreo aleatorio sencillo, cada uno de los miembros

de la poblacin meta tiene la misma oportunidad de
ser seleccionado, pero aleatoriedad no garantiza que
haya representatividad.
Muestreo aleatorio estratificado, se reduce la

probabilidad de elegir una muestra atpica o sesgada,
categorizar, o estratificar, la poblacin de una serie de
variables demogrficas (sexo, edad, nivel
socioeconmico, regin geogrfica y similares) que
presumiblemente estn relacionadas con las
calificaciones de la prueba. Entonces la cantidad de
individuos seleccionados al azar de cada categora o
estrato es proporcional al nmero total de personas de
la poblacin que caen en ese estrato.
El
muestreo por grupos: dividir una regin

geogrfica designada o alguna otra
entidad relevante en bloques o grupos
luego elige al azar un porcentaje
especificado de los grupos y dentro de
cada uno se selecciona aleatoriamente
una cantidad determinada de
subunidades (escuelas, residencias, etc.).
Normas de calificacin
estndar
A
diferencia de los rangos percentilares,

las calificaciones estndar representan la
medicin en una escala de intervalos.
Las
normas de calificacin estndar son

puntuaciones convertidas que tienen
cualesquier media y desviacin estndar
deseadas.
Calificaciones z
X es una puntuacin cruda dada, X es la media

aritmtica, y s es la desviacin estndar de las
puntuaciones crudas.
Transformar puntuaciones crudas en calificaciones z

produce una distribucin de calificaciones con la
misma forma, pero con una media y desviacin
estndar distintas a la distribucin de la puntuacin
cruda (X).
Media de las calificaciones z es 0, y la desviacin

estndar es 1.
Calificaciones Wechsler.
Las puntuaciones crudas en las subpruebas de las
escalas de inteligencia de Wechsler se transformaron

para tener una media de 10 y desviacin estndar de
3. No obstante, las puntuaciones verbales, de
ejecucin y de escala total (CIs de desviacin) en las

pruebas de Wechsler se convirtieron a una distribucin
con una media de 100 y desviacin estndar de 15

(vea las ltimas dos lneas de la figura 4.3).
Otra
escala de calificacin es la calificacin

estanina (nueve estndar).
En esta escala estndar normalizada, que tiene
una media de 5 y desviacin estndar de
aproximadamente 2, hay nueve rangos distintos, o
estaninas.
Calificacin estanina no es una verdadera escala
de calificaciones estndar, porque la primera y la
novena estanina estn abiertas.
Equilibrar la tendencia a considerar las
calificaciones de pruebas como medidas precisas,
invariables, de las diferencias individuales.
Otro
procedimiento que tiene el mismo efecto

es registrar no slo el rango percentilar o la
calificacin estndar correspondiente a una
puntuacin cruda dada, sino tambin un rango
percentilar o un intervalo de calificacin
estndar dentro de los cuales pueda esperarse
razonablemente que caiga la verdadera
posicin.

Clase 2 - D - Análisis de Reactivos y Estandarización de Pruebas

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Clase 2 - D - Análisis de Reactivos y Estandarización de Pruebas

Hochgeladen von

Copyright:

Verfügbare Formate

Anlisis de

de reactivos se centra en el funcionamiento

deben analizar las respuestas de esa muestra

fin de evaluar la utilidad de un reactivo como

validez de un reactivo para predecir una

han usado distintos tipos de coeficientes de

nt = la cantidad total de examinados.

correlacin entre reactivo y criterio= ms

hay un criterio externo fcilmente disponible

procedimiento ms breve consiste en dividir a

Up y Lp son la cantidad de individuos que hay en los

Slo porque la forma como se responde un reactivo

A pesar de sus desventajas, los ndices de dificultad y de

Los datos sobre el desempeo de un grupo numeroso

La estandarizacin tambin incluye aplicar la prueba a

Toda prueba estandarizada tiene instrucciones

principal propsito de estandarizar una prueba

principales tipos de normas son equivalentes

mtodo de interpretacin con referencias a

Seleccin de una muestra de

Muestreo aleatorio sencillo, cada uno de los miembros

Muestreo aleatorio estratificado, se reduce la

muestreo por grupos: dividir una regin

diferencia de los rangos percentilares,

normas de calificacin estndar son

X es una puntuacin cruda dada, X es la media

Transformar puntuaciones crudas en calificaciones z

Media de las calificaciones z es 0, y la desviacin

Las puntuaciones crudas en las subpruebas de las

escalas de inteligencia de Wechsler se transformaron

ejecucin y de escala total (CIs de desviacin) en las

con una media de 100 y desviacin estndar de 15

escala de calificacin es la calificacin

procedimiento que tiene el mismo efecto

Das könnte Ihnen auch gefallen