Beruflich Dokumente
Kultur Dokumente
nto de mapeo de las estrategias desarrolladas en los años 1990 , en conjunción con la
configuración estándar llevadas a cabo para la Evaluación
Nacional de Educación Progreso (NAEP) por los investigadores en América del Colegio de
Pruebas (ACT). Las primeras técnicas de mapeo de ítems se aplicaron
menos como establecimiento de estándares procedimientos per se que como mecanismos de
retroalimentación integrados en otros procedimientos (cf. Loomis y Bourque, 2001).
En 1996, por ejemplo, los investigadores en ACT emplean un elemento de mapeo de pro-
cedimiento en conjunción con un método que se refiere a como Mean Estimación,
que era esencialmente una extensión de la modificado Angoff (1971) técnica. Ese elemento de
mapeo procedimiento se aplica a las pruebas con tanto de opción múltiple y de respuesta
construida (Loomis, Bay, Yang, y Hanick , 1999). Elemento mapas se
utilizaron para proporcionar retroalimentación después de una segunda
ronda de partida calificaciones para el 1996 la evaluación de la Ciencia y la NAEP
1998 Civismo y escritura Assessment mentos . Los mapas muestran la ubicación de cada
elemento en relación a la NAEP- como escala de puntuación, la
cual fue también asociada con los diversos NAEP nivel de logro descriptores (ALD, los
cuales están ahora comúnmente se hace referencia a que el nivel de
rendimiento descriptores). Cada opción
múltiple artículo fue mapeado en conformidad con su probabilidad de respuesta correcta para
cada puntuación de la escala, y cada respuesta construida elemento se asigna una
vez para cada puntuación
de punto, que es, para la probabilidad de obtener una puntuación de 1, 2, 3
o más en cada punto de escala.
Las técnicas de mapeo de ítems evolucionaron a lo largo de varios estudios de
establecimiento de estándares NAEP en ACT. La tabla Reckase ( Reckase , 2001) se
introdujo como una forma de simplificar el conjunto de tareas ante los participantes. Con
los cuadros Reckase , los participantes recibirían sus estimaciones de ítems de la Ronda 2
(es decir, la probabilidad de una respuesta correcta por parte de un alumno en el puntaje de
corte para ítems de opción múltiple y el puntaje bruto estimado para ítems de respuesta
construida para este mismo alumno o grupo de alumnos ), junto con una tabla o "mapa"
preimpreso de probabilidades de elementos.
En la Tabla 10-1 se muestra una tabla de muestra de Reckase para un participante
individual. Se desarrollaría un gráfico Reckase único basado en las calificaciones de
los artículos de cada participante . La primera columna en el gráfico Reckase que
se muestra en la tabla
presenta puntajes escalados ordenados de mayor a menor . Los puntajes escalados se usan e
n los gráficos de Reckase como una medida de la competencia o habilidad general del
examinado en cualquier construcción que se mida por la prueba. Cada
una de las columnas restantes contiene información sobre un solo elemento. La Tabla 10-1
muestra información sobre cinco ítems: los ítems 1–4 se puntúan dicotómicamente
como ítems de formato de opción múltiple y el ítem 5 es un ítem de respuesta
construida calificado en una escala de 0–5. Para las opciones
múltiples artículos, los datos en cada columna indican la probabilidad de que un examinado
en cada puntuación en la escala de contestar correctamente ese artículo, basado en el de tres
parámetros elemento de respuesta del modelo. Por ejemplo, un examinado con un nivel de
habilidad general (es decir, puntaje escalado) de 170 tiene una probabilidad de .53 de
responder correctamente el ítem 1. Para los ítems de respuesta construida, los valores en
una columna muestran el puntaje esperado del ítem para los examinados en una ubicación
de puntaje escalado dado. Considerando de nuevo un examinado con un nivel de capacidad
de 170, la puntuación esperada de que examinado en el elemento de respuesta
construida (punto 5) es 1,8 a cabo de 5.
En la Tabla 10-1, un valor en cada columna aparece entre paréntesis; es de
esta manera que los gráficos Reckase se individualizan para cada participante. Cuando se
usa como retroalimentación en el estándar de ajuste, Reckase gráficos ayuda a los
participantes a medir
cómo constantemente se están aplicando su conceptualización de la mínimamente
competente examinando, limítrofe candidato, o lo que sea hipotética persona
examinada se considera. El Reckase diagrama de un participante que está aplicando
constantemente su o su conceptualización se muestran entre
paréntesis alineados en una sola fila. Por ejemplo, considere al participante cuyos juicios
resultaron
en los valores mostrados en la tabla. En adición, vamos nosotros suponemos que el particip
ante realizó una implícita conceptualización que la mínimamente cualificado examinado es
uno con un nivel de habilidad (representado por una calificación en escala) de 170. La
lectura a través de la fila de la tabla corresponde a un escalado puntuación de 170, nos ver
que la estimación de probabilidad (es decir, la calificación de Angoff ) generada por este
participante fue de .53; este participante dice que la probabilidad de que un examinado con
calificación mínima responda correctamente al punto 1 es .53. Ahora bien, si este
participante aplicaban su conceptualización de la mini- Mally examinando calificado
constantemente, él o ella habría generado
un Angoff calificación de 0.83 por artículo 2, 0,34 para el artículo 3, y de 0,77 para
el artículo 4. Por el de respuesta
construida artículo (artículo 5), este participante podría haber estimado
el mínimamente cualificado del examinando la puntuación a ser de 1,8 a cabo del 5.
Sin embargo, a partir del cuadro Reckase que se muestra en la Tabla 10-1, el participante
puede ver que no está haciendo juicios totalmente consistentes. Para los restantes tres de
opción múltiple artículos (puntos 2-
4), el participante ha estimado los artículos a ser más difícil de lo que son para una persona
examinada de capacidad de nivel 170. Por ejemplo, para
el artículo 2, el participante juzgados la persona examinada mínimamente cualificado tener
una probabilidad de .57 de éxito en el artículo cuando,
utilizando el estándar implícito en la calificación de este participante del Artículo 2, la califi
cación del Artículo 2 debería haber sido .83. Para el elemento de respuesta construida, el
revisor exhibió más coherente el comportamiento con su o su implícita estándar de
rendimiento como lo demuestra el hecho de que su calificación de Punto 5 del 1.5 está muy
cerca de la puntuación elemento de respuesta construida esperado de 1,8 para los
examinados con un total capacidad nivel de 170. Si este participante se siendo
perfectamente coherente, los corchetes valores serían ser alineados en una fila corre pondie
nte a un solo nivel de habilidad (escalado puntuación).
Tabla 10-1 puede ser pensado de como una temprana elemento mapa. A partir
de esta fundación, que era no un gran paso para redefinir el elemento de
mapeo procedimiento mediante la reordenación de los elementos en función de su
dificultad. Loomis, Hanick , Bahía, y Crouse (2000) informaron sobre pruebas de campo
para la prueba NAEP Civismo 1998 en el
que los ítem mapas fueron reordenados de menos a más difíciles artículo. Estas artículo ma
pas también incluyen breves descripciones de contenido de los ítems, lo que permitió a los
participantes, de un vistazo, para resumir tanto la ubicación y el contenido de un artículo
y para reformular sus propios juicios de esos artículos. De dificultad de los ítems
ordenados mapas con contenido de la información y
la probabilidad de correcta respuesta, el salto a un pedido de
prueba manual con semejante información era una corta pero sig uno signifi-. Los
investigadores de la CTB / McGraw-Hill dado ese salto y la intro ducido el método de
Marca (Lewis, Mitzel , y Green, 1996).
p(x 1 | i , j ) exp ( i j ) /
El lector que está familiarizado con el trabajo de Wright y de piedra (1979) va a darse
cuenta de que nos hemos utilizado ligeramente diferente notación de que
la fuente. Nuestra sustitución de y que representan la capacidad
examinado y elemento dificultad, respectivamente, es un intento de hacer
que la notación utilizada en el anterior Explica ción más coherente con la norma noción a
través
de la familia de IRT modelos. (Nosotros deberíamos también observamos otra pequeña pero i
mportante diferencia entre un 2/3 decisión regla y un RP67 regla. Si una respuesta de
probabilidad de 0,67 había sido utilizada, la ecuación 10-10 podría haber
sido i j 0,708; que es, se podría haber sido calculada por tomar la del elemento de
dificultad , más la natural, logaritmo de 0.67 / 0.33.) el uso de la última consecuencia de la
ecuación 10-10 para montar la OIB es sencillo. Para artículos SR, para calcular el valor
de i necesario para tener una oportunidad de responder a un tema determinado
correctamente SR 2/3, pero se añaden 0,693
a la Rasch dificultad valor para que artículo, donde la Rasch dificultad de la que se obtiene
un elemento mediante el uso de un programa de calibración IRT (por ejemplo,
WINSTEPS). Como es quizás evidente, cuando la Rasch modelo se utiliza para crear un OI
B con artículos SR, el procedimiento se acaba de describir se traducirá en el mismo orden
de las
partidas en la OIB como si el folleto había sido ensamblada usando los artículos b val ues.
Este resultado sería no es probable ocurrir, sin embargo, para
los artículos calibrados usando un 2PL o modelo 3PL. Como veremos un poco más
adelante, estos mismos valores utilizados para determinar la ubicación de
los elementos SR en el folleto de prueba ordenado por dificultad también se utilizan para
determinar el puntaje bruto asociado con la configuración de un marcador justo después
de este elemento en el OIB.
Localizar la ubicación adecuada de los elementos CR en el OIB es solo un poco
más complicado. Para localizar los puntos de puntaje de los ítems de CR en el OIB dentro
de un marco Rasch , se utiliza el Modelo de crédito parcial (PCM; Wright & Masters,
1982). En la siguiente discusión, el procedimiento se ilus -
trated para un CR artículo con cinco puntuación de puntos (0, 1, 2, 3, 4 ); sin
embargo, la lógica se aplica a elementos con cualquier número de pasos.
Para empezar, para CR artículos, la probabilidad ( nix ) de una persona con un dado A
exp ( n ij )
0 n i1
n i1 (Ecuación 10-13)
los
4 n i1 i2 i3 i4 (Ecuación 10-16)
Los valores exponenciales de estas sumas que se muestran en las ecuaciones 10-12 a
10-16 son simplemente el logaritmo natural e elevado a los valores respectivos, es decir:
Mitzel y col. (2001) señalan que la probabilidad de una respuesta correcta, p (x 1), a
un elemento de SR dado es una función de la capacidad examinado ( ), punto dif difi-
(b j ), elemento de discriminación (a j ), y un umbral o probabilidad variable de (c j )
en conformidad con la fundamental ecuación de la de tres parámetros Logis tic
(3PL) modelo:
p(x 1 | ) c j (1 c j ) /
N De PAGS PAGS
u no
m m
e
The
r
ta
a
d
o
r
1 2 3
o o o
00 1 2 3 4 4 Su 0 0 1 2 3 4 4 Tot me me me 4 4
ma al jor jor jor
1.0 0.0 0,0 0.0 0.0 1.0 0.9 0.0 0,0 0.0 0.0 1.0 0.00 0,00 0.00 0.0
4.0 00 07 00 00 00 075 926 074 001 000 000 000 74 01 00 00
0 0 4 1 0 0 0
1.0 0.0 0,0 0.0 0.0 1.0 0,9 0.0 0,0 0.0 0.0 1.0 0.00 0,00 0.00 0.0
3.9 00 07 00 00 00 076 925 075 001 000 000 000 75 01 00 00
9 0 5 1 0 0 0
1.0 0.0 0,0 0.0 0.0 1.0 0.9 0.0 0,0 0.0 0.0 1.0 0.00 0,00 0.00 0.0
3.9 00 07 00 00 00 077 924 075 001 000 000 000 76 01 00 00
8 0 6 1 0 0 0
1.0 0.0 0,0 0.0 0.0 1.0 0.9 0.0 0,0 0.0 0.0 1.0 0.00 0,00 0.00 0.0
3.9 00 07 00 00 00 077 923 076 001 000 000 000 77 01 00 00
7 0 7 1 0 0 0
1.0 0.0 0,0 0.0 0.0 1.0 0.9 0.0 0,0 0.0 0.0 1.0 0.00 0,00 0.00 0.0
3.9 00 07 00 00 00 078 922 077 001 000 000 000 78 01 00 00
6 0 8 1 0 0 0
1.0 0.0 0,0 0.0 0.0 1.0 0.9 0.0 0,0 0.0 0.0 1.0 0.00 0,00 0.00 0.0
3.9 00 07 00 00 00 079 922 078 001 000 000 000 78 01 00 00
5 0 8 1 0 0 0
1.0 0.0 0,0 0.0 0.0 1.0 0.9 0.0 0,0 0.0 0.0 1.0 0.00 0,00 0.00 0.0
3.9 00 07 00 00 00 080 921 078 001 000 000 000 79 01 00 00
4 0 9 1 0 0 0
1.0 0.0 0,0 0.0 0.0 1.0 0.9 0.0 0,0 0.0 0.0 1.0 0.00 0,00 0.00 0.0
3.9 00 08 00 00 00 081 920 079 001 000 000 000 80 01 00 00
3 0 0 1 0 0 0
1.0 0.0 0,0 0.0 0.0 1.0 0.9 0.0 0,0 0.0 0.0 1.0 0.00 0,00 0.00 0.0
3.9 00 08 00 00 00 081 919 080 001 000 000 000 81 01 00 00
2 0 1 1 0 0 0
1.0 0.0 0,0 0.0 0.0 1.0 0.9 0.0 0,0 0.0 0.0 1.0 0.00 0,00 0.00 0.0
3.9 00 08 00 00 00 082 919 081 001 000 000 000 81 01 00 00
1 0 1 1 0 0 0
1.0 0.0 0,0 0.0 0.0 1.0 0.9 0.0 0,0 0.0 0.0 1.0 0.00 0,00 0.00 0.0
3.9 00 08 00 00 00 083 918 082 001 000 000 000 82 01 00 00
0 0 2 1 0 0 0
1,6 1.0 2.0 4.3 5.1 2.3 14, 0,0 0.1 0.2 0,3 0.1 1.0 0.93 0,79 0.49 0.1
4 00 95 92 03 16 909 671 406 946 423 554 000 29 23 77 55
0 9 9 9 4 4
1,6 1.0 2.1 4.4 5.2 2.4 15, 0,0 0.1 0.2 0,3 0.1 1.0 0,93 0,79 0,50 0.1
5 00 17 81 59 10 268 655 386 935 444 579 000 45 59 23 57
0 0 7 3 9 9
1,6 1.0 2.1 4.5 5.4 2.5 15, 0,0 0.1 0.2 0,3 0.1 1.0 0.93 0.79 0,50 0.1
6 00 38 72 19 09 639 639 367 924 465 604 000 61 93 70 60
0 3 2 5 3 4
1,6 1.0 2.1 4.6 5.5 2.6 16. 0,0 0.1 0.2 0,3 0.1 1.0 0.93 0,80 0,51 0.1
7 00 59 64 84 11 020 624 348 912 486 630 000 76 28 16 63
0 8 6 5 7 0
1,6 1.0 2.1 4.7 5.7 2.7 16, 0,0 0.1 0.2 0,3 0.1 1.0 0.93 0,80 0,51 0.1
8 00 81 58 54 18 413 609 329 899 506 656 000 91 62 62 65
0 5 8 6 3 6
1,6 1.0 2.2 4.8 5.9 2.8 16, 0,0 0.1 0.2 0.3 0.1 1.0 0.94 0,80 0.52 0.1
9 00 03 55 29 29 817 595 310 887 526 682 000 05 95 08 68
0 4 0 9 2 2
N De PAGS PAGS
u no
m m
e
Th
r
et
a
a
d
o
r
1 2 3
o o o
00 1 2 3 4 4 Su 0 0 1 2 3 4 4 To me me me 4 4
ma tal jor jor jor
1, 1.0 2.2 4.9 6.1 2.9 17. 0,0 0,1 0.2 0.3 0.1 1.0 0,94 0.81 0,52 0.1
7 00 25 53 10 44 233 580 291 874 546 709 00 20 28 54 70
0 0 5 0 4 7 0 9
1, 1.0 2.2 5.0 6.2 3.0 17, 0,0 0,1 0.2 0.3 0.1 1.0 0,94 0.81 0,53 0.1
7 00 47 53 96 64 662 566 273 861 565 735 00 34 61 00 73
1 0 9 1 5 9 0 5
1, 1.0 2.2 5.1 6.4 3.1 18. 0,0 0,1 0.2 0.3 0.1 1.0 0,94 0.81 0,53 0.1
7 00 70 55 88 89 103 552 254 848 584 762 00 48 93 46 76
2 0 5 2 3 9 0 2
1, 1.0 2.2 5.2 6.6 3.3 18, 0,0 0,1 0.2 0,3 0.1 1.0 0.94 0,82 0,53 0.1
7 00 93 59 85 20 558 539 236 834 603 789 00 61 25 92 78
3 0 3 3 9 1 0 9
1, 1.0 2.3 5.3 6.8 3.4 19. 0,0 0,1 0.2 0.3 0,1 1.0 0.94 0.82 0,54 0,1
7 00 16 65 89 55 027 526 217 820 621 816 00 74 57 37 81
4 0 4 6 5 6 0 6
1, 1.0 2.3 5.4 7.0 3.5 19. 0,0 0.1 0.2 0.3 0,1 1.0 0.94 0.82 0,54 0,1
7 00 39 73 99 96 509 513 199 806 639 844 00 87 88 82 84
5 0 6 9 3 6 0 4
1, 1.0 2.3 5.5 7.3 3.7 20. 0,0 0.1 0.2 0.3 0.1 1.0 0.95 0,83 0,55 0.1
7 00 63 84 15 43 006 500 181 791 657 871 00 00 19 28 87
6 0 2 5 5 4 0 1
1, 1.0 2.3 5.6 7.5 3.8 20. 0,0 0.1 0.2 0.3 0,1 1.0 0,95 0.83 0,55 0,1
7 00 86 97 38 96 518 487 163 777 674 899 00 13 49 53 89
7 0 9 3 3 2 0 9
1, 1.0 2.4 5.8 7.7 4.0 21. 0,0 0.1 0.2 0.3 0,1 1.0 0,95 0.83 0,56 0,1
7 00 10 12 67 55 046 475 146 762 691 927 00 25 79 18 92
8 0 9 4 9 2 0 7
1, 1.0 2.4 5.9 8.0 4.2 21. 0,0 0.1 0.2 0,3 0.1 1.0 0,95 0.84 0,56 0.1
7 00 35 29 04 20 590 463 128 747 707 955 00 37 09 62 95
9 0 1 9 5 7 0 5
1, 1.0 2.4 6.0 8.2 4.3 22, 0,0 0.1 0.2 0.3 0.1 1.0 0,95 0,84 0,57 0.1
8 00 59 49 48 92 150 451 110 731 724 983 00 49 38 07 98
0 0 6 6 2 9 0 3
1, 1.0 2.4 6.1 8.4 4.5 22, 0,0 0.1 0.2 0.3 0.2 1.0 0,95 0,84 0,57 0.2
8 00 84 71 99 72 727 440 093 716 740 012 00 60 67 51 01
1 0 3 9 4 2 0 2
1, 1.0 2.5 6.2 8.7 4.7 23, 0,0 0,1 0.2 0,3 0.2 1.0 0,95 0.84 0.57 0.2
8 00 09 96 58 58 322 429 076 700 755 040 00 71 95 96 04
2 0 3 5 3 8 0 0
1, 1.0 2,5 6.4 9.0 4.9 23, 0,0 0,1 0.2 0.3 0.2 1.0 0,95 0,85 0,58 0.2
8 00 34 23 25 53 936 418 059 684 770 069 00 82 23 40 06
3 0 5 7 0 0 0 9
1, 1.0 2,5 6.5 9.2 5.1 24, 0,0 0,1 0.2 0.3 0.2 1.0 0.95 0.85 0,58 0.2
8 00 60 53 99 55 568 407 042 667 785 098 00 93 51 84 09
4 0 0 5 9 2 0 8
1, 1.0 2.5 6.6 9.5 5.3 25, 0,0 0,1 0.2 0.3 0.2 1.0 0.96 0.85 0,59 0.2
8 00 85 85 83 65 220 397 025 651 800 127 00 03 78 27 12
5 0 7 9 1 6 0 7
1, 1.0 2.6 6.8 9.8 5.5 25, 0,0 0.1 0.2 0.3 0.2 1.0 0,96 0.86 0.59 0.2
8 00 11 21 74 84 892 386 009 634 814 157 00 14 05 71 15
6 0 7 0 9 5 0 7
1, 1.0 2.6 6.9 10. 5.8 26. 0,0 0,0 0.2 0.3 0,2 1.0 0.96 0.86 0,60 0,2
8 00 37 58 17 12 584 376 992 618 828 186 00 24 32 14 18
7 0 9 8 5 4 0 6
1, 1.0 2,6 7.0 10. 6.0 27, 0,0 0,0 0.2 0.3 0.2 1.0 0,96 0.86 0,60 0.2
8 00 64 99 48 49 299 366 976 601 841 216 00 34 58 57 21
8 0 5 3 5 6 0 6
(Continuado)
1 2 3
o o o
Th 0 0 1 2 3 44 Su 0 0 1 2 3 4 4 To me me me 4 4
et m tal jor jor jor
a a
1, 1.0 2,6 7.2 10. 6.2 28. 0,0 0,0 0.2 0.3 0.2 1.0 0.96 0.86 0.61 0.2
8 00 91 42 80 96 03 357 960 583 854 246 00 43 83 00 24
9 0 2 7 4 5 5 0 6
1, 1.0 2.7 7.3 11. 6.5 28, 0,0 0,0 0.2 0.3 0.2 1.0 0.96 0.87 0.61 0.2
9 00 18 89 13 53 79 347 944 566 867 276 00 53 09 43 27
0 0 3 1 4 5 4 0 6
1, 1.0 2.7 7.3 11. 6.5 28, 0,0 0,0 0.2 0.3 0.2 1.0 0.96 0.87 0.61 0.2
9 00 18 89 13 53 79 347 944 566 867 276 00 53 09 43 27
0 0 3 1 4 5 4 0 6
1, 1.0 2.7 7.5 11. 6.8 29, 0,0 0,0 0.2 0.3 0.2 1.0 0.96 0,87 0.61 0.2
9 00 45 38 47 21 57 338 928 549 879 306 00 62 34 85 30
1 0 6 3 3 0 7 0 6
1, 1.0 2.7 7.6 11. 7.0 30, 0,0 0,0 0.2 0.3 0.2 1.0 0.96 0.87 0.62 0.2
9 00 73 90 82 99 38 329 913 531 891 336 00 71 58 27 33
2 0 2 6 2 3 5 0 6
1, 1.0 2.8 7.8 12. 7.3 31, 0,0 0,0 0.2 0,3 0.2 1.0 0,96 0.87 0.62 0.2
9 00 01 46 18 89 21 320 897 513 902 367 00 80 82 69 36
3 0 1 0 2 1 8 0 7
1, 1.0 2.8 8.0 12. 7.6 32. 0,0 0,0 0.2 0,3 0.2 1.0 0.96 0.88 0.63 0.2
9 00 29 04 55 90 07 312 882 495 913 397 00 88 06 11 39
4 0 2 5 3 6 7 0 7
1, 1.0 2.8 8.1 12, 8.0 32, 0,0 0,0 0.2 0.3 0.2 1.0 0.96 0,88 0.63 0.2
9 00 57 66 93 04 96 303 867 477 924 428 00 97 30 52 42
5 0 7 2 5 5 4 0 8
1, 1.0 2,8 8.3 13, 8.3 33, 0,0 0,0 0.2 0.3 0.2 1.0 0.97 0,88 0.63 0.2
9 00 86 31 32 31 87 295 852 459 935 459 00 05 53 94 45
6 0 4 1 9 1 8 0 9
1, 1.0 2.9 8.4 13. 8.6 34, 0,0 0,0 0.2 0.3 0.2 1.0 0.97 0,88 0,64 0.2
9 00 15 99 73 71 82 287 837 441 945 490 00 13 76 35 49
7 0 4 4 5 1 1 0 0
1, 1.0 2.9 8.6 14. 9.0 35, 0,0 0,0 0.2 0.3 0.2 1.0 0.97 0,88 0.64 0.2
9 00 44 71 15 25 79 279 823 422 954 521 00 21 98 76 52
8 0 7 1 4 0 4 0 1
1. 1.0 2.9 8.8 14, 9.3 36, 0,0 0,0 0.2 0.3 0.2 1.0 0,97 0.89 0.65 0.2
9 00 74 46 58 93 79 272 808 404 963 553 00 28 20 16 55
9 0 3 3 5 3 9 0 3
2, 1.0 3.0 9.0 15. 9,7 37. 0,0 0,0 0,2 0.3 0.2 1.0 0.97 0,89 0.65 0.2
0 00 04 25 02 76 83 264 794 385 972 584 00 36 42 56 58
0 0 2 0 9 7 5 0 4
2, 1.0 3.0 9.2 15, 10. 38, 0,0 0,0 0.2 0.3 0.2 1.0 0.97 0.89 0.65 0.2
0 00 34 07 48 17 90 257 780 367 981 616 00 43 63 96 61
1 0 4 3 7 5 4 0 6
2, 1.0 3.0 9.3 15. 10. 40, 0,0 0,0 0.2 0.3 0.2 1.0 0,97 0.89 0,66 0.2
0 00 64 93 95 59 00 250 766 348 989 647 00 50 84 36 64
2 0 9 3 8 1 7 0 7
2, 1.0 3.0 9.5 16, 11. 41, 0,0 0,0 0.2 0,3 0.2 1.0 0.97 0.90 0.66 0.2
0 00 95 83 44 02 14 243 752 329 997 679 00 57 05 76 67
3 0 7 1 4 3 6 0 9
NOTA: Los valores de paso son .9, .9, 1.49 y 2.43 para los puntos de
puntuación 1, 2, 3 y 4, respectivamente.
1.00
0,90
0,80
0,70
0,60
P 0.50
0,40
0,30
0,20
0,10
0.00
Theta
Figura 10-2 Curvas características de respuesta para los puntos de puntuación 0–4 (según
los datos de la tabla 10-3, escala de Rasch )
1.00
0,90
0,80
0,70
0,60
P 2/3
P 0.50
0,40
0,30
0,20
0,10
0.00
Theta
Figura 10-3 Probabilidad de obtener un puntaje de puntaje dado o mejor en función de la
capacidad (según los datos de la tabla 10-3, escala de Rasch )
b j 0,693 / 1.7a j (Ecuación 10-24) (De nuevo, tenía la RP sido 0,67, en lugar de
z jk (k 1) j ji ; (Ecuación 10-26)
los artículos. Procedimientos similares a aquellos para establecer ING valores de para cada
punto de la puntuación de cada uno CR artículo dentro de un Rasch trabajo marco pueden
ser establecidas para el 2PL modelo.
Como ilustramos en el contexto de Rasch , proporcionamos una parte de una hoja de
cálculo de Excel para un conjunto de cálculos, en este caso para un elemento hipotético de
CR de 3 puntos, cuando se usa un modelo 2PL. La hoja de cálculo aparece como la Tabla
10-4; Los valores de paso asociados con cada uno de los tres puntos de puntuación se
proporcionan en la parte inferior de la tabla. Y, también como antes, ilustramos
las curvas características de respuesta asociadas con cada opción para ese ítem (Figura 10-
4) y las curvas asociadas con la probabilidad de obtener una puntuación dada o mejor en el
ítem (Figura 10-5).
1 2
01 2 3 Su 0 0 1 2 3 ot om Me 3
0 ma ot ejor jor
al
NOTA: Los valores de paso son -0.33, 1.513 y 3.149 para los puntos de
puntuación 1, 2 y 3, respectivamente.
1.000
0.900
0.800
0.700
0.600
PAGS 0.500
0.400
0.300
0.200
0.100
0,000
Theta
1.000
0.900
0.800
0.700
0.600
P 2/3
P 0.500
0.400
0.300
0.200
0.100
0,000
Theta
Figura 10-5 Probabilidad de obtener un puntaje de puntaje dado o
mejor en función de la capacidad (según los datos de la
tabla 10-4, escala 2PL )
Una vez que los participantes han expresado sus juicios al colocar uno (o
más) marcadores en la OIB, estos juicios se pueden traducir en puntuaciones
reducidas. En un enfoque tradicional de Marcadores, la traducción de
la colocación de marcadores para reducir
la puntuación es sencilla. Por ejemplo, supongamos que
un participante ha colocado su o su marcador en la página 39 de una de 50
páginas OIB distinguir entre Competente y Avanzado niveles de
rendimiento. Esto no corresponde a un puntaje de corte bruto de 39; más
bien, como hemos indicado anteriormente, esta marca indica el juicio del
participante que los examinados
clasificada como avanzada podría ser esperado a ser un
éxito (definido en términos de lo que sea la
decisión regla está siendo utilizado) en los artículos a través de la
página 39 de la OIB. Por supuesto, la persona
examinada podría también tener alguna probabilidad de éxito
en los artículos después de la página 39. Para obtener el corte
de puntuación, la capacidad nivel aso ado con RP67 (o cualquiera que sea la
decisión regla es en el lugar) que se corresponde con la página en la OIB en
en el que se colocó el marcador es la puntuación de corte,
expresada en unidades de escala de habilidad (es
decir, theta) . En este ejemplo, la teta aso ciados con RP67 para el elemento
que aparece en la página 39 de la OIB es el rec reco-
corte puntuación. Desde este punto, que es una sencilla materia a transform
ar el valor theta a la métrica puntaje bruto a través de la curva característica
de prueba o de otra métrica puntuación ajustada a escala usando el
apropiado prima a-puntuación escalada o la conversión-theta-a-puntuación
escalada ecuación .
En la ilustración en el anterior párrafo, el marcador cortado puntuación pa
ra un rendimiento
de nivel se basa únicamente en el marcador colocación de un único participa
nte. Obviamente, en cualquier aplicación de la Marca método de
establecimiento de normas, el procedimiento se llevará a cabo mediante un
gran panel de
Partici pantalones. En el caso habitual , las ubicaciones de marcadores de lo
s participantes variarán. En nuestra experiencia, el típico método para hacer
frente
a esta situación es encontrar, para cada participante, la theta (capacidad) de
nivel asociado con la página en la OIB inmediatamente anterior
a la una en la que el participante fue
marcador colocado en la misma forma como se acaba describió
. El resultado es una distribución de los valores theta , uno para cada particip
ante. El puntaje de corte general recomendado en unidades theta se obtiene
tomando la media de estos valores de theta y luego obteniendo el puntaje de
corte en unidades sin procesar (o puntaje escalado) usando uno
de los métodos descritos en el párrafo anterior. Observamos, sin embargo,
que la elección de la medida de tendencia central más utilizado, es
decir, la media-es quizás basa en gran medida en la tradición estadística y
que el uso de otra estadística tales como la mediana sería probable
que sea igualmente apropiado.
Finalmente, un punto de aclaración está en orden aquí con respecto
a la ubicación real del marcador y el valor de habilidad correspondiente que
se utiliza en los cálculos de puntaje de corte . A
medida que hemos descrito, cuando un marcador procedimiento se lleva a
cabo, los participantes son instruidos para colocar su marcador en la
última página de la que el participante puede responder afirmativamente
a la pregunta de establecimiento de normas “¿Sería un examinado apenas a
este nivel tienen la oportunidad 2/3 de responder correctamente este
elemento?”Sin embargo, en otras normativos sesiones, los
participantes están a veces les dice a colocar sus marcadores en la primera
página para la que la respuesta a esta pregunta es‘No’Si, por ejemplo, un
participante respondió“Sí ”Con respecto al elemento en la página 27 y“ No
” para el elemento que aparece en
la página 28 de la OIB, algunos facilitadores harían
que el participante coloque el marcador en la página 27, y algunos harán que
el participante coloque el marcador en la página 28. Estrictamente hablando
, si el
participante se realidad colocando un marcador en un libro, que podría ser c
olocado entre las páginas 27 y 28. en el ejemplo que hemos descrito aquí, la
correcta theta valor para su uso en el cálculo de la Marca de corte el
puntaje es el que se encuentra en la página 27 de la OIB, no el que se
encuentra en la página 28.
Nuestro punto aquí es que, independientemente de las instrucciones
dadas, debe quedar claro para todos los involucrados (facilitadores y
participantes) lo que se pretende cuando se coloca un marcador en una
ubicación determinada: el elemento más difícil para el que el participante
puede responder ándar cuestión de fijación de
affirma tivamente es el elemento cuyos valores están entrado en Bookmark
corte de puntuación calcu laciones, si los participantes identificar ese
elemento mediante la colocación de un marcador en él, después
de él, o en la siguiente página.
Formación
La formación de un marcador de
normalización actividad típicamente implica famil iarizing participantes con la
s prestaciones de nivel de descripciones (PLD), la prueba en la que se
estándares de rendimiento se establecen, y el marcador de normas
procedimiento de ajuste. Un ejemplo de agenda para una sesión de tres días
usando el método de marca de Book- se muestra en la Figura 10-
6. Durante el primer día, los participantes reciben una visión general del
propósito de la sesión y sus objetivos. A esta descripción general le sigue la
administración y la calificación de las pruebas para que los participantes
comprendan claramente el contenido de la prueba. Luego, esta actividad es
seguida por la presentación y discusión de los PLD. Colocar los PLD después
de la administración y la calificación de la prueba ayuda a los participantes a
ver el contenido de los PLD en un contexto del mundo real. Una vez que los
participantes entienden y pueden articular los componentes clave de los P LD,
se les da la oportunidad de limitar la definición de cada nivel para aplicar a
aquellos que apenas se encuentran en cada nivel de rendimiento, es decir,
estudiantes en el umbral o recortar puntaje para ese nivel . En la mañana del
segundo día, los participantes reciben capacitación en los detalles del método
Bookmark, seguido de una breve ronda de práctica en la que colocan
marcadores para un puntaje de corte. En
www.sagepub.com/cizek/bookmarktraining se encuentra disponible un
conjunto completo de ejemplos de materiales de capacitación que se pueden
adaptar a diferentes contextos. Después de completar las actividades de
práctica, los participantes discuten sus experiencias y completan un formulario
de evaluación para evaluar su comprensión de la capacitación y su disposición
para comenzar las tareas de marcadores.
Después
de una introducción a la procedimiento, cada participante recibe un OIB,
un estímulo folleto, y un conjunto de marcadores. Como se
mencionó anteriormente, la OIB tiene un elemento por
cada página, comenzando con el más sencillo elemento en la prueba
de folleto; cada página contiene información como la que se muestra en
la Figura 10-7. Cada elemento CR se representa una vez para cada
uno de sus puntos de puntuación , como
se señaló anteriormente. Cada página contiene el elemento CR y uno o
más ejemplos de respuestas que son
Exem Plars de la determinada puntuación de punto. Debido a
que no son varias diferentes maneras de ganar cada punto de la puntuación,
a menudo es una buena idea para seleccionar ejemplos de respuestas que
cubren un amplio abanico de posibilidades en los distintos CR artículos.
Para las pruebas que tienen estímulos comunes (p. Ej., Leer pasajes,
mapas, gráficos), se prepara un folleto de estímulo separado y
se distribuye a los participantes. En una OIB, los elementos para un
escenario, mapa, caso, gráfico u otro estímulo dado se encuentran dispersos
en todo el folleto. Para simplificar la tarea participantes se enfrentan en la
adecuación
de artículos en la OIB con sus asociados estímulos, que es útil para cre comi
ó un código para cada estímulo y luego repetir ese código en el comienzo de
la partida correspondiente en el OIB. El cuadro en la esquina inferior
derecha de la Figura 10-
7 proporciona una correspondencia entre ese elemento y su estímulo
asociado (en este caso, Pasaje 3).
Cada participante también recibe un impreso forma en la que al entrar
en su o sus
marcadores (página números). Los formularios se imprimirán en un lado de
una pieza de la tarjeta de valores. Cada forma es semejante a la uno se
muestra en la Figura 10-8. En las rondas 1 y 2,
los participantes ingresan el número de página para cada marcador. En la
Ronda 3, los participantes van a estar familiarizados con la relación entre la
página número y el corte de puntuación. En esta etapa,
los participantes pueden ingresar números de página y puntajes de corte
asociados, así como los datos de impacto. El propósito de pedir a cada
partici pantalón para introducir también los datos de impacto es ayudar a
garantizar que cada participante es plenamente consciente de las
consecuencias de que sus recomendaciones
se tienen en términos de los porcentajes de los
examinados que se pueden clasificar en cada
una de las prestaciones categorías si los puntajes de corte
de los participantes se aplicaron a los resultados reales de la prueba .
Durante la Ronda 1, los participantes generalmente trabajan en pequeños
grupos de tres a cinco personas. Mientras discuten el contenido del elemento
entre ellos, cada participante completa su propio formulario de grabación de
Marcadores como el que se muestra en la Figura 10-8. A medida que
completan la Ronda 1, los participantes revisan sus formularios para
asegurarse de que estén completos, devuelven todos los materiales al
facilitador y son despedidos por el día.
Número de
páginas
Número de
páginas
77
66
55
44
1
00
2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34
36 38 40 42 44 46 48 50
Teniendo en
cuenta el tiempo que ha transcurrido desde su introducción, la limitada canti
dad de publicada la
investigación evidencia sobre la Marca procedimiento es un
poco sur premiación (ver Karantonis y Sireci , 2006). Por otra parte,
teniendo en cuenta el número de veces
que el marcador procedimiento ha sido utilizado, que es no es
sorprendente que, para la mayor parte, muchas de las preocupaciones
iniciales acerca del método se han abordado a través de
procedimiento cambios basados en estas experiencias. Sin embargo ,
debe tenerse en cuenta un aspecto fundamental del procedimiento cada
vez que se emplea: el puntaje de
corte está absolutamente vinculado por la dificultad relativa de la prueba. Q
ue es este Limita ción que la investigación futura en el método de marcador
debe abordar.