Sie sind auf Seite 1von 53

La evaluacin

en el aula

La evaluacin en el aula
Lorrie A. Shepard
Universidad de Colorado, Campus Boulder

Con este volumen, el Instituto Nacional para la Evaluacin de la Educacin (INEE) inicia
una nueva serie de publicaciones, que difundir textos relevantes sobre la evaluacin
educativa creados por la pluma de autores externos al Instituto. En el caso de obras de
autores externos, adems de su inters, se considerar la dificultad de acceder a ellas por
los lectores mexicanos, debido a no estar publicadas en espaol u otras razones.
La obra que se difunde ahora, de la profesora Lorrie A. Shepard, de la Universidad de
Colorado en Boulder, es un texto fundamental sobre un tema que el INEE considera de
gran inters para toda persona interesada en la evaluacin, especialmente para los que

Instituto Nacional para la Evaluacin de la Educacin


en el momento actual sienten preocupacin por el enfoque que se est dando a la
evaluacin en gran escala en nuestro pas.
Convencido como lo est del potencial positivo de la evaluacin en gran escala, el INEE
comparte la preocupacin de no pocas personas del medio educativo, en el sentido de
que ciertos usos de ese tipo de evaluaciones pueden tener tambin serias consecuencias
negativas. Por ello, es de gran importancia reflexionar seriamente sobre los alcances y
limitaciones de dichas evaluaciones, as como sobre la necesidad de que se fortalezcan
paralelamente las evaluaciones a cargo de los maestros.
El trabajo que aqu se presenta es un texto de primera importancia en relacin con estos
temas, y por ello el INEE la pone al alcance de los maestros de nuestro sistema educativo,
y de todas las personas interesadas por la calidad educativa.

Textos de Evaluacin
inee@inee.edu.mx www.inee.edu.mx

Jos Mara Velasco 101, Col. San Jos Insurgentes,


C.P. 03900, Mxico, D.F. Tels. 5482 0900, Exts. 1034 y 1050

El INEE est comprometido con la transparencia y el combate a la corrupcin, por lo cual ha establecido un programa operativo para hacer frente a estas tareas.
La evaluacin en el aula

LA EVALUACIN EN EL AULA*

Lorrie A. Shepard
Universidad de Colorado, Campus Boulder

Captulo 17 de la obra Educational Measurement


(4 Edicin) Editado por Robert L. Brennan
ACE/ Praeger Westport. 2006
pp. 623-646.

*Estoy muy agradecida con Rick Stiggins y Mark Wilson por los alentadores y estimulantes anlisis de los borradores de este
captulo

1
Textos de evaluacin

LA EVALUACIN EN EL AULA

Coordinacin Editorial:
Miguel . Aguilar R.
Diana L. Flores Vzquez

Diseo y Formacin:
Juan Cristbal Ramrez Peraza
Irma Tapia Covarrubias

Instituto Nacional para la Evaluacin del Educacin


Jos Ma. Velasco 101, Col. San Jos Insurgentes,
Delegacin Benito Jurez, C. P. 03900, Mxico D. F.

Classroom Assesment. Lorrie A. Shepard / Robert Brennan. Educational Measurement


Copyright 30 de agosto, 2006.
Reproducido con permiso de Greenwood Publishing Group Inc. Westport CT.

Traduccin:
Martha Doms para el Instituto Nacional para la Evaluacin de la Educacin

Impreso en Mxico

2
Contenido

CONTENIDO

Presentacin 5
La evaluacin en el aula 9
1. Panorama histrico 10
2. Evaluacin formativa 17
2.1 Teora del aprendizaje 17
2.2 Un modelo de la evaluacin formativa 19
2.3 La importancia del contenido: seleccion de las tareas de enseanza
y de evaluacin que encarnan objetivos de aprendizaje 21
2.4 Progresiones del aprendizaje 22
2.5 Evaluacin del conocimiento previo 24
2.6 Criterios explicativos y el uso de guas de calificacin (rbricas) 25
2.7 Retroalimentaciun 25
2.8 Ensear y evaluar para que haya transparencia 26
2.9 Auto-evaluacin del estudiante 27
2.10 Evaluacin de la docencia 29
3. Evaluacin sumativa y calificacin 30
3.1 Finalidades de las calificaciones apropiadas a la edad 30
3.2 La investigacin en la prctica actual 32
3.3 Importancia del contenido y del formato: qu se valora 33
3.4 La investigacin sobre medicin, psicologa cognitiva
y psicologa motivacional 35
3.5 Parmetros para el desarrollo de la competencia 37
4. Evaluaciones externas y en gran escala 38
5. Conclusiones implicaciones para la investigacin y la teora de la medicin 40
5.1 Estudios de las herramientos y procesos de evaluacin 40
5.2 Estudios del desarrollo del maestro 41
5.3 Nuevas conceptualizaciones de la confiabilidad y la validez 42
Bibliografa 45

3
Textos de evaluacin

4
Presentacin

PRESENTACIN

Con este volumen, el Instituto Nacional para ciones a cargo de los maestros, de manera que la
la Evaluacin de la Educacin (INEE) inicia combinacin de unas y otras contribuya verda-
una nueva serie de publicaciones, que difundir deramente a avanzar en la direccin que a todos
textos relevantes sobre la evaluacin educativa nos interesa: la de la mejora real y profunda de
creados por la pluma de autores externos al Ins- la educacin que nuestras escuelas ofrecen a los
tituto, o que no caben dentro de las otras se- nios y nias de Mxico.
ries que comprende su programa editorial. En el La obra que se presenta es un texto de pri-
caso de obras de autores externos, adems de su mera importancia en relacin con estos temas, y
inters, se considerar la dificultad de acceder por ello el INEE la pone al alcance de los maes-
a ellas por los lectores mexicanos, debido a no tros de nuestro sistema educativo, y de todas
estar publicadas en espaol u otras razones. Este las personas interesadas por la calidad educati-
fue el caso de la obra Learning divides, del inves- va. En los prrafos siguientes se desarrollan con
tigador canadiense Jon Douglas Willms, que el mayor amplitud las preocupaciones que nos han
INEE hizo traducir y public con el debido per- llevado a difundirla.
miso del editor original, el Instituto de Estads- En su forma ms conocida, la evaluacin edu-
ticas de la UNESCO, con el ttulo Las brechas de cativa no es algo reciente. La tarea del maestro,
aprendizaje. en su interaccin cotidiana con los alumnos, ha
La obra que se difunde ahora, de la profesora incluido siempre, como una dimensin funda-
Lorrie A. Shepard, de la Universidad de Colora- mental, el evaluar los avances de cada uno. En
do en Boulder, es un texto fundamental sobre las formas tradicionales de enseanza que preva-
un tema que el INEE considera de gran inters lecieron hasta bien entrado el siglo XIX, cuando
para toda persona interesada en la evaluacin, surgieron los sistemas educativos de concepcin
especialmente para los que en el momento ac- moderna con los que estamos familiarizados
tual sienten preocupacin por el enfoque que con cobertura que tenda a ser universal y,
se est dando a la evaluacin en gran escala en por ello, con muchos alumnos, organizados en
nuestro pas. grados de edad y avance similar la tarea de los
Convencido como lo est del potencial po- maestros era ms de evaluacin que de docencia.
sitivo de la evaluacin en gran escala, el INEE En las escuelitas en que un dmine atenda a una
comparte la preocupacin de no pocas perso- docena de chicos de distintas edades y niveles,
nas del medio educativo, en el sentido de que para ensearles a leer, escribir, contar y rezar, la
ciertos usos de ese tipo de evaluaciones pueden leccin magistral estaba ausente; el trabajo del
tener tambin serias consecuencias negativas. maestro se limitaba fundamentalmente a tomar
Por ello, es de gran importancia reflexionar se- la leccin a cada alumno, indicndole, en funcin
riamente sobre los alcances y limitaciones de di- de su avance, la siguiente tarea.
chas evaluaciones, as como sobre la necesidad La que s es bastante reciente es la evalua-
de que se fortalezcan paralelamente las evalua- cin en gran escala, la aplicacin estandarizada de

5
Textos de evaluacin

pruebas a grandes nmeros de alumnos, para cargo de los maestros, insustituibles para eva-
apreciar el nivel de aprendizaje que se alcanza luar de manera detallada todos los aspectos
en el sistema educativo de todo un pas, regin del currculo y para hacerlo de manera que
o distrito, ante la imposibilidad de agregar las puedan ofrecer a cada alumno la retroalimen-
evaluaciones que hacen los maestros, siempre tacin precisa sobre sus puntos fuertes y d-
ligadas al contexto en que trabaja cada uno. biles, esencial para mejorar el aprendizaje. Es
Con antecedentes que se remontan al final preciso, sin embargo, advertir sobre un riesgo
del siglo XIX, las evaluaciones en gran escala se que no se puede ignorar: el peligro de que las
desarrollaron en los Estados Unidos, durante la pruebas en gran escala produzcan consecuen-
primera mitad del siglo XX, adquirieron impor- cias negativas para la calidad educativa, si se
tancia a lo largo de su segunda mitad y se exten- les comprende y utiliza mal.
dieron a la mayor parte de los pases del mundo En efecto: para poder dar resultados con-
en las dos o tres ltimas dcadas. Adems de fiables de los niveles de aprendizaje que al-
evaluaciones nacionales, se desarrollaron pro- canzan muchos miles de alumnos, una prueba
yectos internacionales que hoy atraen poderosa- estandarizada necesariamente tiene que redu-
mente la atencin cada vez que se difunden sus cirse a la medicin de un nmero relativamen-
resultados. Las ms conocidas son las pruebas te mnimo de temas, y debe hacerlo mediante
del Proyecto para la Evaluacin Internacional de preguntas que no pueden atender los aspec-
los Estudiantes (PISA, por sus siglas en ingls), tos ms complejos de las competencias que
de la Organizacin para la Cooperacin y el De- pretende desarrollar la escuela. Por ello, hay
sarrollo Econmicos (OCDE), cuyo desarrollo que reiterar que las pruebas en gran escala no
comenz a planearse en 1995, y se aplican cada pueden sustituir el trabajo de evaluacin de
tres aos desde el 2000. los maestros, el nico que puede atender con
Ms de tres dcadas antes, en 1958, comen- precisin los aspectos ms complejos de la en-
zaba a gestarse la Asociacin Internacional de seanza y el aprendizaje, y hacerlo de modo
Evaluacin del Rendimiento Acadmico (IEA, que se brinde retroalimentacin detallada y
por sus siglas en ingls), con la planeacin del oportuna a cada alumno.
Primer Estudio Internacional sobre Matem- Si no se entienden bien los alcances y lmites
ticas que se llev a cabo en la dcada de 1960, de los resultados de las pruebas en gran escala,
del que se deriva el Estudio de Tendencias en es fcil que se usen en forma inapropiada. El
Matemticas y Ciencias (TIMSS) una de las eva- peligro ms claro es la tendencia a tomar como
luaciones vigentes ms importantes. En Mxico, referente para la tarea docente el contenido de
el desarrollo de pruebas en gran escala para edu- las pruebas y no el de los programas de estudio,
cacin bsica dio inicio desde la dcada de 1970, enseando para las pruebas, por la visibilidad de
y se desarroll sobre todo a partir de la de 1990, sus resultados. Con ello la tarea de la escuela se
con las pruebas para evaluar el Factor Aprove- empobrece, al descuidar aspectos esenciales que
chamiento Escolar del Programa de Carrera Ma- no evalan las pruebas en gran escala, como la
gisterial. La tendencia se acentu en la ltima expresin escrita y oral, la formacin de acti-
dcada, con las pruebas del Instituto Nacional tudes y valores, la educacin artstica, e incluso
para la Evaluacin de la Educacin (INEE), a los niveles cognitivos ms complejos de las reas
partir de 2003, y las pruebas censales de la Se- tradicionalmente cubiertas de Lectura, Mate-
cretara de Educacin Pblica, desde 2006. mticas y Ciencias.
Las pruebas en gran escala pueden ser una Otros ejemplos de manejo inapropiado de los
herramienta valiosa para apoyar los esfuerzos resultados de las evaluaciones en gran escala son
de mejora de la calidad educativa, si se las ve la asignacin de estmulos a los docentes o la ela-
como un complemento de las evaluaciones a boracin de ordenamientos simples de escuelas,

6
Presentacin

supuestamente en funcin de la calidad de unos der tambin que las preguntas de opcin ml-
y otras, sin tener en cuenta los numerosos facto- tiple son esenciales en las primeras, pero que
res que inciden en los resultados de los alumnos las segundas, las evaluaciones que los maestros
en las pruebas ni tener en cuenta las limitacio- llevan a cabo, pueden utilizar acercamientos di-
nes de stas. Este tipo de errores, adems, pro- ferentes y mejores para evaluar aspectos finos
duce un explicable rechazo de toda evaluacin y complejos, los cuales difcilmente se pueden
en gran escala por parte de muchos maestros, atender en gran escala, pero que en el mbito del
que perciben sus graves consecuencias para la aula es posible emplear. Las preguntas de opcin
educacin. Por ello, conviene reiterar que la mltiple pueden ser usadas tambin en el aula,
evaluacin en gran escala puede ser muy valio- y son adecuadas para evaluar algunos aspectos
sa para la mejora de la calidad, a condicin de del aprendizaje, pero otros deben valorarse de
entenderla y usarla vindola como complemento formas distintas, como mediante la produccin
del trabajo del maestro, y no como sustituto del de textos amplios, la realizacin de ejercicios en
mismo. Para eso es necesario que los maestros vivo, la observacin del trabajo individual y gru-
entiendan bien los alcances y lmites de la eva- pal de los alumnos, entre otros.
luacin en gran escala, y los de la evaluacin que La expresin evaluacin en aula (classroom as-
ellos llevan cabo. sessment) se refiere a este tipo de acercamientos.
En Mxico la formacin inicial que reciben Es importante que escuelas normales y progra-
muchos maestros no los prepara bien ni para mas de actualizacin de maestros en servicio
una cosa ni para la otra. Un indicio de ello es la presten la atencin que merecen a estos enfo-
solicitud que el INEE suele recibir, de maestros, ques, relativamente recientes y poco conocidos
supervisores y directivos de escuelas normales, en nuestro medio.
para impartir talleres de elaboracin de reacti- Para contribuir al desarrollo de estas innova-
vos de opcin mltiple, gracias a lo cual se espe- doras ideas, el INEE hizo las gestiones necesa-
ra que mejore la calidad de las evaluaciones que rias para difundir en espaol el texto siguiente,
deben hacer los maestros. En el Instituto hemos de una de sus principales defensoras. Al invitar
mantenido la posicin anterior sobre los alcan- a leerlo y reflexionar detenidamente sobre su
ces y lmites de la evaluacin en gran escala, y contenido, expreso el deseo de que la evaluacin
sobre la necesidad de verla como complemen- educativa en Mxico se desarrolle combinando
taria de la evaluacin a cargo de los maestros, el avance tcnico de las pruebas en gran escala,
y nos enfrentamos permanentemente con una con un uso de sus resultados que no ignore sus
dificultad considerable para conseguir que esta lmites y un avance substancial de la evaluacin
postura sea comprendida no slo por la socie- en aula, a cargo de los maestros. As, y slo as, la
dad en general, sino tambin por las autoridades evaluacin podr contribuir realmente a la me-
educativas y por los maestros, como muestran jora educativa.
las demandas a las que alude el prrafo.
Si se comprenden las caractersticas de las Felipe Martnez Rizo
evaluaciones en gran escala y en aula, se enten- Julio de 2008.

7
Textos de evaluacin

8
La evaluacin en el aula

La evaluacin en el aula

El modelo de evaluacin en el aula que se explica tivo de la evaluacin como parte del proceso de
detalladamente en este trabajo es muy diferente aprendizaje (Black, y Wiliam, 1998; Gipps, 1999;
del modelo de pruebas y mediciones que predo- Shepard, 2000). A principios de la dcada de los
min en aulas y escuelas durante el siglo pasado. ochenta, el inters en reformar la prctica de la
En los primeros aos del siglo XX, los expertos evaluacin se vio acuciado por un uso mayor de
en mediciones crean que podan usarse pruebas pruebas estandarizadas, cuyo propsito era la
nuevas y objetivas para estudiar y mejorar los re- responsabilizacin*, y por una evidencia cada vez
sultados de la educacin, as como para encargar- mayor de que los formatos estrechos de pruebas
se del diagnstico y la colocacin de estudiantes tenan un efecto perjudicial en la calidad de la
de acuerdo con sus necesidades de aprendizaje enseanza y el aprendizaje de los estudiantes
(Symonds, 1927; Thorndike, 1913). El punto de (Resnick y Resnick, 1992; U.S. Congress, Office of
vista prevaleciente fue que los expertos deban Technology Assessment, 1992). Adelantndose a los
elaborar pruebas estandarizadas que los do- expertos en mediciones, los especialistas en las
centes utilizaran con objeto de incrementar la materias empezaron a desarrollar estrategias de
precisin en su toma de decisiones. Adems, los evaluacin que se vinculaban ms estrechamente
expertos en mediciones empezaron a ensear a a los objetivos curriculares (Kulm, 1990; Mathe-
los maestros cmo hacer sus propias pruebas si- matical Sciences Education Boarad, 1993; Morrow
guiendo principios cientficos de medicin. En y Smith, 1990; Valencia y Calfee, 1991). Por otra
aquellos primeros aos, se desarroll un sistema parte, la investigacin en psicologa cognitiva
para los libros de texto de mediciones con el fin y motivacional aport tanto la teora como las
de ensear a los maestros cuestiones sobre la evidencias, gracias a las cuales se perfil el cami-
validez y la confiabilidad (utilizando representa- no para los cambios que se necesitaban (Black,
ciones en su mayor parte cuantitativas), la ela- y Wiliam, 1998; Crooks, 1988; Pellegrino, Chu-
boracin de pruebas, los formatos y el anlisis dowsky y Glaser, 2001). Por ltimo, este nuevo
de reactivos, as como anlisis estadsticos de los modelo de evaluacin en el aula, se ha hecho
resultados de las pruebas. Este sistema que manifiesto en un nuevo tipo de libro de texto de
consista casi exclusivamente en pruebas forma-
les, cuestionarios y calificaciones ha seguido
*
El concepto del que habla la autora es accountability, que se ha tra-
ducido como responsabilizacin porque se responsabiliza a escuelas,
siendo el modelo de los libros de texto hasta el directores y maestros del progreso acadmico de los estudiantes.
da de hoy. Este concepto, en el contexto de la educacin, hace referencia al
uso sistemtico de datos de evaluacin y otro tipo de informa-
En contraste con este modelo tcnico y cuan- cin para garantizar que las escuelas vayan en la direccin deseada.
titativo, existe un punto de vista diferente de la Con frecuencia, en los sistemas de responsabilizacin se incluyen
metas, indicadores de progreso hacia el cumplimiento de esas me-
evaluacin en el aula, que se desarroll a fines tas y anlisis de datos, as como procedimientos de informacin
del siglo XX y que busca lograr que, en mucho prescritos y consecuencias o sanciones. La responsabilizacin a
menudo incluye el uso de resultados de evaluacin y otros datos
mayor medida, el estudiante alcance un entendi- para determinar la eficacia del programa y para tomar decisiones
miento; asimismo, busca obtener el uso forma- sobre recursos, recompensas y consecuencias. (Nota de la traduc-
tora)[N. T.]

9
Textos de evaluacin

evaluacin fundamentado en la prctica docente ban fallando (U. S. Congress, Office of Technology
(Stiggins, 2001; Taylor y Nolen, 2005). Al sealar Assessment, 1992), elaboraron instrumentos para
la naturaleza fundamental de esta transforma- documentar la necesidad de mejorarlas y esta-
cin, unos cuantos expertos en mediciones han blecer el rumbo para lograrlo. Se pedan pruebas
empezado a preguntar cmo deberan cambiar estandarizadas para que pudieran agregarse re-
las ideas tradicionales de validez y confiabilidad sultados de diversas escuelas y compararlas en-
en el contexto del aula (Brookhart, 2003; Mac- tre s; y el nuevo tipo de examen objetivo se con-
millan, 2003; Moss, 2003; Smith, 2003). sider como un remedio para la escandalosa falta
En este captulo se presenta, tanto la concep- de confiabilidad de los exmenes que hacan los
cin como los fundamentos de la investigacin maestros, y que haba quedado demostrada en
sobre las estrategias de evaluacin en el aula varios estudios anteriores (Thorndike, 1922).
concebidas para ser parte integral de la ensean- Desde el principio hubo tambin crticos que
za y el aprendizaje. Comienza con una introduc- se quejaron de que las pruebas objetivas medan
cin histrica para explicar el punto de vista que tan slo hechos o fragmentos de informacin en vez de
sostuvieron ciertos tericos de la medicin en el que midieran la capacidad de razonar y la aptitud
pasado sobre la aplicacin de pruebas en el aula. para la organizacin, etctera, (Wood, 1923). No
Se detiene especficamente en los puntos de vis- obstante, al hablar en nombre del pensamiento
ta presentados en ediciones previas de Educatio- dominante, Wood estableci los argumentos
nal Measurement, obras editadas por Lindquist fundamentales de las ventajas de la medicin
(1951), Thorndike (1971) y Linn (1989), respec- objetiva1, los cuales fueron repetidos a lo largo
tivamente. La intencin es identificar las ideas de todo el siglo:
que han perdurado, as como las que actualmen- La prueba estandarizada es sumamente
te se impugnan. La parte principal del captulo exacta no slo debido a que uno puede ca-
est organizada en tres secciones: 1) Evaluacin lificarla objetivamente, sino porque da su-
formativa, 2) Evaluacin sumativa y calificacin, ficientes muestras del desempeo del exa-
3) Evaluaciones externas y en gran escala. En una minado as como del material sobre el cual
seccin de conclusiones, se consideran las impli- se examina. Por otra parte, es lo bastante
caciones de estas ideas transformadoras para el flexible como para que pueda examinar no
campo de la medicin educativa. Se propone un slo informacin sino tambin juicio, y la
programa de investigacin y se sugieren los cam- evaluacin de relaciones, causas y conse-
bios que se necesitan en la conceptualizacin de cuencias. (p. 162)
la validez y la confiabilidad para los objetivos del No hay tanta oposicin entre informacin
aula. y razonamiento como algunos maestros
quisieran hacernos creer Los hechos no
1. PANORAMA HISTRICO son slo un aspecto legtimo e indudable
DE LA MEDICIN EDUCATIVA del pensamiento sino que slo el pensa-
Y LAS AULAS miento puede adquirirlos, conservarlos y
reproducirlos, y slo puede hacerse esto
El movimiento que pugnaba para que se apli- mediante la organizacin lgica y sistem-
caran pruebas de rendimiento escolar que se tica del material. (p. 162)
inici en 1908 con la publicacin por Thorn- Todo estudio experimental del que tenga-
dike y sus alumnos de pruebas de Aritmtica y
Escritura estaba estrechamente relacionado 1
Para ser justos, Wood (1923) argument en favor del uso de prue-
bas estandarizadas por su mayor confiabilidad con el fin de com-
con el movimiento de la administracin cien- plementar mediciones que utilizaban los exmenes tradicionales
tfica o movimiento de la eficiencia social. Sus de ensayo. Sin embargo, otros usaron posteriormente este mismo
lderes, que consideraban que las escuelas esta- razonamiento para sustituir pruebas de ensayo por pruebas obje-
tivas ms confiables.

10
La evaluacin en el aula

mos conocimiento, y que se haya realizado con las decisiones rutinarias que se toman en el
hasta ahora, ha mostrado una fuerte rela- aula no era una distincin evidente en 1951.
cin entre la medicin de la informacin Walter Cook (1951), en su captulo titulado
en un campo y la inteligencia o la capaci- The Functions of Measurement in the Facilitation of
dad de pensar en el material de ese campo. Learning, defenda el uso de la medicin objetiva
(p. 163) para adaptar la enseanza a las necesidades indi-
Por otra parte, puesto que las pruebas de ren- viduales de aprendizaje. En tanto que reconoca
dimiento se elaboraron en el mismo periodo y que Los mejores maestros no dejan de seguir
las hicieron los mismos autores de las pruebas constantemente el proceso de verificacin del
de Coeficiente Intelectual (CI), ambos tipos de aprendizaje mediante la observacin directa de
pruebas llegaron a tener los mismos formatos la conducta y las pruebas informales, al mismo
de reactivos y los mismos modelos estadsticos tiempo argumentaba en favor del valor de las
cuyas races se hundan en la psicologa de las pruebas preparadas por expertos porque:
diferencias individuales. 1. Son ms concienzudamente analticas que
Despus de la Primera Guerra Mundial, el la mayora de las que podran preparar los
uso de pruebas estandarizadas de rendimiento maestros.
aument notablemente debido al xito prctico 2. Hacen que los maestros tomen concien-
y en gran escala de la prueba Army Alpha, al esta- cia de los elementos importantes, las se-
blecimiento de grandes oficinas de investigacin cuencias necesarias y las dificultades del
educativa y agencias de investigacin coopera- proceso.
tiva, y a la conceptualizacin de Ralph Tyler en 3. Ahorran tiempo y energa al maestro
el campo de la evaluacin educativa, con el pro- para hacer diagnsticos, y le dejan ms
psito de evaluar cun bien haban logrado sus tiempo y energa para que haga el trabajo
objetivos los programas educativos (Cook, 1941; de correccin.
Madaus y Stufflebeam, 2000; U. S. Congress, 4. Ayudan al alumno a reconocer sus necesi-
Office of Technology Assessment, 1992). dades de aprendizaje al hacer hincapi en
La primera edicin de Educational Measure- forma sistemtica en sus errores.
ment, libro que se public en 1951 y que edit 5. Los procedimientos correctivos se indi-
E. F. Lindquist, reflej y extendi la idea de que can o proporcionan al maestro y le aho-
las pruebas estandarizadas eran esenciales para rran tiempo, as como tambin le ayudan
el proceso de evaluacin y mejoramiento de la a sistematizar el proceso. (p. 37)
educacin. Si bien los autores de los captulos En el captulo sobre The Functions of Measurement
de la edicin de 1951 dicen que las funciones in Improving Instruction, que se relaciona con lo
de la medicin educativa se relacionan con anterior, Tyler (1951) observ que la medicin
la facilitacin del aprendizaje (Cook, 1951, p. educativa est concebida, no como un proceso
4), lo que ellos tenan en mente era que esto lo totalmente distinto de la enseanza, sino ms
realizaran pruebas elaboradas fuera del aula. Su bien como una parte integral de sta (p. 47).
punto de vista era que haba que desarrollar pro- Pese a la similitud entre estas palabras y las con-
gramas de pruebas estandarizadas en los distri- cepciones actuales de la evaluacin en el aula, los
tos escolares, que es lo que hoy podra llamarse procesos que Tyler tena en mente se asuman casi
administracin de datos o sistemas manejados totalmente fuera del aula. Si bien algunos de los
con datos. La distincin que se hace en nuestro ejemplos de Tyler tomaban en cuenta la posibili-
informe contemporneo Knowing What Students dad de que un instructor individual de un curso
Know (Pellegrino et al., 2001) entre los tipos pudiera recorrer todo el proceso de planeacin
de datos de evaluacin que se necesitan para de la enseanza especificando objetivos, pla-
las polticas en gran escala, en contraposicin nificando experiencias de aprendizaje y valoran-

11
Textos de evaluacin

do efectos, Tyler se interesaba sobre todo en Al escribir l solo para la tercera edicin, Ni-
que un programa de pruebas de rendimiento en tko (1989) ofreci nuevamente un enfoque sobre
un distrito escolar se planificara y desarrollara la planificacin de la enseanza que aprovechaba
como parte integral del programa del currculo y una base de investigacin cognitiva sumamente
la enseanza (p. 64). Los maestros aprenderan sofisticada con el fin de ofrecer pruebas pertinen-
participando en el desarrollo de objetivos y en la tes, desde el punto de vista de la instruccin, para
elaboracin de pruebas, y tambin aprenderan que se utilizaran en el aula. Revis la literatura
de los datos resultantes. sobre pruebas de diagnstico que se basaban en
Para la segunda edicin, de 1971, Robert Gla- los conocimientos previos requeridos, en habi-
ser, un psiclogo cognitivo, y Anthony Nitro, un lidades y en el dominio de objetivos conductua-
terico de la medicin, escribieron el captulo les acercamientos que reflejaban una idea muy
sobre Measurement in Learning and Instruction. Su estrecha de cmo se desarrolla el aprendizaje y
perspectiva formal de planificacin de la ense- una representacin relativamente empobrecida
anza estaba influida por supuestos docentes del dominio de los contenidos. En contraste con
conductistas y de la educacin adaptativa por esto, Nitko (1989) tambin estudi textos emer-
computadora, que gozaban de popularidad en gentes de diagnstico centrados en el anlisis de
la poca. Al igual que Tyler y Cook, su visin errores y estructuras de conocimiento de los es-
planteaba la necesidad de pruebas pertinentes tudiantes. Estas ltimas categoras le permitieron
para la enseanza, que se elaboraran fuera del vislumbrar los temas de investigacin que seran
aula y se entregaran a los docentes. A medida fundamentales para la concepcin contempor-
que se desarrolla la enseanza, la informacin nea del aprendizaje y la evaluacin. Por ejemplo,
para tomar decisiones educativas deben darse al (la) comprensin que tenga quien disea prue-
docente, al estudiante y posiblemente a una m- bas sobre el significado y la estructura del cono-
quina (pp. 626-627). En vista de la complejidad cimiento que un estudiante trae al sistema de
que implica el diseo de pruebas apropiadas, in- enseanza podra utilizarse para identificar la
cluyendo la validacin de modelos cuantitativos comprensin cotidiana de palabras y fenmenos
de adaptacin de la enseanza, parecera ade- [] que no concuerden con la comprensin ca-
ms que el agobio de planificar y elaborar tales nnica de los expertos (p. 461). Es importante
pruebas, de procesar las respuestas y de llevar a sealar que Nitko (1989) tambin observ que
cabo anlisis preliminares de los resultados de la investigacin reciente en psicologa educativa
la prueba, debe manejarlo alguien que no sea el indica que las formas en que los estudiantes re-
maestro de la clase. De nueva cuenta, al igual presentan mentalmente el conocimiento son tan
que Tyler, Glaser y Nitko vieron que estos resul- importantes, para el desarrollo de sus habilida-
tados de las pruebas podran estar al servicio de des para resolver problemas y para el aprendizaje
la evaluacin de programas, al proporcionar una avanzado, como las formas en que manifiestan su
retroalimentacin formativa a los responsables conocimiento conductualmente (p.466). Si bien
del sistema. Sin embargo, a diferencia de Tyler, Nitko (1989) todava imaginaba un sistema de en-
estaban ms interesados en datos de las prue- seanza informal y de evaluacin que se elabora-
bas que pudieran usarse en forma permanente ra fuera del aula y se entregara a los maestros, su
para adaptar la enseanza a los estudiantes in- punto de vista reflej un cambio esencial e impor-
dividuales, y crean que su sistema de pruebas tante: quedaron lejos las pruebas de competencia
diseado externamente podra quedar inclui- del estudiante despus de una leccin o periodo
do en la enseanza de un modo perfectamente de instruccin, donde pasaba o reprobaba, y se
consistente. Si se hacen apropiadas y sutiles, la dio un paso hacia las evaluaciones ms ricas de
docencia, la educacin y la aplicacin de prue- su comprensin y aprovechamiento en un campo
bas se irn diluyendo una en otra. (p. 646) del conocimiento.

12
La evaluacin en el aula

Si bien los primeros volmenes de Educa- por sentado que sera sencillo volver a ensear
tional Measurement tenan poco que decir sobre ciertas cuestiones (Torgerson, y Adams, 1954).
las pruebas que hacan los docentes o sobre las La estadstica y las presentaciones cuantitativas
prcticas de evaluacin en el aula, el movimien- de la confiabilidad y la validez fueron sobresa-
to de pruebas estandarizadas y el paradigma de lientes en cuanto a qu necesitaban saber los do-
la evaluacin de programas determinaron, no centes. En el prefacio a su texto de Educational
obstante, qu se enseaba a los docentes acer- Measurement, Travers (1955) seal que muchos
ca de la evaluacin. Los tericos de la medicin, de sus colegas tenan preferencia por los libros
responsables de los cursos de Pruebas y Medicio- de texto sobre medicin psicolgica porque brin-
nes para maestros, crean que deba ensearse daban un alimento intelectual ms slido que
a stos cmo emular la confeccin de pruebas los libros sobre medicin educativa (p. vi), en
estandarizadas de rendimiento, as como de qu vista de lo cual aument el nivel tcnico de su
manera deban usar una diversidad de medicio- libro para ayudar a fortalecer una debilidad en
nes estandarizadas. Los libros de texto tpicos la preparacin de los maestros (p. vi). En una
desde la dcada de 1940 hasta la de 1990 incluan muestra de treinta libros de texto examinados
los siguientes captulos: para este anlisis histrico, slo encontr dos
I. Finalidad de la medicin y la evaluacin que tenan una seccin o subseccin dedicada
II. Anlisis estadstico de los resultados de al uso de la observacin en el aula. Encontr un
pruebas texto que menciona el uso de la evaluacin para
111. Validez la retroalimentacin2. La mayor parte de los tex-
IV. Confiabilidad tos tenan un captulo sobre la especificacin
V. Principios generales de la elaboracin de objetivos para la enseanza; y, si se captara
de pruebas (incluye la especificacin el mensaje principal de estos libros, ayudara a
de los objetivos de la enseanza) los maestros a volverse ms sistemticos en el
VI. Principios de la elaboracin de pruebas uso que hacen de diversos formatos de reacti-
objetivas vos para representar un contenido importante.
VII. Principios de elaboracin de pruebas de Sin embargo, sera justo decir que los aspectos
ensayo tcnicos de la elaboracin de pruebas recibieron
VIII. Anlisis de reactivos para pruebas en ms atencin que las conexiones entre la evalua-
el aula cin y las actividades de la enseanza.
IX. Asignacin de calificaciones y for- El acento que ponen los integrantes de la
ma de reportarlas comunidad de la medicin en temas formales
X. Pruebas de CI y aptitud acadmica y tcnicos tambin puede encontrarse en la li-
XI. Pruebas estandarizadas de rendimiento teratura de investigacin sobre la capacitacin
XII. Mediciones de intereses y personalidad en medicin para los maestros. Esta literatura,
XIII. Interpretacin de normas estadsticas que se extiende por varias dcadas, se lamenta
para las pruebas constantemente de que los maestros han recibi-
Los libros de texto de medicin se centraban do una preparacin deficiente para cumplir con
en la elaboracin de pruebas formales cuya fina-
lidad era la asignacin de calificaciones. Si bien 2
Brown (1981), de manera proftica, coment: (El) aspecto efi-
varios autores mencionaban la importancia de caz de la retroalimentacin es saber si una pregunta se contest
correctamente o, si se contest en forma incorrecta, saber dnde
utilizar la informacin que aportaban las pruebas ocurri el error y qu necesita hacerse para corregir dicho error.
para modificar la enseanza, los libros de texto Esta informacin es suministrada por el sealamiento del maestro
sobre la correccin de la respuesta y/o por sus comentarios, no
daban pocas explicaciones sobre el modo en que por la calificacin. As, una prueba que se corrige, pero que no da
los docentes entenderan los datos con objeto de lugar a una calificacin, puede proporcionar tanta retroalimenta-
redisear su enseanza. Algunos autores dieron cin til a los estudiantes como una que si lleva a una calificacin
(p. 171).

13
Textos de evaluacin

sus responsabilidades de medicin y evaluacin. la gran importancia de las pruebas elaboradas


Histricamente, muchos estudios dieron por por los maestros, las pruebas incluidas en el cu-
sentado que los maestros necesitaban saber lo rrculo, y las interacciones y observaciones in-
que se enseaba en los cursos de Pruebas y Me- formales para su toma de decisiones cotidiana
diciones, y hablaban de la idoneidad de dicha (Dorr-Bremme, 1983; Salmon-Cox, 1981; Yeh,
preparacin segn cuntos programas forma- Herman y Rudner, 1981). Gracias a datos de en-
tivos ofrecan tales cursos, cuntos estados los trevistas, Dorr-Bremme (1983) concluyeron que
requeran y cuntos maestros los tomaban (Gos- los maestros actan como razonadores prcticos
lin, 1967; Noll, 1955; Roeder, 1972; Ward, 1980). y como clnicos, y que orientan sus actividades
Cuando los investigadores intentaron identifi- de evaluacin a las tareas prcticas que deben
car en forma directa las habilidades especficas de llevar a cabo en las rutinas cotidianas, tales
que se juzgaban esenciales para los maestros, los como decidir qu ensear y cmo ensearlo a
instrumentos que utilizaron en sus encuestas li- los estudiantes de diferentes niveles de desem-
mitaron desafortunadamente la base de conoci- peo; llevar el registro de cmo progresan los
mientos posibles a los contenidos de los libros alumnos y cmo ellos (los maestros) pueden
de medicin. As, por ejemplo, en el estudio de ajustar su enseanza apropiadamente y evaluar
mayo de 1964, se pidi a maestros y directores y calificar a los estudiantes en su desempeo
as como a profesores de universidad y exper- (p. 3). Para estos fines, los maestros se apoyan
tos en pruebas, que clasificaran la importancia en muy buena medida en las pruebas hechas por
de setenta competencias. Treinta y dos de stas ellos y en las interacciones con los estudiantes y
eran elementos estadsticos que tenan que ver las observaciones que hacen de stos. Stiggins
con el clculo y la interpretacin de la media, y Conklin (1992) publicaron resultados de una
la mediana y la moda, la desviacin estndar, las serie de estudios de campo que documentaban
puntuaciones estndar, las correlaciones y as qu hacen los maestros para evaluar a sus estu-
sucesivamente. Las competencias restantes que diantes, y analizaron qu necesitaran saber los
recibieron clasificaciones ms altas, correspon- docentes para hacer bien estas tareas. Stiggins
dieron fielmente a los captulos de los libros de (1991) concluy que la capacitacin tradicional
texto de medicin citados anteriormente. De en medicin ha estado crnicamente mal enfocada,
igual manera, en 1973, Goehring utiliz libros de tanto as, que slo nosotros tenemos la culpa
texto de Pruebas y Medicin para generar una lista por la falta de atencin dada a la capacitacin
de 116 competencias y luego pidi a maestros y en medicin en los programas educativos para
directores de escuelas que analizaran su impor- maestros.
tancia relativa. Muy aparte de la literatura sobre medicin,
Slo alguna que otra vez, y relativamente en los expertos en los contenidos de la enseanza
fecha reciente, han empezado los especialistas empezaron a elaborar alternativas a las pruebas
de medicin a fijarse en el contexto del aula para estandarizadas para el aula, movidos por una
tratar de entender las necesidades que tienen aversin a los efectos de las pruebas de rendicin
los maestros de obtener competencia en eva- de cuentas o responsabilizacin, pero tambin a
luacin. En 1973 Fahr y Griffin cuestionaron la causa de profundos cambios en las concepcio-
literatura que, al parecer, haca de la medicin nes del aprendizaje y el aprovechamiento en las
un fin en s mismo, y sostuvieron en cambio que materias (Shepard, 2000). En lectura, por ejem-
las habilidades deben estar relacionadas direc- plo, los investigadores que trabajaban desde una
tamente con las decisiones de enseanza que perspectiva emergente del alfabetismo (Clay,
los maestros necesitan tomar. Varios estudios, 1985; Teale y Sulzby, 1986), se dedicaron mucho
centrados inicialmente en cmo se utilizaban ms a observar y respaldar las habilidades en de-
en el aula las pruebas estandarizadas, revelaron sarrollo de nios en contextos sociales concre-

14
La evaluacin en el aula

tos, ms que en habilidades aisladas y descon- do un cambio considerable en la investigacin


textualizadas. Clay (1985) invent estrategias de sobre la enseanza y el aprendizaje. Debido a
evaluacin insertas en el acto de leer, sealando la revolucin de la ciencia cognitiva, la investi-
que la investigacin haba fracasado en demos- gacin ya no se centraba solamente en conduc-
trar que el aprendizaje hubiera mejorado por la tas observables, sino que tambin tomaba en
asignacin de estudiantes a grupos de diferente consideracin procesos cognitivos internos. En
nivel con base en un diagnstico asentado en vez de un modelo de aprendizaje en el que los
pruebas de velocidad en lectura o en pruebas maestros transmiten el conocimiento y los estu-
de prerrequisitos, tales como habilidad lings- diantes lo absorben, el nuevo modelo de apren-
tica o discriminacin visual. Goodman (1985) dizaje sostiene que los estudiantes construyen
reintrodujo el concepto de vigilancia de los nios, activamente conocimiento nuevo. En las obras
un remanente del movimiento de estudios del del National Council of Teachers of Mathematics
nio, que estuvo en boga mucho tiempo antes. (Consejo Nacional de Maestros de Matemticas
A diferencia de las pruebas estandarizadas que [NCTM], por sus siglas en ingls) Curriculum and
se aplican en un nico momento, la vigilancia Evaluation Standards for School Mathematics (1989)
de nios es continua. Legitima la importancia y Everybody Counts, un informe del National Re-
de la observacin profesional en el aula y tiene search Council (1989), el aprendizaje de las Mate-
en cuenta experiencias de aprendizaje ms ricas mticas se redefini, ms bien, como un proceso
que aquellas que pueden sepultarse sin riesgos en de indagacin y de bsqueda de sentido que una
la prueba (Goodman, 1985, p. 14). La reunin de repeticin y mmica sin sentido. Para la evaluacin
muestras del trabajo de los estudiantes (Teale, esto significaba que se necesitaban problemas
Hiebert y Chittenden, 1987) se convirti en un ms extensos y no rutinarios para atraer a los
recurso valioso, no slo para alcanzar una com- estudiantes y para evaluar la potencia matemtica
prensin del pensamiento de los nios, sino para definida como la capacidad de usar el conoci-
documentar su progreso a lo largo del tiempo. miento matemtico para razonar y pensar crea-
Se descubri que la narracin de cuentos era tivamente y para formular, resolver y reflexionar
ms eficaz, tanto para los fines de la enseanza crticamente en los problemas (NCTM, 1989,
como para los de evaluacin, que las preguntas p. 205). Adems, el discurso del aula se convirti
tradicionales de comprensin de lectura (Mo- en un punto focal de las reformas en Matemti-
rrow, 1985), y as sucesivamente. Irnicamente, cas que buscaba proporcionar a los estudiantes
estos investigadores estaban haciendo exacta- la oportunidad de conjeturar y explicar su razo-
mente lo que Tyler haba recomendado dcadas namiento. Estas nuevas rutinas de enseanza
antes al clarificar sus objetivos de enseanza y incrementaron al mismo tiempo la importancia
buscar una representacin lo ms fiel posible de de las evaluaciones informales e integradas ob-
estos objetivos en sus planes de evaluacin. Con servaciones, preguntas del maestro y escritura
todo, lo que Tyler no previ fueron las limitacio- de un diario como medios para comprender el
nes de los formatos de las pruebas objetivas, que pensamiento de los estudiantes (Silver y Kenney,
para finales del siglo XX ya no eran adecuadas 1995). En vez de la prctica imperante segn la
para corresponder a las nuevas concepciones del cual los maestros ajustaban sus propias pruebas
aprendizaje de las materias (Shepard, 2000). para que emularan tanto la forma como el conte-
En la comunidad de las Matemticas, la fuer- nido de las pruebas externas de opcin mltiple,
za motriz y la direccin para los cambios en la Silver y Kilpatrick (1989) sostuvieron que deba
evaluacin fueron paralelos a los que hubo en hacerse un esfuerzo serio para dotar de nuevas ha-
Lectura. En el captulo sobre Matemticas del bilidades a los docentes, para que pudieran dar
tercer Handbook of Research on Teaching, Romberg clases con enfoque de resolucin de problemas
y Carpenter (1986) observaron que haba ocurri- y para evaluar las capacidades y actitudes de sus

15
Textos de evaluacin

estudiantes en cuanto a resolucin de proble- tiva, diciendo que la evaluacin es formativa slo
mas, en el contexto de tales clases. cuando la comparacin de los niveles reales y los
Pueden narrarse historias parecidas para otras de referencia producen informacin que luego se
materias, como ciencias y estudios sociales. En usa para modificar la laguna (p. 53).
cada caso, los reformadores de finales del siglo En la siguiente seccin sobre la evaluacin
XX estuvieron motivados por la teora construc- formativa, me explayo sobre la idea del uso de
tivista del aprendizaje y la necesidad de una ense- la evaluacin como parte del proceso de apren-
anza y una evaluacin ms autnticas (Resnick y dizaje. La evaluacin formativa se define como
Resnick, 1992; Wiggins, 1993). Para la comunidad la evaluacin llevada a cabo durante el proceso
dedicada a las mediciones en Estados Unidos, el de enseanza con el fin de mejorar la enseanza
impacto de estos cambios se concentr princi- o el aprendizaje. La evaluacin formativa pue-
palmente en reformar programas de evaluacin de implicar mtodos informales, tales como
en gran escala, ya que varios estados iniciaron un la observacin y las preguntas orales, o el uso
programa de evaluaciones innovadoras y basadas formativo de medidas ms formales como ex-
en el desempeo (Baron y Wolf, 1996). Quiz a menes tradicionales, portafolios y evaluaciones
causa de la gran importancia de las pruebas de del desempeo. Tambin me ocupo de proble-
responsabilizacin externa3, la comunidad estu- mas de coherencia y de cmo podramos lograr
diosa de las mediciones mostr lentitud en consi- que las estrategias de evaluacin formativas y
derar las implicaciones de estos cambios tericos sumativas se respaldaran mutuamente. La dis-
para la evaluacin en el aula. Se form un peque- tincin entre la evaluacin formativa y la suma-
o Grupo de Inters Especial dentro de la American tiva es paralela al uso original que Michael Scri-
Educational Research Association; pero, durante los ven (1967) dio a estos trminos, en el contexto
aos noventa, por ejemplo, la evaluacin en el de la evaluacin curricular y la evaluacin de
aula o temas afines, tales como las formas de asig- programas, para distinguir entre la evaluacin
nar calificaciones, dieron cuenta de slo el 4% de realizada durante el proceso de desarrollo para
las sesiones en las reuniones anuales del National dar informacin al proceso mismo, en contra-
Council on Measurement in Education (Consejo Na- posicin con la evaluacin del producto final.
cional de la Medicin en Educacin). En Gran La evaluacin sumativa, que se considera en una
Bretaa, las pruebas estandarizadas tomaron una seccin posterior, se refiere a las evaluaciones
direccin muy diferente. El Assessment Reform realizadas al final de una unidad de enseanza
Group (1999), que empez en 1989 como un Gru- o curso de estudio, con el propsito de dar ca-
po de Tareas [Task Group] de la British Educational lificaciones o de certificar el aprovechamiento
Research Association, se centr en el vnculo deci- del estudiante. Como veremos, el nuevo mode-
sivo entre la evaluacin en el aula y la enseanza lo de evaluacin formativa aspira a hacer que la
y el aprendizaje. El Assessment Reform Group acu- evaluacin forme parte integral de la ensean-
la expresin evaluacin para el aprendizaje para za, tal como lo propusieron los primero teri-
referirse a la evaluacin que respalda el proceso cos de la medicin. La diferencia importante
de aprendizaje, lo que contrasta con la evaluacin es que las estrategias que se explican aqu estn
que slo mide los resultados del aprendizaje. Si- construidas sobre un modelo muy diferente de
guiendo a Sadler (1989), Black y Wiliam (1998) enseanza y aprendizaje, y no dependen de ins-
hicieron que este aprendizaje se centrara en la trumentos estandarizados que se hayan elabo-
caracterstica definitoria de la evaluacin forma- rado fuera del saln de clase.

3
External accountability. Hace referencia a que la sociedad respon-
sabiliza y, tambin pide una rendicin de cuentas a la institucin,
a los maestros y/o a los estudiantes mismos. La interna sera la
propia de la institucin, los maestros y/o los estudiantes [N. T.]

16
La evaluacin en el aula

2. EVALUACIN FORMATIVA cin futura debe considerar el aprendizaje y el


desarrollo profesional de los maestros as como
Para que los docentes sean eficaces en reforzar a la eficacia de herramientas especficas de eva-
el aprendizaje de los estudiantes, deben com- luacin.
probar constantemente la comprensin que s-
tos vayan logrando. Por otra parte, tienen que 2.1 Teora del aprendizaje, y coherencia
darles a conocer la importancia de que ellos mis- en el diseo de la evaluacin
mos asuman la responsabilidad de reflexionar y
supervisar su propio progreso en el aprendiza- La obra Knowing What Students Know (Pellegrino
je. Un anlisis fundamental de Black y Wiliam et al., 2001) fue el resultado de un comit del
(1998), que marc un hito, descubri que los es- National Research Council, que se encarg de re-
fuerzos orientados a mejorar la evaluacin for- unir los avances hechos tanto en la ciencia cog-
mativa producan beneficios mayores a la mitad nitiva como en la medicin. Una premisa central
de una desviacin estndar. En otras palabras, que sustenta las recomendaciones de Knowing
la evaluacin formativa, eficazmente implemen- What Students Know es que las observaciones e
tada, puede hacer tanto o ms para mejorar la interpretaciones de la evaluacin deben estar
realizacin y los logros que cualquiera de las relacionadas con un modelo cognitivo bien es-
intervenciones ms poderosas de la enseanza, tructurado de cmo aprende el estudiante en
como la enseanza intensiva de Lectura, las cla- cierto campo. Este modelo fundamental debe
ses particulares y otras parecidas. reflejar una comprensin actualizada de cmo
En esta seccin, comienzo con un resumen se desarrolla el aprendizaje en un campo, y no
de las teoras contemporneas del aprendizaje las creencias tan restrictivas (Pellegrino et al.,
y luego presento un modelo de evaluacin for- 2001, p. 54) en que se basan las evaluaciones del
mativa del que muestro su compatibilidad tan- logro acadmico que ms se utilizan. Un modelo
to con la teora cognitiva como con la teora de aprendizaje sirve como un elemento unifica-
sociocultural del aprendizaje. Luego considero dor, un ncleo que da cohesin al currculo, la en-
varias estrategias y herramientas especficas que seanza y la evaluacin (Pellegrino et al., 2001,
comprenden el modelo general que los docen- p. 54). Por otra parte, los autores de Knowing
tes utilizan como parte de las rutinas cotidianas What Students Know argumentan ms adelante
de enseanza. Estos procesos recursivos de eva- en favor de esta misma coherencia esencial entre
luacin son esenciales para una revisin y per- las evaluaciones externas y las que se hacen en
feccionamiento continuos de la enseanza as clase. Para trabajar conjuntamente y respaldar el
como para mejorar tambin el aprendizaje del aprendizaje del estudiante, las evaluaciones en
estudiante. ambos niveles de un sistema de evaluacin de-
No obstante, antes es necesario hacer una ben apoyarse en modelos compatibles sobre el
advertencia. Las prcticas ideales de evaluacin aprendizaje del estudiante, aun cuando los mo-
que aqu se explican y que se basan en la inves- delos referentes al aula pueden ser mucho ms
tigacin, son consistentes con las prcticas de detallados. En este captulo, utilizo el concepto
maestros particularmente competentes y exper- de coherencia para hablar acerca de cmo puede
tos, pero no necesariamente reflejan prcticas de hacerse que se respalden mutuamente la evalua-
evaluacin tpicas. De hecho, la mayora de los cin formativa y la sumativa dentro del aula.
maestros en servicio tiene solo un conocimiento En el panorama histrico que esboc en l-
limitado de estrategias de evaluacin formativa, neas anteriores, los cambios en la teora del
y sigue pensando en la evaluacin como un pro- aprendizaje se mencionaron varias veces como la
ceso que sirve principalmente para calificar. Por fuerza motriz de los cambios en la forma en que
consiguiente, la seccin final sobre la investiga- conceptualizaron la enseanza y la evaluacin

17
Textos de evaluacin

los expertos en las materias. Las concepciones actividad prctica llena de significado. Un indi-
contemporneas del aprendizaje han transfor- viduo aprende a pensar y a razonar gracias a una
mado nuestra comprensin de cmo ocurre el gran diversidad de apoyos proporcionados por
aprendizaje, pero de manera ms fundamental, adultos y pares ms conocedores e informados.
han alterado nuestras concepciones de qu es el Este modelo de aprendizaje queda excelente-
aprendizaje, qu significa ser competente en un mente caracterizado como un proceso de induc-
campo y, por consiguiente, cmo buscaramos cin, o como un modelo del aprendiz, median-
evidencia de esa competencia. La revolucin cog- te el cual se permite a los novatos participar y
nitiva fue una rebelin en contra de la psicologa hacer contribuciones en un contexto de trabajo
de las diferencias individuales y el conductismo, real, pero a los que se asignan tareas adaptadas
que se haba interesado sobre todo en la adquisi- a su nivel particular de competencia. El ejemplo
cin de competencias mediante el reforzamien- paradigmtico, desde luego, es la forma como
to de conductas observadas, en lugar de tratar de se adquiere el lenguaje gracias a un proceso de
explicar los procesos mentales bsicos. En cam- prctica mediada socialmente (Bruner, 1985).
bio, de acuerdo con la teora cognitiva, quienes En la teora sociocultural es fundamental com-
aprenden construyen el conocimiento conec- prender que los productos de la actividad (los
tando nueva informacin a estructuras previas resultados del aprendizaje) estn integrados en
de conocimiento. Los esquemas mentales, en el las prcticas culturales del ambiente donde se
cerebro o la mente, sirven para organizar el co- desarrolla la actividad. De este modo, aprender
nocimiento para que cuando despus se necesite a conocer es volverse un adepto que participa en
lo recuperemos y utilicemos en situaciones pro- las maneras de hablar, las representaciones del
blemticas; y los procesos ejecutivos, llamados conocimiento y el uso de herramientas asocia-
metacognicin, permitan monitorear y manejar das con una comunidad de prctica especfica.
su propia comprensin y aprendizaje a quienes En otro lado he propuesto una concepcin
aprenden. Los cognitivistas hacen hincapi en la del aprendizaje social-constructivista4, que rene
comprensin conceptual y han demostrado que las teoras cognitiva y sociocultural (Shepard,
la transferencia, esto es el uso del conocimien- 2000). Si bien hay muchos puntos discutibles
to en situaciones nuevas, se hace posible por la no resueltos entre estas dos perspectivas y en
aprehensin de principios generalizados y el uso el interior de ellas, las considero compatibles.
de esquemas gracias a los cuales se reconocen Vygotsky (1978, p. 57) sostena que todas las fun-
las similitudes en los distintos tipos de proble- ciones en el desarrollo cultural del nio aparecen
mas. La perspectiva cognitiva predomina en el dos veces: primero, en el nivel social, y luego en
trabajo terico y emprico presentado en dos el nivel individual; primero entre la gente (interp-
publicaciones significativas del National Research sicolgica), y luego dentro del nio (intrapsicolgi-
Council, How People Learn (Bransford, Brown, y ca). Siguiendo la direccin de Vygotsky, pues,
Cocking, 1999) y Knowing What Students Know, podemos usar la investigacin sociocultural para
si bien ambas reconocen la influencia del con- entender los procesos sociales que respaldan y
texto social y la aplicabilidad de las perspectivas definen el aprendizaje, y la teora cognitiva, con
socioculturales o situacionales. el fin de entender los procesos mentales subse-
Un modelo sociocultural del aprendizaje cuentes y recurrentes del individuo. Obsrvese,
surge de un renovado inters en el trabajo de sin embargo, que incluso el razonamiento y las
Vygotsky (1978) y otros psiclogos rusos. Se ocu- reflexiones de una persona aparentemente pri-
pan de la naturaleza social del aprendizaje y en
4
En este captulo no defino ni uso el trmino social-constructi-
la idea de que la competencia y la identidad de vismo como la conjuncin de las teoras cognitiva y sociocultural,
quienes aprenden se desarrollan por medio de porque algunos autores utilizan el social-constructivismo en forma
una participacin mediada socialmente, en una ms estrecha para referirse solamente a una variante de la teora
cognitiva.

18
La evaluacin en el aula

vadas, estn integradas socialmente, porque el dad del estudiante para defender un argumento?
individuo lleva consigo las formas de razonar, las Luego, la fase de evaluacin debe ocurrir durante
expectativas, los criterios, etctera. de su mun- el proceso de aprendizaje, mientras el estudiante
do social. Ms recientemente, en mi trabajo me trabaja en tareas que ejemplifican directamente el
he concentrado en la teora sociocultural porque objetivo del aprendizaje que se propone alcanzar.
creo que es la teora ms completa. Esta evaluacin, que se hace en medio del apren-
dizaje, podra ocurrir por medio de preguntas al
2.2 Un modelo de la evaluacin estudiante durante el trabajo grupal, cuando un/
formativa una estudiante explica a la clase cmo resolvi un
problema, o al examinar un trabajo escrito. Final-
Sadler (1989) aport el modelo ms aceptado de mente, en la tercera etapa, para que la evaluacin
la evaluacin formativa. Este autor indic que formativa sea de verdadera ayuda para el aprendi-
es insuficiente que los maestros simplemente zaje, debe darse una retroalimentacin que pro-
den una retroalimentacin respecto de si las res- porcione entendimiento acerca de cmo llenar
puestas son correctas o incorrectas. En vez de una carencia. Por ejemplo, cuando un estudian-
ello, para facilitar el aprendizaje, es igualmente te tiene an confusin respecto de un concepto
importante que la retroalimentacin est vin- fundamental, existe un mtodo diferente para
culada explcitamente a criterios claros de des- abordar el problema o un conocimiento esencial
empeo y que se proporcione a los estudiantes al que haya que volver? Si el razonamiento en
estrategias de mejoramiento. Este modelo de un trabajo de composicin est desarrollado en
evaluacin formativa fue explicado ms amplia- forma deficiente, cmo puede corregirlo el es-
mente en un reporte reciente de Atkin, Black, tudiante despus de tomar primero en conside-
y Coffey (2001) sobre evaluacin en ciencias en racin lo que falta en relacin con los criterios de
el aula. Estos autores construyen el proceso de evaluacin?
evaluacin del aprendizaje con estas preguntas Este modelo de evaluacin formativa es ms
clave: que una etapa de recoleccin de de datos. Es
un modelo para el aprendizaje que corresponde
Adnde tratas de ir? directamente a la Zona de Desarrollo Prximo
Dnde ests ahora? (ZDP) y a la teora sociocultural del aprendizaje.
Cmo puedes llegar ah? Tal como lo visualiz Vygotsky (1978), la Zona
de Desarrollo Prximo es la regin, en un conti-
Al responder la pregunta de evaluacin (la No. nuo imaginario de aprendizaje, entre lo que un
2, dnde ests ahora?) en relacin con el obje- nio puede hacer de manera independiente y lo
tivo de la enseanza (pregunta No. 1) y dedicn- que ese mismo nio puede hacer si lo ayudan.
dose especficamente a lo que se necesita para Wood, Bruner y Ross (1976) desarrollaron ade-
alcanzar el objetivo (pregunta No.3), el proceso ms la idea del andamiaje5 para caracterizar el
de evaluacin formativa respalda directamente apoyo, bajo la modalidad de gua, indicaciones
el mejoramiento. y estmulo, que los adultos proporcionan en la
Establecer objetivos claros para el aprendizaje ZDP con objeto de capacitar a quien aprende
por parte del estudiante implica mucho ms que a desempear a un nivel de logro algo que de
anunciar una finalidad de la enseanza para que otro modo no habra sido capaz de alcanzar. La
los estudiantes la contemplen. Tambin requiere etapa de evaluacin en el modelo de evaluacin
la elaboracin de los criterios mediante los cua- formativa (dnde ests ahora?) proporciona la
les ser juzgado el trabajo del estudiante. Cmo
sabrn el maestro y el estudiante que se ha enten- 5
Scaffolding en ingls. Se refiere a la tcnica mediante la cual el
dido un concepto? Cmo se evaluar la capaci- maestro modela la tarea o la estrategia deseada del aprendizaje, y
luego traslada gradualmente la responsabilidad a los estudiantes.

19
Textos de evaluacin

comprensin que se necesita para un respaldo Yackel (1993) hablan de anlisis de toda una cla-
eficaz. Y el modelo formativo completo, que se donde hay andamiaje y donde los estudiantes
comprende el esclarecimiento del objetivo y son capaces no slo de esclarecer su compren-
la identificacin de los medios para llegar ah, sin de conceptos matemticos, sino tambin
puede verse esencialmente como un sinnimo de practicar las normas y formas sociales de ha-
del andamiaje de la enseanza. En realidad, la blar en esa disciplina. De igual manera, en clases
versin plenamente elaborada de Sadler de la de investigacin en Ciencias (Hogan y Pressley,
evaluacin formativa requiere que los maestros 1997), los estudiantes aprenden a dar evidencias
y los estudiantes tengan una comprensin y una que sustenten una posicin y tambin a criticar
apropiacin compartidas del objetivo de apren- las conclusiones sin fundamento de sus com-
dizaje y, por ltimo, que los estudiantes sean paeros de clase: una forma valiosa de retroali-
capaces de supervisar su propio mejoramiento. mentacin. Semejantes despliegues pblicos en
Esto corresponde al objetivo del andamiaje: fo- que se desarrolla el pensamiento crean, asimis-
mentar que quien aprende interiorice este pro- mo, la oportunidad perfecta para la evaluacin
ceso y asuma su responsabilidad. formativa.
En el mundo real, los maestros rara vez tienen Idealmente, pues, la evaluacin formati-
tiempo para dar sesiones de tutora individuales va debe quedar perfectamente integrada en la
o de hacer evaluaciones dinmicas que les per- enseanza. En los prrafos que siguen me ex-
mitieran dedicarse a impartir una enseanza con playo sobre los elementos especficos del pro-
andamiaje a un estudiante durante un ciclo com- ceso de evaluacin formativa, los cuales tienen
pleto de aprendizaje. Y, con seguridad, planear un extenso fundamento de investigacin. Co-
la enseanza para un saln de clases completo mienzo ocupndome del contenido porque la
lleno de estudiantes cuya ZDP es muy variada, evaluacin carece de significado si no abarca
es un verdadero reto. No obstante, pueden es- las cosas que ms queremos que aprendan los
tablecerse rutinas del aula para garantizar que estudiantes. En seguida considero los avances
los elementos bsicos de la evaluacin formativa de los estudiantes porque, dentro de los conte-
y del andamiaje estn establecidas y funcionan- nidos de las materias, los maestros deben tener
do en la forma de interacciones de enseanza tambin una idea de las progresiones tpicas
ordinarias. Por ejemplo, hablar con estudiantes de aprendizaje, con el fin de que sepan en qu
en forma individual es una parte normal de la direccin ayudan a los estudiantes, y tambin
enseanza de la escritura, junto con la correc- cmo respaldarlos cuando la comprensin fa-
cin editorial por los compaeros o el ejercicio lla. Ms tarde tomo en cuenta aspectos espe-
de la silla del autor, que es una prctica en la que cficos de las interacciones entre evaluacin y
un estudiante comparte algo que ha escrito con enseanza, cmo tener acceso al conocimien-
toda la clase. Otra estrategia es desarrollar las to previo, cmo hacer explcitos los criterios,
capacidades de los estudiantes para proporcio- proporcionar retroalimentacin, etctera. No
narse retroalimentacin unos a otros. Una de las obstante, no hace falta que ninguno de estos
razones por las que el discurso sobre el aula ha procesos interrumpa la enseanza, sino que
recibido tanta atencin en la investigacin sobre ms bien deben retroalimentar un aprendizaje
la reforma en la enseanza, es que las pautas de continuo. Aun si uno toma tiempo para un exa-
interaccin grupal, especialmente las preguntas men formal, los resultados pueden utilizarse
de los estudiantes y la forma en que explican su para un diagnstico de la enseanza con el fin
razonamiento, pueden proveer de andamiaje al de decidir qu conceptos necesitan ms anli-
aprendizaje del estudiante, sin que sea necesa- sis y trabajo. Y los estudiantes pueden llegar a
rio que el docente invierta tiempo para atender entender que tales evaluaciones tienen una fi-
a los estudiantes uno por uno. Cobb, Wood, y nalidad de aprendizaje.

20
La evaluacin en el aula

2.3. La importancia del contenido: seleccin all del dominio de las habilidades y los concep-
de las tareas de enseanza y de evaluacin tos bsicos. No es de sorprender que la refor-
que encarnan objetivos de aprendizaje ma de la evaluacin fuera una parte igualmente
importante de los movimientos de estndares,
La evaluacin no puede impulsar el aprendizaje por la necesidad de alcanzar estos objetivos ms
si se basa en tareas o preguntas que distraen la ambiciosos. El trmino alineacin se ha utiliza-
atencin de los verdaderos objetivos de la ense- do para especificar la correspondencia deseada
anza. Histricamente, las pruebas tradiciona- entre evaluaciones y estndares curriculares.
les a menudo dirigan erradamente la enseanza Desafortunadamente, el significado de alinea-
cuando se centraban en lo que era ms fcil de cin se desvaloriza un tanto cuando los editores
medir en vez de centrarse en lo que era impor- de pruebas muestran que todos su reactivos de
tante aprender. La enseanza en clase debe ocu- seleccin mltiple pueden hacerse corresponder
par a los estudiantes en actividades de aprendi- con las categoras de los estndares de conteni-
zaje, las cuales sean lo ms directamente posible do de un estado, aun cuando en conjunto slo
ejemplos de los objetivos reales del aprendizaje. utilizan un estrecho subconjunto de los estn-
Si queremos que los estudiantes sean capaces de dares deseados. Anteriormente, he propuesto
leer libros, peridicos y poemas, ellos deben en el trmino encarnar como una forma de carac-
realidad hacer eso, por lo que no hay que dar- terizar mejor la alineacin ms completa y real
les materiales abreviados y simulados, excepto que ocurre cuando las tareas, los problemas y los
cuando queramos adaptarlos a su edad. De igual proyectos en los que estn ocupados los estu-
modo, en Ciencias, si queremos que los estu- diantes representan toda la gama y profundidad
diantes sean capaces de razonar y usar el cono- de lo que decimos que queremos entiendan y
cimiento cientfico, entonces debemos darles la tengan capacidad de hacer (Shepard, 2003).
oportunidad de explicarse cmo funcionan las Tal como lo ilustraron Wiggins y McTighe
cosas, realizando investigaciones y elaborando (1998), la elaboracin de evaluaciones que mani-
explicaciones con sus propias palabras, para que fiesten objetivos de aprendizaje es esencial para
as conecten sus experiencias con las teoras del una buena enseanza, y no slo una cuestin de
libro de texto. La evaluacin, entonces, debe medir resultados. En vez de un planeamiento de
realizarse como parte de estas actividades de la enseanza que se concentre en actividades in-
aprendizaje significativo. Si los estudiantes rea- teresantes, Wiggins y McTighe utilizan un pro-
lizan un proyecto de investigacin en Historia ceso de planificacin hacia atrs, que empieza con
o muestran a la clase cmo resolvieron un pro- los objetivos de la enseanza, luego se cuestiona
blema de Matemticas, entonces la tarea de la cul ser una evidencia convincente o una de-
enseanza es la labor de la evaluacin. mostracin de que hubo aprendizaje? y al final
Un rasgo definitorio de las reformas basadas planea actividades que permitiran desarrollar
en estndares ha sido el desarrollo de normas en los estudiantes esa comprensin. Con esta
curriculares que sirven para revigorizar y realzar ltima como objetivo de la enseanza, subrayar
qu significa saber y demostrar aprovechamien- la evaluacin fuerza a los maestros a explicar en
to en cada disciplina. Por ejemplo, el Curriculum forma muy clara y sin lugar a dudas qu aspecto
and Evaluation Standards for School Mathematics tendra la evidencia de la comprensin, y estas
del NCTM (1989)6 plantea expectativas, hace descripciones del desempeo los mueven a brin-
hincapi en la solucin de problemas, la comu- dar oportunidades a los estudiantes para que
nicacin, el razonamiento matemtico y el esta- desarrollen y practiquen estas habilidades que
blecimiento de conexiones que van mucho ms de otro modo podran haberse perdido si la com-
prensin se hubiese dejado slo como un objetivo
6
Siglas en ingls del National Council of Teachers of Mathematics, declarado para toda la unidad. Por ejemplo, un
Consejo Nacional de Maestros de Matemticas. [N. T.]

21
Textos de evaluacin

maestro encontrara pruebas de comprensin English Literacy Survey, el cual ejemplifica una
por parte de los estudiantes si stos pudieran progresin en el aprendizaje, fue diseado para
explicar su razonamiento o aplicar su conoci- reunir datos bsicos sobre la realizacin y los lo-
miento en un contexto nuevo. Y cada una de gros de estudiantes del tercer y quinto grados en
estas facetas puede desarrollarse an ms para el curso de Lengua, incluyendo Habilidades de
dejar en claro qu es lo que los estudiantes se- lectura, Revisin visual, Audicin y Expresin
ran capaces de hacer. Por ejemplo, el criterio de oral y escrita (Masters y Forster, 1997). El pro-
Wiggins y McTighe (1998) para una explicacin greso de un estudiante en conseguir el control
que demuestre comprensin incluye dar razones de estructuras y convenciones del lenguaje pue-
crebles, proporcionar una explicacin sistem- de diagramarse o comunicarse en este continuum,
tica, o utilizar modelos mentales tiles. Si bien el cual proporciona una imagen del crecimiento
es cierto que ser capaz de explicar un concepto individual en contraposicin con un teln de
exige mucho ms que conocerlo, conocer y ex- fondo de expectativas establecidas normativa-
plicar guardan una estrecha relacin entre s, y mente. A diferencia de los informes de evalua-
el razonamiento y pensamiento que adems se cin, que se ven ms bien como una lista de ve-
requieren para producir una explicacin creble rificacin de objetivos de los diferentes grados,
son exactamente el tipo de esfuerzo mental que los mapas de progreso tienen implicaciones ms
hace falta para desarrollar una comprensin ms directas para la enseanza, porque brindan si-
flexible y ms profunda. multneamente una imagen de las fortalezas y
debilidades y una manera de mirar hacia lo que
2.4. Progresiones del aprendizaje viene para cada una de las facetas del campo de
que se trate. Por ejemplo, un estudiante de se-
Las progresiones del aprendizaje o los continuos gundo grado puede estar muy avanzado en el uso
del aprendizaje son importantes para monitorear de la puntuacin (maysculas y puntos) y dele-
y respaldar el desarrollo a lo largo del tiempo. A trear palabras comunes correctamente (Nivel 3),
diferencia de los estndares, que han recibido pero tal vez necesite ayuda para experimentar e
una gran atencin durante la ltima dcada, se ir ms all de estructuras repetitivas de oracio-
ha desarrollado relativamente poco y ha habi- nes (Nivel 2).
do mucha menos investigacin para explicar las En Australia, los sistemas de evaluacin son
progresiones en el aprendizaje. Desde luego que coherentes con las evaluaciones en el aula y en
la mayora de los maestros tienen cierto senti- gran escala estn relativamente bien desarrolla-
do intuitivo de qu sigue, o no seran capaces de dos y vinculados a un mismo mapa de progreso
ayudar a los estudiantes a desempearse mejor. (Forster y Masters, 2004). Algo parecido sucede
Sin embargo, incluso los maestros ms capaci- en los Pases Bajos, donde se elaboran trayecto-
tados podran sacar provecho de modelos con rias aprendizaje-enseanza para proporcionar los
mayor desarrollo formal sobre cmo se desplie- conocimientos pedaggicos necesarios para
ga el aprendizaje en un mbito curricular, y se respaldar el desarrollo del pensamiento del es-
beneficiaran tambin si conocieran las variacio- tudiante a lo largo del tiempo (Van der Heuvel-
nes y desviaciones naturales del patrn tpico. Si Panhuizen, 2001). En Estados Unidos, en cam-
bien las progresiones empricamente validadas bio, el desarrollo de progresiones de aprendizaje
pueden hacer posible un andamiaje ms com- tiles para la enseanza se ha visto limitado por
prensivo de la enseanza, las progresiones jams la forma transversal y a retazos, que con el tiem-
deben interpretarse como algo cerrado o como po han propiciado los sistemas de evaluacin en
una secuencia absoluta de requisitos. gran escala. Las evaluaciones estatales y nacio-
El mapa de progreso en escritura que aparece nales, que originalmente se propusieron moni-
en la Figura 17.1, del Australias National School torear tendencias en momentos particulares,

22
La evaluacin en el aula

centraron la atencin en las expectativas del ni- FIGURA 17.1 Mapa de progreso en escritura
vel a alcanzar en ciertos grados fundamentales fundamentado empricamente
(cuarto ao de primaria, segundo de secundaria Revisa escritura para que sea consistente en conte-
nido y estilo.
y tercero de preparatoria). En aos ms recien- Hace pruebas con distintos reordenamientos de ora-
tes, los estados, que ahora piden ms requisitos ciones.
Controla estructuras gramaticales y puntuacin en

Nivel 5
para las pruebas individuales, completan los gra- oraciones complejas.
Organiza la escritura en un todo coherente apropiado
dos intermedios e intercalan las expectativas cu- 600 al contexto (por ejemplo: prrafos para textos narrati-
rriculares. No obstante, estas expectativas, es- vos y subttulos para textos informativos).
Utiliza vocabulario preciso y eficaz.
pecialmente en momentos en que los estndares Se acerca a la ortografa de palabras particularmente
difciles utilizando modelos y convenciones.
de nivel internacional se han establecido en curr-
culos que nunca se haban implementado antes,
Empieza a adoptar convenciones de formato estruc-
no necesariamente reflejan la trayectoria del de-

Nivel 4
turado para organizar su trabajo (por ejemplo: una ex-
posicin introductoria general a un informe).
sarrollo de estudiantes reales. Al mismo tiempo, Maneja una diversidad de formas de oraciones (por
existe el peligro de que depender de promedios 500 ejemplo: oraciones sencillas y complejas).
Utiliza puntuacin apropiada la mayor parte del tiempo.
normativos para establecer progresiones, con- Da cuerpo a su escritura con un inicio y un final cla-
gelar las expectativas curriculares pasadas de ros, y posiblemente divide los prrafos.
Utiliza vocabulario apropiado la mayor parte del
moda o establecer expectativas demasiado ba-
Realizacin y logros en escritura
tiempo.
Escribe correctamente la mayor parte de las pala-
jas porque promedian los resultados de una en- bras.
seanza fallida. Por ejemplo, con base en datos
empricos, la Keymath Diagnostic Arithmetic Test Muestra algunas evidencias de cierta planeacin, revi-

Nivel 3
sin y correccin de su propia escritura.
(Connolly, Nachtman, y Pritchett, 1972) utiliza 400 Controla la estructura de oraciones sencillas e intenta
reactivos en la forma de 4 1/2 x 5 como ejemplo utilizar estructuras ms complejas.
Intenta variar inicios de oracin.
de la Aritmtica que, se espera, deben dominar Intenta dar forma a su escrito en lo referente a la es-
tructura (por ejemplo: idea del principio y el fin).
los estudiantes en el grado equivalente al tercero Escribe correctamente muchas de las palabras comu-
de secundaria. nes.
Escribe legiblemente.
Lo que hace falta es un proceso para crear
continuos de aprendizaje que estn basados no 300
slo en la investigacin, sino en un juicio ex-

Nivel 2
perto que incluya la validacin de los continuos Usa oraciones sencillas.
Usa una estructura repetitiva de oracin.
propuestos en el contexto de un currculo bien Utiliza conjunciones sencillas (por ejemplo, y
implementado. Hasta la fecha, algunas de las in- pero).
Controla la puntuacin comn a menudo o todo el
vestigaciones ms fundamentadas y ms perti- 200 tiempo (por ejemplo, maysculas y puntos).
Escribe correctamente casi todo el tiempo palabras
nentes respecto de la enseanza, se han hecho muy frecuentes.
en las reas del alfabetismo emergente y de la Escribe de un modo que otros pueden por lo general
entender.
habilidad con los nmeros tambin emergen-
te, las cuales pueden servir como modelo. Por 100 Utiliza algunas convenciones bsicas (por ejemplo,
Nivel 1

ejemplo, en la ortografa prefonmica, los nios escribe de izquierda a derecha y pone espacios entre
las palabras).
escriben primero letras que representan pala- Maneja algunas palabras conocidas, o palabras repre-
sentadas por sus letras iniciales.
bras sin relacionar los sonidos de las letras con Utiliza algunas letras iniciales correctas y otros sonidos.
la palabra deseada. Despus dan un paso en su El nio puede volver a leer lo que ha escrito mientras
lo est escribiendo
desarrollo cuando empiezan a escribir letras que
tienen correspondencia con los fonemas ms
prominentes en una palabra, y as sucesivamente
Fuente: De Masters, G. y Forster, M. (1997), Mapping Litera-
(Hiebert y Raphael, 1998). De modo parecido, cy Achievement: Results of the 1996 National School English Lit-
las estrategias naturales de los nios para sumar eracy Survey, Canberra, Australia, Department of Employ-
ment, Education, Training and Youth Affairs (DEETYA).
se desarrollan con el tiempo, desde que empie- Reproducido con permiso.

23
Textos de evaluacin

zan a contar hasta que usan nmeros (Carpenter 1988) y las tcnicas K-W-L7 (Ogle, 1986) no son
y Moser, 1984), y la investigacin sobre la ense- consideradas como evaluaciones como tales ni
anza ha demostrado que los maestros se vuel- por maestros ni por estudiantes. Sin embargo,
ven ms eficaces cuando se les hace tomar con- s aportan datos valiosos para corregir la ense-
ciencia de estas estrategias tpicas de solucin anza, como cuando los maestros encuentran
de problemas (Fennema y Franke, 1992). lagunas en un conocimiento que suponen ya asi-
milado o cuando descubren que los estudiantes
2.5. Evaluacin del conocimiento previo saben mucho ms sobre un tema de lo previsto.
Dada la evidencia obtenida, gracias a la inves-
El conocimiento previo es esencial para el tigacin, sobre la necesidad de combatir con-
aprendizaje. De hecho, el proceso del apren- ceptos errneos cuando se presenten, el reco-
dizaje puede concebirse como lo que hacemos nocimiento explcito de los conceptos errneos
para conectar e integrar una nueva comprensin evaluados como la razn para las actividades
con el conocimiento existente. El conocimiento posteriores de enseanza podra ser una manera
previo incluye el aprendizaje formal, como el de de elevar la conciencia de los estudiantes de que
un preescolar que aprende la norma de no cru- la evaluacin est al servicio de la finalidad del
zar la calle sin mirar hacia los dos lados, pero aprendizaje.
tambin incluye una multitud de explicaciones El conocimiento previo es ms que un con-
implcitas, las cuales nos enseamos a nosotros junto de hechos que un estudiante ha acumula-
mismos, sobre cmo funciona el mundo. Estas do en su casa y en grados anteriores. El cono-
intuiciones o teoras que nos enseamos a noso- cimiento previo tambin incluye patrones de
tros mismos pueden en ocasiones facilitar nue- lenguaje y formas de pensar que los estudiantes
vo aprendizaje, como cuando las explicaciones desarrollan por medio de sus roles sociales y sus
cientficas se dominan fcilmente porque tienen experiencias culturales. Los maestros pueden a
sentido y armonizan con nuestra experiencia pre- veces interpretar mal las diferencias en las prc-
via. Las teoras intuitivas tambin pueden ser el ticas culturales y considerarlas como evidencia
origen de conceptos errneos importantes que de un dficit. Por ejemplo, los nios blancos de
obstaculizan el aprendizaje nuevo y son relati- clase media estn ms acostumbrados a que les
vamente impenetrables al cambio que busca la hagan preguntas descontextualizadas, como qu
enseanza, a menos que los estudiantes reciban color es ste?, que los nios de otros grupos socia-
una forma estructurada de trabajo que les per- les (Heath, 1983). Las reglas implcitas de inte-
mita resolver las inconsistencias entre sus intui- raccin pueden hacer que a los maestros se les
ciones y otras evidencias. dificulte advertir las fortalezas de los estudian-
Las estrategias eficaces de enseanza se ba- tes fuera de su propio grupo social, a menos que
san en el conocimiento previo de los estudiantes dispongan de medios para sacar esas fortalezas
como recurso. Por otra parte, al usarse rutinas de una manera que tenga sentido culturalmen-
de activacin del conocimiento al principio te. Por ejemplo, Moll, Amanti, Neff y Gonzlez
de nuevas lecciones y unidades de estudio, los (1992) utilizan el concepto fondos de conocimiento
maestros ayudan a los estudiantes a desarrollar
el hbito de preguntarse (cuando se enfrentan 7
Instructional conversations son charlas en las que se exploran ideas
a un nuevo aprendizaje o a una tarea en la que ms que respuestas a preguntas de exmenes que se evaluarn.
Tcnicas KWL:
tengan que resolver un problema) de lo que ya s, K Representa la ayuda que se da a los estudiantes para que recuer-
qu puede ayudarme a resolver esto? Muchas acti- den lo que Saben [know, en ingls] sobre la materia.
W Representa la ayuda que se da a los estudiantes para que de-
vidades de conocimiento previo como las con- terminen lo que Quieren [want, en ingls] aprender.
versaciones instruccionales (Tharp y Gallimore, L - Representa la ayuda que se da a los estudiantes para que identi-
fiquen lo que Aprenden [learn, en ingls] al leer. [N. T.]

24
La evaluacin en el aula

para referirse al conocimiento que reciben en la retroalimentacin facilita el aprendizaje. Sin


casa los nios de familias pobres, y que se basa retroalimentacin sobre errores conceptua-
en la agricultura, la carpintera, la medicina, la les o retrocesos ineficaces es probable que
religin, el cuidado infantil y las actividades re- el que aprende persista en cometer los mismos
lacionadas con el manejo del presupuesto, que errores. En un extenso meta-anlisis de 131 es-
pueden usarse para reforzar el conocimiento es- tudios controlados, Kluger y DeNisi (1996) die-
colar. ron a conocer un tamao de efecto [effect size] o
ganancia de 0.4 gracias a la retroalimentacin.
2.6. Criterios explcitos y el uso de guas Tambin reconocieron una variacin significati-
de calificacin (rbricas) va en el estudio con aproximadamente un tercio
de los estudios que mostraron efectos negativos.
El modelo de evaluacin formativa requiere que Al intentar identificar las caractersticas de re-
el maestro y el estudiante tengan una compren- troalimentacin ms asociadas con los efectos
sin compartida de los objetivos del aprendizaje. positivos, Kluger y DeNisi descubrieron que es
En la teora cognitiva, las metas deben definirse ms probable estimular el aprendizaje cuando la
explcitamente y ser visibles para los estudian- retroalimentacin se enfoca en ciertos aspectos
tes. En la teora sociocultural, una comprensin de la tarea y destaca los objetivos de aprendizaje.
del objetivo se construye conjuntamente mien- Este importante hallazgo proveniente de la lite-
tras el estudiante recibe ayuda para mejorar su ratura sobre la retroalimentacin, es consisten-
desempeo. Cuando los maestros ayudan a los te con mi argumento anterior para las guas de
estudiantes a entender e internalizar los estn- calificacin [rubrics], las cuales permiten juzgar
dares de excelencia de una disciplina es decir, el desempeo en relacin con criterios bien de-
aquello que hace que un trabajo de historia o finidos (en vez de juzgar a un estudiante compa-
una explicacin matemtica sean buenos les rndolo con otros), y se armoniza con los descu-
ayudan a desarrollar la conciencia metacognitiva brimientos de la literatura sobre motivaciones
de aquello a lo que necesitan prestar atencin que analizar posteriormente en el contexto de
mientras escriben o resuelven un problema. las prcticas de calificacin.
Ciertamente, aprender las normas y formas de De acuerdo con evidencias de la investiga-
una disciplina es parte del aprendizaje de sta, y cin, es un error hacer elogios falsos, tratan-
no slo un medio para sistematizar o justificar la do de motivar a los estudiantes y aumentar su
calificacin. Por otra parte, no es probable que autoestima. Al mismo tiempo, la retroalimen-
los estudiantes lleguen a entender qu significan tacin negativa directa, sin consideraciones,
los estndares de excelencia simplemente por- puede minar el aprendizaje y la disposicin del
que el maestro coloque en la pared las guas de estudiante a esforzarse ms. Por consiguiente,
calificacin [scoring rubrics], aunque stas pueden una comprensin de las consecuencias motiva-
ser un punto de referencia til. Ms bien, los es- cionales de la retroalimentacin es tan impor-
tudiantes desarrollan la comprensin de las ex- tante como conocer sus propsitos cognitivos.
pectativas por medio de la retroalimentacin y El modelo de evaluacin formativa, consistente
de las autoevaluaciones, gracias a las cuales los con la literatura cognitiva, demuestra que la re-
criterios se vinculan directamente a sus propios troalimentacin es especialmente eficaz cuando
esfuerzos de aprendizaje. dirige su atencin a cualidades particulares del
trabajo del estudiante en relacin con criterios
2.7. Retroalimentacin establecidos y proporciona una gua sobre qu
hacer para mejorar. Adems, los maestros deben
Uno de los hallazgos ms antiguos de la inves- establecer un clima de confianza y desarrollar
tigacin psicolgica (Thorndike, 1931) es que normas en clase que posibiliten la crtica cons-

25
Textos de evaluacin

tructiva. Esto significa estratgicamente que la de reagrupar (o pedir prestado) de memoria en


retroalimentacin debe ocurrir durante el pro- aritmtica de segundo grado a las soluciones a
ceso de aprendizaje (y no al final, cuando ya se problemas del tipo inserta y a ver si pega en los
termin el aprendizaje de ese tema); maestro y cursos de fsica en la universidad8. En cambio,
alumnos deben tener una comprensin compar- la investigacin sobre expertos y novatos y los
tida de que la finalidad de la retroalimentacin estudios de transferencia nos demuestran que es
es facilitar el aprendizaje; y puede significar que ms probable que haya transferencia cuando el
la calificacin debe quedar en suspenso durante aprendizaje inicial se centra en la comprensin
la etapa formativa. de principios fundamentales, cuando se consi-
Para que haya una retroalimentacin eficaz, deran explcitamente las relaciones de causa y
es necesario que los maestros sean capaces de efecto y sus razones, y cuando los principios de
analizar el trabajo del estudiante e identificar aplicacin estn presentes en forma directa.
los patrones de errores y las lagunas que ms Dar clases para que haya transferencia re-
atencin requieren (no cualquier error posible). quiere que la enseanza inicial se centre en la
En un estudio de intervencin, Elawar y Corno comprensin. Tambin significa trabajar osten-
(1985) descubrieron que los maestros mejoraban siblemente para ampliar la comprensin de los
extraordinariamente la eficacia de la retroali- estudiantes. Por ejemplo, debe ser algo comn
mentacin cuando se concentraban en estas tan pronto como se vea que los estudiantes
preguntas: Cul es el error principal? Cul es han dominado un nuevo tipo de problema o una
la razn probable de que el estudiante cometie- manera de resolver un problema que los maes-
ra este error? Cmo puedo guiar al estudiante tros hagan una nueva pregunta relacionada con
para que evite el error en un futuro? (p. 166). ese conocimiento pero lo ample. El problema
Los maestros tambin deben entender la teo- inicial y las aplicaciones de seguimiento en la
ra de cmo la retroalimentacin incrementa el Figura 17.2 provienen de Connected Mathematics
aprendizaje para que ellos puedan desarrollar ru- (Lappan, Fey, Fitzgerald, Friel y Phillips, 1998).
tinas en el aula que comprueben la comprensin stas son tareas ejemplares en varios sentidos.
de los estudiantes y aseguren que no los dejan En primer lugar, ilustran que las buenas tareas
solos para que persistan en los malos hbitos o de evaluacin pueden ser intercambiables con
los conceptos errneos. las buenas tareas de enseanza. Segundo, la in-
vestigacin completa de la que se han extrado
2.8. Ensear y evaluar para que haya estos problemas ayuda claramente a desarrollar
transferencia un entendimiento del principio fundamental de
equivalencia, al pedir a los estudiantes que esta-
La transferencia se refiere a la capacidad de utili- blezcan relaciones entre representaciones tabu-
zar nuestro conocimiento en contextos nuevos. lares, grficas y algebraicas. Tercero, los proble-
La transferencia es obviamente una meta del mas de aplicacin pueden pensarse como tareas
aprendizaje. De qu sirve el conocimiento si no de cuasi-transferencia que pueden utilizarse
podemos acceder a l o no podemos aplicarlo?
Sin embargo, los estudios de la capacidad de los 8
Plug and chug es la expresin original en ingls: En los cursos
introductorios de fsica en la universidad, los estudiantes empie-
estudiantes para utilizar informacin pertinente zan a resolver un problema recurriendo a la solucin algebraica y
incluso de una leccin reciente en la que hubo numrica, es decir buscan ecuaciones y las manipulan, insertan-
do nmeros en las ecuaciones hasta encontrar una combinacin
aciertos son notoriamente decepcionantes. La que produzca una respuesta. Rara vez utilizan su conocimiento
transferencia se ve inhibida cuando los estu- conceptual de fsica para analizar cualitativamente la situacin
del problema, ni tampoco planean sistemticamente una solucin
diantes aprenden de memoria y se someten a antes de que empiecen con sus manipulaciones numricas y alge-
rutinas mecnicas para resolver problemas sin braicas de las ecuaciones. Cuando llegan a una respuesta, general-
pensar. Los ejemplos son numerosos, y van des- mente se muestran satisfechos y rara vez verifican si la respuesta
tiene sentido. [N. T.]

26
La evaluacin en el aula

para estar seguros de que los estudiantes pueden auto-supervisin del desempeo, que es la fina-
generalizar lo que han aprendido en la investi- lidad del andamiaje de la enseanza as como el
gacin. Sin embargo, los estudiantes tendrn objetivo del modelo de evaluacin formativa de
que pensar un poco sobre las caractersticas ni- Sadler (1989). El proceso de auto-evaluacin se
cas de la nueva tarea. No pueden simplemente basa en las ventajas metacognitivas de los cri-
aplicar la regla del Problema 1 de memoria a las terios explcitos, pues se pide a los estudiantes
Aplicaciones 1 y 2. que piensen y apliquen criterios en el contexto
Una de las razones por la cual los expertos de su propio trabajo. Al hacerlo as, los estudian-
tienen mejores habilidades de transferencia que tes se explican y llegan a entender qu significan
los novatos, es porque son capaces de recono- los criterios de un modo ms profundo que si
cer peculiaridades de los problemas que son las slo leyeran una lista de ellos. En trminos ms
mismas y diferentes a las de problemas resueltos generales, este tipo de prctica asistida de me-
con anterioridad. Por consiguiente, es importan- tacognicin es decir, la prctica en la cual los
te que los estudiantes aprendan a pensar espe- estudiantes aprenden estrategias para supervisar
cficamente sobre cmo pueden utilizar lo que su propio aprendizaje ayuda a desarrollar las
ya saben. En este sentido, ensear para manejar capacidades metacognitivas de los estudiantes.
estrategias de transferencia, especialmente de Al mismo tiempo, la auto-crtica puede incre-
transferencia lejana, tambin tiene correspon- mentar la responsabilidad del estudiante ante su
dencia con las tcnicas de conocimiento previo. propio aprendizaje y hacer que la relacin entre
el maestro y l sea de ms colaboracin. Esto no
2.9. Auto-evaluacin del estudiante significa que los maestros renuncien a su res-
ponsabilidad, sino que al compartirla, consiguen
Hacer que los estudiantes se ocupen en criticar que el estudiante tenga mayor posesin, menos
su propio trabajo es til tanto desde el punto desconfianza y ms reconocimiento de que las
de vista cognitivo como desde el motivacional. expectativas no son caprichosas ni que estn
En esencia el hbito de auto-evaluarse lleva a la fuera de su alcance.

FIGURA 17.2 Una tarea inicial de evaluacin y de enseanza y tareas de aplicacin


de transferencia cercana

Problema 1
En este problema, explorars esta pregunta: Si una piscina cuadrada tiene lados de L pies de longitud, cuntos azulejos se
necesitan para formar el borde?

1 pie

L 1 pie
azulejo del borde

L
A. Dibuja en un papel cuadriculado para que te formes una idea de cuntos azulejos se necesitan para los bordes de piscinas
cuadradas con lados de longitud 1, 2, 3, 4, 6 y 10 pies. Registra tus resultados en una tabla.
B. Escribe una ecuacin para el nmero de azulejos (N) que hacen falta para formar un borde de una piscina cuadrada con lados
de longitud de (L) pies.
C. Trata de escribir por lo menos una ecuacin ms para la cantidad de azulejos que hacen falta para el borde de la piscina.
Cmo podras convencer a alguien de que tus expresiones para la cantidad de azulejos son equivalentes?

27
Textos de evaluacin

Aplicaciones
1 a. Cuntos azulejos cuadrados de 1 pie se necesitan para formar el borde de una piscina que mide 10 pies de largo y 5 de ancho?
b. Anota una expresin para la cantidad de azulejos del borde que se necesitan para una piscina que mide L pies de largo y A pies
de ancho.

L
c. Anota una expresin diferente para la cantidad de azulejos que se necesitan. Explica por qu tus expresiones son equivalentes.

2 Una tina cuadrada tiene lados de longitud de L pies. Se crea un borde al colocar azulejos
cuadrados que miden 1 pie de cada lado a lo largo de los bordes de la tina y azulejos
triangulares en las esquinas. Los azulejos triangulares se hicieron cortando azulejos
cuadrados a la mitad

a. Si la tina tiene lados de una longitud de 7 pies, Cuntos azulejos cuadrados


se necesitan para hacer el borde? L
b. Escribe dos ecuaciones para la cantidad de azulejos cuadrados (C )
que hacen falta para hacer este tipo de borde para una tina cuadrada con lados
de longitud de L pies.
L

Fuente: De Connected Mathematics, Say It with Symbols: Algebraic Reasoning 1998 Universidad del Estado de Michigan, Glenda Lappan,
James T. Fey, William M. Fitzgerald, Susan N. Friel, y Elizabeth Difanis Phillips, publicado por Pearson Education Inc., publicado como
Pearson Prentice Hall. Se ha usado con permiso.

En estudios de caso de dos localidades aus- aprendieron a usar los criterios de la investiga-
tralianas e inglesas, Klenowski (1995) descu- cin cientfica para evaluar su propio trabajo.
bri que los estudiantes que participaron en Como parte del protocolo, los estudiantes del
una auto-evaluacin se interesaron ms en los grupo experimental tuvieron que escribir una
criterios y en la retroalimentacin sustantiva exposicin razonada cada vez que se auto-eva-
que en su calificacin misma. Los estudiantes luaban, sealando los rasgos distintivos de su
tambin manifestaron que deban ser ms ho- trabajo que respaldaban sus valoraciones. Ade-
nestos respecto de su propio trabajo, as como ms, los estudiantes utilizaron los criterios para
tambin tendran que ser honestos con otros dar retroalimentacin a sus compaeros de cla-
estudiantes y estar preparados para defender se cuando se presentaron proyectos en clase en
sus opiniones tomando en cuenta la evidencia. forma oral. En comparacin con el grupo con-
Los datos de Klenowski (1995) respaldan la ase- trol, los estudiantes que haban participado en
veracin previa de Wiggins (1992) de que hacer la auto-evaluacin presentaron proyectos que
que los estudiantes analicen su propio trabajo fueron valorados mucho ms por sus maestros
hace que se apropien del proceso de evaluacin (con base en los criterios compartidos). Por
y hace posible llevar a los estudiantes a niveles otro lado, estudiantes que al inicio tenan rea-
ms altos porque los criterios son claros y ra- lizacin y logros deficientes mostraron mejoras
zonables (p. 30). En un estudio experimental notables en una medicin de comprensin con-
de White y Frederiksen (2000), los estudiantes ceptual.

28
La evaluacin en el aula

Como parte de las reformas curriculares, los tenerse y dedicar un tiempo al concepto errneo
expertos en contenido de diversas materias han que subyace a ste. Mientras que la evaluacin
desarrollado reformas en la evaluacin para in- formativa se centra en qu puede hacer el estu-
tegrarlas mejor en la evaluacin y la enseanza. diante para mejorar, la evaluacin paralela de la
Algunas de estas estrategias, en particular, sir- docencia pregunta si los estudiantes han tenido
ven para hacer que las autoevaluaciones y las una oportunidad adecuada para aprender.
evaluaciones por pares formen parte normal de Los maestros que reflexionan sobre su prc-
la enseanza en el aula. Por ejemplo, la tcnica tica utilizan datos en forma sistemtica para
de la silla del autor es una prctica de enseanza hacer juicios sobre los aspectos especficos de
de lectoescritura en la que los estudiantes apren- las estrategias docentes que quiz estn obsta-
den explcitamente las normas para escuchar y culizando el aprendizaje. Buscan explicaciones
dar retroalimentacin a sus compaeros de clase del xito o el fracaso en el aprendizaje, y se fijan
respecto de un escrito (Routman, 2000). Hablar especialmente en las decisiones de su ensean-
con los estudiantes puede tambin ser un medio za que pudieran ser la causa. Por ejemplo, hay
para ver si estn desarrollando la capacidad de ciertas tareas que parecen hacer que los estu-
auto-evaluarse. Tanto el estudio de Klenowski diantes piensen mucho, porque son muy intere-
como el de White y Frederiksen, ya menciona- santes y dan lugar a mltiples soluciones? Hay
dos, significaron un paso en la auto-evaluacin, algunas actividades que interesan a la mayora
la cual lleg a formar parte de la enseanza nor- de los nios pero que dejan a las nias clavadas
mal. Es importante mencionar que la finalidad en sus asientos? Batallan con las tareas escolares
de involucrar a los estudiantes en autoevaluacio- los chicos que aprenden dos lenguas, si no hay
nes no es llegar a una calificacin, sino que ellos tiempo suficiente para hablar de su conocimien-
obtengan una mayor comprensin, la cual puede to pertinente de datos esenciales o para esclare-
utilizarse para nuevos aprendizajes. cer expectativas? En una revisin ya clsica de su
propia enseanza, Mazur (1997) descubri que
2.10 Evaluacin de la docencia los estudiantes podan resolver problemas como
el nmero 2 de la Figura 17.3, pero no problemas
El modelo de evaluacin formativa se centra en como el nmero 1. Su extenso anlisis de por qu
el aprendizaje del estudiante. Un uso igualmente los estudiantes podran resolver problemas algo-
importante de la evaluacin en el aula es la eva- rtmicos pero no conceptuales y qu haca l que
luacin y el perfeccionamiento de la docencia. A estimulaba la bsqueda de recetas (incluyendo
la par que los maestros renen evidencia acerca la forma de sus exmenes) llev a Mazur a reexa-
de la comprensin del estudiante, tambin to- minar su manera de ensear para enfocarse en
man en consideracin cules prcticas docentes estrategias de aprendizaje ms activas.
funcionan y cules no, y qu nuevas estrategias Cuando los maestros utilizan datos de eva-
hacen falta. El Assessment Standards for School Ma- luacin para modificar su enseanza, tambin
thematics del NCTM (1995) identific tres tipos dan un ejemplo importante a los estudiantes. Tal
de decisiones docentes, las cuales fueron infor- como sostuve con anterioridad, si queremos
madas a travs de datos de evaluacin: las deci- desarrollar una comunidad de estudiosos en la
siones de momento a momento, la planeacin a que los estudiantes busquen en forma natural re-
corto plazo y la planeacin a largo plazo. Cuan- troalimentacin y critiquen su propio trabajo
do la evaluacin y la enseanza estn eficazmen- entonces es razonable que los maestros modelen
te entrelazadas, entonces las ideas de evaluacin el mismo compromiso de usar datos en forma
pueden usarse en tiempo real para ajustar la en- sistemtica, ya que esto se aplica a su propio pa-
seanza. Por ejemplo, si varios estudiantes co- pel en el proceso de enseanza y aprendizaje.
meten el mismo tipo de error, puede ser til de- (Shepard, 2000, p. 12)

29
Textos de evaluacin

3. EVALUACIN SUMATIVA formativas y sumativas de evaluacin alcancen


Y CALIFICACIN coherencia y que se respalden mutuamente.

La evaluacin sumativa y la calificacin consti- 3.1. Finalidades de las calificaciones


tuyen una seria amenaza para los objetivos de apropiadas a la edad
aprendizaje declarados por la evaluacin forma-
tiva. De acuerdo con descubrimientos de la lite- Los libros de texto de medicin y de psicolo-
ratura motivacional y de estudios de maestros ga educativa dan por sentado que calificar es
y estudiantes, las prcticas de las calificaciones algo que los maestros deben hacer. Son pocas
pueden minar el proceso de aprendizaje de va- las razones que se ofrecen, excepto que las po-
rias maneras. En primer lugar, las pruebas y las lticas escolares exigen que los maestros den
tareas calificadas comunican lo que es importan- calificaciones, a menudo con especificaciones
te aprender. Si estas mediciones divergen de las detalladas en cuanto a la informacin reque-
metas del aprendizaje que se valora, entonces los rida en las boletas. De igual manera, tengo la
estudiantes concentran su atencin y esfuerzo certeza de que los maestros deben dar califi-
slo en la porcin calificada del currculo. Segun- caciones principalmente porque los padres las
do, el uso de calificaciones como premio o como desean. Sin embargo, indico que no ha habi-
castigo puede socavar la motivacin intrnseca do estudios sistemticos de los efectos de las
de aprender. Tercero, a aquellos estudiantes para prcticas de calificacin sobre la realizacin y
quienes los criterios de las calificaciones les pa- los logros del estudiante. Adems, s que exis-
recen fuera de su alcance, stas pueden reducir ten tres pblicos importantes para las califica-
su esfuerzo y su ulterior aprendizaje. Cuarto, la ciones: los padres, los usuarios externos, tales
naturaleza comparativa de las prcticas tradi- como empleadores y funcionarios de servicios
cionales de calificacin puede reducir la buena de admisin a las universidades, y los estudian-
voluntad de los estudiantes de ayudar a otros o tes mismos. Los estudiantes se convierten en
de aprender de los dems. el pblico principal de las calificaciones, por-
En esta seccin, considero qu finalidades se que lo que se les dir a los dems acerca de sus
persiguen al calificar y resumo la investigacin logros, llega a desempear un papel muy im-
que se ha realizado sobre las prcticas actuales. portante en las interacciones del aprendizaje.
Luego, despus de examinar los hallazgos emp- No obstante, si los estudiantes fueran el nico
ricos pertinentes de la literatura sobre la psicolo- pblico, no queda claro que las calificaciones
ga cognitiva de la medicin y sobre la psicologa por s mismas aadiran informacin til. Ms
motivacional, hago un bosquejo de las prcticas bien, lo que maestros y estudiantes necesitan
de calificacin de las que se espera sean no slo ms son evaluaciones sumativas que sirvan para
vlidas para comunicar logros sino que conduz- verificar la consecucin de logros importantes
can al aprendizaje del estudiante. Si estn cons- en la adquisicin de competencias por parte de
truidas sobre el mismo modelo fundamental de los estudiantes, y las cuales se relacionen con
desarrollar competencia en un campo del cono- los mismos continuos de desempeo que se
cimiento, entonces es posible que las prcticas utilicen en la evaluacin formativa.

30
La evaluacin en el aula

FIGURA 17.3 Pregunta conceptual (arriba) y convencional (abajo) sobre el tema


de circuitos elctricos

1. Un circuito en serie consta de tres focos de luz idnticos conectados a una batera como
se muestra aqu. Cuando el interruptor I est cerrado, aumentan, disminuyen o permanecen
iguales los siguientes?
A B C

(a) Las intensidades de los focos A y B


(b) La intensidad del foco C
(c) La corriente que se extrae de la batera
(d) La cada de voltaje entre un foco y otro
(d) La potencia disipada en el circuito

5. Para el circuito que se muestra, calcula (a) la corriente en la resistencia de 2- y (b) la dife-
rencia potencial entre los puntos P y Q.

4
12 V

2 Q

P
6

8V

Fuente: De Mazur, Eric, Peer instruction: a users manual, 1 edicin, 1997. Reimpreso con permiso de Pearson education, Inc., Upper
Saddle River, NJ.

31
Textos de evaluacin

Los principios sobre lo apropiado de las cali- tandarizadas, de las que slo el 43% y el 14% de
ficaciones en funcin de la edad, indican que las ellos, respectivamente, consideraron que eran
calificaciones deberan ser mucho menos impor- muy tiles. En datos de entrevistas, los padres
tantes en la vida del aula en la escuela primaria, explicaron que hablar con el maestro les pareci
de lo que son para los estudiantes de secundaria lo ms valioso porque les daba un conocimiento
y preparatoria. Cuando los estudiantes llegan a de primera mano de las fortalezas y debilidades
la secundaria, hay una expectativa mayor de que especficas de su hijo en el contexto del currcu-
las calificaciones tengan significado para un p- lo del aula. Una generalizacin adicional de esta
blico externo. Por ejemplo, una calificacin alta investigacin tiene implicaciones significativas
en Lengua y Literatura debera implicar que el para las prcticas de calificacin. Los padres
estudiante puede escribir una composicin bien quieren comparaciones normativas. No obstan-
organizada; y un promedio de calificaciones de te, parecen estar deseosos de tener maestros que
nueve debe significar que un alumno del ltimo les digan cmo va su hijo en lo que respecta a las
ao de preparatoria est bien preparado para el expectativas que debe responder segn el grado,
trabajo universitario. Una finalidad bsica del ms que exigir una prueba referida a una norma.
movimiento de estndares ha sido, en realidad, Esta sustitucin de estndares de nivel de grado
la de asegurar este tipo de comprensin compar- por comparaciones referidas a una norma, es im-
tida sobre el significado de las calificaciones. En portante en el contexto de reportes basados en
cambio, es mucho ms difcil llevar a cabo eva- estndares y, como veremos, a causa de las con-
luaciones formales de nios pequeos y mucho secuencias desmotivadoras de las prcticas de
menos necesario. Los principios articulados por calificacin referidas a las normas estadsticas.
la National Association for the Education of Young
Children [Asociacin Nacional para la Educa- 3.2. La investigacin en la prctica actual
cin de Nios Pequeos, NAEYC por sus siglas
en ingls] hacen hincapi en que las evaluaciones Brookhart (1994) identific 19 estudios publi-
de nios pequeos deben basarse en la observa- cados en los diez aos anteriores al trabajo que
cin realizada durante las actividades ordinarias realiz sobre las prcticas docentes de califica-
del aula, y deben usarse con fines formativos y cin. Los mtodos de estudio fueron variables
para comunicrselas a los padres. La NAEYC y abarcaron desde exmenes a maestros hasta
concluy que para los nios en los primeros estudios de caso. Con el respaldo de resultados
grados El mtodo de presentar informes a los muy consistentes entre los estudios, Brookhart
padres no (debe) depender de las calificaciones (1994) identific las siguientes generalizaciones:
con letras o nmeros, sino que ms bien (debe) Los maestros tratan afanosamente de ser
proporcionar una informacin ms significativa justos con los estudiantes, y en esto se in-
y descriptiva de manera narrativa (p. 15). cluye, informarles sobre cules sern los
La evidencia respecto de qu tipo de infor- componentes de una calificacin.
macin les parece til a los padres de familia es Las mediciones de rendimiento o desem-
limitada. En uno de los estudios, sorprenden- peo, especialmente las pruebas, son los
temente, los padres de algunos nios de tercer componentes ms importantes para las
ao consideraron que lo ms valioso era hablar calificaciones, pero el esfuerzo y la capa-
con el maestro sobre el progreso de su hijo; el cidad tambin suelen tomarse en consi-
77% dijo que esto les pareca muy til (Shepard y deracin.
Bliem, 1995). Lo siguiente ms til fue ver mues- En las prcticas de calificacin hay un
tras calificadas del trabajo de mi hijo. El 60% de los efecto del nivel de grado. Los maestros de
padres refirieron que esto fue muy beneficioso primaria utilizan evidencia y observacin
en contraposicin con las boletas y pruebas es- ms informales. En el nivel Secundaria,

32
La evaluacin en el aula

las mediciones de rendimiento con prue- cer una calificacin; los hbitos de trabajo estn
bas de lpiz y papel y otras actividades estrechamente relacionados con la retroalimen-
escritas constituyen una porcin mucho tacin que los estudiantes necesitan respecto
mayor de la calificacin. de cmo mejorar, y la participacin es esencial
Hay una variacin individual entre las para la relacin del estudiante con el maestro
prcticas de calificacin por parte de los como instructor. Si bien es decisivo entender los
docentes. Diferentes maestros perciben puntos de vista de los maestros y las realidades
el significado y la finalidad de las califica- prcticas del aula, las creencias intuitivas de los
ciones en forma diferente, y consideran maestros acerca de qu es justo y qu motiva a
de manera diferente los factores de des- los estudiantes tal vez no cuente con el respaldo
empeo positivo o negativo. de la investigacin. Tambin debemos tomar en
Las prcticas identificadas en los hallazgos 1 y consideracin si los maestros utilizan califica-
3 que los maestros tratan de ser justos y co- ciones de esfuerzo para controlar la conducta de
munican sus criterios de calificacin y que usan los estudiantes, que no es lo mismo que crear un
evidencia ms informal en los grados de niveles ambiente de aprendizaje que los motive. En un
inferiores son consistentes con los estnda- estudio de caso de los mtodos de evaluacin de
res profesionales basados en la investigacin. los maestros (Lorsbach, Tobin, Briscoe y Lamas-
Sin embargo, el uso de factores de esfuerzo y ter, 1992), un hallazgo de gran importancia fue el
capacidad para ajustar las calificaciones de des- que las tareas y los sistemas de totalizar notas
empeo es contrario a las recomendaciones de con frecuencia recompensan el haber completa-
los expertos en medicin y de los reformadores do las tareas y la motivacin para aprender, y no
que se basan en los estndares. En un estudio tanto lo que se sabe (p. 310). Aparentemente los
de 143 maestros de escuelas primarias y secun- maestros se desempeaban dentro de la metfo-
darias del Medio Oeste, Cizek, Fitzgerald y ra de la escuela es trabajo (Marshall, 1988), creando
Rachor (1995/1996) descubrieron de modo pa- un elaborado sistema para estar informados del
recido que el 52% dijo que tomaban en cuenta trabajo del estudiante, pero sin evaluar la calidad
la capacidad del estudiante individual y el 42% o el contenido de ese trabajo.
dijo que consideraban el esfuerzo del estudiante
al asignar calificaciones. Cizek et al. observaron 3.3. Importancia del contenido
que los maestros se sirven de un conjunto varia- y del formato: qu se valora
do de factores distintos al desempeo en formas
que crean un sesgo de buenos resultados, lo que les El contenido de las pruebas qu se evala y
ayuda a elevar las calificaciones de los estudian- cmo se evala y el contenido de las tareas que
tes. Los expertos dan argumentos en contra de se evalan para un grado, comunican los obje-
considerar el esfuerzo, la capacidad y la actitud tivos de la enseanza a los estudiantes y hacen
cuando se califica, porque minan la validez de las que centren su atencin y esfuerzo (obsrvese,
calificaciones como indicadores de desempeo. sin embargo, que tan slo dar puntos a tareas
Adems, estos factores no pueden medirse con no garantiza que pongan atencin, si la calidad
precisin, crean desigualdades, invitan a los es- del trabajo nunca se examina; vase Lorsbach et
tudiantes a fingir y confunden a la mayora o a al., 1992). Anteriormente abord la cuestin del
todos los pblicos acerca del significado de las contenido de la evaluacin, en el contexto de la
calificaciones. evaluacin formativa, y volv a revisarlo cuando
Al tratar de explicar la gran brecha entre la examin el efecto de las pruebas externas en la
teora y la prctica, Brookhart (1994) presenta enseanza y el aprendizaje en el aula.
varios argumentos en nombre de los maestros: Histricamente, los maestros, especialmen-
el esfuerzo se considera como una parte de mere- te en el nivel secundario, se han atenido a las

33
Textos de evaluacin

pruebas formales con vistas a la calificacin, y a los estudiantes en tareas autnticas con el fin
han usado predominantemente en sus pruebas de desarrollar, usar y extender su conocimiento.
preguntas de bajo nivel. Fleming and Cham- Un trabajo ms significativo dirigido a la com-
bers (1983) analizaron 8 mil 800 preguntas de prensin conceptual no slo proporciona mejo-
pruebas desde la primaria hasta la secundaria y res datos de evaluacin acerca de cun bien se
descubrieron que casi el 80% de ellas tenan el desempean los estudiantes, sino que tambin
nivel del conocimiento en la taxonoma de Bloom tiene beneficios cognitivos y motivacionales.
(1956). Se descubrieron resultados parecidos una Por ejemplo, Crooks (1988) revis estudios que
dcada despus. En un estudio nacionalmente examinaban el vnculo entre el formato de eva-
representativo, Madaus, West, Harmon, Lomax luacin y las estrategias para estudiar de los es-
y Viator (1992) encontraron que el 53% de los tudiantes universitarios. Numerosos estudios
maestros de matemticas en secundaria y pre- corroboraron los primeros hallazgos de Marton
paratoria y el 73% en primaria manifestaron que y Saljo (1976) de que la aproximacin de los estu-
usaban pruebas del libro de texto al menos una diantes a las tareas de aprendizaje podra catego-
vez al mes. Cuando los analizaron Madaus et al. rizarse como aproximaciones profundas o superfi-
(1992), slo 3% de los reactivos en las pruebas ciales. Las profundas implicaban una bsqueda
finales contenidas en el texto examinaban co- activa de significado, principios fundamentales
nocimiento conceptual de alto nivel y alrededor y estructuras que relacionaran diferentes con-
del 5% examinaban habilidades de pensamiento ceptos. Las aproximaciones superficiales se con-
de alto nivel. El restante 95% de los reactivos centraban principalmente en la memorizacin
examinaban informacin, clculos y uso de algo- de hechos aislados sin buscar conexiones entre
ritmos y frmulas en problemas de rutina, pare- estos hechos. Si bien hay otros factores que in-
cidos a los que esos estudiantes haban trabajado fluyen en la tendencia de los estudiantes a usar
en el texto. Un porcentaje ms alto de maestros aproximaciones profundas o superficiales, es-
comunicaron que hacan sus propias pruebas, pecialmente inters o motivacin, en todos los
pero cuando stas fueron examinadas en estu- estudios, su percepcin de lo que exigan las eva-
dios de campo, Madaus et al. (1992) descubrieron luaciones que esperaban, tuvieron una evidente
que eran adaptaciones que se parecan mucho a influencia en la eleccin de su estrategia.
las pruebas del libro de texto. Ms recientemen- Los expertos en asignaturas valoran concep-
te, Cizek et al. (1995/1996) dieron a conocer un tualmente las tareas docentes ricas porque cap-
importante hallazgo: era ms probable que los tan lo ms importante para que los estudiantes
maestros novatos elaboraran sus propias evalua- aprendan. Los cognitivistas prefieren tareas es-
ciones que los experimentados, quienes tenan timulantes porque hacen que los estudiantes ra-
la tendencia a atenerse a las pruebas preparadas zonen y favorzcan la generalizacin si las tareas
comercialmente. Este hallazgo poda obedecer de transferencia se usan como parte normal de la
al hecho de que los maestros que empiezan tie- enseanza. Las tareas autnticas que requieren
nen ms conocimiento de los materiales basados un pensamiento de ms alto nivel y una activa
en las reformas y los tipos de problemas y mayor solucin de problemas tambin incrementan la
acceso a los mismos. motivacin del estudiante porque son intrnse-
Como ya he subrayado con anterioridad, la camente ms interesantes que la memorizacin
naturaleza del logro en cada una de las discipli- o la aplicacin de procedimientos sencillos (Sti-
nas no puede ser representada adecuadamente pek, 1998). Por ejemplo, Mitchell (1993) descu-
por preguntas de bajo nivel en las que slo se bri que las creencias de los estudiantes acerca
recuerda la informacin. La reforma de la eva- de la importancia en el mundo real de lo que
luacin ha sido parte integral de la reforma aprenden era algo que predeca poderosamente
educativa a causa de la necesidad de involucrar su inters y placer en la clase de Matemticas.

34
La evaluacin en el aula

Adems, las tareas estimulantes aumentan la mo- el maestro, el estudiante y la comunidad (Pelle-
tivacin intrnseca al intensificar el sentimiento grino, Baxter, y Glaser, 1999). Como dije antes,
de competencia en los estudiantes. Newmann brindar a los estudiantes una comprensin cla-
(1992), por ejemplo, descubri que los estudian- ra de los objetivos hace que stos sean ms al-
tes califican con los puntajes ms altos de inte- canzables. Y ayudar a los chicos a aprender el
rs a las clases que los hacen pensar mucho y los significado de los criterios en el contexto de su
hacen participar activamente en el pensamiento propio trabajo les ayuda a desarrollar la concien-
y el aprendizaje. cia metacognitiva sobre qu necesitan para me-
jorar. La teora cognitiva no lleva a predecir que
3.4. La investigacin sobre medicin, dejar de hacer evaluaciones sumativas mejorara
psicologa cognitiva y psicologa motivacional el aprendizaje. De hecho, desde una perspectiva
cognitiva, el mejor sistema sera aquel en el que
A la mayora de los maestros les disgusta eva- las evaluaciones sumativa y formativa estuvieran
luar a sus estudiantes y darles una calificacin mutuamente alineadas con objetivos de apren-
(Brookhart, 1993; Nava y Loyd, 1992). En vista dizaje orientados conceptualmente, y en el que
de los efectos de distorsin de las prcticas de las evaluaciones sumativas se utilizaran como
calificacin examinados en lneas anteriores, y momentos importantes de logro (quiz reco-
de los efectos motivacionales negativos de las nocidos por la familia y los amigos) despus de
calificaciones que he considerado, sera fcil ver felices periodos de aprendizaje reforzados por la
las calificaciones tan slo como un mandato des- evaluacin formativa.
encaminado y opresivo. Sin embargo, hay cierta La evidencia ms abrumadora que demuestra
evidencia de beneficios cognitivos positivos de los efectos negativos de las prcticas docentes
las evaluaciones sumativas que hay que tomar en y de calificacin proviene de la literatura moti-
consideracin junto con los hallazgos de la lite- vacional. En una revisin comprehensiva de la
ratura motivacional. Lo que es ms importante, investigacin sobre la motivacin en los nios,
los estudiantes parecen estudiar y aprender ms Wigfield, Eceles, y Rodrguez (1998) relatan el
si esperan que les hagan una prueba. Como lo hecho impresionante de que muchos aspectos
resumi Crooks (1988), las ventajas de poner de la organizacin en el aula tienen efectos ne-
pruebas pueden explicarse por tres factores. gativos tan generalizados que la creencia de los
Primero, hacer pruebas de seguimiento hace nios en su competencia, sus metas de realiza-
que los estudiantes revisen y vuelvan a aprender, cin y logros, su inters en las materias escolares
lo que opera como una forma limitada de prc- y su motivacin intrnseca para aprender, dismi-
tica distribuida. Segundo, la experiencia misma nuyen conforme los estudiantes van cursando
de presentar pruebas pone a los estudiantes a los aos de la primaria hasta llegar a segundo de
procesar mentalmente el contenido, si bien esto secundaria. Con respecto a las prcticas de cali-
depende mucho de la calidad de las preguntas en ficacin, los problemas ms importantes tienen
la prueba. Tercero, como ya he observado antes, que ver con el papel de las calificaciones como
para bien o para mal, la prueba dirige la atencin recompensas (o castigos), las orientaciones de
a los temas y las habilidades que se examinan, los estudiantes hacia las metas de desempeo
lo cual tiene implicaciones para los esfuerzos de o aprendizaje, y el uso de estndares normati-
estudio de los alumnos. vos de evaluacin contrapuestos a estndares de
La teora cognitiva tambin indica que los evaluacin de la maestra o dominio en una ma-
estudiantes obtienen beneficios si se les da la teria. Todos estos factores, junto con otros tales
oportunidad de demostrar competencia y de como el locus de control9 de los estudiantes y sus
trabajar por el aumento de su aprovechamien-
to, definido mediante criterios compartidos por
9
Dimensin utilizada en la teora de la atribucin que se relaciona
con la percepcin de un competidor de la causa del xito o fracaso.

35
Textos de evaluacin

sentimientos de competencia interaccionan de estrategias de solucin. Una orientacin de


maneras complejas. Aqu resumo solamente los maestra tambin se ha denominado una orien-
patrones ms significativos y consistentes. tacin de tarea por teoras afines. En cambio,
El uso de calificaciones como recompensa los estudiantes con una orientacin de metas de
contribuye a lo que Lave y Wenger (1991) llama- desempeo estn motivados extrnsecamente.
ron la comercializacin del aprendizaje (p. 112). Estn ms bien interesados en verse competen-
Cuando no se da un valor cultural al incremen- tes que en serlo y tendern a evitar situaciones
to de la habilidad y la participacin de alguien en las que pudieran parecer incompetentes. Las
en un esfuerzo, la nica razn para participar es teoras relacionadas indican que la orientacin
obtener un conocimiento superficial que puede del desempeo es provocada por ambientes que
exhibirse para que lo evalen. En revisiones de fomentan el ego. Cuando encaran una tarea di-
estudios experimentales, los investigadores des- fcil, los estudiantes orientados al desempeo
cubrieron que el uso de recompensas externas harn con frecuencia comentarios sobre su falta
puede minar realmente el inters intrnseco de de capacidad, actuarn con aburrimiento o an-
los estudiantes en una tarea (Deci y Ryan, 1985; siedad, y exhibirn un marcado deterioro en su
Lepper, 1983). Como lo resumi Stipek (1996), desempeo. Dweck llam a estas conductas im-
las recompensas funcionan para disminuir la potencia aprendida. A causa de su miedo a la eva-
motivacin intrnseca cuando se perciben como luacin, los estudiantes en esta categora quiz
un control y cuando no estn directamente rela- traten de ocultar al maestro su falta de enten-
cionadas con un desempeo exitoso. Consisten- dimiento.
tes con los hallazgos positivos de la investigacin Es importante hacer notar que la orientacin
sobre la retroalimentacin, las recompensas o las a metas de maestra o de desempeo no son
alabanzas que transmiten una informacin posi- atributos fijos del estudiante; pueden crearse o
tiva sobre la competencia tienen ms probabili- producirse en diferentes grados por el ambiente
dades de incrementar la motivacin intrnseca. de aprendizaje y se han provocado experimen-
Los descubrimientos respecto de los efectos talmente (Elliot y Dweck, 1988). Por ejemplo,
de las recompensas estn estrechamente rela- en un estudio de estudiantes universitarios,
cionados con la investigacin sobre el tipo de dos grupos desarrollaron niveles muy diferen-
metas que se proponen alcanzar los estudian- tes de comprensin conceptual segn si saban
tes. Dweck (1986) distingue entre aquellos con que les haran una prueba al final del estudio o
metas de maestra y aquellos con metas de desem- que necesitaran dar clases a otros sobre el ma-
peo. Estas disposiciones son independientes de terial (Benware y Deci, 1984). Los estudiantes
las capacidades acadmicas de los estudiantes. tienen ms probabilidades de desarrollar una
Aquellos que tienen metas de maestra estn in- orientacin de aprendizaje cuando los maestros
trnsecamente motivados, buscan tareas estimu- destacan el esfuerzo, el aprendizaje y el trabajo
lantes y disfrutan las oportunidades de desarro- duro, en vez del desempeo y la obtencin de la
llar nuevas competencias. Es menos probable respuesta correcta, cuando los errores se tratan
que tengan miedo a la evaluacin porque ven al como una parte normal del aprendizaje, y cuan-
maestro como un recurso. Cuando los estudian- do la evaluacin del progreso se ve acompaada
tes con una orientacin de maestra se enfrentan de oportunidades de mejorar (Ames, 1992; Sti-
a una tarea difcil, es probable que persistan, que pek, 1996).
mantengan una actitud positiva y que busquen Tal vez las consecuencias negativas ms se-
rias de las prcticas tradicionales de calificacin
El locus de control puede ser interno (es decir, basado en las propias
caractersticas del competidor, tales como capacidad o esfuerzo) o
provienen del uso de comparaciones normati-
externos (esto es, debido a factores tales como la suerte, fuera del vas. Como ha indicado Ames (1984), las estruc-
control del competidor). turas de clase competitivas hacen que adquieran

36
La evaluacin en el aula

importancia las comparaciones sociales y los jui- aprendido. Las evaluaciones sumativas pueden
cios sobre la capacidad. En una serie de estudios, pensarse como momentos importantes conti-
Butler (1987, 1988), Butler y Nisan (1986) descu- nuos de aprendizaje que apuntalan la evaluacin
brieron que las calificaciones que se distribuan formativa.
normativamente daban como resultado un inte- Las evaluaciones sumativa y formativa tie-
rs menor, menos ganas de persistir y un desem- nen finalidades diferentes. Una hace posible el
peo ms bajo en comparacin con los estudian- aprendizaje y, la otra, ilustra la realizacin y los
tes que haban recibido una retroalimentacin logros. En vista de los conocidos efectos negati-
sustantiva. En un estudio clsico, Harackiewicz, vos de la calificacin, una pregunta crucial sera
Abrahams y Wageman (1987) descubrieron que la siguiente: cun a menudo deberamos recu-
la evaluacin que se basaba en normas sociales rrir a la evaluacin sumativa? Los especialistas
reduca el inters en una tarea, en tanto que la en medicin defienden la calificacin frecuente
evaluacin basada en lograr un nivel predetermi- de trabajos escolares para reunir suficientes da-
nado incrementaba el inters. La conclusin ge- tos con objeto de asegurar la confiabilidad. Los
neral de Stipek (1996) respecto de esta literatura cognitivistas consideran que los estudiantes de-
fue que la evaluacin, especialmente la de tareas ben tener prctica con los criterios que se usa-
difciles, tiende a minar el inters intrnseco. Sin rn para evaluar desempeos culminantes. Sin
embargo, la excepcin que identific es digna embargo, el modelo de evaluacin formativa y
de atencin y anticipa mis recomendaciones en la investigacin sobre la motivacin sostienen
cuanto a las prcticas de calificacin: que la calificacin podra socavar la orientacin
No obstante, la evaluacin sustantiva que de aprendizaje de los estudiantes. Por lo tanto,
proporciona informacin sobre competen- para conseguir que la evaluacin formativa sea
cias y una gua para esfuerzos futuros, y la realmente para el aprendizaje, tal vez los maes-
evaluacin que est basada en la maestra o tros necesiten posponer otorgar calificaciones,
ms bien el dominio que en las normas so- o usarlas slo cuando el estudiante se auto-eva-
ciales, no tienen, al parecer, estos efectos ne- le, y como calificaciones hipotticas que ayuden
gativos y pueden incluso aumentar el inters a los estudiantes a permanecer centrados en la
intrnseco en las tareas acadmicas. (Stipek, retroalimentacin sustantiva. Pero lo cierto es
1996, p. 99) que los maestros deben evitar interrumpir y
juzgar como si ya estuviera terminada la calidad
3.5. Parmetros para el desarrollo del aprendizaje que an est en marcha. Desde
de la competencia luego que la cuestin de la confiabilidad es im-
portante, y no debe calificarse a los estudiantes
Para que se respalden mutuamente, las evalua- con base solamente en una o dos pruebas for-
ciones sumativa y formativa deben estar alinea- males aisladas. Sin embargo, si las evaluaciones
das conceptualmente. Deben ser plenamente sumativas estn contenidas en las progresiones
capaces de representar objetivos de aprendi- del aprendizaje, entonces la confiabilidad de los
zaje importantes, y deben usar la misma gama eventos calificados est respaldada por otras evi-
extensa de tareas y de tipos de problemas para dencias de cada competencia en proceso de de-
representar la comprensin de los estudiantes. sarrollo del estudiante a lo largo de ese continuo
Sin embargo, las evaluaciones sumativas no de- fundamental.
ben ser meras repeticiones de tareas formativas Las evaluaciones sumativas y las calificaciones
previas, sino que deben ser la culminacin de que se basan en ellas deben representar realizacin
desempeos que inviten a los estudiantes a ex- y logros. Consistente con el resumen que hice de
hibir su maestra y a utilizar su conocimiento en Stipek (1996), en lneas anteriores, acerca de la
formas que generalicen y extiendan lo que han investigacin sobre motivacin; la evaluacin del

37
Textos de evaluacin

desempeo debe basarse en estndares de maes- respuesta a las preguntas de los hacedores de po-
tra o dominio ms que en normas sociales. Las lticas a cierta distancia del aula. No obstante, en
calificaciones basadas en el desempeo se alinea- una era de rendicin de cuentas basada en prue-
rn en forma ms transparente a la retroalimen- bas de alto impacto (high-stakes accountability), las
tacin con los mismos estndares utilizados para pruebas externas pueden tener tambin profun-
la evaluacin formativa, y se comunicarn mejor dos efectos en las prcticas del aula. Idealmente,
a pblicos externos. Cuando los maestros hacen una evaluacin externa que estuviera bien ali-
ajustes a las calificaciones para tomar en cuenta neada con objetivos de aprendizaje ricos desde
el esfuerzo y el mejoramiento, con frecuencia res- un punto de vista conceptual, tendra impactos
ponden a cuestiones de justicia. Es justo juzgar a positivos en la enseanza si ilustrara metas sig-
los estudiantes de capacidades diferentes con los nificativas de aprendizaje, pues proporcionara
mismos criterios? Y no ocurre que los estudian- una retroalimentacin til a los maestros sobre
tes de menores capacidades probablemente dejen las fortalezas y las debilidades curriculares, y
de hacer esfuerzos si los estndares estn fuera de asimismo verificara logros de estudiantes indi-
su alcance? En aulas heterogneas, calificar desde viduales. Los autores de Knowing What Students
el punto de vista de los estndares de maestra o Know (Pellegrino et al., 2001) imaginaron para el
dominio requerir de otros sistemas de respaldo futuro un sistema de evaluacin ms equilibrado
para los estudiantes de diferentes capacidades, in- y coherente, en el cual la evaluacin formativa de
cluyendo estrategias tales como: diferente ritmo la clase recibira igual atencin que las pruebas
de aprendizaje y tiempo diferente para las evalua- de alto impacto y en la que las evaluaciones en
ciones importantes, identificacin de metas inter- el aula y las externas estaran vinculadas de una
medias y alcanzables, y andamiaje diferencial. Si se manera coherente al mismo modelo fundamen-
toma con seriedad, el compromiso de que las cali- tal de aprendizaje.
ficaciones representen desempeo significara su- Actualmente, la idealizacin de Knowing
primir los diversos elementos de la calificacin por What Students Know no se ha realizado. En rea-
condescendencia, tales como puntos extra, puntos lidad, un extenso cuerpo de la literatura al res-
por entregar fichas y borradores de trabajos, pun- pecto ha documentado los efectos negativos en
tos por entregar tareas que jams se califican y as la enseanza y el aprendizaje (Heubert y Hauser,
sucesivamente. Los efectos de las tareas que ayu- 1999; Pedulla et al., 2003; Pellegrino et al., 2001;
dan a los estudiantes a aprender deben evaluarse U.S. Congress, Office of Technology Assessment,
en ltima instancia en evaluaciones culminantes 1992), causados principalmente por los efectos
donde el aprendizaje ser manifiesto. Al mismo de distorsin que ejerce el ensear para la prue-
tiempo, estaran permitidas otras formas de ayu- ba, con formatos limitados y una representacin
dar a los estudiantes a suavizar sus preocupaciones muy poco adecuada de los objetivos de aprendi-
sobre las calificaciones, si en cada caso les dieran la zaje significativos.
oportunidad de que ellos demostraran su maestra. En un tratamiento ms extenso tanto de los
Entre stas estaran las tareas o pruebas de reem- efectos positivos como de los negativos de las
plazo o descartar las calificaciones de exmenes pruebas de alto impacto (Shepard, Hammerness,
cuando se verifica el aprendizaje mediante evalua- Darling-Hammond y Rust, 2005), mis coautores
ciones posteriores. y yo concluimos que existen dos factores que pa-
recen intervenir en la forma en que las pruebas
4. EVALUACIONES EXTERNAS externas remodelan el currculo. El primero es
Y EN GRAN ESCALA cun idneo es el contenido de las pruebas para
captar los objetivos del aprendizaje, y el segun-
Las evaluaciones nacionales, estatales y distrita- do, es la capacidad del docente para mantener
les se utilizan para reunir datos con el fin de dar en el aula la enseanza concentrada en el verda-

38
La evaluacin en el aula

dero aprendizaje. Con base en estas lecciones de Si estamos de acuerdo con la idea de que los
la literatura que investiga cmo se ensea para la estudiantes deben estar conscientes de su pro-
prueba, identificamos estrategias que ayudan a pio progreso en el aprendizaje, tambin tiene
mantener enfocada la atencin de los estudian- sentido ayudarles a entender la relacin entre
tes en el aprendizaje, las cuales son consistentes el conocimiento que se requiere para las prue-
con la visin de la evaluacin formativa de la cul- bas y cmo se compara esto con las formas en
tura en el aula. As, adems de la coherencia de que usan su conocimiento en otros ambientes.
contenido entre las pruebas internas y las exter- Por ejemplo, Calkins, Montgomery y Santman
nas, buscamos preservar una coherencia filos- (1998) proponen que enseemos a los nios
fica entre las actitudes hacia el aprendizaje y la cmo leer las pruebas, igual que les enseamos
evaluacin, las cuales son transmitidas durante a dominar las caractersticas de cualquier otro
las clases normales, y la actitud que uno adopta gnero. Si nuestros pequeos estn acostum-
hacia el aprendizaje cuando se prepara para las brados a reunirse en la alfombra a leer juntos
pruebas externas. un texto, que quiz es ms largo de lo normal, y
Para protegerse de los efectos de un currculo luego a hablar de las estrategias para abordarlo
guiado por la aplicacin de pruebas, los maestros o para manejar las dificultades que plantea, por
en forma individual, o preferentemente equipos qu no pueden hacer lo mismo con el extracto
de maestros, deben elaborar una exposicin de una prueba estandarizada de lectura? (p.
razonada con el fin de ubicar el conocimiento 71). De igual manera, en el estudio de McNeil
y las habilidades relacionadas con las pruebas (1988), maestros experimentados de escuelas
dentro de los lmites ms amplios de los curr- magnet10 buscaron la forma de contrarrestar el
culos reales. Llamamos a esta tcnica mapeo del enfoque de fragmentos y hechos que tenan las
campo. Si comienzan con el marco de referencia pruebas y ayudaron a sus alumnos a llevar dos
del currculo estatal o los estndares nacionales conjuntos de notas, uno para el conocimiento
de contenido, los maestros pueden dibujar un real y otro para el conocimiento que necesi-
diagrama de Venn o construir una tabla para taran para la prueba. Si bien los estudiantes,
ilustrar cul subparte del currculo deseado es especialmente los de primaria, merecen tener
abarcado por la prueba y cul no. Muchas prue- algo de prctica con formatos de pruebas que
bas elaboradas comercialmente abarcan la parte les piden hacer ejercicios de respuesta abierta
ms fcil de medir de cada elemento del con- (Matemticas), o redactar prrafos a partir de
tenido de un campo, pero esto no significa que una instruccin general, para que no se descon-
se represente el campo adecuadamente. Sealar cierten ante tareas poco familiares, tal prctica
lo que se ha dejado fuera ayuda a esclarecer las debe darse en el contexto de los objetivos de
limitaciones de la prueba como gua curricular. la enseanza con los que estas tareas se rela-
Con base en este anlisis explcito, los maestros cionan. Y en vista de lo que sabemos sobre la
pueden entonces planear conscientemente uni- falta de transferencia cuando slo se utiliza un
dades de estudio y distribucin del tiempo de tipo de problema, los maestros pueden trabajar
enseanza en formas que mantengan la atencin para asegurarse de que haya una comprensin
al contenido de las pruebas en su lugar propor- ms slida si se concentran en los principios
cional. Por consiguiente, no se permitira que las fundamentales y si continan pidiendo a sus
pruebas de habilidades bsicas y de bajo nivel, alumnos que hagan extensiones y aplicaciones
que representan slo una subparte de los estn- de lo aprendido.
dares de contenido deseados, tuvieran tanta in-
10
Las magnet schools son escuelas pblicas que atraen a estudiantes
fluencia en la enseanza dentro del aula como de otro vecindario para reducir o eliminar el desequilibrio racial.
las evaluaciones basadas en conceptos, que son Estas escuelas dan una importancia especial al logro acadmico o
ms estimulantes. a un campo en particular, como Ciencias, Matemticas, Artes o
Ciencias de la computacin. [N. T.]

39
Textos de evaluacin

Buena parte de este consejo, sobre cmo 5. CONCLUSIONES:


mantener nuestra integridad profesional ante las IMPLICACIONES
presiones de las pruebas de alto impacto, tie- PARA LA INVESTIGACIN
ne que ver con la actitud y la posicin que uno Y LA TEORA DE LA MEDICIN
adopte. La idea fundamental es poner atencin
en la prueba slo en la medida en que sta se re- Ralph Tyler es un icono en la historia de la me-
lacione con el currculo, ms que detenerse en la dicin educativa. Empec este captulo con un
prueba y dejar que sta se convierta en el centro anlisis histrico porque yo quera abordar expl-
de la planeacin de la enseanza. Tal posicin citamente la tensin entre mi constante creen-
permite a los maestros utilizar los resultados cia en la visin de Tyler de que la medicin
de las pruebas para hacer slo las mejoras apro- educativa debe ser parte integral de la ensean-
piadas y necesarias en el currculo y la ensean- za y mi necesidad de cuestionar su herencia
za. Como lo seal Wiggins (1998), los buenos involuntaria: el persistente modelo de pruebas y
maestros tienen la capacidad de auto-evaluarse, mediciones para la evaluacin en el aula, fundado
pero an as hay puntos ciegos y una carencia de principalmente en pruebas objetivas elaboradas
referentes externos. La mayora de los maestros externamente. La otra visin de la evaluacin
con un buen conocimiento de los estndares en el aula presentada en este captulo es radical-
de contenido (puesto que la prueba se refiere a mente diferente de la imagen de la aplicacin de
ellos), y con una idea bastante clara de lo que sus pruebas en el saln de clase presentada en vo-
alumnos saben, pueden predecir cmo saldrn lmenes anteriores de Educational Measurement,
stos. Por lo tanto, las aportaciones ms impor- y en libros de texto sobre medicin. sta otra
tantes de los resultados de las pruebas externas visin se centra en conceptualizaciones mucho
pueden a menudo venir de los que resultan sor- ms ricas sobre el aprendizaje del estudiante en
presivos, ya que los maestros se ven llevados a el contexto de actividades significativas y resalta
preguntarse cosas como stas: por qu no fue- el uso formativo de la evaluacin para mejorar el
ron capaces mis alumnos de resolver este pro- aprendizaje.
blema (o de realizar esta tarea)? Cmo debo El nuevo modelo idealizado est bien fundado
cambiar mi enseanza para ayudarles a resolver en las teoras cognitivas y socioculturales contem-
problemas de este tipo? Por qu no supe lo que porneas del aprendizaje y en la teora de la moti-
ellos no saban? Adems, aun cuando los resulta- vacin, pero en cierto sentido todava es experi-
dos concuerden con sus predicciones, los maes- mental, ya que no se ha puesto en marcha en gran
tros pueden evaluar la idoneidad de sus propios escala. Queda mucho por aprender sobre qu nue-
esfuerzos si examinan las relativas fortalezas y vas ideas y adaptaciones adicionales se necesitarn
debilidades de los elementos curriculares. Por para hacer que tal visin funcione en la prctica.
ejemplo, se desempean los estudiantes igual- Concluyo reflexionando sobre cuatro temas esen-
mente bien en las habilidades de pensamiento ciales para la investigacin futura: (1) estudios de
de orden ms elevado que en las habilidades las herramientas y los procesos de evaluacin, (2)
bsicas? Cuando los maestros tienen un cono- desarrollo de las progresiones del aprendizaje, (3)
cimiento profesional bien desarrollado sobre estudios del desarrollo del maestro, y (4) nuevas
cmo encaja la informacin basada en pruebas conceptualizaciones de confiabilidad y la validez.
en un marco de referencia ms amplio de obje-
tivos curriculares enriquecidos, se hace posible 5.1. Estudios de las herramientas y los pro-
prestar atencin a una comprensin provenien- cesos de evaluacin
te de los resultados de exmenes, sin temor a
reducir y distorsionar el currculo, tan bien do- En Knowing What Students Know, Pellegrino et
cumentados en la literatura. al. (2001) sostuvieron que las interpretaciones

40
La evaluacin en el aula

y las prcticas de evaluacin deben basarse en nes a los maestros y estudiantes, y qu otros es-
un modelo bien concebido de aprendizaje del tmulos proporcionan para que se hagan avances
estudiante. Lo mismo puede decirse respecto en el aprendizaje? Cmo puede hacerse que las
de la importancia del modelo terico que sirve ocasiones de la evaluacin y las estrategias para
de fundamento a los estudios de investigacin. realizarla se adapten a las rutinas de enseanza?
Cuando Black y Wiliam (1998) emprendieron (Ejemplos de estas estrategias son sobre todo los
su voluminosa revisin de la investigacin sobre portafolios, las discusiones entre estudiantes y
la evaluacin formativa en el aula, citaron estu- la explicacin a la clase de las soluciones a pro-
dios fundamentales, meta-anlisis y revisiones blemas.) Pueden introducirse con muchsimo
que representaban mucho ms de mil estudios. cuidado los procesos derivados de la teora del
Con todo, muchos de los estudios citados son aprendizaje evaluacin del conocimiento pre-
inadecuados para nuestros propsitos, porque vio, retroalimentacin, conciencia metacogniti-
se derivan de modelos de aprendizaje muy in- va, auto-evaluacin, etctera como un medio
suficientes para la teora contempornea. Por para incrementar el aprendizaje y la motivacin
ejemplo, una gran mayora de los estudios sobre del estudiante? En qu condiciones y para quin
retroalimentacin se conceptualizaron desde son eficaces estas estrategias? Pueden hacerse
una perspectiva conductista y dependan de pre- coherentes, y que se respalden mutuamente la
pruebas y post-pruebas que se parecan mucho a evaluacin formativa y la sumativa? Cuando son
los materiales de enseanza. En la literatura mo- coherentes, se incrementan el aprendizaje y la
tivacional, la recomendacin de evitar tareas es- motivacin del estudiante? Las extrapolaciones
timulantes tal vez no se sostenga en un ambiente especulativas de la investigacin y la teora exis-
basado en criterios ms que en uno que remita tentes tambin deben someterse a prueba ex-
a normas, o cuando la cultura del aula respalda plcitamente. Por ejemplo, si se pospusieran las
a los estudiantes para que desarrollen una orien- calificaciones, aumentara esto la eficacia de la
tacin hacia el aprendizaje. Se necesitan nuevos evaluacin formativa, es decir, se vera estimula-
estudios que reflejen modelos constructivistas y da la orientacin al aprendizaje y aumentaran la
socioculturales del aprendizaje asistido. realizacin y los logros?
Unos cuantos estudios citados en el captulo
ilustran cmo puede introducirse y estudiarse 5.2. Estudios del desarrollo del maestro
una prctica especfica de evaluacin, consis-
tente con la teora social-constructivista. Por Los estudios de una variable por vez o de una
ejemplo, Elawar y Corno (1985) crearon una caracterstica de la evaluacin por vez son ti-
intervencin para ayudar a los maestros a que les para los fines de la investigacin, porque nos
se concentraran en conseguir que la retroali- ayudan a concentrarnos en los efectos de una es-
mentacin fuera til para el mejoramiento de trategia especfica y en las formas mediante las
los estudiantes. White y Frederiksen (2000) y cuales esas prcticas de evaluacin en particular
Klenowski (1995) examinaron el efecto de la respaldan el aprendizaje del estudiante. Adems,
auto-evaluacin en el aprendizaje del estudian- estos estudios me parecen ejemplos tiles de
te y sus actitudes respecto a las calificaciones, cmo puede ocurrir el cambio: es decir, cmo
el conocimiento de los criterios, etc. Se nece- es posible que los maestros a quienes les gusta la
sitan ms estudios como stos. Deben disear- teora de la evaluacin formativa den los pasos
se para que respondan a preguntas de inves- iniciales para modificar su prctica. En ltima
tigacin tales como las siguientes: cun bien instancia la meta es hacer un paradigma com-
captan objetivos importantes de aprendizaje pleto y un cambio cultural (Shepard, 2000). Sin
las evaluaciones incorporadas en la enseanza? duda, si uno adopta una tcnica de evaluacin for-
Qu conocimientos aportan tales evaluacio- mativa sin un cambio filosfico correspondiente,

41
Textos de evaluacin

los esfuerzos se vern socavados o acabarn por la comunidad en la que participan (Lave y Wen-
ser intiles, ya que persistirn las actitudes tra- ger, 1991). Para que los docentes hagan cambios
dicionales, como la de quienes en su desempeo significativos en las creencias pedaggicas y en
acadmico slo les importa la calificacin. Sin las prcticas concomitantes, ellos mismos nece-
embargo, sabemos gracias a la investigacin so- sitarn experimentar y reflexionar sobre nuevos
bre la reforma educativa y el cambio del docente procedimientos en el contexto de sus propias
que es imposible instaurar una reforma integral. aulas (Putnam y Borko, 2000). Los estudios de
Por lo tanto, es bastante prctico tomar en con- investigacin realizados en el contexto de la
sideracin argumentos tericos y luego adoptar prctica deben prestar atencin a cuestiones ta-
una estrategia especfica de evaluacin, como el les como las siguientes: qu condiciones, creen-
punto focal para la transformacin lenta y con- cias previas o apoyos hacen posible o frustran
cienzuda en la prctica, junto con un acompa- el uso de la evaluacin tal como uno la quiere
amiento constante y la reflexin para tener en hacer? Cmo influye el conocimiento de la ma-
cuenta las inevitables repercusiones tericas y teria que tiene un maestro sobre sus creencias
prcticas. La estrategia de la intervencin nica y sobre la implementacin de prcticas eficaces
de evaluacin podra ser una capacitacin espe- de evaluacin formativa? Cmo pueden quedar
cial para dar retroalimentacin enfocada al me- integradas las prcticas de evaluacin formati-
joramiento; documentar los fondos del mismo va con otras reformas curriculares o con otros
conocimiento de los estudiantes; examinar el cambios culturales dirigidos a desarrollar una
trabajo de los alumnos en equipos de grado; in- comunidad de personas que aprenden, los cua-
troducir la auto-evaluacin, y as sucesivamente. les tambin se basan en un modelo sociocultural
En un estudio notable realizado en Inglaterra en del aprendizaje? Cmo debe uno dedicarse a las
el que el avance promedio de los alumnos de un cuestiones en torno a la calificacin y a las eva-
grupo fue del orden de un tercio de una desvia- luaciones externas, con objeto de ayudar y no de
cin estndar, Black y Wiliam (2004) familiari- obstaculizar los esfuerzos de la evaluacin for-
zaron a los maestros con la teora de la evalua- mativa? Cmo influyen en la renegociacin de
cin formativa y luego los invitaron a desarrollar los objetivos de la evaluacin formativa el con-
sus propios planes, seleccionando estrategias de texto escolar y el contrato social implcito (Pe-
la literatura, tales como preguntas abundantes, rrenoud, 1991) que los estudiantes llevan consigo
marcar el trabajo escolar slo con comentarios, en lo que se refiere a las calificaciones?
compartir criterios con los alumnos e implantar
la auto-evaluacin y la evaluacin por pares dada 5.3. Nuevas conceptualizaciones
por los estudiantes. de la confiabilidad y la validez
La investigacin sobre el aprendizaje y desa-
rrollo profesional de los maestros nos propor- Mi prembulo histrico describi el campo de
ciona varios principios generales para respaldar la medicin como reacio a distanciarse de una
el cambio. En esencia, nosotros (los que pro- visin tradicional de las pruebas en el aula, que
movemos el cambio) necesitamos tratar a los se concentraban en la evaluacin sumativa. La
maestros en la medida en que son personas que llegada del siglo XXI, sin embargo, ha visto
aprenden, de la misma manera como les pedi- cambios notables. La publicacin de Knowing
mos que traten a sus estudiantes. Necesitamos What Students Know (Pellegrino et al., 2001) fue
tener un modelo bien concebido de la prctica un verdadero parteaguas. Un segundo aconteci-
profesional ideal hacia la que los conducimos, y miento muy relevante fue la publicacin de un
al mismo tiempo debemos estar conscientes de nmero especial de Educational Measurement: Is-
que los maestros harn contribuciones y tam- sues and Practice sobre cambiando la manera en
bin modificarn las herramientas y prcticas de que los tericos de la medicin piensan sobre

42
La evaluacin en el aula

las evaluaciones en el aula (Brookhart, 2003). para una carta de recomendacin, o formativa,
Al frente de este movimiento, Brookhart (2003) como cuando un maestro adapta la retroalimen-
sostiene que los avances en la teora de la confia- tacin para ayudar a un estudiante a mejorar el
bilidad y la validez han sido forjados en el con- trabajo que ha escrito.
texto de programas de evaluacin en gran escala. As como la evaluacin formativa quizs no
En atencin a la necesidad de que evaluacin y necesite que se d a conocer una calificacin fija,
enseanza se integren en el aula, como he sea- tambin es el caso que los coeficientes de co-
lado en este captulo, Brookhart (2003) ha dado rrelacin rara vez pueden ser los indicadores
argumentos en el sentido de que la forma de apropiados de la confiabilidad. En las aulas,
concebir confiabilidad y validez en el aula debe dar sentido a los datos de observacin y a las
ser tambin fundamentalmente diferente. muestras del trabajo de los alumnos significa
Un principio bsico de la teora de la medi- buscar patrones, comprobar evidencia contra-
cin ha sido siempre que la confiabilidad y la dictoria y comparar la descripcin emergente
validez dependen del uso de pruebas. En el con- en contraposicin con modelos del desarrollo
texto del aula, no es necesario que la confiabi- de las competencias. Al igual que otros autores,
lidad de cualquier evaluacin cumpla el mismo estoy en favor de un enfoque interpretativista
criterio de estabilidad que una medicin utili- del anlisis y la sntesis de datos (Gipps, 1999;
zada para determinar la graduacin del bachille- Graue, 1993; Moss, 1996, 2003; Shepard, 2001).
rato o el ingreso a la universidad. Debido a que En mi propio caso, veo una fuerte conexin en-
la evaluacin formativa en las aulas es constan- tre el uso de mtodos cuantitativos de investi-
te, una percepcin errnea de las habilidades o gacin, de prcticas de evaluacin formativa, y
el conocimiento de un estudiante puede un da mi preparacin para el trabajo clnico, cuando
corregirse con nueva informacin y al siguiente utilizo observaciones para formar una hiptesis
con una demostracin de su aprovechamiento tentativa, cuando reno informacin adicional
(Shepard, 2000). Lo que es ms importante, los para confirmar o revisar, y cuando planeo una
conceptos de andamiaje y evaluacin dinmica intervencin (que en s misma es una hiptesis
(Lidz, 1987), fundamentados en la zona de de- de trabajo). En efecto, hace un tiempo, Geertz
sarrollo prximo de Vygotsky, tienen la finali- (1973) estableci una analoga entre la inferen-
dad de cambiar el nivel de aprovechamiento del cia clnica como la que se usa en medicina y la
estudiante en el mismo proceso de evaluacin. forma en que los tericos culturales diagnostican
Moss (2003), en el nmero especial de Educatio- el significado fundamental del discurso social,
nal Measurement: Issues and Practice, sostiene que, queriendo decir con ello que usan una teora ate-
como docente, No tengo necesidad de sacar rrizada (grounded) para generar interpretaciones
y garantizar interpretaciones fijas de las capa- convincentes, o generalizaciones que tienen un
cidades de los estudiantes, sino que ms bien poder explicativo ms all de las descripciones
mi trabajo es ayudarles a hacer que esas inter- gruesas. Obsrvese que verificar si existen patro-
pretaciones se vuelvan obsoletas (p. 16). Smith nes y justificar que ciertas interpretaciones par-
(2003), tambin en el nmero especial, propuso ticulares estn fundamentadas borra los lmites
que quizs la suficiencia de la informacin sera el entre la confiabilidad y la validez, como Smith
criterio ms apropiado para la confiabilidad en (2003) tuvo que reconocer en su argumento en
el contexto del aula. Tengo a la mano la infor- favor de la suficiencia de la informacin como
macin suficiente para tomar una decisin ra- la forma de definir la confiabilidad concerniente
zonable respecto de este estudiante en relacin a los propsitos del aula. De hecho, la lnea de
con este campo de contenido? (p. 30). Como interrogacin que Smith (2003) propone para
observ Moss, el criterio sera diferente depen- evaluar la confiabilidad corresponde de cerca al
diendo de si la decisin fuera sumativa, como proceso interpretativo de evidencia que Moss

43
Textos de evaluacin

(2003) ofrece como criterio de validez. En vista tudiante. Como seala Moss (2003), la validez en
de que esta ltima es el concepto ms incluyen- los contextos del aula alude principalmente a las
te, prefiero usar el trmino validez para referir- consecuencias, a qu tan bien las interpretaciones
me al proceso de fundamentar interpretaciones, de las evaluaciones informan a las decisiones do-
y limitar el uso del trmino confiabilidad a las centes y cunto ayudan a hacer que los estudiantes
exigencias de consistencia ms estrechas, tales avancen a lo largo de una trayectoria de competen-
como los acuerdos entre varios jueces al utilizar cia creciente. Para trazar un plan de investigacin
guas de calificacin (rubrics). con objeto de desarrollar una teora de la validez
Brookhart (2003), Moss (2003) y Smith apropiada para la evaluacin en el aula, uno nece-
(2003) han comenzado a especular sobre cmo sita solamente retomar los temas importantes del
tendr que reformularse la teora de la confiabi- captulo. Para que se respalden mutuamente, la
lidad y la validez para que tengan sentido en los evaluacin formativa y la sumativa deben alinearse
propsitos del aula, pero es tan slo el inicio de desde el punto de vista conceptual. Deben incor-
un esfuerzo mayor de reconceptualizacin. Ser porar objetivos de aprendizaje importantes, que se
necesario modificar muchos viejos conceptos o sirvan de una amplia gama de tareas y tipos de pro-
incluso ir en contra de ellos. Por ejemplo, sabe- blemas para captar las comprensiones de los estu-
mos que la diferencia entre dos calificaciones diantes. Las investigaciones sobre la validez deben
cuantitativas, es por lo general mucho menos examinar lo bien que diversas herramientas de
confiable que cualquiera de las dos calculada por evaluacin representan el conocimiento, las habi-
s sola. No obstante, si furamos a tomar con lidades y las actitudes de los estudiantes as como
seriedad la recomendacin de Knowing What sus identidades en proceso de desarrollo, con fines
Students Know, de representar el progreso del es- sumativos, y cun bien soportan acercamientos
tudiante a lo largo de continuos de aprendizaje profundos y de dominio del aprendizaje, cuan-
bien desarrollados, las calificaciones de diferencia o do se usan formativamente. Los estudios de vali-
las mediciones del progreso podran ser suma- dez deben, asimismo, consagrarse a revisar si los
mente confiables, porque la medicin de creci- procesos de evaluacin funcionan como se desea.
miento basada en el aula tendra el respaldo de Por ejemplo, utilizan los estudiantes una retroali-
todos los datos que se reunieran a lo largo del mentacin sustantiva para mejorar su trabajo? El
proceso, y no dependera solamente de los dos programa de investigacin esbozado lneas arriba
extremos. Un programa de investigacin que es- para examinar los efectos de las herramientas y
tudiara la confiabilidad para los propsitos del los procesos de evaluacin es, en realidad, un pro-
aula debera empezar por examinar el tipo y el grama de investigacin sobre la validez. La mayor
grado de consistencia requerido para respaldar comprensin que se alcance gracias a la investiga-
las decisiones en el aula. cin que pone a prueba el modelo de evaluacin
La validez es el sitio apropiado para empezar formativa, su relacin con la teora del aprendizaje,
o terminar cualquier intento de medicin educa- etctera, ayudar asimismo a iluminar una nueva
tiva. En las aulas, la evaluacin formativa es vlida comprensin de la teora de la validez, necesaria
si contribuye al progreso del aprendizaje del es- para la evaluacin en el aula.

44
La evaluacin en el aula

Bibliografa Brookhart, S. M. (1993). Teachers grading prac-


tices: Meaning and values. Journal of Edu-
Ames, C. (1984). Competitive, cooperative, and cational Measurement, 30, 123-142.
individualistic goal structures: A cogniti- Brookhart, S. M. (1994). Teachers grading:
ve-motivational analysis. En R. E. Ames Practice and theory. Applied Measurement
y C. Ames (Eds.). Research on motivation in in Education, 7 (4), 279-301.
education, 1, 177-207. Nueva York: Acade- Brookhart, S. M. (2003) Developing measure-
mic Press. ment theory for classroom assessment
Ames, C. (1992). Classrooms: Goals, structures, purposes and uses. Educational Measure-
and student motivation. Journal of Educa- ment: Issues and Practice, 22 (4), 5-12.
tional Psychology, 84, 261-271. Brown, F. G. (1981). Measuring classroom achie-
Assessment Reform Group. (1999). Assessment vement. Nueva York: Holt, Rinchart y
for learning: Beyond the black box. University Winston.
of Cambridge School of Education: Cam- Bruner, J.S. (1985). Vygotsky: A historical and
bridge. conceptual perspective. En J. V. Wersch
Atkin, J. M., Black, P., y Coffey, J. (2001). Classro- y Center for Psychosocial Studies (Eds.),
om assessment and the National Science Educa- Culture, communication, and cognition:
tion Standards. Washington, DC: National Vygotskian perspectives, pp. 21-34. Nueva
Academy Press. York: Cambridge University.
Baron, J. B., y Wolf, D. P. (Eds.). (1996). Perfor- Butler, R. (1987). Task-involving and ego-invol-
mance-based student assessment: Challenges and ving properties of evaluation: Effects of
Possibilities, Ninety-fifth Yearbook of the Natio- different feedback conditions on moti-
nal Society for the Study of Education. Parte 1. vational perceptions, interest and perfor-
Chicago: University of Chicago Press. mance. Journal of Educational Psychology,
Benware, C., y Deci, E. (1984). Quality of lear- 79, 474-482.
ning with an active versus passive motiva- Butler, R. (1988). Enhancing and undermining
tional set. American Educational Research intrinsic motivation: The effects of task-
Journal, 21, 755-765. involving and ego-involving evaluation on
Black, P., y William, D. (1998). Assessment and interest and performance. British Journal
classroom learning. Assessment in Education: of Educational Psychology, 58, 1-14.
Principles, Policy, and Practice, 5(1), 7-74. Butler, R., y Nisan, M. (1986). Effects of no fee-
Black, P., y William, D. (2004). The formative dback, task-related comments, and grades
purpose: Assessment must first promo- on intrinsic motivation and performan-
te learning. En M. Wilson (Ed.), Towards ce. Journal of Educational Psychology, 78,
coherence between classroom assessment and 210-216.
accountability: 103 Yearbook of the National Calkins, L., Montgomery, K., y Santman, D.
Society for the Study of Education. Parte 2, (1998). A teachers guide to standardized rea-
pp. 20-50. Chicago: University of Chicago ding tests: Knowledge is power, Portsmouth,
Press. NH: Heinemann.
Bloom, B. S. (Ed.). (1956). Taxonomy of educational Carpenter, T. P., y Moser, J. M. (1984). The
objectives: The classification of educational goals. acquisition of addition and subtraction
Nueva York: David McKay Company. concepts in grades one through three. Jo-
Bransford, J. D., Brown, A. L., y Cocking, R. R. urnal for Research in Mathematics Education.
(1999). How people learn: Brain, mind, expe- 15 (3), 179-202.
rience, and school. Washington, DC: Natio- Cizek, G. J., Fitzgerald, S. M., y Rachor, R. E.
nal Academies Press. (1995/1996). Teachers assessment prac-

45
Textos de evaluacin

tices: Preparation, isolation, and the kit- Farr, R., y Griffin, M. (1973). Measurement
chen sink. Educational Assessment, 3 (2), gaps in teacher education. Journal of Re-
159-179. search and Development in Education, 7 (1),
Clay, M. M. (1985). The early detection of reading 19-28.
difficulties. Auckland, Nueva Zelanda: Hei- Fennema, E., y Franke, M. L. (1992). Teachers
nemann. knowledge and its impact. En D. A.
Cobb, P., Wood, T., y Yackel, E. (1993). Discour- Grouws (Ed.), Handbook of research on ma-
se, mathematical thinking, and classroom thematics teaching and learning, pp. 147-164.
practice. En E. A. Forman, N. Minick, y Nueva York: Macmillan.
C. A. Stone (Eds.), Contexts for learning: Fleming, M., y Chambers, B. (1983). Teacher-
Sociocultural dynamics in childrens develo- made tests: Windows on the classroom.
pment, pp. 91-119. Nueva York: Oxford New Directions for Testing and Measurement:
University Press. Testing in the Schools, 19, 29-38.
Connolly, A., Nachtman, W., y Pritchett, M. Forster, M., y Masters, G. (2004). Bridging the
(1972). Keymath diagnostic arithmetic test. conceptual gap between classroom as-
Circle Pines, MN: American Guidance sessment and system accountability. En
Service. M. Wilson (Ed.), Towards coherence between
Cook, W. W. (1941). Achievement tests. En W. classroom assessment and accountability: 103
S. Monroe (Ed.), Encyclopedia of educational Yearbook of the National Society for the Stu-
research, pp. 1283-1301. Nueva York: Mac- dy of Education, parte 2, pp. 51-73. Chicago:
millan. University of Chicago Press.
Cook, W. W. (1951). The functions of measure- Geertz, C. (1973). The interpretation of cultures.
ment in the facilitation of learning. In E. Nueva York: Basic Books.
F. Lindquist (Ed.), Educational Measure- Gipps, C. V. (1999). Socio-cultural aspects of as-
ment, pp. 3-46. Washington, DC: Ameri- sessment. En P.D. Pearson y A. Iran-Nejad
can Council of Education. (Eds.), Review of research in education, 24,
Crooks, T. J. (1988). The impact of classroom 355-392. Washington, DC: American Edu-
evaluation practices on students. Review cational Research Association.
of Educational Research, 58 (4), 428-481. Glaser, R., y Nitko, A. J. (1971). Measurement in
Deci, E., y Ryan, R. (1985). Intrinsic motivation learning and instruction. En R. L. Thorn-
and self-determination in human behavior. dike (Ed.), Educational measurement, 2a ed.,
Nueva York: Plenum. pp. 625-670. Washington, DC: American
Dorr-Bremme, D. W. (1983). Assessing students: Council on Education.
Teachers routine practices and reasoning. Goehring, H. J., Jr. (1973). Course competencies
Evaluation Comment, 6 (4), 1-12. for undergraduate courses in educational
Dweek, C. (1986). Motivational processes affec- tests and measurement. The Teacher Edu-
ting learning. American Psychologist, 41, cator, 9, 11-20.
1040-1048. Goodman, Y. M. (1985). Kidwatching: Ob-
Elawar, M. C., y Corno, L. (1985). A factorial ex- serving children in the classroom. En
periment in teachers written feedback on A. Jaggar y M. T. Smith-Burke (Eds.),
student homework: Changing teacher be- Observing the language learner, pp. 9-18.
havior a little rather than a lot. Journal of Newark, DE: International Reading As-
Educational Psychology, 77, 162-173. sociation and National Council of Tea-
Elliot, E., y Dweck, C. (1988). Goals: An approach chers of English.
to motivation and achievement. Journal of Goslin, D. A. (1967). Teachers and testing. Nueva
Personality and Social Psychology, 54, 5-12. York: Russell Sage.

46
La evaluacin en el aula

Graue, M. E. (1993). Integrating theory and prac- Lepper, M. (1983). Extrinsic reward and intrinsic
tice through instructional assessment. motivation: Implications for the classro-
Educational Assessment, 1, 293-309. om. En J. Levine y M. Wang (Eds.), Teacher
Harackiewicz, J., Abrahams, S., y Wageman, R. and student perceptions: Implications for lear-
(1987). Performance evaluation and intrin- ning, pp. 281-317. Hillsdale, NJ: Lawrence
sic motivation: The effects of evaluative Erlbaum.
focus, rewards, and achievement orienta- Lidz, C. S. (1987). Dynamic assessment: An interac-
tion. Journal of Personality and Social Psycho- tional approach to evaluating learning poten-
logy, 53, 1015-1023. tial. Nueva York: Guilford Press.
Heath, S. B. (1983). Ways with words: Language, Lindquist, E. F. (Ed.). (1951). Educational measure-
life, and work in communities and classrooms. ment. Washington, DC: American Council
Cambridge: Cambridge University Press. on Education.
Heubert, J., y Hauser, R. (Eds.). (1999). High- Linn, R. L. (Ed.). (1989). Educational measurement,
stakes: Testing for tracking, promotion, and 3a ed. Nueva York: American Council on
graduation. Washington, DC: National Education y Macmillan.
Academy Press. Lorsbach, A. W., Tobin, K., Briscoe, C., y La-
Hiebert, E. H., y Raphael, T. E. (1998). Early lite- Master, S. U. (1992). An interpretation
racy instruction. Fort Worth, TX: Harcourt of assessment methods in middle school
Brace College Publishers. science. International Journal of Science
Hogan, K., y Pressley, M. (1997). Scaffolding Education, 14 (3), 305-317.
scientific competencies within classroom Madaus, G. F., y Stufflebeam, D. L. (2000). Pro-
communities of inquiry. En K. Hogan y M. gram evaluation: A historical overview.
Pressley (Eds.), Scaffolding student learning: En D. L. Stufflebeam, G. F. Madaus, y
Instructional approaches and issues, pp. 74-107. T. Kellaghan (Eds.), Evaluation models:
Cambridge, MA: Brookline Books. Viewpoints on educational and human services
Klenowski, V. (1995). Student self-evaluation evaluation, 2a ed., pp. 3-18. Boston: Kluwer
process in student-centered teaching and Academic.
learning contexts of Australia and En- Madaus, G. F., West, M. M., Harmon, M. C.,
gland. Assessment in education, 2, 145-163. Lomax, R. G., y Viator, K. A. (1992, Octo-
Kluger, A. N., y DeNisi, A. (1996). The effect of ber). The influence of testing on teaching math
feedback interventions on performance: and science in grades 4-12: Executive summary.
A historical review, a meta-analysis, and a Chestnut Hill, MA: Boston College, Cen-
preliminary feedback intervention theory. ter for the Study of Testing, Evaluation,
Psychological Bulletin, 119, 254-284. and Educational Policy.
Kulm, G. (Ed.). (1990). Assessing higher order Marshall, H. H. (1988). Work or learning: Impli-
thinking in mathematics. Washington, DC: cations of classroom metaphors. Educatio-
American Association for the Advance- nal Researcher, 17 (9), 9-16.
ment of Science. Marton, F. y Saljo, R. (1976). On qualitative di-
Lappan, G., Fey, J. T., Fitzgerald, W. M., Friel, S. fferences in learning: 1. Outcome and pro-
N., y Phillips, E. D. (1998). Connected ma- cess. British Journal of Educational Psycholo-
thematics, say it with symbols: Algebraic rea- gy, 46, 4-11.
soning. Student Ed. Menlo Park, CA: Dale Masters, G., y Forster, M. (1997). Mapping literacy
Seymour Publications. achievement: Results of the 1996 National School
Lave, J., y Wenger, E. (1991). Situated learning: Le- English Literacy Survey. Camberra, Australia:
gitimate peripheral participation. Cambrid- Department of Employment, Education,
ge: Cambridge University Press. Training and Youth Affairs (DEETYA).

47
Textos de evaluacin

Mathematical Sciences Education Board. (1993). serving children ages 3 through 8. Washing-
Measuring what counts: A conceptual guide for ton, DC: National Association for the
mathematics assessment. Washington, DC: Education of Young Children.
National Academy Press. National Council of Teachers of Mathematics.
Mayo, S. T. (1964, February). What experts think (1989). Curriculum and evaluation standards
teachers ought to know about educational mea- for school mathematics. Reston, VA: Autora.
surement. Ponencia presentada en la re- National Council of Teachers of Mathematics.
union anual del National Council on Mea- (1995). Assessment Standards for School Ma-
surement in Education, Chicago. thematics. Reston, VA: Autora.
Mazur, E. (1997). Peer instruction: A users manual. National Research Council. (1989). Everybody
Upper Saddle River, NJ: Prentice Hall. counts: A report to the nation on the future of
McMillan, J. H. (2003). Understanding and im- mathematics education. Washington, DC:
proving teachers classroom assessment National Academy Press.
decision making: Implications for theory Nava, F. J. G., y Loyd, B. H. (abril de 1992). An
and practice. Educational Measurement: Is- investigation of achievement and non-achie-
sues and Practice, 22 (4), 34-43. vement criteria in elementary and secondary
McNeil, L. M. (1988). Contradictions of control: school grading. Ponencia presentada en la
School structure and school knowledge. Nueva reunion anual de la American Educational
York: Routledge. Research Association: San Francisco.
Mitchell, M. (1993). Situational interest: Its Newmann, F. (1992). Higher order thinking and
multifaceted structure in the secondary prospects for classroom thoughtfulness.
school mathematics classroom. Journal of En F. Newmann (Ed.), Student engage-
Educational Psychology, 85, 424-436. ment and achievement in American secondary
Moll, L.C., Amanti, C., Neff, D., y Gonzlez, N. schools, pp. 62-91. Nueva York: Teachers
(1992). Funds of knowledge for teaching: College Press.
Using a qualitative approach to connect Nitko, A. J. (1989). Designing tests that are in-
homes and classrooms. Theory Into Practi- tegrated with instruction. En R. L. Linn
ce, 31 (2), 132-141. (Ed.), Educational measurement, 3ra ed., pp.
Morrow, L. M. (1985). Retelling stories: Strate- 447-474. Nueva York: American Council
gies for improving childrens comprehen- on Education y Macmillan.
sion, concept of story structure, and oral Noll, V. H. (1955). Requirements in educational
language complexity. Elementary School Jo- measurement for prospective teachers.
urnal, 85, 647-661. School and Society, 80, 88-90.
Morrow, L. M., y Smith, J. K. (1990). Assessment Ogle, D. M. (1986). K-W-L: A teaching model
for instruction in early literacy. Englewood that develops active reading of expository
Cliffs, NJ: Prentice Hall. text. The Reading Teacher, 39 (6), 564-570.
Moss, P. A. (1996). Enlarging the dialogue in Pedulla, J. J., Abrams, L. M., Madaus, G. F., Rus-
educational measurement: Voices from sell, M. K., Ramos, M. A., y Miao, J. (2003).
interpretive research traditions. Educatio- Perceived effects of state-mandated testing pro-
nal Researcher, 25, 20-28, 43. grams on teaching and learning: Findings from
Moss, P. A. (2003). Reconceptualizing validity for a national survey of teachers. Boston: Boston
classroom assessment. Educational Measu- College, National Board on Educational
rement: Issues and Practice, 22 (4), 13-25. Testing and Public Policy.
National Association for the Education of Young Pellegrino, J. W., Baxter, G. P., y Glaser, R.
Children. (1990). Guidelines for appropriate (1999). Addressing the Two Disciplines
curriculum content and assessment in programs problem: Linking theories of cognition

48
La evaluacin en el aula

and learning with assessment and instruc- Seriven (Eds.), Perspectives of curriculum
tional practice. En P. D. Pearson y A. Iran- evaluation, pp. 39-83. Chicago: Rand Mc-
Nejad (Eds.), Review of research in education, Nally.
24, 307-353. Washington, DC: American Shepard, L. A. (2000). The role of assessment in
Educational Research Association. a learning culture. Educational Researcher;
Pellegrino, J. W., Chudowsky, N., y Glaser, R. 29 (7), 4-14.
(2001). Knowing what students know: The Shepard, L. A. (2001) The role of classroom as-
science and design of educational assessment. sessment in teaching and learning. En V.
Washington, DC: National Academy Richardson (Ed.), Handbook of research on
Press. teaching, 4a ed., pp. 1066-1101. Washing-
Perrenoud, P. (1991). Towards a pragmatic appro- ton, DC: American Educational Research
ach to formative evaluation. En P. Weston Association.
(Ed.), Assessment of pupils achievement: Mo- Shepard, L. A. (2003). Reconsidering large-scale
tivation and school success, pp. 77-101. Ams- assessment to heighten its relevance to
terdam: Swets and Zeitlinger. learning. En J. M. Atkin y J. E. Coffey
Putnam, R. T., y Borko, H. (2000). What do new (Eds.) Everyday assessment in the science clas-
views of knowledge and thinking have to sroom, pp. 121-146. Arlington, VA: NSTA
say about research on teacher learning? Press.
Educational Researcher, 29 (1), 4-15. Shepard, L. A., y Bliem, C. L. (1995). Parents
Resnick, L. B., y Resnick, D. P. (1992). Assessing thinking about standardized tests and
the thinking curriculum: New tools for performance assessments. Educational Re-
education reform. En B. R. Gifford y M. searcher, 24 (8), 25-32.
C. OConnor (Eds.), Changing assessments: Shepard, L., Hammerness, K., Darling-Ham-
Alternative views of aptitude, achievement, mond, L., y Rust, F. (2005). Assessment. En
and instruction, pp. 37-75. Boston: Kluwer L. Darling-Hammond y J. Bransford (Eds.),
Academic. Preparing teachers for a changing world: What
Roeder, H. H. (1972). Are todays teachers pre- teachers should learn and be able to do, pp.
pared to use tests? Peabody Journal of Edu- 275-326. San Francisco: Jossey-Bass.
cation, 59, 239-40. Silver, E. A., y Kenney, P. A. (1995). Sources of
Romberg, T., y Carpenter, T. (1986). Research assessment information for instructional
on teaching and learning mathematics: guidance in mathematics. En T. A. Rom-
Two disciplines of scientific inquiry. En berg (Ed.), Reform in school mathematics and
M. Wittrock (Ed.), Handbook of research on authentic assessment, pp. 38-86. Albany, NY:
learning, 3a ed., pp. 850-873. Nueva York: State University of New York Press.
Macmillan. Silver, E. A., y Kilpatrick, J. (1989). Testing ma-
Routman, R. (2000). Conversations: Strategies thematical problem solving. En R. Char-
for teaching, learning and evaluating. Ports- les y E. Silver (Eds.), Teaching and assessing
mouth, NH: Heinemann. mathematical problem solving, pp. 178-186.
Sadler, R. (1989). Formative assessment and the Hillsdale, NJ: Lawrence Erlbaum.
design of instructional assessments. Ins- Smith, J. K. (2003). Reconsidering reliability in
tructional Science, 18, 119-144. classroom assessment and grading. Educa-
Salmon-Cox, L. (1981). Teachers and standardi- tional measurement: Issues and Practice, 22 (4),
zed achievement tests: Whats really ha- 26-33.
ppening? Phi Delta Kappan, 69(9), 631-634. Stiggins, R. J. (1991). Relevant classroom as-
Seriven, M. (1967). The methodology of evalua- sessment training for teachers. Educational
tion. En R. A. Tyler, R. M. Gagne, y M. Measurement: Issues and Practice, 10 (1), 7-12.

49
Textos de evaluacin

Stiggins, R. J. (2001). Student-involved classroom teacher with implications for corrective proce-
assessment, 3a ed. Upper Saddle River, NJ: dures. Nueva York: Dryden Press.
Prentice Hall. Travers, R. M. W. (1955). Educational measurement.
Stiggins, R. J., y Conklin, N. F. (1992). In teachers Nueva York: Macmillan.
hands: Investigating the practices of classro- Tyler, R. W. (1951). The functions of measure-
om assessment. Albany: State University of ment in improving instruction. In E. F.
New York Press. Lindquist (Ed.), Educational measurement,
Stipek, D. J. (1996). Motivation and instruction. pp. 47-67. Washington, DC: American
En D. C. Berliner y R. C. Calfee (Eds.), Council on Education.
Handbook of educational psychology, pp. U. S. Congress, Office of Technology Assessment.
85-113. Nueva York: Simon & Schuster (1992). Testing in American schools: Asking the
Macmillan. right questions (OTA-SET-519). Washington,
Stipek, D. (1998). Motivation to learn: From theory DC: U.S. Government Printing Office.
to practice, 3a ed.,. Boston: Allyn & Bacon. Valencia, S. W., y Calfee, R. C. (1991) The de-
Symonds, P. M. (1927). Measurement in secondary velopment and use of literacy portfo-
education. Nueva York: Macmillan. lios for students, classes, and teachers.
Taylor, C. S., y Nolen, S. B. (2005). Classroom Applied Measurement in Education, 4,
assessment: Supporting teaching and learning 333-346.
in real classrooms. Upper Saddle River, NJ: Van den Heuvel-Panhuizen, M. (2001). A lear-
Pearson Education. ning-teaching trajectory description as a
Teale, W. H., Hiebert, E. y Chittenden, E. (1987). hold for mathematics teaching in primary
Assessing young childrens literacy develo- schools in the Netherlands. En M. Tzeka-
pment. The Reading Teacher, 40, 772-777. ki (Ed.), Didactics of mathematics and infor-
Teale, W. H., y Sulzby, E. (Eds.). (1986). Emergent matics in education. 5a Conferencia Panhelni-
literacy: Writing and reading. Norwood, NJ: ca con Participacin Internacional, pp. 21-36.
Ablex. Thessaloniki: Universidad Aristteles de
Tharp, R. G., y Gallimore, R. (1988). Rousing Thessaloniki, Universidad de Macedonia,
minds to life: Teaching, learning, and schooling Instituto Pedaggico.
in social context. Nueva York: Cambridge Vygotsky, L. S. (1978). Mind in society: The develo-
University Press. pment of higher psychological processes. Cam-
Thorndike, E. L. (1913). Introduction to the theory bridge, MA: Harvard University Press.
of mental and social measurements. Nueva Ward, J. G. (1980). Teachers and testing: A sur-
York: Teachers College, Universidad de vey of knowledge and attitudes. En L.
Columbia. M. Rudner (Ed.), Testing in our schools, pp.
Thorndike, E. L. (1922). Measurement in educa- 15-24. Washington, DC: National Institu-
tion. En Twenty-first yearbook of the Natio- te of Education.
nal Society for the Study of Education. Parte White, B. Y., y Frederiksen, J. R. (2000). Me-
1, pp. 1-9. Bloomington, IL: Public School tacognitive facilitation: An approach to
Publishing. making scientific inquiry accessible to
Thorndike, E. L. (1931). Human learning. Nueva all. En J. Minstrell y E. van Zee (Eds.), In-
York: Century. quiring into inquiry learning and teaching in
Thorndike, E. L. (1971). Educational measurement, science, pp. 33-370. Washington, DC: Ame-
2a ed. Washington, DC: American Council rican Association for the Advancement of
on Education. Science.
Torgerson, T. L., y Adams, G. S. (1954). Measure- Wigheld, A., Eccles, J. S., y Rodrguez, D. (1998).
ment and evaluation for the elementary-school The development of childrens motivation

50
La evaluacin en el aula

in school contexts. En P. D. Pearson y A. Wiggins, G., y McTighe, J. (1998). Understanding by


Iran-Nejad (Eds.), Review of Research in Edu- design. Alexandria, VA: Association for Su-
cation, 23, 73-118. Washington, DC: Ameri- pervision and Curriculum Development.
can Educational Research Association. Wood B. D. (1923). Measurement in higher edu-
Wiggins, G. (1992). Creating tests worth taking. cation. Yonkerson-Hudson, Nueva York:
Educational Leadership, 49, 26-33. Banco Mundial.
Wiggins, G. (1993). Assessment: Authenticity, Wood, D., Bruner, J. S., y Ross, G. (1976). The role
context, and validity. Phi Delta Kappan, 74, of tutoring in problem-solving. Journal of
200-214. Child Psychology and Psychiatry, 17, 89-100.
Wiggins, G. (1998). Educative assessment: Desig- Yeh, J. P., Herman, J. L., y Rudner, L. M. (1981).
ning assessments to inform and improve stu- Teachers and testing: A survey of test use (CSE
dent performance. San Francisco: Jossey- Report No. 166). Los ngeles: UCLA,
Bass. Center for the Study of Evaluation.

51
Textos de evaluacin

52