Sie sind auf Seite 1von 5

Efectos negativos en el salón de clases de la rendición de cuentas basada en pruebas

No existe un consenso general en Inglaterra sobre cómo la evaluación puede informar mejor la
rendición de cuentas y el mejoramiento escolar. Expertos en evaluación creen que el sistema de
rendición de cuentas y la manera en que la evaluación lo alimenta deberían ser rigurosamente
evaluados para que podamos entender hasta qué punto las evaluaciones estatutarias afectan el
desempeño a lo largo de las distintas etapas educativas. En lo que sí existe consenso es que
nuestro sistema de rendición de cuentas a menudo tiene una influencia dañina sobre las prácticas
de evaluación en el aula realizadas día a día por los docentes.

Planeo cubrir algunos de los asuntos causadas por un sistema de evaluación estándar que tuvimos
en firme hasta 2014/15, los problemas relacionados con las pruebas nacionales estandarizadas
aplicadas a los 11 años de edad y las cualificaciones GCSE a los 16 y las implicaciones de estos para
las prácticas de aula.

Nuestro [¿sistema?] nacional de niveles por evaluación (de los 5 a 14 años) tenía un impacto
significativo en las prácticas de aula. Era un sistema de evaluación basado en descriptores, lo cual
significaba que muchas lecciones fueron establecidas para demostrar completamente de la
capacidad de los alumnos, generando así evidencia usada para describir el desempeño general de
estos. El resultado era que toda lección comenzaba a parecer un examen. En vez de evaluar para
aprender, hubo un cambio hacia la evaluación del aprendizaje y se pasó de lo formativo a lo
informativo. Con este enfoque en la evaluación informativa, el principal objetivo era darles a los
alumnos una nota final o nivel o subnivel, de modo que a veces existía presión para tratar de
ocultar y pasar por alto los malentendidos. Nuestro se convirtió en un monitoreo de grandes
apuestas y pruebas, en vez de una evaluación diagnóstica de apuestas bajas.

Los niveles fueron gradualmente vistos como umbrales, la enseñanza se centró en llevar a los
estudiantes a través del próximo umbral en vez de asegurar que estos estuviesen seguros del
conocimiento y comprensión definidos en los programas de estudios.

El uso de niveles desembocó en que el trabajo de los estudiantes fuese sobreescalado,


sobrecargado con tiras de escritura y apoyado más de la cuenta. Un problema adicional es que
esta carrera a través del currículo significaba la atomización del material, y que los alumnos nunca
tenían la oportunidad de ver exactamente cómo su trabajó se enmarcaba dentro de un panorama
más general.

La desconexión entre los niveles y el contenido del currículo nacional también significaba que
decirle a un padre que su hijo o hija era nivel 4b no proveía información significativa sobre lo que
el niño sabía y entendía o necesitaba saber para progresar.

El reporte que condujo a la abolición de los niveles subrayó las presiones en conflicto que la
evaluación colocaba sobre los maestros y la necesidad de alinear la evaluación, el currículo y la
política de rendición de cuentas.

Las escuelas no son juzgadas únicamente por su desempeño en exámenes a los 11, 16 y 18 años,
sino también por evaluaciones interinas a sus docentes. El marco de inspección escolar actual en
Inglaterra menciona un progreso de los alumnos para juzgar una escuela que pone una gran
cantidad de presión sobre las capturas frecuentes de información sumativas.
Recoger datos de esta forma mueve a las escuelas hacia ciertos comportamientos. Las
preparaciones para evaluaciones sumativas frecuentes pueden tomar el control y el seguimiento
de los alumnos se convierte en una plaga en el plan de estudios, una plaga en el progreso de los
niños, un deterioro en la carga de trabajo de los docentes y el bienestar mental. Estamos
empezando a desafiar esto, y esto se reflejará en un nuevo marco de inspección programado para
2019, en tanto que los expertos en evaluación están señalando los defectos del seguimiento
frecuente a este tipo de evaluación.

La práctica implicó medir todo el progreso del alumno en calificaciones acumulativas, lo que
termina ejerciendo tanta presión sobre el plan de estudios como el abolido modelo basado en
descriptores. Por ejemplo, los maestros usan pruebas acumulativas estandarizadas al final de un
periodo para medir el progreso; sin embargo, aunque estos métodos de evaluación podrían ser
una forma de medir el progreso sumativo de cara a dominios muy grandes, demuestran ser
instrumentos obtusos y poco sensibles para medir el progreso en dominios más pequeños y
periodos de tiempo más cortos. Es muy difícil hacer mejoras genuinas y significativas en dominios
tan grandes en solo 6 semanas. Las actividades valiosas con retornos a largo plazo no se muestran
en el corto plazo. Terminamos evaluando el rendimiento a corto plazo en lugar de la retención a
largo plazo y los alumnos no podían recordar las cosas en 6 días, semanas o 6 meses.

Lo que sucedió fue que, dado que los maestros eran responsables del progreso a corto plazo en
estas evaluaciones, estos terminaban priorizando actividades que no conducían a un aprendizaje
significativo a largo plazo sino a ganancias engañosas de corto plazo. Los maestros a menudo
establecían simulacros completos de pruebas y exámenes en lugar de desarrollar la comprensión
de los alumnos de conocimientos y habilidades más específicas. Nos dimos cuenta de que cuando
los puntajes de las pruebas se convierten en el objetivo, el valor que tienen como indicadores se
reduce.

En consecuencia, la evaluación y la rendición de cuentas trabajaron en objetivos cruzados


sometiendo a los docentes a presiones diferentes y, a menudo, competitivas. Muchos sintieron
que tenían que preparar a los alumnos para las pruebas y exámenes en formas que no
consideraban óptimas para el aprendizaje (tales como enseñar para la prueba). Por lo tanto, la
evaluación a veces se desalineó con el objetivo de aprender, los alumnos terminaron practicando
la “forma final”; evaluaciones que se asemejaban a pruebas y exámenes estatutarios en lugar de
dominar los conocimientos y habilidades de los componentes.

Las escuelas priorizaron la generación de información de seguimiento, lo cual desvió la atención


docente de cómo apoyar los próximos pasos y el aprendizaje de los alumnos y, finalmente, los
planes de estudio de textos y exámenes se convirtieron en el currículo. Algunas escuelas
comenzaron a asociar sus evaluaciones entre las edades de 11 y 16 años con los criterios
examinados a los 16 años. No obstante, estas declaraciones fueron diseñadas únicamente como
descriptores para el examen final, y nunca fueron un criterio para juzgar trabajo anterior. Lo que
parece haber sucedido es que al intentar preparar a los alumnos jóvenes para las exigencias de los
exámenes a los 16 años, se colocó un énfasis indebido en las habilidades genéricas consideradas
esenciales para obtener una buena calificación en el examen final, en lugar de concentrarse en el
contenido que debía ser aprendido en ese grupo de edad.
Otro problema fue que le dimos más crédito a las mejoras pequeñas y estadísticamente no
significativas justo por debajo de una nota que a las mejoras grandes y significativas en el medio
de una nota.

El problema era simple: las evaluaciones utilizadas para juzgar si los estándares estaban
mejorando, era igualmente lo que los alumnos, profesores y escuelas tenían como objetivo.

Además de instrucción limitada impulsada por la evaluación, enseñar para la prueba también tuvo
un efecto nocivo tanto en la calidad de los recursos de aprendizaje como en la relación entre
recursos y cualificaciones, según un informe gubernamental de 2012. La mayor junta de
evaluación para cualificaciones en Inglaterra -niveles GCSES y A a los 16 y 18- ahora quiere intentar
reducir la enseñanza de la prueba. Ahora solamente darán libros de texto de apoyo para este tipo
examen de grandes apuestas, y su aprobación [está sujeta a] si están creados para enseñar más
allá de lo que se podría esperar en el examen.

Un problema similar ocurre con las pruebas nacionales estandarizadas a los 11 años y la inspección
de la evidencia muestra que el currículo se reduce mediante la evaluación; si las evaluaciones
están escritas de una manera particular, entonces enseñamos para la evaluación.

El informe de la Inspección en 2016 mostró que los currículos escolares estaban siendo reducidos
debido a un enfoque en las materias básicas en las pruebas reglamentarias.

Una declaración recién emitida la semana pasada por un sindicato de docentes sobre estas
pruebas culpa a las pruebas de reducir la calidad de la educación primaria. Los docentes sienten
que han estado sujetos a grandes presiones para reducir el currículo y reemplazar el aprendizaje
conceptual profundo con la memorización temporal de hechos y procedimientos, con el fin de
aumentar los resultados de las pruebas estandarizadas a los 11 años. Una encuesta mostró que el
86% de los maestros de alumnos de 11 años cree que las pruebas fueron una barrera para limitar
el acceso de los alumnos a un currículo completo, como algunos si se los excluyera. Las pruebas
evalúan inglés y matemáticas y los profesores sienten que aquellos alumnos con desventajas en
lectoescritura y matemáticas sienten como si fallasen debido al énfasis en estas asignaturas a
expensas de otras. La declaración también citó el impacto en los grupos de alumnos que
consideraban también desfavorecidos -aquellos con necesidades educativas especiales, aquellos
que tienen al inglés como segunda lengua y los niños nacidos en el verano. Algunas personas
piensan que, pese a que un gobierno intente enfocarse en elevar los estándares, hemos creado un
sistema que está excluyendo el amor del proceso de aprendizaje. En medio de la creciente presión
sobre los docentes, muchos instan al gobierno a prestarle atención a la experiencia en otros
países, la cual muestra mayores estándares como resultado de sistemas de evaluación que confían
en los docentes y les permiten desarrollar un plan de estudios completo que involucra a los
alumnos y no es limitado.

Las consecuencias de las pruebas estandarizadas a los 11 años pueden traducirse en que los
profesores dediquen su tiempo a temas que tienen más probabilidades de ser evaluados, lo que
puede tener un impacto indeseable tanto en alumnos como profesores. Los alumnos han
informado que la enseñanza puede ser estereotípica y aburrida cuando el enfoque se reduce a
ganar pruebas. Los maestros se quejaron de que socavaba su profesionalismo y disminuía su amor
por su asignatura y por el aprendizaje mismo.
Sin embargo, otros expertos nacionales en currículos sugieren que, si los docentes enseñan las
pruebas correctas y todos están de acuerdo con el propósito de estas pruebas (que apuntan a
muestrear aleatoriamente a través de todo el currículo enseñado y no es posible predecir qué
ocurrirá), entonces en estas condiciones las pruebas estandarizadas pueden ser efectivas.

En medio de toda esta enseñanza enfocada en pruebas, los expertos han comenzado a expresar
que la planificación del currículo y su evaluación formativa deberían ser estructuradas en torno al
dominio de los componentes básicos, y no ser “retroajustadas” a la estructura y requisitos de las
pruebas.

Como resultado, las escuelas están reduciendo el tiempo que los maestros dedican a realizar
evaluaciones sumativas, para que puedan enfocarse en llevar a cabo evaluaciones diagnósticas y
formativas. Las escuelas también están comenzando a usar exámenes estandarizados para
comparar e informar los logros estudiantiles. Tenemos una serie de paquetes comerciales
disponibles para pruebas estandarizadas en asignaturas básicas. Algunas escuelas las están
utilizando al comienzo del Año 7 y al final del año 8 y en el año 8. El uso de estas evaluaciones
estandarizadas se considera importante para las escuelas, pues muestra cómo el progreso de los
alumnos se compara con otros alumnos de la misma edad a nivel nacional. Es útil a nivel de
cohortes, mostrando cómo progresa un grupo de un año en general. Los resultados de las pruebas
estandarizadas también ayudan a triangular los resultados de las evaluaciones sumativas bianuales
de una escuela. Su desventaja es que no proporcionan información que se relacione directamente
con los siguientes pasos que un alumno debe seguir. A veces ejercen una influencia indebida sobre
el currículo si los docentes se sienten presionados a "marcar" ciertos objetivos.

Ahora que las escuelas y los maestros pueden pensar en sus propios sistemas de evaluación entre
las edades de 11 y 16, esto ha revelado una falta significativa de conocimiento sobre qué es lo que
hace una buena evaluación, los pilares de la evaluación: propósito, confiabilidad y validez, y se
está entrenando para desarrollar más experiencia en esta área. Los docentes están comenzando a
comprometerse con la teoría de la evaluación y a comprender que ninguna evaluación es
perfectamente confiable; nuestro desafío ahora es que todas las partes interesadas en la
educación acepten la falta de fiabilidad de las evaluaciones, para aceptar que siempre existe una
cierta cantidad de incertidumbre y margen de error.

De esta manera, podríamos comenzar a tomar en consideración otras fuentes de evidencia a la


hora de tomar decisiones sobre cuánto peso colocar sobre cualquier evaluación.

Así, una cosa que hemos aprendido sobre la mejora de la evaluación en las escuelas inglesas es
hacer menos -una evaluación nacional menos formal, sumativa y basada en pruebas. Muchos
están tratando de romper el control de la evaluación y ponerla en su lugar -apoyando el plan de
estudios, respaldando la enseñanza y demostrando el rango completo de logros estudiantiles que
no dominan el plan de estudios, socavando el aprendizaje y reduciendo la definición de logro a
ganar los exámenes.

La evaluación no es el enemigo, sino la hiper rendición de cuentas. Siempre que el sistema defina
el éxito escolar en términos de rendimiento en la evaluación sumativa de apuestas altas, este
impulsará un abordaje reduccionista del currículo.
Suzanne O’Farrell

Julio de 2018