Sie sind auf Seite 1von 23
CONFIABILIDAI CAPITULO CINCO CONFIABILIDAD Y VALIDEZ La estandarizacién es un paso importante en el diseiio y la evaluaci6n de pruebas psicolégicas y otros instrumentos de evaluacién, pero no es el iltimo paso. Antes de que una prueba pueda uti- lizarse con cierta seguridad, debe obtenerse informacién acerca de su confiabilidad y validez por lo que a sus propésitos especfficos concierne. Ninggn instrumento psicométrico puede considerarse de valor a menos que sea una medida con- sistente, o confiable. En consecuencia, una de las primeras cosas que sera necesario determinar acerca de una prueba de elaboracién reciente es si resulta lo suficientemente confiable como pa- ramedirlo que fue disefiada para medir. Si, en ausencia de cualquier cambio permanente en una persona debido al crecimiento, al aprendizaje, a alguna enfermedad o lesi6n, las puntuaciones en una prueba varfan con la ocasi6n o la situacidn, es probable que la prueba no sea lo suficien- temente confiable como para ser usada en describir y evaluar a la gente y hacer predicciones so- bre su conducta. Hablando en términos estrictos, més que ser una caracteristica de una prueba, Ja confiabilidad es una propiedad de las puntuaciones obtenidas cuando se administra la prueba un grupo particular de personas en una ocasién particular y bajo condiciones especificas (Thompson, 1994). Note que confiabilidad no es lo mismo que estabilidad: al determinar la confiabilidad se asume que la prueba mide una caracteristica relativamente estable. A diferencia de la inestabil dad, la falta de confiabilidad es resultado de errores de medici6n producidos por estados inter- nos temporales, como la baja motivacién o la falta de disposicién, o de condiciones externas como un ambiente de prueba inedmodo o con distracciones. ‘Teoria clasica de la confiabilidad En la teorfa cldsica de los tests se supone que la calificacién observada de una persona en una prueba est compuesta por una puntuacién “real” més algin error no sistemético de medicién, La puntuacién real de una persona en una prueba particular se define como el promedio de las puntuaciones que obtendria si presentara la prueba un ntimero infinito de veces. Es obvio que la puntuacién real de una persona nunca puede medirse de manera exacta; tiene que ser estimada 85 ‘CAPITULO CINCO Contabildad y vader a partir de su puntuacién observada en Ia prueba. También se asume en la teorfa clisica de los tests que la varianza de las puntuaciones observadas (s%,,) de un grupo de personas es igual a la varianza de sus puntuaciones reales (s%,,) mas la varianza debida a los errores no sisteméticos de medicign (s°,,): 2+ 2 6) 2 Sos Entonces la confiabilidad (r,,) de las calificaciones se define como la raz6n de la varianza de la calificaci6n real con la varianza de la calificacién observada, o la proporcién de la varianza ob- servada que es explicada por la varianza real maa (6.2) She ’ La proporcién de la varianza observada explicada por la varianza de error o que no se explica por la varianza real puede determinarse a partir de las {6rmulas 5.1 y 5.2 como: 2 Bain 63) 5 So La confiabilidad de un conjunto de calificaciones en una prueba se expresa como un né- mero decimal positivo que flucta entre .00 y 1.00. Una r,, de 1.00 indica una confiabilidad per- fecta, y una r,, de 00 indica una falta absoluta de confiabilidad de la medicién. Como la varianza de las calificaciones reales no puede calcularse de manera directa, la confiabilidad se estima ana- lizando los efectos de variaciones en las condiciones de la administraci6n y el contenido de la prueba en las calificaciones observadas. Como advertimos antes, la confiabilidad no es influida por cambios sistemsticos en las calificaciones que tienen un efecto similar en todos los examina- dos, sino sélo por cambios no sistemiticos que tienen efectos diferentes en personas distintas. Di chos factores no sisteméticos influyen en la varianza de error y, por lo tanto, en la confiabilidad de las calificaciones en la prueba. Cada uno de los diversos métodos para estimar la confiabili- dad (test-retest, formas paralelas, consistencia interna) toma en consideracién los efectos de cit- ccunstancias algo diferentes que pueden producir cambios no sistemidticos en las puntuaciones y, por ende, afectan la varianza de error y el coeficiente de confiabilidad. Coeficiente test-retest Se calcula un coeficiente test-retest para determinar si un instrumento mide de manera consis- tente de una ocasin a otra. Este coeficiente, conocido también como coeficiente de estabilidad, se encuentra correlacionando las calificaciones obtenidas por un grupo de personas en una apli- cacién con sus puntuaciones en la segunda aplicacién de la prueba. El procedimiento test-retest toma en consideracién los errores de medicién que resultan de diferencias en las condiciones (ambientales, personales) asociadas con las dos ocasiones en que se administr6 la prueba. Dado que en ambas ocasiones se aplicé la misma prueba, los errores debidos a diferentes muestras de Jos reactivos de la prueba no se reflejan en un coeficiente test-retest. Ademés, es probable que las diferencias entre las condiciones de la aplicacién sean mayores luego de un intervalo largo ‘CONFIABILIDAD. 87 que de uno corto. Como resultado, la magnitud de un coeficiente dé confiabilidad test-retest tiende a ser mayor cuando el intervalo entre la prueba inicial y el retest es corto (unos cuantos dias 0 semanas) que cuando es largo (meses 0 afios). Coeficiente de formas paralelas Cuando el intervalo entre la prueba inicial y el retest es corto, los examinados recuerdan, por lo general, muchas de las preguntas y respuestas de la prueba inicial. Como es obvio, esto afecta sus respuestas en la segunda aplicacién, un hecho que por sf mismo no cambia el coeficiente de confiabilidad si todos recuerdan igual cantidad. Sin embargo, por lo regular algunas personas re- cuerdan més del material de la prueba que otras, ocasionando que la correlacién entre el test y el retest sea menos que perfecta. Lo que parece necesitarse para superar esta fuente de error es una forma paralela del instrumento, esto es, una que conste de reactivos similares pero no de los mis- mos reactivos. Entonces puede calcularse como indice de confiabilidad un coeficiente de formas paralelas, también conocido como coeficiente de equivalencia. En principio, la idea de formas paralelas es razonable: al aplicar una forma paralela luego de un intervalo apropiado que sigue a la aplicacién de la primera forma puede determinarse un Coeficiente de confiabilidad que refleje los errores de medicién debidos a los diferentes reacti- ‘vos y los distintos momentos de aplicacién. Para controlar los efectos de confusién de la forma de la prueba con el momento de la aplicaci6n, la forma A debe administrarse primero a la mitad del grupo y la forma B a la otra mitad; luego, en la segunda aplicacién, el primer grupo presen- ta la forma B y el segundo la forma A. La correlaci6n resultante entre las calificaciones de las dos formas, conocida como coeficiente de estabilidad y equivalencia, toma en cuenta errores de- bidos a los diferentes momentos de aplicacién o a los distintos reactivos. Coeficientes de consistenci: Se dispone de formas paralelas para una serie de pruebas, en particular para pruebas de habili- dad (aprovechamiento, inteligencia, aptitudes especiales). Sin embargo, una forma paralela de ‘una prueba a menudo es costosa y dificil de elaborar. Por esta raz6n se elabord un método me- nos directo de tomar en cuenta los efectos de diferentes muestras de los reactivos de una prueba sobre la confiabilidad. Este es el método de consistencia interna, que incluye el método de divi- sién por mitades de Spearman, las formulas de Kuder-Richardson y el coeficiente alfa de Cron- bach, Sin embargo, los errores de medicién causados por diferentes condiciones 0 momentos de aplicacién no se reflejan en un coeficiente de consistencia interna. En consecuencia, este tipo de coeficientes no pueden verse como verdaderos equivalentes de los coeficientes test-retest o de formas paralelas. terna Método de division por mitades. En este enfoque simplificado de la consistencia interna una sola prueba se considera compuesta por dos partes (formas paralelas) que miden la misma cosa. De este modo, puede aplicarse una prueba y asignar calificaciones separadas a sus dos mitades, seleccionadas de manera arbitraria, Por ejemplo, los reactivos con ndmeros nones pueden cali- ficarse por separado de los que tienen ntimeros pares. Entonces la correlacién (r,.) entre los dos conjuntos de calificaciones obtenidas por un grupo de personas es un coeficiente de confiabili- dad de formas paralelas para una mitad de la prueba tan larga como la prueba original. Suponien-

Das könnte Ihnen auch gefallen