Sie sind auf Seite 1von 41

VALIDEZ

Definici
n:
Una prueba es vlida al grado en que las inferencias
que se realicen a partir de ella sean apropiadas,
significativas y tiles.
Una puntuacin de prueba por si misma carece de significado hasta que
el examinador extrae inferencias de ella con base en el manual de prueba
o en otras conclusiones de la investigacin.

La validez refleja un juicio en evolucin basado en la

investigacin , acerca de que tan adecuadamente mide la


prueba aquel atributo para el cual se diseo.
La validez de las pruebas no puede captarse con facilidad

a travs de resmenes estadsticos exactos sino que mas


bien se le puede caracterizar en un continuo que va de
dbil a aceptable a fuerte.

Las diferentes maneras de acumular evidencia de la validez


son:
Validez de contenido
Validez relacionada con el criterio
Validez de constructo

VALIDEZ DE CONTENIDO
Se determina por el grado en que las preguntas, tareas o reactivos

de la prueba constituyen una muestra representativa del universo


de conductas para el cual se disearon.
Los reactivos de una prueba son considerados como una muestra
obtenida de la poblacin ms amplia de reactivos potenciales que
definen aquello que el investigador desea medir.
Si la muestra (reactivos especficos de la prueba) es representativa
de la poblacin -> posee validez

Hay que tener mucho cuidado de especificar el universo relacionado

con las respuestas.


Opciones de uso mltiple, no siempre son buenas para utilizarlas.
Hoste (1981) menciona que no existe un modo aceptable para
cuantificar la validez de contenido y, por lo tanto, no puede ser
expresada como un coeficiente de validez.
Cuando el rasgo a medir es menos tangible se considera para
obtener la validez de contenido hacer uso de la: Tcnica de
Jueceo----> jueces competentes en el atributo que se pretende medir
y en el objetivo de la prueba, ponderan el contenido de los reactivos.

Lawshe, Martuza y otros autores han analizado los mtodos estadsticos para

determinar la validez general de contenido de una prueba a partir de juicios de


expertos.
Ejemplo
Cuando dos jueces expertos valoran los reactivos individuales de una prueba en la

escala de cuatro puntos que se propone ( 1 (no relacionado)


(2 un tanto
relacionado) ( 3 bastante relacionado) (4 muy relacionado), las calificaciones de
cada juez para cada reactivos pueden dividirse en dos tipos:
Relevancia dbil (Calificaciones de 1 o 2)------- Contra relevancia fuerte
(calificaciones 3 o4).

Si dos jueces consideraron que


un reactivo era sumamente
relevante se colocara en la
casilla D.
Si el primer juez consider que
un reactivo era muy relevante
pero el segundo lo considero
slo como apenas relevante, el
reactivo se colocara en la
casilla B.

La casilla D es la nica que


refleja
concordancia vlida entre los jueces; las
otras, implican desacuerdo (casillas B y C) o
concordancia en que un reactivo no debe
estar en la prueba (Casilla A).

Validez de
contenido=
D
________________
(A+B+C+D

VALIDEZ DE FACIE

Este concepto aparece cuando se trata de pruebas. Una prueba

tiene validez de Facie si aparece valida en los


examinadores, y en especial, en personas evaluadas.

usuarios,

La validez de facie no debe confundirse con la objetividad, que se

determina a travs de la relacin de puntuaciones de prueba con


otros fuentes de informe.

VALIDEZ RELACIONADA CON EL CRITERIO


Se aplica cuando se confirma que una prueba es para estimar el

desempeo del examinado en alguna medida de resultado.


En este contexto la variable de inters es la medida de resultado,
llamado Criterio.
En la validez concurrente, las medidas de criterio se obtienen
aproximadamente al mismo tiempo que las puntuaciones de pruebas.
En la validez predictiva, las medidas de criterio se obtienen en el
futuro, en general en meses o aos despus de que se obtienen las
puntuaciones de prueba. Como el caso de las calificaciones .

CARACTERSTICAS DE UN BUEN CRITERIO

Un criterio es cualquier medida de resultado contra la cual es valida

una prueba. Un criterio puede ser casi cualquier cosa.


En cualquier caso, el coeficiente de correlacin resultante se

denomina Coeficiente de Validez.

VALIDEZ CONCURRENTE.
En un estudio de validez concurrente, las puntuaciones de prueba y

la informacin de criterio se obtiene de manera simultnea.


En general la evidencia concurrente de la validez de una prueba es

deseable en el caso de pruebas de rendimiento, aquellas que se


utilizan para otorgar licencias o certificacin y de diagnostico
clnico.
Este indica el grado en que las puntuaciones de una prueba estima

de manera precisas la posicin actual de un individuo en el criterio


relacionado.

VALIDEZ PREDICTIVA

EN UN ESTUDIO DE VALIDEZ PREDICTIVA, LAS PUNTUACIONES DE UNA PRUEBA SE


UTILIZAN PARA ESTIMAR MEDIDAS DE RESULTADO OBTENIDAS EN FECHA POSTERIOR.
-EXMENES DE INGRESO
-PRUEBAS DE EMPLEO
ESTA PRUEBA DETERMINA QUIN EST EN PROBABILIDAD DE TENER XITO EN UNA
TAREA FUTURA.

Cuando las pruebas se utilizan con propsitos de prediccin, es necesario desarrollar una

ecuacin de regresin.
Y=.07X+.2
-Para un individuo que obtiene una puntuacin de 55 en una prueba, el pronstico del nivel de

desempeo sera de 4.05 (es decir .07 (55)+.2).

-Una puntuacin de 33 en la prueba produce un nivel de desempeo pronosticado de 2.51 es

decir (.07 (33)+.2).

COEFICIENTE DE VALIDEZ Y ERROR ESTNDAR DEL


ESTIMADO.
La relacin entre las puntuaciones de una prueba y las medidas de criterio puede expresarse de

varias maneras diferentes.


El enfoque ms popular consiste en calcular la correlacin entre prueba y criterio (r). En este

contexto, la correlacin resultante se conoce como coeficiente de validez.


-Entre ms alto sea el coeficiente de validez, ms precisa ser la prueba en la prediccin del

criterio.
En el caso hipottico donde r fuera 1.00, la prueba poseera validez perfecta y dara lugar a

predicciones impecables.

No existe una prueba de validez perfecta y los coeficientes de validez se encuentran de manera

ms habitual en los rangos de correlacin de bajo a medio y en pocas ocasiones superan al .80.

El error estndar del estimado (EE) es el margen de error que puede esperarse en la prediccin

de la puntuacin de criterio, y se obtiene de la siguiente frmula:


EE= Dey

1-r

Donde r es el cuadrado del coeficiente de validez y DE es la desviacin estndar de las puntuaciones


del criterio.

El Error Estndar de Medicin (EEM) indica el margen de error de medicin producido por la
falta de confiablidad de la prueba, mientras el EE indica el Margen de Error de prediccin
causado por la validez imperfecta de la prueba.

APLICACIN DE LA TEORA DE DECISIN LAS PRUEBAS


PSICOLGICAS.

Los defensores de la teora de decisin destacan que el propsito de las pruebas psicolgicas

no es la medicin en s, sino la medicin al servicio de la teora de la toma de decisiones.

Con frecuencia, las pruebas psicolgicas representan un papel de suma importancia en estos

tipos de toma de decisiones institucionales.


La proporcin de personas en el grupo de pronstico se conoce como proporcin de

seleccin. Esta prueba puede variar de 0 a 1.0, dependiendo de la proporcin de las personas
que se consideran como buenos candidatos para tener xito en la medida de criterio.

Si una prueba tiene buena validez predictiva, entonces la mayora de las personas para las

que se pronostica en xito lo tendrn y la mayora de aquellas para las que se predice el
fracaso, fracasarn.
Ninguna prueba de seleccin es un medio perfecto de prediccin, de modo que tambin son

posibles otros tipos de resultados.


-Algunas personas para las que se predice el xito fracasarn; stos casos se conocen como

falsos positivos.
-Algunas para las que se predice el fracaso, tendrn xito si se les da la oportunidad; estos

casos de conocen como falsos negativos.

Los defensores de la teora de decisin tienen dos suposiciones fundamentales acerca

de la utilizacin de pruebas de seleccin.


1. El valor de diversos resultados para la institucin puede expresarse en trminos de

una escala de utilidad comn.


2. En las decisiones de seleccin en instituciones, la estrategia que en general es ms

til es aquella que aumenta al mximo la ganancia promedio den la escala de utilidad (o
reduce al mnimo la prdida promedio).

TABLAS DE TAYLOR-RUSSELL
Estas tablas permiten que el usuario de pruebas determine la proporcin esperada de

solicitantes exitosos seleccionados con la utilizacin de una d ellas.


A fin de utilizarlas el examinador debe especificar:
1. La validez predictiva de la prueba.
2. La proporcin de la seleccin.
3. La tasa base para los solicitantes exitosos.

VALIDEZ DE CONSTRUCTO
CONSTRUCTO: ES LA CUALIDAD O RASGO TERICO, INTANGIBLE, EN EL CUAL DIFIEREN LOS
INDIVIDUOS.

TODOS LOS CONSTRUCTOS POSEEN DOS CARACTERSTICAS


EN COMN.

1.- No existe un solo referente externo suficiente para validar la

existencia del constructo.


2.-No obstante, puede obtenerse una red de posiciones
entrelazadas a partir de la teora existente acerca del constructo.
La validez de constructo atae a las pruebas psicolgicas que afirman
medir los atributos psicolgicos complejos, multifacticos y
vinculados con la teora como la psicopata, inteligencia, capacidad
de liderazgo y similares.

Los diversos procedimientos de la validez de

constructo estn diseados para responder a una


pregunta crucial:
Se encuentran los tipos de relaciones con criterios
ajenos a la prueba que la teora predice?

ENFOQUES DE LA VALIDEZ DE CONSTRUCTO.

La mayor parte de los estudios de validez de constructo caen dentro de las


siguientes categoras:
Anlisis para determinar si las subpruebas o reactivos o reactivos de una
prueba son homogneos y por lo tanto, miden un solo constructo.
Estudio de los cambios relacionados con el desarrollo para determinar si

son consistentes con la teora del constructo.


Investigacin para evaluar si las diferencias grupales en las puntuaciones

de una prueba son consistentes en la teora.

Anlisis para determinar si los efectos de la intervencin sobre

las puntuaciones de una prueba son consistentes con la teora


Correlacin

de la prueba con
relacionadas y no relacionadas.

otras

pruebas

medidas

Anlisis factoriales de las puntuaciones de prueba en relacin

con otras fuentes de informacin.

HOMOGENEIDAD
Se incorpora dentro de la prueba durante el proceso de

desarrollo.
El

mtodo que mas se utiliza para lograr una escala


homognea es la correlacin de cada reactivo potencial con la
puntuacin total y la seleccin de los reactivos que muestren
altas correlaciones con la puntuacin total.

DIFERENCIAS GRUPALES CONSISTENTES


CON LA TEORA

Las personas con antecedentes y caractersticas diferentes obtienen


puntuaciones de prueba consistentes con la teora.
Crandall elabor una escala de inters social que ilustra el empleo de
las diferencias grupales consistentes con la teora en el proceso de
validacin del constructo.
Dise un intrumento .
15 reactivos de eleccin forzada.
INTERS SOCIAL

Incluye un rasgo que se relaciona de manera


estrecha con el concepto de inters social.
En un rasgo igualmente atractivo, pero sin relacin
con lo social.
Se califican con uno si se elige el rasgo de interes
social y con cero si se elige el otro.

EFECTOS DE LA
INTERVENCIN
CONSISTENTES CON LA
TEORA

OTRO
ENFOQUE
DE LA
VALIDEZ
DE
CONTRUC
TO
SI LA
BATERA DE
UNA
PRUEBA
POSEE
VALIDEZ DE
CONSTRUCT
O

Consiste en mostrar que las puntuaciones de una


prueba cambian en la direccin y cantidad apropiadas
en reaccin a intervenciones planeadas o no
planeadas.

Se puede predecir que las puntuaciones en orientacin


espacial deberan mostrar mayor incremento de la
preprueba a la posprueba que el encontrado en
capacidades no relacionadas que no son el objetivo del
entrenamiento social.

VALIDEZ
CONVERGENTE Y DE
DISCRIMINACIN

VALIDEZ
CONVERGENTE

Se demuestra cuando una prueba se correlaciona mucho con otras


variables o pruebas con las que comparte una superposicin de constructo.
Dos pruebas deseadas
para medir diferentes
tipos de inteligencia.

Compartir de todas maneras una


cantidad considerable del factor
general en inteligencia para producir
una fuerte corrrelacin

Cualquier prueba nueva de inteligencia que no se correlacione al menos en


cierto grado con las medidas existentes sera sumamente sospechosa, con
base en que no posee validez convergente.

VALIDEZ DE
DICRIMINACIN

Se demuestra cuando una prueba no se correlaciona con variables o pruebas


con las cuales debera tener diferencias.
El inters social y la
inteligencia no tienen
relacin terica

Las pruebas con estos dos


constructos deberan
correlacionarse en sentido
negativo, si es que acaso lo hacen

Campbell y Fiske, propusieron un diseo experimental sistemtico para


confirmar de manera simultnea la validez convergente y la de
discriminacin de una prueba psicolgica.
Matriz multirrasgo-multimtodo

Requiere de la evaluacin de dos o


ms rasgos a travs de dos o ms
mtodos.

Es una contribucin importante para la comprensin del proceso de


validacin de una prueba.

Es ms frecuente que los autores de pruebas obtengan datos sobre


validez convergentes y discriminativa en retazos, en lugar de producir
una matriz completa de intercorrelaciones.

Meier proporciona una de las pocas ejecuciones realistas de la matriz


multirrasgo-multimtodo en un examen de la validez del constructo de
agotamiento.

ANLISIS FACTORIAL
El anlisis factorial es una tcnica estadstica especializada que es de
particular utilidad para la investigacin de la validez de un constructo.
El propsito del anlisis factorial consiste en identificar el numero
mnimo de determinantes (factores) que se requieren para explicar las
intercorrelaciones entre una batera de pruebas.

El objetivo en el anlisis factorial es encontrar el conjunto mas


pequeo de dimensiones, llamadas factores, que puedan explicar la
disposicin observada de intercorrelaciones entre las pruebas
individuales.
Consiste en aplicar una batera de pruebas a varios cientos de
personas y despus calcular una matriz de correlacin a partir
de las puntuaciones en todos los posibles pares de pruebas.

Una carga factorial es una correlacin entre una prueba


individual y un solo factor.
As las cargas factoriales pueden variar entre -1.0 y +1.0. El
resultado final es una tabla que presenta la correlacin de
cada prueba con cada factor.
Una tabla de cargas factoriales ayuda a describir la
composicin factorial de una prueba y, por tanto,
proporciona informacin relacionada con la validez de
constructo.

PREOCUPACIONES EXTERNAS A LA VALIDEZ Y AMPLIACIN


DEL ESPECTRO DE LA VALIDEZ DE UNA PRUEBA.
Incluyen los efectos colaterales y consecuencias involuntarias de las
pruebas.
EFECTOS COLATERALES INVOLUNTARIOS EN LAS PRUEBAS
El examinador debe determinar si los beneficios de aplicar una prueba
superan los costos de los efectos colaterales potenciales. Al anticipar
los efectos colaterales involuntarios, el examinador podra desviarlos
o disminuirlos.

Un efecto colateral involuntario de utilizar el MMPI para la


valoracin de los solicitantes a puestos de orden publico es
que los candidatos al trabajo que no tengan xito con
alguna institucin puedan quedar sealados con una
etiqueta psicolgica como psicpatas, esquizofrnicos o
paranoides.

AMPLIACIN DEL ESPECTRO DE VALIDEZ DE UNA PRUEBA

Varios tericos en psicometra han introducido una definicin


mas amplia, funcionalista, de validez que asevera que una
prueba es valida si satisface el propsito para el cual se utiliza.
La perspectiva funcionalista reconoce que quien valida la
prueba tiene la obligacin de determinar si una practica tiene
consecuencias constructivas para los individuos e instituciones
y , en especial, para proteger de los resultados adversos.

La validez de una prueba es un juicio valorativo general acerca de la


idoneidad y pertinencia de las inferencias y acciones que fluyan de
las puntuaciones de sta.
Messick afirma que el concepto nuevo y ms amplio de validez
descansa sobre cuatro bases:
1) Evidencia tradicional de validez de constructo
2) Anlisis de las implicaciones de valor de la interpretacin de la
prueba
3) Evidencia de la utilidad de las interpretaciones de una prueba en
aplicaciones particulares
4) Una estimacin de las consecuencias sociales potenciales y reales,
incluyendo efectos colaterales del empleo de sta.

Das könnte Ihnen auch gefallen