Validez Terminado

VALIDEZ
Definici
n:
Una prueba es vlida al grado en que las inferencias
que se realicen a partir de ella sean apropiadas,
significativas y tiles.
Una puntuacin de prueba por si misma carece de significado hasta que
el examinador extrae inferencias de ella con base en el manual de prueba
o en otras conclusiones de la investigacin.
La validez refleja un juicio en evolucin basado en la
investigacin , acerca de que tan adecuadamente mide la

prueba aquel atributo para el cual se diseo.
La validez de las pruebas no puede captarse con facilidad
a travs de resmenes estadsticos exactos sino que mas

bien se le puede caracterizar en un continuo que va de
dbil a aceptable a fuerte.
Las diferentes maneras de acumular evidencia de la validez

son:
Validez de contenido
Validez relacionada con el criterio
Validez de constructo
VALIDEZ DE CONTENIDO
Se determina por el grado en que las preguntas, tareas o reactivos
de la prueba constituyen una muestra representativa del universo

de conductas para el cual se disearon.
Los reactivos de una prueba son considerados como una muestra
obtenida de la poblacin ms amplia de reactivos potenciales que
definen aquello que el investigador desea medir.
Si la muestra (reactivos especficos de la prueba) es representativa
de la poblacin -> posee validez
Hay que tener mucho cuidado de especificar el universo relacionado
con las respuestas.

Opciones de uso mltiple, no siempre son buenas para utilizarlas.
Hoste (1981) menciona que no existe un modo aceptable para
cuantificar la validez de contenido y, por lo tanto, no puede ser
expresada como un coeficiente de validez.
Cuando el rasgo a medir es menos tangible se considera para
obtener la validez de contenido hacer uso de la: Tcnica de
Jueceo----> jueces competentes en el atributo que se pretende medir
y en el objetivo de la prueba, ponderan el contenido de los reactivos.
Lawshe, Martuza y otros autores han analizado los mtodos estadsticos para
determinar la validez general de contenido de una prueba a partir de juicios de

expertos.
Ejemplo
Cuando dos jueces expertos valoran los reactivos individuales de una prueba en la
escala de cuatro puntos que se propone ( 1 (no relacionado)

(2 un tanto
relacionado) ( 3 bastante relacionado) (4 muy relacionado), las calificaciones de
cada juez para cada reactivos pueden dividirse en dos tipos:
Relevancia dbil (Calificaciones de 1 o 2)------- Contra relevancia fuerte
(calificaciones 3 o4).
Si dos jueces consideraron que

un reactivo era sumamente
relevante se colocara en la
casilla D.
Si el primer juez consider que
un reactivo era muy relevante
pero el segundo lo considero
slo como apenas relevante, el
reactivo se colocara en la
casilla B.
La casilla D es la nica que

refleja
concordancia vlida entre los jueces; las
otras, implican desacuerdo (casillas B y C) o
concordancia en que un reactivo no debe
estar en la prueba (Casilla A).
Validez de
contenido=
D
________________
(A+B+C+D
VALIDEZ DE FACIE
Este concepto aparece cuando se trata de pruebas. Una prueba
tiene validez de Facie si aparece valida en los

examinadores, y en especial, en personas evaluadas.
usuarios,
La validez de facie no debe confundirse con la objetividad, que se
determina a travs de la relacin de puntuaciones de prueba con

otros fuentes de informe.
VALIDEZ RELACIONADA CON EL CRITERIO

Se aplica cuando se confirma que una prueba es para estimar el
desempeo del examinado en alguna medida de resultado.

En este contexto la variable de inters es la medida de resultado,
llamado Criterio.
En la validez concurrente, las medidas de criterio se obtienen
aproximadamente al mismo tiempo que las puntuaciones de pruebas.
En la validez predictiva, las medidas de criterio se obtienen en el
futuro, en general en meses o aos despus de que se obtienen las
puntuaciones de prueba. Como el caso de las calificaciones .
CARACTERSTICAS DE UN BUEN CRITERIO
Un criterio es cualquier medida de resultado contra la cual es valida
una prueba. Un criterio puede ser casi cualquier cosa.

En cualquier caso, el coeficiente de correlacin resultante se
denomina Coeficiente de Validez.
VALIDEZ CONCURRENTE.
En un estudio de validez concurrente, las puntuaciones de prueba y
la informacin de criterio se obtiene de manera simultnea.

En general la evidencia concurrente de la validez de una prueba es
deseable en el caso de pruebas de rendimiento, aquellas que se

utilizan para otorgar licencias o certificacin y de diagnostico
clnico.
Este indica el grado en que las puntuaciones de una prueba estima
de manera precisas la posicin actual de un individuo en el criterio

relacionado.
VALIDEZ PREDICTIVA
EN UN ESTUDIO DE VALIDEZ PREDICTIVA, LAS PUNTUACIONES DE UNA PRUEBA SE

UTILIZAN PARA ESTIMAR MEDIDAS DE RESULTADO OBTENIDAS EN FECHA POSTERIOR.
-EXMENES DE INGRESO
-PRUEBAS DE EMPLEO
ESTA PRUEBA DETERMINA QUIN EST EN PROBABILIDAD DE TENER XITO EN UNA
TAREA FUTURA.
Cuando las pruebas se utilizan con propsitos de prediccin, es necesario desarrollar una
ecuacin de regresin.
Y=.07X+.2
-Para un individuo que obtiene una puntuacin de 55 en una prueba, el pronstico del nivel de
desempeo sera de 4.05 (es decir .07 (55)+.2).
-Una puntuacin de 33 en la prueba produce un nivel de desempeo pronosticado de 2.51 es
decir (.07 (33)+.2).
COEFICIENTE DE VALIDEZ Y ERROR ESTNDAR DEL

ESTIMADO.
La relacin entre las puntuaciones de una prueba y las medidas de criterio puede expresarse de
varias maneras diferentes.

El enfoque ms popular consiste en calcular la correlacin entre prueba y criterio (r). En este
contexto, la correlacin resultante se conoce como coeficiente de validez.

-Entre ms alto sea el coeficiente de validez, ms precisa ser la prueba en la prediccin del
criterio.
En el caso hipottico donde r fuera 1.00, la prueba poseera validez perfecta y dara lugar a
predicciones impecables.
No existe una prueba de validez perfecta y los coeficientes de validez se encuentran de manera
ms habitual en los rangos de correlacin de bajo a medio y en pocas ocasiones superan al .80.
El error estndar del estimado (EE) es el margen de error que puede esperarse en la prediccin
de la puntuacin de criterio, y se obtiene de la siguiente frmula:

EE= Dey
1-r
Donde r es el cuadrado del coeficiente de validez y DE es la desviacin estndar de las puntuaciones

del criterio.
El Error Estndar de Medicin (EEM) indica el margen de error de medicin producido por la
falta de confiablidad de la prueba, mientras el EE indica el Margen de Error de prediccin
causado por la validez imperfecta de la prueba.
APLICACIN DE LA TEORA DE DECISIN LAS PRUEBAS

PSICOLGICAS.
Los defensores de la teora de decisin destacan que el propsito de las pruebas psicolgicas
no es la medicin en s, sino la medicin al servicio de la teora de la toma de decisiones.
Con frecuencia, las pruebas psicolgicas representan un papel de suma importancia en estos
tipos de toma de decisiones institucionales.

La proporcin de personas en el grupo de pronstico se conoce como proporcin de
seleccin. Esta prueba puede variar de 0 a 1.0, dependiendo de la proporcin de las personas
que se consideran como buenos candidatos para tener xito en la medida de criterio.
Si una prueba tiene buena validez predictiva, entonces la mayora de las personas para las
que se pronostica en xito lo tendrn y la mayora de aquellas para las que se predice el
fracaso, fracasarn.
Ninguna prueba de seleccin es un medio perfecto de prediccin, de modo que tambin son
posibles otros tipos de resultados.

-Algunas personas para las que se predice el xito fracasarn; stos casos se conocen como
falsos positivos.
-Algunas para las que se predice el fracaso, tendrn xito si se les da la oportunidad; estos
casos de conocen como falsos negativos.
Los defensores de la teora de decisin tienen dos suposiciones fundamentales acerca
de la utilizacin de pruebas de seleccin.

1. El valor de diversos resultados para la institucin puede expresarse en trminos de
una escala de utilidad comn.

2. En las decisiones de seleccin en instituciones, la estrategia que en general es ms
til es aquella que aumenta al mximo la ganancia promedio den la escala de utilidad (o
reduce al mnimo la prdida promedio).
TABLAS DE TAYLOR-RUSSELL
Estas tablas permiten que el usuario de pruebas determine la proporcin esperada de
solicitantes exitosos seleccionados con la utilizacin de una d ellas.

A fin de utilizarlas el examinador debe especificar:
1. La validez predictiva de la prueba.
2. La proporcin de la seleccin.
3. La tasa base para los solicitantes exitosos.
VALIDEZ DE CONSTRUCTO
CONSTRUCTO: ES LA CUALIDAD O RASGO TERICO, INTANGIBLE, EN EL CUAL DIFIEREN LOS
INDIVIDUOS.
TODOS LOS CONSTRUCTOS POSEEN DOS CARACTERSTICAS

EN COMN.
1.- No existe un solo referente externo suficiente para validar la
existencia del constructo.

2.-No obstante, puede obtenerse una red de posiciones
entrelazadas a partir de la teora existente acerca del constructo.
La validez de constructo atae a las pruebas psicolgicas que afirman
medir los atributos psicolgicos complejos, multifacticos y
vinculados con la teora como la psicopata, inteligencia, capacidad
de liderazgo y similares.
Los diversos procedimientos de la validez de
constructo estn diseados para responder a una

pregunta crucial:
Se encuentran los tipos de relaciones con criterios
ajenos a la prueba que la teora predice?
ENFOQUES DE LA VALIDEZ DE CONSTRUCTO.
La mayor parte de los estudios de validez de constructo caen dentro de las

siguientes categoras:
Anlisis para determinar si las subpruebas o reactivos o reactivos de una
prueba son homogneos y por lo tanto, miden un solo constructo.
Estudio de los cambios relacionados con el desarrollo para determinar si
son consistentes con la teora del constructo.

Investigacin para evaluar si las diferencias grupales en las puntuaciones
de una prueba son consistentes en la teora.
Anlisis para determinar si los efectos de la intervencin sobre
las puntuaciones de una prueba son consistentes con la teora

Correlacin
de la prueba con
relacionadas y no relacionadas.
otras
pruebas
medidas
Anlisis factoriales de las puntuaciones de prueba en relacin
con otras fuentes de informacin.
HOMOGENEIDAD
Se incorpora dentro de la prueba durante el proceso de
desarrollo.
El
mtodo que mas se utiliza para lograr una escala

homognea es la correlacin de cada reactivo potencial con la
puntuacin total y la seleccin de los reactivos que muestren
altas correlaciones con la puntuacin total.
DIFERENCIAS GRUPALES CONSISTENTES

CON LA TEORA
Las personas con antecedentes y caractersticas diferentes obtienen

puntuaciones de prueba consistentes con la teora.
Crandall elabor una escala de inters social que ilustra el empleo de
las diferencias grupales consistentes con la teora en el proceso de
validacin del constructo.
Dise un intrumento .
15 reactivos de eleccin forzada.
INTERS SOCIAL
Incluye un rasgo que se relaciona de manera

estrecha con el concepto de inters social.
En un rasgo igualmente atractivo, pero sin relacin
con lo social.
Se califican con uno si se elige el rasgo de interes
social y con cero si se elige el otro.
EFECTOS DE LA
INTERVENCIN
CONSISTENTES CON LA
TEORA
OTRO
ENFOQUE
DE LA
VALIDEZ
DE
CONTRUC
TO
SI LA
BATERA DE
UNA
PRUEBA
POSEE
VALIDEZ DE
CONSTRUCT
O
Consiste en mostrar que las puntuaciones de una

prueba cambian en la direccin y cantidad apropiadas
en reaccin a intervenciones planeadas o no
planeadas.
Se puede predecir que las puntuaciones en orientacin

espacial deberan mostrar mayor incremento de la
preprueba a la posprueba que el encontrado en
capacidades no relacionadas que no son el objetivo del
entrenamiento social.
VALIDEZ
CONVERGENTE Y DE
DISCRIMINACIN
VALIDEZ
CONVERGENTE
Se demuestra cuando una prueba se correlaciona mucho con otras

variables o pruebas con las que comparte una superposicin de constructo.
Dos pruebas deseadas
para medir diferentes
tipos de inteligencia.
Compartir de todas maneras una

cantidad considerable del factor
general en inteligencia para producir
una fuerte corrrelacin
Cualquier prueba nueva de inteligencia que no se correlacione al menos en

cierto grado con las medidas existentes sera sumamente sospechosa, con
base en que no posee validez convergente.
VALIDEZ DE
DICRIMINACIN
Se demuestra cuando una prueba no se correlaciona con variables o pruebas

con las cuales debera tener diferencias.
El inters social y la
inteligencia no tienen
relacin terica
Las pruebas con estos dos

constructos deberan
correlacionarse en sentido
negativo, si es que acaso lo hacen
Campbell y Fiske, propusieron un diseo experimental sistemtico para

confirmar de manera simultnea la validez convergente y la de
discriminacin de una prueba psicolgica.
Matriz multirrasgo-multimtodo
Requiere de la evaluacin de dos o

ms rasgos a travs de dos o ms
mtodos.
Es una contribucin importante para la comprensin del proceso de

validacin de una prueba.
Es ms frecuente que los autores de pruebas obtengan datos sobre

validez convergentes y discriminativa en retazos, en lugar de producir
una matriz completa de intercorrelaciones.
Meier proporciona una de las pocas ejecuciones realistas de la matriz

multirrasgo-multimtodo en un examen de la validez del constructo de
agotamiento.
ANLISIS FACTORIAL
El anlisis factorial es una tcnica estadstica especializada que es de
particular utilidad para la investigacin de la validez de un constructo.
El propsito del anlisis factorial consiste en identificar el numero
mnimo de determinantes (factores) que se requieren para explicar las
intercorrelaciones entre una batera de pruebas.
El objetivo en el anlisis factorial es encontrar el conjunto mas

pequeo de dimensiones, llamadas factores, que puedan explicar la
disposicin observada de intercorrelaciones entre las pruebas
individuales.
Consiste en aplicar una batera de pruebas a varios cientos de
personas y despus calcular una matriz de correlacin a partir
de las puntuaciones en todos los posibles pares de pruebas.
Una carga factorial es una correlacin entre una prueba

individual y un solo factor.
As las cargas factoriales pueden variar entre -1.0 y +1.0. El
resultado final es una tabla que presenta la correlacin de
cada prueba con cada factor.
Una tabla de cargas factoriales ayuda a describir la
composicin factorial de una prueba y, por tanto,
proporciona informacin relacionada con la validez de
constructo.
PREOCUPACIONES EXTERNAS A LA VALIDEZ Y AMPLIACIN

DEL ESPECTRO DE LA VALIDEZ DE UNA PRUEBA.
Incluyen los efectos colaterales y consecuencias involuntarias de las
pruebas.
EFECTOS COLATERALES INVOLUNTARIOS EN LAS PRUEBAS
El examinador debe determinar si los beneficios de aplicar una prueba
superan los costos de los efectos colaterales potenciales. Al anticipar
los efectos colaterales involuntarios, el examinador podra desviarlos
o disminuirlos.
Un efecto colateral involuntario de utilizar el MMPI para la

valoracin de los solicitantes a puestos de orden publico es
que los candidatos al trabajo que no tengan xito con
alguna institucin puedan quedar sealados con una
etiqueta psicolgica como psicpatas, esquizofrnicos o
paranoides.
AMPLIACIN DEL ESPECTRO DE VALIDEZ DE UNA PRUEBA
Varios tericos en psicometra han introducido una definicin

mas amplia, funcionalista, de validez que asevera que una
prueba es valida si satisface el propsito para el cual se utiliza.
La perspectiva funcionalista reconoce que quien valida la
prueba tiene la obligacin de determinar si una practica tiene
consecuencias constructivas para los individuos e instituciones
y , en especial, para proteger de los resultados adversos.
La validez de una prueba es un juicio valorativo general acerca de la

idoneidad y pertinencia de las inferencias y acciones que fluyan de
las puntuaciones de sta.
Messick afirma que el concepto nuevo y ms amplio de validez
descansa sobre cuatro bases:
1) Evidencia tradicional de validez de constructo
2) Anlisis de las implicaciones de valor de la interpretacin de la
prueba
3) Evidencia de la utilidad de las interpretaciones de una prueba en
aplicaciones particulares
4) Una estimacin de las consecuencias sociales potenciales y reales,
incluyendo efectos colaterales del empleo de sta.

Validez Terminado

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Validez Terminado

Hochgeladen von

Copyright:

Verfügbare Formate

VALIDEZ

La validez refleja un juicio en evolucin basado en la

investigacin , acerca de que tan adecuadamente mide la

a travs de resmenes estadsticos exactos sino que mas

Las diferentes maneras de acumular evidencia de la validez

de la prueba constituyen una muestra representativa del universo

Hay que tener mucho cuidado de especificar el universo relacionado

con las respuestas.

determinar la validez general de contenido de una prueba a partir de juicios de

escala de cuatro puntos que se propone ( 1 (no relacionado)

Si dos jueces consideraron que

La casilla D es la nica que

Este concepto aparece cuando se trata de pruebas. Una prueba

tiene validez de Facie si aparece valida en los

La validez de facie no debe confundirse con la objetividad, que se

determina a travs de la relacin de puntuaciones de prueba con

VALIDEZ RELACIONADA CON EL CRITERIO

desempeo del examinado en alguna medida de resultado.

CARACTERSTICAS DE UN BUEN CRITERIO

Un criterio es cualquier medida de resultado contra la cual es valida

una prueba. Un criterio puede ser casi cualquier cosa.

denomina Coeficiente de Validez.

la informacin de criterio se obtiene de manera simultnea.

deseable en el caso de pruebas de rendimiento, aquellas que se

de manera precisas la posicin actual de un individuo en el criterio

EN UN ESTUDIO DE VALIDEZ PREDICTIVA, LAS PUNTUACIONES DE UNA PRUEBA SE

desempeo sera de 4.05 (es decir .07 (55)+.2).

-Una puntuacin de 33 en la prueba produce un nivel de desempeo pronosticado de 2.51 es

decir (.07 (33)+.2).

COEFICIENTE DE VALIDEZ Y ERROR ESTNDAR DEL

varias maneras diferentes.

contexto, la correlacin resultante se conoce como coeficiente de validez.

de la puntuacin de criterio, y se obtiene de la siguiente frmula:

Donde r es el cuadrado del coeficiente de validez y DE es la desviacin estndar de las puntuaciones

APLICACIN DE LA TEORA DE DECISIN LAS PRUEBAS

no es la medicin en s, sino la medicin al servicio de la teora de la toma de decisiones.

tipos de toma de decisiones institucionales.

posibles otros tipos de resultados.

casos de conocen como falsos negativos.

Los defensores de la teora de decisin tienen dos suposiciones fundamentales acerca

de la utilizacin de pruebas de seleccin.

una escala de utilidad comn.

solicitantes exitosos seleccionados con la utilizacin de una d ellas.

TODOS LOS CONSTRUCTOS POSEEN DOS CARACTERSTICAS

1.- No existe un solo referente externo suficiente para validar la

existencia del constructo.

Los diversos procedimientos de la validez de

constructo estn diseados para responder a una

ENFOQUES DE LA VALIDEZ DE CONSTRUCTO.

La mayor parte de los estudios de validez de constructo caen dentro de las

son consistentes con la teora del constructo.

de una prueba son consistentes en la teora.

Anlisis para determinar si los efectos de la intervencin sobre

las puntuaciones de una prueba son consistentes con la teora

Anlisis factoriales de las puntuaciones de prueba en relacin

con otras fuentes de informacin.

mtodo que mas se utiliza para lograr una escala

DIFERENCIAS GRUPALES CONSISTENTES

Las personas con antecedentes y caractersticas diferentes obtienen

Incluye un rasgo que se relaciona de manera

Consiste en mostrar que las puntuaciones de una

Se puede predecir que las puntuaciones en orientacin

Se demuestra cuando una prueba se correlaciona mucho con otras

Compartir de todas maneras una