Sie sind auf Seite 1von 10

INDICE

I CONFIABILIDAD
1.1Confiabilidad
1
1.2Homogeneidad
o
consistencia
interna.
.1.
1.3Coeficientes
de
confiabilidad.1
1.4Factores
que
influyen
en
los
coeficientes
de
confiabilidad1
1.5Estimaciones
de
confiabilidad1
II VALIDEZ
2.1
Definicin
de
Validez..3
2.2
Aspectos
sobre
la
prueba3
2.3
Criterio
..3
2.4
Factores
que
influyen
en
los
ndices
de
validez.4
2.5
Generabilidad
de
los
datos
de
validez.4
2.6
Requisitos
mnimos
para
el
nivel
aceptable
de
Validez4
III. VALIDEZ RELACIN CON EL CONTENIDO.
3.1
Pruebas
representativas
4
3.2
Validez
de
contenido
4
3.3
Muestreo
representativo4
3.4
Mtodo
de
Cronbach
y
otro
mtodo
alternativo4

3.5
Validez
de
Facie
4
IV VALIDEZ DE CONSTRUCCIN.
4.1
Validez
de
construccin.
5
4.2
Red
nomolgica
.5
4.3
Categora
de
las
tcnicas6
4.4
Desarrollo
de
la
escala
de
la
fuerza
del
yo6
4.5
Resumen
de
los
tres
tipos
de
Validez.6
4.6
Validez
sinttica
.7
4.7
Incremento
de
la
Validez7
V. CALIFICACIN REAL DE LAS NORMAS.
5.1
Calificacin
derivada
o
transformadas.7
5.2
Normas
de
grupo.8
5.3
Calificacin
relacionada
con
las
normas..8
5.4
Perfil
de
la
prueba8

I CONFIABILIDAD
1.1

Confiabilidad.

Definicin: Se mide como la probabilidad de que un sistema no falle en ejecutar la


funcin para la que fue constituida dentro de un periodo especifico de tiempo.
2

Se ocupa de la pregunta hasta qu punto ser consistente la ejecucin de una persona,


si toma otra forma de la prueba psicolgica (equivalencia) o si toma la misma forma en
un momento diferente (estabilidad?.)
1.2

Homogeneidad o consistencia interna.

Se ocupa de la pregunta miden todas las preguntas de una prueba la misma


caracterstica?
1.3

Coeficientes de confiabilidad.

Estos coeficientes no son ms que la correlacin entre dos conjuntos de calificaciones,


obtenidos de una misma muestra de personas y que se utiliza como ndice de
consistencia de la medicin.
1.4

Factores que influyen en los coeficientes de confiabilidad.

El coeficiente de estabilidad y equivalencia da por lo comn la estimacin ms baja de


confiabilidad, debido a que hay ms factores que tienen probabilidades de influir en las
calificaciones.
1. El rango de calificaciones: los coeficientes de confiabilidad, como todos los
coeficientes de correlacin, se ven afectados por el rango de distribucin de las
calificaciones.
2. Longitud de prueba: al agregar ms reactivos, asegurndose que son
igualmente confiables, se incrementara la confiabilidad de la prueba.
3. Dificultad de la prueba: si la prueba es muy difcil o muy fcil para un grupo, el
rango de calificaciones se estrechara y reducir la confiabilidad.
4. Velocidad: al fijar un lmite de tiempo restrictivo, de tal modo que nadie pueda
concluirlos, produciremos una prueba acelerada.
1.5

Estimaciones de confiabilidad.

Una medida posible de confiabilidad es la correlacin entre medidas repetidas (o sea,


entre una prueba y una recopilacin). Esa estimacin se denomina coeficiente de
estabilidad. Cualquier prueba contiene solo una muestra de todos los reactivos posibles.
Puede esperarse que las calificaciones sean consistentes de una muestra de reactivos a
otra o sea de una forma de la prueba a otra. As, un segundo tipo de estimacin de
confiabilidad se refiere a la consistencia sobre las formas de una prueba. Esta medida se
denomina coeficiente de equivalencia. Podramos combinar tambin esos dos
procedimientos mediante la administracin de formas equivalentes dando un intervalo en
el tiempo, coeficiente de equivalencia y estabilidad.
3

II VALIDEZ
VALIDEZ RELACIONADA CON EL CRITERIO
2.1 Definicin de Validez.
Medida en que las estrategias y los instrumentos de recopilacin de datos mide lo que
tienen por objeto medido.
2.2 Aspectos sobre la prueba.
Es el predecir la conducta futura, predecir la ejecucin de un individuo en alguna
situacin cualitativa diferente, que sean procesos de seleccin, de la validez y
confiabilidad, hasta el punto en que mejore la eficacia de la toma de decisiones.
2.3 Criterio
Si se disea una prueba para predecir la ejecucin en un rea, es preciso identificar
alguna medida o norma de ejecucin, es decir, el criterio.
A la ejecucin que se predice, cuando la prueba predice y cuando hay correlacin de
datos y esto a su vez predicen el criterio de la evaluacin.
La validez predictiva se refiere a las situaciones en que los datos de criterio se renen en
algn momento del futuro.
Caractersticas:
Relevancia: La medida de un criterio debe reflejar en realidad las importantes facetas del
criterio conceptual, incluye la evaluacin racional de si las dimensiones relevantes del
criterio conceptual estn presentes o en la medida del criterio.
Confiable: La razn es evidente, si la ejecucin en el criterio varia de tiempo en tiempo o
de situacin en situacin, no podr relacionarse de manera consistente con otras
medidas incluyendo los predictores.
No hay desviaciones tendenciosas: cuando la medida de criterio es una clasificacin.
Contaminacin de criterio; no permite que la persona que califiqu el criterio vea las
calificaciones predictoras.
Mtodos de evaluacin para determinar la validez relacionada con el criterio:
Coeficiente de validez: Correlacionar los resultados de la prueba con un criterio,
incluye 5 etapas.
1. Seleccin de un grupo apropiado de estudio.
2. Aplicacin de la prueba predictiva.
3. Aplicacin del tratamiento relevante.
4. Reunin de los datos del criterio.
4

5. Correlacin de calificaciones de la prueba y del criterio.


Diferenciacin de grupos: Para ver si las calificaciones predictorias difieren a los
grupos especficos para su ejecucin en el criterio.
Exactitud de la toma de decisiones: la persona que ha de tomar decisiones est
interesada siempre en la exactitud de sus juicios, se reforzara en aumentar el
nmero de decisiones correctas y disminuir las incorrectas.
Utilidad: es el anlisis de los costos y beneficios de diversas acciones. La economa
de uso como ndice de la validez de la prueba indica la determinacin de los
beneficios alcanzados y los costos devengados mediante la aplicacin.
2.4 Factores que influyen en los ndices de validez.
1. La muestra: hay dos dimensiones de la muestra que son cruciales: su tamao y el
hecho de si es o no representativa.
2. ndices bsicos: la prueba psicolgica ms valida era la que permitiera tomar las
decisiones ms correctas.
3. Razones de seleccin: proporcin de personas escogidas entre cierto nmero de
solicitantes.
2.5 Generabilidad de los datos de validez
Predecir la ejecucin de un individuo en alguna situacin cualitativamente diferente.
2.6 Requisitos mnimos para el nivel aceptable de Validez.
La relacin de validacin cruzada entre calificaciones del predictor y del criterio, tienen
que ser estadsticamente significativa- o sea, algo ms que una simple relacin de al
azar. La utilizacin de la prueba psicolgica debe dar como resultado decisiones ms
correctas que las que se tomaran al recurrir simplemente a los ndices bsicos.
La prueba debe poseer cierta utilidad; debe dar como resultado ciertas ganancias para el
usuario.
La eficacia de la prueba tiene que ser mayor que otros instrumentos disponibles para la
toma de decisiones; o sea, la prueba debe proporcionar alguna informacin nica.
III. VALIDEZ RELACIN CON EL CONTENIDO.
3.1

Pruebas representativas.

Se utilizan primordialmente para describir las caractersticas y las conductas de las


personas, en lugar de predecirlas las conductas externas a la prueba psicolgica.
3.2

Validez de contenido

Es si los reactivos constituyen la prueba son realmente una muestra representativos del
dominio de contenido que nos interesa.
Se ocupa del contenido de la prueba psicolgica. El contenido significa los constituyentes
substantivos de la materia, sus componentes reales o informativos.
3.3

Muestreo representativo.

El muestreo representativo implica la seleccin de reactivos en proporcin a su nfasis o


importancia. Los reactivos de la prueba tienen que ser representativos del contenido total
del curso o la unidad; pero solo del material que se considere importante o relevante.
Proceso de muestreo de reactivos implica, la divisin del dominio de contenido en cierto
nmero de subcategoras, cada una de las cuales representa una rea relevante de
contenido; a continuacin, se asigna un peso proporcional a cada categora y, finalmente,
se muestrean al azar los reactivos de cada categora, hasta alcanzar el numero requerido.
3.4Mtodo de Cronbach y otro mtodo alternativo.
Cronbach propuso que se evaluara cuantitativamente la validez del contenido, correlacionando las calificaciones de dos formas de una prueba, construidas independientemente a
partir del mismo dominio de contenido. Otro mtodo alternativo es el de aplicar
previamente la prueba a un grupo de personas que tengan conocimientos mnimos del
rea, exponiendo al grupo a un curso o un programa de adiestramiento que cubra el
material relevante y, a continuacin realizar una reaplicacin.
3.5 Validez de Facie.
Validez de facie se determina mediante un examen bastante superficial de la prueba por
el examinando y considera solamente la relevancia obvia. Y Validez de contenido se
establece mediante una evaluacin completa y sistemtica de la prueba por un juez
competente y se toma en consideracin la relevancia, tanto en sus aspectos evidentes
como en los ms sutiles.
IV VALIDEZ DE CONSTRUCCIN.
4.1

Validez de construccin

Tiene como meta fundamental la comprensin del rasgo (construccin) que mide una
prueba psicolgica.
Los estudios de la validez de construccin tratan de responder las preguntas que siguen:
Qu construccin psicolgica mide la prueba? Hasta que punto mide bien la prueba
psicolgica esa construccin?
6

En la edicin anterior se indicaba que la validez de construccin tena que utilizarse


cuando:
El usuario de la prueba desea inferir el grado en el que el individuo posee alguna cualidad
o rasgo hipottico (construccin), que se supone que se refleje en la ejecucin de la
prueba psicolgica.
Preciso examinar todo el caudal de evidencias que la rodean: el tipo de reactivo que se
incluyen, la estabilidad de las calificaciones en condiciones variables, la homogeneidad
de la prueba psicolgica, su correlacin con variables de otras pruebas, los efectos de la
manipulacin experimental de la ejecucin en la prueba y otros datos que iluminen el
significado de las calificaciones.
Lgica de la validez de construccin, as como sus mtodos, son esencialmente los del
mtodo cientfico. Se parte una teora que considera una construccin que se supone que
mide la prueba psicolgica en cuestin. A partir de esta teora se pueden hacer ciertas
predicciones sobre las relaciones entre las variables. Luego, se comprueban esas
predicciones empricamente. Dependiendo de los resultados de la verificacin emprica,
se ratifica o se rectifica la teora. Las predicciones continuas, las pruebas empricas y la
revisin de la teora sirven para definir con mayor precisin la construccin.
4.2

Red nomolgica.

Cualquier teora se compone de una serie de conceptos interrelacionados, proposiciones


y leyes. Este sistema de leyes entrelazadas se denomina red nomolgica.
4.3 Categora de las tcnicas
Cinco categoras:
1. Mtodos intrapruebas: Tcnicas que estudian la estructura interna de una
prueba; su contenido, los procesos utilizados para responder a las preguntas y las
relaciones entre las subpruebas o los reactivos.
2. Mtodos interpruebas: Toma en consideracin las relaciones reciprocas entre
varias pruebas de manera simultnea. Esos mtodos se disean para indicar
cuales son los aspectos que tienen en comn varias pruebas, o bien, desde otro
punto de vista, si las pruebas miden o no la misma construccin.
3. Manipulacin experimental: Podemos obtener informacin til mediante la
manipulacin experimental de alguna variable y la observacin de sus efectos
sobre las calificaciones de la prueba psicolgica o la relacin de estas y algn
criterio.
4. Estudios relacionados con los criterios: La naturaleza y el tipo de criterios que
se pueden predecir mediante la prueba psicolgica dan una indicacin de la
construccin o hiptesis que la prueba est midiendo. As, los datos de los estudios
de validez relacionados con los criterios pueden proporcionar informacin
relevante para la validez de construccin.
7

5. Estudios de capacidad de generalizacin: Los estudios que caen en esta


categora analizan sistemticamente la prueba sobre una gama de condiciones o
dimensiones por ejemplo, en una gran variedad de poblaciones (transferibilidad) o
con diferentes condiciones de administracin.
4.3

Desarrollo de la escala de la fuerza del yo.

Barron, demostr que los estudiantes universitarios que obtenan calificaciones elevadas
en una escala de fuerza del yo, se clasificaban como personas activas, osadas,
determinativas, independientes, con iniciativa, expresivas, persistentes, confiables, llenas
de recursos y responsables; quienes obtenan calificaciones bajas se clasificaban como
dependientes afeminados, amanerados y sumosos. Esas descripciones dan una
indicacin sobre la construccin que est siendo medida por la prueba psicolgica,
definiendo, de ese modo, su naturaleza.
4.4

Resumen de los tres tipos de Validez.

1. Validez relacionada con el criterio: predice la ejecucin


2. Validez de contenido: se centra en el proceso de evaluar que tan
adecuadamente una muestra de reactivos (de una prueba psicolgica) representa
el dominio relevante.
3. Validez de construccin: se enfoca en la definicin del rasgo medido por la
prueba psicolgica, o sea, en la capacidad de la prueba para proporcionar
informacin relativa a la naturaleza del rasgo.
4.5

Validez sinttica.

Es el proceso de inferencia de la validez en una situacin especfica de un anlisis lgico


de los elementos que caracterizan las tareas que exige el puesto.
El procedimiento bsico incluye tres etapas: identificacin de los elementos esenciales en
un trabajo o un grupo de trabajos (ocupaciones), estimacin de la validez de las pruebas
psicolgicas para medir los elementos y combinacin de las valideces elementales en
una validez compuesta.
4.6

Incremento de la Validez.

Hace hincapi en el hecho de que una validez se determina por su contribucin nica a la
eficiencia predictiva. En otras palabras, una prueba es vlida en tanto que incrementa su
exactitud de prediccin.
V. CALIFICACIN REAL DE LAS NORMAS.
8

5.1

Calificacin derivada o transformadas.

Calificaciones relacionadas con las normas


Lo ms frecuente es que la ejecucin de un individuo se compare con las
calificaciones obtenidas por otras personas en un grupo de referencia pertinente,
el grupo normativo.
El desarrollo de las calificaciones relacionadas con las normas implica: (1)
identificar un grupo pertinente de comparacin; (2) obtener las calificaciones en la
prueba de los miembros de este grupo y (3) convertir las calificaciones brutas a
una escala que exprese la ejecucin como clasificacin relativa dentro de un
grupo normativo.

Calificaciones relacionadas con el contenido


Descripcin de la ejecucin en funcin del contenido que ha llegado a dominar y
no en funcin de un grupo normativo.

Calificaciones relacionadas con las consecuencias


Una tercera posibilidad es la de expresar la ejecucin en funcin de una conducta o
una calificacin pronosticada. Suelen ser datos relacionados con el criterio.

5.2 Normas de grupo.


Desde el punto de vista de quien desarrolla la prueba, la pregunta es: En que
poblaciones se utilizara la prueba?
Los usuarios de las pruebas observan las normas desde diferentes puntos de vista, segn
las ventajas que ellos consideran. Su pregunta primordial es: Cul de los grupos
normativos disponibles es ms apropiado?
Requisitos de las normas de grupo

Que la composicin de las normas de grupo se defina con claridad


Que el grupo normativo sea una muestra representativa de la poblacin designada
El procedimiento de muestreo se debe describir con claridad
Que los grupos normativos se basen en una muestra de tamao adecuado
Las normas se deben actualizar peridicamente y se deben abordar las normas
antiguas con el escepticismo apropiado
5.3

Calificacin relacionada con las normas.

1. Percentiles
Los rasgos percentiles de una calificacin se definen como el porcentaje de personas del
grupo normativo que obtienen las calificaciones ms bajas.
2. Calificaciones estndar
Es la desviacin que tiene una calificacin bruta de la media.
9

3. Escalas de desarrollo
Muchas habilidades, capacidades y caractersticas se desarrollan de modo sistemtico a
travs del tiempo. Debido a esto, se pueden desarrollar escalas de calificaciones que
comparen la ejecucin de un individuo con el de la persona promedio a varios niveles de
desarrollo.
Las escalas de desarrollo sealan generalmente la ejecucin como equivalente a la edad
cronolgica o al grado escolar.
4. Razones y cocientes
Coeficiente Intelectual (CI) definido como la razn entre la edad mental del nio y su
edad cronolgica
5.4 Perfil de la prueba.
Grafica en la que se trazan una serie de calificaciones de una prueba.

10

Das könnte Ihnen auch gefallen