Beruflich Dokumente
Kultur Dokumente
. M tocQ 5
............. ~
94
CONFIABIL1DAD DE LA MEDIDA
La confiabilidad se refiere a la consistencia o estabilidad de una medida del com
portamiento. La definicin cotidiana de la confiabilidad se acerca bastante a la
definicin cientfica. Por ejemplo, se podra decir que la profesora Fuentes es
confiable porque inicia su clase exactamente a las 10:00 de la maana, diaria
mente; en contraste, a la profesora Fine se le podra considerar poco confiable
debido a que, aunque en ocasiones inicia su clase exactamente a la hora, cual
quier da puede llegar entre las 10:00 y las 10:20 de la maana.
De forma similar, una medida confiable de una variable psicolgica, como
la inteligencia, puede producir el mismo resultado cada vez que se administra la
prueba de inteligencia a la misma persona. El examen sera poco confiable si
evala a la misma persona en una primera semana como promedio, como defi
ciente la siguiente semana y brillante en la tercera semana. En trminos senci
llos, una medida confiable no flucta de una lectura a la siguiente. Si la medida
flucta, existe un error en el instrumento de medicin.
Una manera ms formal de comprender la confiabilidad implica el uso de
los conceptos de puntaje verdadero y error de medicin. Se puede pensar que
cualquier medida que se haga tiene estos componentes: 1) un puntaje verdade
ro, que es el puntaje real de la variable, y 2) un error de medicin. Una medida
poco confiable de inteligencia contiene una cantidad cosiderable de error de
medicin, por lo cual no proporciona un indicador preciso de la verdadera inte
ligencia del individuo. En contraste, una medida confiable de la inteligencia que
contenga poco error de medicinproducir un puntaje idntico (o casi idn
tico), cada vez que se mida al mismo individuo.
96
o
;o
J3
O
(/)
O
c3
CL
d)
o
O
<5
E
3
FIGURA 5.1
Confiabilidad de la medida
97
Confiabilidad de la medida
j pnxnnlio Je todos los coeficientes de correlacin- Tambin se puede exa l, correlacin del puntaje de cada reactivo con el puntaje total, basado en
Mos ios reactivos. Este tipo de correlaciones reactivo-total y el alfa de Cronbach
blinda mucha informacin, ya que proporcionan datos sobre cada reactivo
individual. Los reactivos que no se correlacionan con otros pueden eliminarse
di ia medida para aumentar la confiabilidad.
Conflabllldad entre jueces
En ciertas investigaciones, algunos evaluadores observan las conductas y hacen
puntajes o juicios. Para hacer esto, un evaluador o juez sigue instrucciones para
hacer juicios sobre las conductas; por ejemplo, evaluando si el comportamien
to de un nio en un parque es agresivo, y qu tanto lo es. Usted puede pedir a
un evaluador que haga juicios sobre la agresin, pero las observaciones de un
solo evaluador podran ser poco confiables. La solucin para este problema es
utilizar, al menos, dos evaluadores que observen la misma conducta. Laconflabilidad entre jueces se refiere a la magnitud de acuerdo que hay entre los eva
luadores con respecto de sus observaciones. Por lo tanto, si dos evaluadores juz
gan que las conductas son agresivas, se obtiene una alta correlacin entre jueces,
cuando la mayora de las observaciones dan como resultado los mismos juicios.
Un indicador que se utiliza comnmente para la confiabilidad entre jueces es la
kappa de Cohn.
100
Validez aparente
El contenido de la medida aparentmente refleja el constructo que se est
midiendo.
Validez orientada al criterio
Las puntuaciones de la medida estn relacionadas con un criterio (un
indicador del constructo).
Tipos de validez orientada al criterio
Validez predictiva
Validez concurrente
Validez convergente
Validez discriminante
FIGURA 5.2
Indicadores de la validez de constructo de una medida.
101
102
Validez predictiva
La validez predictiva es el grado en que la medida permite pronosticar las con
ductas que debe predecir. Por lo tanto, en la validez predictiva el criterio es alguna
conducta futura. En el caso de algunas medidas, la naturaleza del criterio es ob
via. Una prueba de habilidades administrativas tiene el objetivo de proporcionar
una forma rpida para predecir el desempeo futuro en un puesto administra
tivo. De manera similar, muchos estudiantes universitarios responden el Gradate
Record Exam (GRE), que se elabor para predecir el xito en programas de pos
grado, o el Law School Admission Test (LSAT), creado para predecir el xito en la
Escuela de leyes. La validez de constructo de medidas como stas se demuestra
cuando los puntajes de la medida s predicen el comportamiento futuro. Por
ejemplo, la validez predictiva del LSAT se demuestra cuando la investigacin
indica que las personas que obtienen puntajes altos en la prueba tienen mayor
xito en la escuela de leyes que las personas que obtienen puntajes bajos (por
ejemplo, existe una relacin positiva entre el puntaje en la prueba y las califica
ciones en la escuela de leyes). La medida puede utilizarse para aconsejar a los in
dividuos con respecto al xito que tendrn en la escuela de leyes o para seleccio
nar a quienes solicitan entrar a esta escuela.
Para otros tipos de variables, las predicciones son menos obvias. Si tiene
una medida de la timidez, puede hacer predicciones sobre la manera en que los
puntajes de la medida se relacionarn con diversas conductas. Por ejemplo, su
teora de la timidez podra pronosticar que los puntajes de timidez se relacio
narn con la cantidad de ansiedad que las personas mostrarn cuando se descri
ban a s mismas ante un extrao. Si esta prediccin resulta correcta, aumenta su
confianza en la validez de la medida. Sin embargo, la confirmacin de una sola
prediccin nunca se utilizara como evidencia nica para la validez de construc
to de una medida de una variable, como la timidez. Mejor dicho, la validez de la
medida se construye con el tiempo, conforme diversos estudios investigan la teo
ra del constructo que se est midiendo. Adems, las medidas de las variables
suelen tener una vida limitada. Conforme se acumulan los hallazgos de investi
gaciones, los cientficos refinan la medida y en ocasiones crean medidas nuevas
que hacen mejores predicciones. Este proceso conduce a mejores medidas y a
una comprensin ms completa de la variable subyacente en estudio.
Validez concurrente
El cricerio para la investigacin de la validez concurrente es el hecho de que dos
o ms grupos de personas difieran, de la manera esperada, en la medida. Regre
sando al ejemplo de la medida de la timidez, su teora de la timidez podra hacer
que usted esperara que vendedores cuyo trabajo requiere hacer llamadas fras
a clientes potenciales, obtuvieran menores puntajes en su escala de timidez que
los vendedores que trabajan en puestos que requieren tratar nicamente con
personas que han hecho el esfuerzo para contactar a la empresa, con el fin de ha
cer una compra potencial.
Validez convergente
Cualquier medida es una definicin operacional particular de la variable en es
tudio. Con frecuencia existen otras definiciones operacionales otras medi
das del mismo constructo o de constructos similares. La validez convergente
es el grado en que los puntajes de la medida en cuestin se relacionan con pun
tajes de otras medidas del mismo constructo o de constructos similares. Las me
didas de constructos similares deben converger; por ejemplo, una medida de
la timidez debe tener una alta correlacin con otra medida de la timidez o una
medida de un constructo similar, como la ansiedad social. En una investigacin
real, llevada a cabo con una escala de timidez, se demostr la validez de conver
gencia de la Q de timidez por medio de una correlacin alta (0,77) entre los pun
tajes de esta escala y las de otra, denominada Temor de una evaluacin negativa
(Bortnik et al., 2002).
Validez discriminante
La validez discriminante se demuestra cuando la medida no est relacionada
con variables con las que no debe estarlo. La medida debe discriminar entre el
constructo que se mide y otros constructos que no tienen relacin con l. Al
investigar la validez discriminante de su medida de la timidez, Bortnik y sus
colaboradores (2002) no encontraron relacin entre los puntajes de la Q de
timidez y varios valores interpersonales que no tienen una relacin conceptual,
como la evaluacin de la fortaleza de los dems.
La Escala de bsqueda de sensaciones (Zuckerman, 1979) es un excelente
ejemplo de la investigacin de la validez de constructo, en la que diversos es
tudios sustentan las predicciones hechas por una teora. La investigacin de
Zuckerman se vio motivada por una teora psicolgica sobre los niveles ptimos
de activacin fisiolgica. La teora establece que las personas necesitan man
tener un nivel ptimo de activacin. Cuando la activacin es demasiado baja, los
individuos se sienten motivados a realizar cosas para incrementar la activacin;
104
tivas. Muchas de estas medidas incluyen formas inteligentes del registro indirec
to de una variable. Por ejemplo, una medida no directiva sobre las preferencias
de las pinturas en un museo de arte es la frecuencia con que deben cambiarse las
baldosas que rodean a cada pintura; las pinturas ms populares son aquellas con
cambios ms frecuentes. El estudio de Levine (1990) sobre el ritmo de vida en las
ciudades, mencionado en el captulo 2, emple medidas indirectas como la pre
cisin de los relojes en los bancos y la velocidad del procesamiento de las solici
tudes estndares en las oficinas de correos, para medir el ritmo de vida. Algunas
de las medidas descritas por Webb y sus colaboradores (1981) son cmicas. Por
ejemplo, en 1872, Sir Francis Galton estudi la eficacia de rezar para tener una
vida larga. Galton se cuestion si la realeza britnica, que con frecuencia era el
recipiente de los rezos del pueblo, viva ms que otras personas. Verific regis
tros de las muertes y encontr que los miembros de las familias reales en reali
dad vivan menos que los dems, al igual que los literatos y los cientficos. El
libro de Webb y sus colaboradores es una rica fuente de medidas no reactivas co
mo stas. Adems, logra dirigir la atencin hacia el problema de la reactividad y
sensibiliza a los investigadores de la necesidad de reducir la reactividad, siempre
que sea posible. Regresaremos a este tema en diversos puntos de este texto.
Escalas nominales
Las escalas nominales no poseen propiedades numricas o cuantitativas. En su
lugar, las categoras o grupos sencillamente difieren entre s (en ocasiones las
variables nominales se conocen como variables categricas). Un ejemplo ob
vio es la variable del gnero: a una persona se le clasifica como hombre o mujer.
Ser hombre no implica una mayor cantidad de gnero" que ser mujer; los dos
niveles son simplemente distintos. Se le llama escala nominal debido a que slo
asignamos nombres las distintas categoras. Otro ejemplo es la clasificacin
de los estudiantes universitarios de acuerdo con la carrera que estudian. Por
ejemplo, no podra drsele un nmero mayor a la carrera de psicologa que a la
de historia. Incluso si se asignan nmeros a las distintas categoras, los nmeros
careceran de significado, excepto como una forma de identificacin.
En un experimento, con frecuencia la variable independiente es de tipo no
minal o categrico. Por ejemplo, Punnert (1986) estudi una variable que po-
105
106
Escalas ordinales
Las escalas ordinales nos permiten ordenar los niveles de la variable en estudio.
En lugar de tener categoras que slo son diferentes, como en una escala nomi
nal, las categoras pueden ordenarse de la primera a la ltima. Un ejemplo de es
ta escala es el sistema de clasificacin de filmes que se uciliza en la seccin de te
levisin y espectculos del peridico local. Las pelculas que pasan en televisin
reciben una, dos, tres o cuatro estrellas, con base en las siguientes descripciones:
107
108
Escala nominal
Escala ordinal
Puntuacin verdadera
Reactividad
Validez aparente
Validez concurrente
Validez convergente
Validez de constructo
Validez discriminante
Validez orientada al criterio
Validez predictiva
Variable criterio
Preguntas de repaso ----------------------1. A qu se refiere la confiabilidad de una medida? Distinga entre el puntaje
verdadero y el error de medicin.
2. Describa los mtodos para determinar la confiabilidad de una medida.
3. Comente el concepto de validez de constructo. Establezca la diferencia
entre la validez convergente y la discriminante.
4. A qu se refiere la validez orientada al criterio?
5. Por qu no es suficiente la validez aparente para establecer la validez de
una medida?
Actividades
109