Beruflich Dokumente
Kultur Dokumente
1. INTRODUCCIN.
2. SUPUESTOS.
3. CONSTRUCCIN DE UNA ESCALA LIKERT.
4. INTERPRETACIN DE LAS PUNTUACIONES.
5. VALORACIN.
1. INTRODUCCIN.
El mtodo de escalamiento de Likert es el mtodo ms utilizado en Psicologa para
medir actitudes, y su uso se ha extendido a la medicin de otros constructos, com
o por ejemplo las dimensiones de personalidad.
Likert (1932) propuso su mtodo de escalamiento a finales del primer tercio
del siglo XX. Previamente, Thurstone (1928) haba propuesto un mtodo para la medic
in de actitudes que implicaba la participacin de sujetos que desempeaban el papel d
e jueces (el mtodo de los intervalos aparentemente iguales). Segn Thurstone (1928)
, el nmero de jueces debea oscilar entre 200 y 300. La tarea de estos sujetos cons
ista en valorar un conjunto de tems. A partir de estas valoraciones, se calibraba
n los tems, es decir, se estimaba el valor del tem en la escala. Una vez se dispona
de un conjunto de tems calibrados que constituan un cuestionario, ste se aplicaba
al grupo de sujetos que se deseaba estudiar, y se les peda que marcaran los tems c
on los que estaban de acuerdo y aqullos con los que disentan. La puntuacin de cada
persona consista en la media de los valores de los tems con los que estaban de acu
erdo. El empleo de un nmero elevado de jueces y la necesidad de calibrar los tems
hacan que este mtodo fuera muy costoso y laborioso. Asimismo, el mtodo de Thurstone
implicaba una serie de supuesto estadsticos que no haban sido verificados, por ej
emplo, que los valores de escala de los enunciados son independientes de la dist
ribucin de actitudes de los jueces que los valoran (Likert, 1932).
Tras reconocer la importancia de las aportaciones de Thurstone en el terr
eno de la medicin de las actitudes, Likert (1932) se pregunt si la construccin de e
scalas de medida mediante procedimientos ms sencillos dara resultados tan buenos c
omo los obtenidos por Thurstone en cuanto a la fiabilidad y validez de las medid
as, y si sera posible construir escalas evitando asumir supuestos estadsticos inne
cesarios. As pues, el objetivo principal de Likert (1932) fue desarrollar un mtodo
de medicin de actitudes sencillo y simple.
Brevemente, el mtodo de medicin de Likert consiste en la presentacin a los s
ujetos de una serie de tems o enunciados ante los que tienen que expresar su posi
cin escogiendo una alternativa de respuesta entre las ofrecidas. Por ejemplo, ima
ginemos que uno de los tems que componen una escala de actitud hacia la pena de m
uerte dijera: La pena de muerte debe abolirse , y que las alternativas de respuesta
ofrecidas para contestar el tem fueran:
1. Completamente en desacuerdo.
2. En desacuerdo.
3. Indeciso.
4. De acuerdo.
5. Completamente de acuerdo.
Un sujeto que tuviera una actitud contraria a la pena de muerte contestara
4 o 5. Una vez que el sujeto a contestado todos los tems, la puntuacin del sujeto
todas ellas consista en asignar puntuaciones de 1 a 5 a cada una de las cinco alt
ernativas de respuesta de desacuerdo-acuerdo presentadas anteriormente (1. Compl
etamente en desacuerdo; 2. En desacuerdo; 3. Indeciso; 4. De acuerdo; 5. Complet
amente de acuerdo). Comprob que esta forma de puntuar los tems ofreca resultados mu
y similares a los obtenidos mediante otras tcnicas ms complejas y costosas (como p
or ejemplo, los valores sigma). Actualmente, esta forma de puntuar los tems tambin
se conoce como puntuacin mediante nmeros enteros (Andrich & Schoubroeck, 1989).
Las escalas de respuesta empleadas para puntuar los tems de una escala Li
kert pueden presentar un nmero diferente de alternativas de respuesta. Las escala
s con cinco alternativas son muy frecuentes. Pero no es extrao encontrar escalas
de respuestas con cuatro, seis y siete alternativas. Las escalas con nmeros pares
omiten la categora de respuesta central, que suele ser Indeciso , Indiferente , No esto
y seguro , o Ni de acuerdo ni en desacuerdo . Existe cierto debate sobre si la catego
ra central debera incluirse o no. Algunos investigadores han recomendado el uso de
la categora de respuesta central (Edwards, 1957; Newman, 1979; Sudman y Bradburn
, 1989), argumentando que es preferible no forzar las respuestas de los sujetos
indecisos hacia un polo (acuerdo o desacuerdo) que podra no describirles. Sin emb
argo, otros estudios han cuestionado el uso de las categoras centrales porque stas
pueden atraer a las personas que las seleccionan por razones diferentes de cul e
s su posicin en la actitud medida (Bock y Jones, 1968; Worthy, 1969; Kaplan, 1972
; Dubois y Burns, 1975). Investigaciones recientes sobre este tema han revelado
que casi un 50% de los sujetos que responde mediante diferentes tipos de categora
s de respuesta centrales lo hace por razones diferentes a la de estar en el punt
o medio de la dimensin medida (Espejo, 1998; Espejo y Gonzlez-Rom, 1999). Otros est
udios han mostrado que incluso los sujetos con niveles medios en la dimensin medi
da, tiene una probabilidad muy pequea de contestar utilizando la categora central,
y es ms probable que respondan utilizando otras categoras de respuesta adyacentes
, como En desacuerdo o De acuerdo (Andrich, de Jong y Sheridan, 1997; Hernndez, Espej
o, Gonzlez-Rom y Gmez-Benito, en prensa; Espejo y Gonzlez-Rom, 2001). As pues, en base
a los ms recientes resultados de la investigacin sobre el tema, parece que la uti
lidad de la categora de respuesta central est seriamente cuestionada.
Las escalas de respuesta con seis alternativas suelen ser muy similares
a la siguiente:
1. Completamente en desacuerdo.
2. Bastante en desacuerdo.
3. Algo en desacuerdo.
4. Algo de acuerdo.
5. Bastante de acuerdo.
6. Completamente de acuerdo.
Las escalas de respuesta que presentan siete alternativas incluyen en la escala
anterior una categora de respuesta central a la que se le asigna la puntuacin de 4
.
Todas las escalas de respuesta que se utilizan en las escalas Likert son
politmicas, pues presentan ms de dos alternativas de respuesta. Adems, son escalas
de respuesta ordenadas o graduadas, ya que la asignacin de los nmeros enteros a la
s distintas respuestas constituye una escala ordinal. A partir de las puntuacion
es obtenidas por distintos sujetos en un mismo tem, podemos hacer inferencias ace
rca de quines tienen una actitud ms o menos favorable, pero no podemos determinar
cul es la distancia entre sujetos que responden con alternativas diferentes.
Una vez se ha determinado cmo se puntuar cada tem, pero antes de calcular la
puntuacin de cada sujeto en el cuestionario, hay que detectar los tems invertidos
y transformar la puntuacin obtenida en ellos de manera que tenga el mismo signif
icado que la puntuacin obtenida en el resto de tems. Como sealamos anteriormente, L
ikert (1932) recomend que aproximadamente la mitad de los tems representaran manif
estaciones de actitudes positivas o favorables, y la otra mitad de los tems const
Puntuacin (Po)
escuela es divertida
5
la escuela aprendo cosas tiles. 6
escuela es un rollo
2
la escuela pierdo el tiempo.
1
Los tems 1 y 2 manifiestan una actitud favorable, mientras que los tems 3 y 4 deno
tan una actitud desfavorable. Procedamos ahora a transformar los tems 3 y 4 aplic
ando la frmula correspondiente. Como la escala de respuesta oscila entre 1 y 6, a
plicaremos la frmula Pi = (Pm+1) - Po.
Items Puntuacin (Po) Puntuacin transformada (Pi)
3. La escuela es un rollo
2
(6+1)-2 = 5
4. En la escuela pierdo el tiempo.
1
(6+1)-1 = 6
Ahora que ya hemos transformado las puntuaciones obtenidas en los tems inv
ertidos, podemos calcular la puntuacin total de cada sujeto en el cuestionario. C
omo se indic al comienzo de este tema, la puntuacin total de un sujeto en el cuest
ionario se determina sumando o promediando los valores de las alternativas de re
spuesta escogidas ante cada tem (Likert, 1932), razn por la que las escalas o cues
tionarios construidos siguiendo este mtodo se denominan escalas sumativas. En el
donde, riT es la correlacin tem-test, Si es la desviacin tpica que muestran las punt
uaciones en el tem, y ST es la desviacin tpica que presentan las puntuaciones en te
st.
Para interpretar el ndice de homogeneidad corregido suele tomarse como val
or de referencia 0.20. De manera que todos los tems que presentan ri(T-i) con val
ores inferiores a 0.20 son eliminados del banco de tems por ser indiferenciadores
.
Ejemplo de clculo.
Supongamos que 16 sujetos han contestado a los cuatro tems del cuestionar
io de actitudes hacia la escuela que utilizamos anteriormente. Despus de transfor
mar los tems invertidos, se han calculado las puntuaciones en el test. Las puntua
ciones en los tems despus de realizar las transformaciones y en el test aparecen e
n la tabla que se muestra a continuacin. Vamos a ilustrar cmo calcularamos el ndice
de homogeneidad corregido (IHc) del tem 1.
Likert (1932) estudi la relacin entre los resultados producidos por los dos
mtodos de anlisis. Orden un conjunto de tems en funcin de su IH, y los orden tambin e
funcin de la diferencia que los dos grupos extremos mostraban en cada tem. La rel
acin entre los dos rdenes fue estimada mediante el coeficiente de correlacin rho, q
ue present un valor de 0.91. Este resultado indica un grado de relacin muy alto en
tre los dos rdenes obtenidos, lo cual sugiere que los dos mtodos de anlisis tienden
a producir resultados similares. Esto no es de extraar, ya que si un tem presenta
un elevado IH, los sujetos que puntan alto en el tem tendern a puntuar alto en el
test, y los sujetos que puntan bajo en el tem tendern a puntuar bajo en el test. Y
viceversa: el grupo con puntuaciones altas en el test tender a mostrar puntuacion
es altas en el tem, y el grupo con puntuaciones altas en el test tender a mostrar
puntuaciones altas en el tem. Sin embargo, hay que tener en cuenta que Likert cor
relacion rdenes de clasificacin (esto es, rankings), y que los rdenes no informan ac
erca de si un determinado criterio de anlisis es superado o no (por ejemplo: IHc
? 0.20). Por ello, aunque los resultados de ambos tipos de anlisis estn relacionad
os, pueden no conducir necesariamente a la misma conclusin (McIver y Carmines, 19
81). As pues, cuando se han aplicado los dos tipos de anlisis es conveniente elimi
nar los tems que tengan IHc bajos y los que no discriminen entre los grupos con p
untuaciones extremas en el test. Estos tems son los tems indiferenciadores.
Likert (1932) seal algunas de las razones por las que un tem puede resultar
indiferenciador:
a. Puede medir una actitud diferente a la que miden el resto de tems.
b. Puede ser respondido por casi todos los sujetos de la misma forma.
c. Puede estar redactado de manera que no sea entendido correctamente.
d. Puede tratarse de un enunciado de hecho.
3.4. Evaluacin de la fiabilidad y validez de la escala.
Una vez se ha seleccionado un conjunto de tems, hay que evaluar las propi
edades psicomtricas del test o cuestionario que forman considerado como un todo.
Las dos propiedades psicomtricas ms importantes son la fiabilidad, y la validez2.
Para que un test sea un instrumento de medida til hay que demostrar su fiabilidad
y su validez. Brevemente, sealaremos que la fiabilidad hace referencia al grado
de precisin que ofrecen las medidas obtenidas mediante un test. Supone tambin un i
ntento por cuantificar el grado de error que afecta a esas medidas. Un mtodo bast
ante extendido para estimar la fiabilidad de un test consiste en calcular el coe
ficiente alfa de Cronbach, cuya frmula es la siguiente:
donde n es la longitud del test (es decir, el nmero de tems que lo componen), S2i
es la varianza del tem i, y S2x es la varianza que muestran las puntuaciones tota
les en el test. Un criterio bastante extendido para interpretar el coeficiente a
lfa es que ste ha de ser igual o superior a 0.70 (Nunnally, 1978), entonces puede
afirmarse que el test tiene una fiabilidad suficiente.
Ejemplo de clculo.
Con los datos del ejemplo que estamos utilizando, vamos a calcular el co
eficiente alfa del cuestionario de actitudes hacia la escuela. En la primera tab
la que hemos mostrado, aparecen las desviaciones tpicas de cada uno de los cuatro
tems y de las puntuaciones totales en el test. Con esta informacin ya podemos apl
icar la frmula del coeficiente alfa de Cronbach:
El resultado obtenido indica que el cuestionario es fiable.
5. VALORACIN.
Una de las crticas que suele hacerse del mtodo de escalamiento de Likert es
que no est basado en un modelo matemtico determinado. Esta es una diferencia impo
rtante con los mtodos desarrollados por Thurstone, que bas sus mtodos en una serie
de supuestos formales y unas leyes (por ejemplo, la Ley del Juicio Comparativo).
En todo caso, el mtodo de Likert puede emnarcarse dentro del mbito ms general de l
a Teora Clsica de los Tests.
Otra crtica se refiere al uso del coeficiente de correlacin tem-test (ndice d
e homogeneidad) como base para realizar el anlisis correlacional de los tems. Ya h
emos sealado que para evitar aumentar artificialmente esa correlacin es necesario
utilizar el ndice de homogeneidad corregido.
La verificacin de la unidimensionalidad del test tambin presenta ciertas de
ficiencias. Likert (1932) supona que una vez se hubiera eliminado todos los tems i
ndiferenciadores, los tems restantes mediran una misma dimensin subyacente o actitu
d. Sin embargo, esto no tiene que ser necesariamente as. Si un test mide dos acti
tudes diferentes pero relacionadas, los IHc sern probablemente elevados, y llevarn
a la conclusin errnea de que los tems miden una nica actitud. El clculo de los IHc n
o es una buena base para evaluar la unidimensionalidad del test. En su lugar hay
que utilizar mtodos ms apropiados como el anlisis factorial.
Recordemos que Likert pretenda desarrollar un mtodo sencillo para medir las
actitudes que ofreciera resultados similares al mtodo ms costoso de los intervalo
s aparentemente iguales desarrollado por Thurstone. Likert (1932) observ que la f
iabilidad de los cuestionarios producidos por los dos mtodos era muy similar, y q
ue la correlacin entre las puntuaciones obtenidas por los dos mtodos era muy eleva
da. Estos resultados muestran que Likert consigui su objetivo. Quizs lo que no pre
vi Likert es que su mtodo tuviera tanto xito. Su relativa sencillez, en comparacin a
otros mtodos ms modernos, es la responsable de que actualmente sea todava el mtodo
ms utilizado para medir actitudes, dimensiones de la personalidad, y otros constr
uctos psicolgicos.
BIBLIOGRAFIA.
Arce, C. (1994). Construccin de escalas psicolgicas. Madrid: Sntesis.
Garca Cueto, E. (1993). Introduccin a la psicometra. Madrid: Siglo XXI.
Meli, J. L. (1991). Mtodos de escalamiento unidimensional. Valencia: Cristbal Serra
no Villalba.
Sancerni, M. D.; Meli, J. L.; Gonzlez Rom, V. y Daz, J. V. (1992). Psicometra: Proble
mas y Prcticas. Valencia: Cristbal Serrano Villalba.
Wainerman, CH (1976) Escalas de medicin en Ciencias Sociales. Buenos Aires: Nueva
Visin.
Referencias bibliogrficas.
Andrich, D. & Schoubroeck, L. (1989). The General Health Questionnaire: a psycho
metric analysis using latent trait theory. Psychological Medicine, 19, 469-485.
Andrich, D.; Jong, J. y Sheridan, B. E. (1997). Diagnostic opportunities with th
e Rasch model for ordered response categories. En J. Rost y R. Langeheine (Eds.)
, Applications of latent trait and latent class models in the social sciences (p
p. 58-68). Mnster, Germany: Waxman Verlag.
Bock, R. y Jones, L. V. (1968). The measurement and prediction of judgement and
choice. San Francisco: Holden Day.
Dubois, B. y Burns, J. A. (1975). An analysis of the meaning of the question mar
k response category in attitude scales. Educational and Psychological Measuremen
t, 35, 869-884.
Edwards, A. L. (1957). Techniques of attitude scale construction. New York: Appl
eton-Century-Crofts.
Espejo, B. y Gonzlez-Rom, V. (1999). El significado de las categoras centrales en l
as escalas tipo Likert. Trabajo presentado al VI Congreso de Metodologa de las CC
. Sociales y de la Salud. Oviedo, Espaa.
Espejo, B. y Gonzlez-Rom, V. (2001). Orden y relevancia de las alternativas de res
puesta "no estoy seguro", "trmino medio" y "?". Trabajo presentado al VII Congres
o de Metodologa de las CC. Sociales y de la Salud. Madrid, Espaa.
Hernndez, A.; Espejo, B.; Gonzlez-Rom, V. y Gmez-Benito, J. (en prensa). Escalas de
respuesta tipo Likert: es relevante la alternativa indiferente ?. Metodologa de Encu
estas
Kaplan, K. J. (1972). On the ambivalence-indifference problem in attitude theory
: A suggested modification of the semantic differential technique. Psychological
Bulletin, 77, 361-372.
Likert, R. (1932). A technique for the measurement of attitudes. Archives of Psy
chology, 140, 1-50. (Traduccin al castellano en C. H. Wainerman (Comp.) (1976), E
scalas de medicin en ciencias sociales, pp-199-260. Buenos Aires: Nueva visin.
McIver, J. P. y Carmines, E. G. (1981). Unidimensional scaling. Beverly Hills, C
A: Sage.
Neumann, L. (1979). Effects of categorization on relationships in bivariate dist
ributions and applications to rating scales. Dissertation Abstracts Internationa
l, 40, 2262-B
Nunnally, J. C. (1978). Psychometric theory. New York: McGraw-Hill.
Peters, C. C. y Van Vorhis, W. R. (1940). Statistical procedures and their mathe
matical bases. New York: McGraw-Hill.
Sudman, S. y Bradburn, N. M. (1989). Measuring attitudes: recording responses. E
n Sudman, S. y Bradburn, N. M. (Eds.). Asking questions: a practical guide to qu
estionnaire design. San Francisco: Jossey-Bass Publishers.
Worthy, M. (1969). Note on scoring midpoint responses in extreme response style
scores. Psychological Reports, 24, 189-190.
--------------------------------------------------------------------------------------------------------------------------------------------------