Sie sind auf Seite 1von 10

Avances en Medicin, 6, 1726

2008

ESCALAS O NDICES PARA LA MEDICIN DE CONSTRUCTOS: EL


DILEMA DEL ANALISTA DE DATOS
Eiliana Montero Rojas*
Universidad de Costa Rica, Costa Rica

Resumen
Se intenta disipar algunas de las mayores confusiones existentes entre los analistas de datos en relacin con la
naturaleza de los ndices y las escalas y tambin en relacin con la metodologa para su construccin. Se definen
conceptos clave y se listan siete diferencias fundamentales entre ndices y escalas. Estas son: El nmero de
componentes o dimensiones representados en el indicador, el para qu (propsito) del indicador, la utilizacin de
mtodos psicomtricos, el peso o ponderacin de los tems o reactivos, el tratamiento de los valores faltantes
(missing), la necesidad de estandarizar estadsticamente la medida y el grado de interpretabilidad. A lo largo de
todo el documento se dan ilustraciones utilizando ejemplos reales. Se espera que esta discusin contribuya a una
toma de decisiones informada por parte de los profesionales que trabajan analizando y/o construyendo este tipo de
medidas y por parte de aquellos que deben usarlas o analizarlas ocasionalmente.
Palabras clave: Escalas, ndices, constructos

Abstract
An attempt is made to dissipate some of the major confusions among data analysts regarding the nature of scale
and indexes, and also the methodology for their construction. Key concepts are defined and seven basic
differences between indexes and scales are listed. They are: the number of components or dimensions represented
in the indicator, the purpose of the indicator, the use of psychometric methods, the weights assigned to the items
or reactives, the treatment of the missing values, the need for statistical standardization and the degree of
interpretability. Throughout the document illustrations are provided with real examples. It is hoped that this
discussion contributes to an informed decision making by the professionals that work analyzing and/or
constructing this type of measures and by those who have to use them or analyze them occasionally.
Key words: Scales, indexes, constructs.

Introduccin
El objetivo bsico de este documento es contribuir a disipar algunas de las mayores confusiones existen
entre los investigadores sociales y analistas de datos en relacin con la naturaleza de los ndices y escalas
y tambin en torno a la metodologa para su construccin y validacin.
Esta temtica posee relevancia dado que se presentan frecuentemente instancias reales que ilustran
problemas metodolgicos en la elaboracin e interpretacin de ndices y escalas. En ciertas ocasiones, al
conocer slo de manera superficial el enfoque psicomtrico, algunos investigadores novatos intentan
obtener, por ejemplo, la medida de confiabilidad Alpha de Cronbach para todas las preguntas de un
cuestionario, aun cuando se trate de grupos distintos de reactivos que intentan representar diferentes
constructos. Otro caso se da cuando se incluyen en el anlisis psicomtrico variables directamente
observables como el sexo y la edad. Estos ejemplos evidencian la necesidad de capacitar a los
investigadores para que puedan distinguir apropiadamente las instancias en que se deben emplear tales
tcnicas psicomtricas y aquellas que requieren otros procedimientos de anlisis para su elaboracin y
validacin.

Instituto de Investigaciones Psicolgicas, Universidad de Costa Rica, San Jos de Costa Rica. Tel: (506) 207-5636. Fax: (506) 2075493. E-mail: emontero@cariari.ucr.ac.cr

18

Montero -Rojas

Asimismo, es tambin frecuente entre investigadores de reas diferentes a la psicologa, o an entre


algunos psiclogos, la aplicacin de instrumentos e interpretacin sustantiva de sus puntajes, sin haber
realizado previamente el necesario proceso emprico para garantizar su validez y confiabilidad. Esto
sucede a veces cuando se trata de medidas que fueron desarrolladas y validadas en otro contexto social o
cultural.
Adems, esta autora ha conocido casos donde investigadores inexpertos de reas como psicologa,
salud y educacin han realizado interpretaciones sustantivas de los puntajes de cada uno de los tems
individuales de una escala, ignorando que en este tipo de medidas el puntaje total es el que representa el
nivel del constructo en cada individuo, y que, por tanto, no tiene sentido interpretar por s mismo cada
tem o reactivo que compone la escala.
Anastasi & Urbina (1998), Babbie (2000), Kerlinger (1988), y Nunnally y Bernstein (1995), son
algunos de los autores ms conocidos que, con ciertas diferencias, han ayudado a estructurar y divulgar los
conceptos y tcnicas desarrollados en este artculo.

Definiciones bsicas
Constructo: Es una conceptualizacin que requiere de un marco terico para ser definido. En general,
las conceptualizaciones que estudian los investigadores cientficos presentan la caracterstica de que no
existe un claro consenso a nivel social en cuanto a cmo definirlos o medirlos, sino que para lograrlo se
debe contar con una teora que los sustente. Otra caracterstica fundamental de los constructos es que no
son directamente observables y su captura a nivel emprico requiere generalmente de rigurosos
procedimientos. (Babbie, 2000; Cortada de Kohan, 2001; Kerlinger, 1988). Y es que es evidente que el
estudio de constructos, rasgos o variables latentes es el pan de cada da en la investigacin social y
psicolgica. Se intentan estudiar y medir rasgos de personalidad, atributos intelectuales, actitudinales, etc.
Ejemplos de constructos son desarrollo humano, violencia de gnero, calidad de vida, actitud hacia
la estadstica, aptitud acadmica, etc.
Indicador: El indicador es la operacionalizacin de una variable o constructo. Debe describir las
operaciones de medicin necesarias para su clculo emprico. En general, es ms fcil definir indicadores
para medir variables, comparados con la medicin de constructos. Por ejemplo, la edad se puede medir
con el indicador nmero de aos cumplidos de vida, mientras que la medicin de un constructo como
ansiedad requiere de procedimientos ms sofisticados, menos obvios y que se reporten de manera ms
rigurosa sus evidencias de validez. (Babbie, 2000; Kerlinger, 1988).
ndice: El ndice es un tipo especial de indicador. Es una medida compuesta que relaciona variables o
constructos de diferente naturaleza. (Gmez, 1997). Quiz algunos de los ndices ms conocidos son los
ndices de precios, en los cuales se relacionan precios y cantidades de artculos o bienes. Otro de los
ndices ms conocidos es el ndice de Desarrollo Humano de las Naciones Unidas, que relaciona, en una
sola medida, tres constructos diferentes: Educacin, medida por dos indicadores: tasa de alfabetismo y
tasa de matriculacin combinada; longevidad, medida por la esperanza de vida; y poder adquisitivo,
medido por el indicador ingreso anual per cpita en dlares. (United Nations Development Programme,
2007).
Escala: La escala es tambin una medida compuesta, pero slo relaciona variables de la misma
naturaleza y, en general, se usa para medir constructos complejos como actitudes, valores, habilidades
intelectuales y rasgos de personalidad. En psicologa se han diseado muchas escalas para medir rasgos de
personalidad como estabilidad emocional (neuroticismo), introversin, empata, etc. y tambin habilidades
intelectuales. (Nunnally & Bernstein, 1995; Anastasi & Urbina, 1998; Martnez, 2005).

Escalas o ndices en la medicin de constructos

19

En general, tendemos a usar ms los ndices que las escalas en nuestro trabajo estadstico, quiz porque
para construir apropiadamente una escala es necesario un manejo exhaustivo del marco de referencia
terico que permite definir el constructo a medir. Ejemplos de ndices son:
a. El Promedio de Admisin a la Universidad de Costa Rica. Es un ndice porque relaciona dos
variables de claramente diferente naturaleza: el promedio de notas de los dos ltimos aos de la educacin
secundaria y el puntaje en una prueba de Aptitud Acadmica o Prueba de Admisin de dicha Universidad.
Actualmente ambos componentes tienen la misma ponderacin en el Promedio de Admisin, o sea cada
uno representa el 50% del Promedio de Admisin.
b. ndice de Desarrollo Humano. Como ya se mencion antes, el ndice de Desarrollo Humano
relaciona tres constructos diferentes: Educacin, longevidad y poder adquisitivo. Hay dos indicadores para
Educacin y un indicador respectivamente para cada una de las otras dos dimensiones. Los tres
componentes tienen el mismo peso en el ndice, es decir cada uno contribuye con un tercio al valor del
ndice.
c. Nota final en un curso de Estadstica. Es un ndice cuando para su clculo se usan indicadores de
diferentes dimensiones como por ejemplo, notas de exmenes, notas de presentaciones orales, notas de
trabajos en grupo. Por el contrario, podra ser considerado una escala si slo relacionara, por ejemplo,
notas de exmenes y se pudiera asegurar que lo que se pretende medir con esas pruebas es
fundamentalmente un nico constructo. De todas formas, en este ltimo caso habra que definir
claramente cul es el rasgo que se pretende medir.
d. Indicadores indirectos de nivel socioeconmico. Sucede con estos algo similar que con el anterior.
Si podemos vlidamente argumentar que el conjunto de preguntas, tems o reactivos que componen el
indicador de nivel socioeconmico efectivamente estn midiendo un slo constructo terico con ese
nombre, entonces diramos que es una escala, de otra manera sera un ndice. Un ejemplo de escala
socioeconmica fue la que se us hace algunos aos en una investigacin sobre factores asociados al
rendimiento acadmico en la Universidad de Costa Rica. Se pregunt a una muestra aleatoria de
estudiantes acerca de la tenencia o no en su ncleo familiar directo, de los siguientes artculos o servicios:
Televisin por cable o satlite, agua caliente en toda la casa, vehculo (no de trabajo), computadora,
acceso a Internet (desde la casa), telfono celular y pertenencia a un club de recreacin privado. Luego,
con los datos recolectados se realiz un anlisis factorial que mostr evidencia clara de un solo factor o
dimensin subyacente, por lo podemos llamarla escala socioeconmica. (Montero, Villalobos & Valverde,
2007).
e. ndice de Calidad de Vida en nios con enfermedades terminales. Este es un ejemplo que se deriva
de una consultora en que particip esta autora. Es un ndice, ya que relaciona tres dimensiones de
diferente naturaleza: (a) Aspectos mdicos, (b) Aspectos de la cuidadora del nio(a), y (c) Aspectos del
medio ambiente del nio(a). Los aspectos mdicos y los aspectos de la cuidadora a su vez representan
escalas. (Ziga & Montero, 2007).

Diferencias entre ndices y escalas


Pasemos ahora a comentar las principales diferencias entre ndices y escalas, habiendo ya definido cada
uno de estos.
1. En la escala est ms claramente definido el constructo, y se supone una sola dimensin subyacente.
Por el contrario, en el caso del ndice se puede trabajar con constructos y variables definidos menos
claramente desde el punto de vista terico, tales son los casos descritos anteriormente de las notas finales
de un curso y el indicador de nivel socioeconmico. Usamos ndices, en general, para medir estas

20

Montero -Rojas

dimensiones y nos preocupamos menos por la definicin terica de los constructos. En el primer caso el
constructo podra ser rendimiento acadmico y en el segundo nivel socioeconmico. En ambas
situaciones deberamos contar con un marco terico que permitiera definir si se trata efectivamente de un
constructo, pero en la prctica sucede que muchas veces no contamos con ese marco de referencia o no lo
construimos. Pero si se quisiera llamar escala a cualquiera de esas medidas compuestas, deberamos
poder argumentar que los tems as llamados estn midiendo efectivamente un constructo terico llamado
nivel socioeconmico o rendimiento acadmico.
En este contexto, adems de la teora, una herramienta muy til para ayudarnos a dilucidar la estructura
subyacente en un grupo de indicadores o tems es el anlisis de factores. Esta tcnica de la estadstica
multivariada puede utilizarse una vez que se han recolectado datos empricos, para arrojar luz sobre si lo
que se est midiendo con el instrumento es un ndice o una escala. Si claramente la estructura factorial
apunta hacia una dimensin, componente o factor, entonces podemos concluir que hay evidencia de que
los tems componen una escala, si la medida se construy con ese fin.
2. Debido a que la escala trata de medir un slo constructo terico es ms til para ser usada con
propsitos de diagnstico. Precisamente en el caso de la escala vamos a tener mayor claridad en trminos
de lo que est midiendo y de cmo interpretar valores altos o bajos en los puntajes. Si el constructo es
Actitud hacia la estadstica y Juan y Mara tienen ambos 20 puntos en la escala podemos concluir que
ambos presentan la misma intensidad en trminos del constructo. Por el contrario, en el caso de un ndice,
como el de Desarrollo Humano, dos pases pueden exhibir el mismo valor en el ndice pero tener muy
diferentes combinaciones de los tres componentes. Por ejemplo, el pas A podra tener valores altos en el
Producto Interno Bruto (PIB) per Cpita y bajos valores en los indicadores de Educacin, y el pas B
podra exhibir valores altos de los indicadores de educacin y valores bajos en el PIB per Cpita. An as
los dos podran tener el mismo valor en el ndice de Desarrollo Humano. De esta manera decimos que los
ndices, en general, tienen menos valor diagnstico, debido a que estamos combinando variables y
constructos de diferente naturaleza y por ello su interpretabilidad es menor que la de las escalas. En este
contexto entendemos interpretabilidad como la capacidad que posee un indicador para poder inferir, a
partir de sus valores, un sentido o explicacin terica, en trminos de sus constructos subyacentes.
3. En general, en las escalas es recomendable y necesario el uso de mtodos psicomtricos para
establecer evidencias de su grado de validez y confiabilidad. Una de las medidas ms importantes que
podemos usar para establecer el grado de confiabilidad de una escala es el Alpha de Cronbach, que mide
la confiabilidad desde el punto de vista de la consistencia interna del instrumento. Pero para su correcta
aplicacin se requiere que el instrumento sea unidimensional, es decir que est midiendo una sola cosa, tal
como en las escalas. Los ndices, por definicin, estn mezclando en una sola medida compuesta variables
de diferente naturaleza, y por tanto, sera errado tratar de usar el Alpha de Cronbach para establecer su
grado de confiabilidad. En el caso de las escalas, por el contrario, estos mtodos son los ms apropiados.
Un ejemplo de este tipo de anlisis se presenta en el cuadro 1, en donde se muestra la salida del
procedimiento RELIABILITY del SPSS en la depuracin de la escala mencionada anteriormente para
medir la dimensin de Aspectos Mdicos como componente del ndice de Calidad de Vida en nios con
enfermedades terminales. A partir de la Tabla 1 y observando los valores del ndice de discriminacin y la
columna Alpha al eliminar el item, podemos concluir que los tems M2, M7 y M9 deberan eliminarse de
la escala para lograr mayores niveles de confiabilidad.
De esta forma, los mtodos psicomtricos nos proveen de poderosas herramientas para dotar de calidad
tcnica a las escalas que construimos. En este caso especfico nos permiten construir escalas de alta
confiabilidad. Desafortunadamente el uso de la psicometra es menos apropiado en el caso de los ndices,
precisamente porque no se cumple con el supuesto fundamental de unidimensionalidad. Por el contrario,
la construccin de ndices y el anlisis de su calidad tcnica requiere ms del concurso de expertos para
definir y analizar sus dos propiedades fundamentales: validez y confiabilidad.

Escalas o ndices en la medicin de constructos

21

Tabla 1.
Resultados iniciales del anlisis de tems para la escala de Aspectos Mdicos1
Nombre de la variable
M1 Tiempo de diagnstico
M2 Dolor
M3 Presencia de sntomas estresantes
M4 Estado de conciencia
M5 Integridad fsica del paciente
M6 Actividad motora
M7 Respiracin
M8 Alimentacin
M9 Medicamentos
M10 Vas de aplicacin de medicamentos

Promedio

Desviacin
estndar

,7131
2,2623
1,2295
2,4918
1,2951
1,2377
2,6148
1,7541
2,7623
2,2377

1,024
,960
,869
,730
1,026
1,005
,776
1,215
,515
1,260

Indice de
discriminacin
,389
,018
,442
,413
,508
,556
,136
,652
,132
,465

Alpha al eliminar
el tme
,692
,749
,685
,692
,670
,662
,726
,635
,722
,678

Alpha de Cronbach= 0.7163. Fuente: Montero, E. (consultora)

4. En las escalas generalmente todos los tems o reactivos tienen el mismo peso y estn respondidos
con el mismo tipo de categoras. Precisamente porque todos los reactivos, tems o preguntas estn
dirigidos a medir el mismo constructo, en general se construyen usando el mismo formato y las mismas
categoras de respuesta, que pueden ser dicotmicas (SI-NO), ordinales tipo Likert de frecuencia (Desde
Siempre o Casi siempre hasta Nunca o Casi nunca), ordinales tipo Likert de grado de acuerdo (Desde Muy
de acuerdo hasta Muy en desacuerdo) o, correcto-incorrecto, en el caso de pruebas para medir habilidades
intelectuales. En los ndices no sucede lo anterior, precisamente porque las variables que se combinan son
de diferente naturaleza. En el caso del ndice de Desarrollo Humano, por ejemplo, algunos indicadores son
porcentajes (la tasa de alfabetismo y la tasa de matriculacin combinada), otros estn dados en aos
(Esperanza de Vida) y otros en dlares (PIB Per Cpita anual). Conviene aclarar aqu que las medidas
llamadas tasa de alfabetismo y tasa de matriculacin combinada son en realidad porcentajes pues
relacionan una parte con su totalidad; sin embargo, por convencin, tradicionalmente se les ha llamado
tasas.
En las escalas es inusual asignar diferentes ponderaciones a los tems. En general, todos los reactivos
van a tener la misma ponderacin en la medida compuesta que representa el puntaje en el constructo y en
este caso esa medida compuesta no es otra cosa que la suma simple de los puntajes de los tems, una vez
que se han recodificado aquellos sea necesario para garantizar que todos queden con sus puntajes
alineados en la misma direccin (es decir, representando, por ejemplo bajos niveles del constructo con
puntajes bajos y altos niveles del constructo con puntajes altos). No hay gran necesidad de ponderar para
que todos tengan el mismo peso en la escala, pues, como se mencion antes, en general van a tener el
mismo formato y las mismas categoras de respuesta.
Por el contrario, la decisin de cmo ponderar cada uno de los componentes de un ndice es quiz una
de las ms importantes decisiones que se deben tomar durante su construccin. Aunque existen diferentes
criterios para asignar las ponderaciones o pesos a las variables del ndice, debemos decir aqu que el
marco terico y el juicio experto son fundamentales en este proceso de asignacin de ponderaciones.
5. El tratamiento de los valores faltantes es ms fcil de resolver en las escalas, puesto que podemos
usar los datos de los otros componentes o tems de la escala para estimar o imputar lo que el sujeto habra
respondido, dado que todos los tems estn midiendo el mismo constructo y es razonable pensar que el
sujeto seguir en ese tem la tendencia que mostr en los valores que s respondi. Por el contrario, si en el

22

Montero -Rojas

ndice se presentan valores faltantes, se deben seguir procedimientos clsicos estadsticos tales como la
sustitucin por la media del conjunto de datos, porque no se puede suponer que el sujeto va a seguir, en el
valor faltante, la misma tendencia que exhibe en los otros componentes del ndice (son constructos o
variables de diferente naturaleza). Resulta entonces ms difcil la imputacin. Desde este punto de vista
son ms vlidos los procedimientos para realizar dicha imputacin, si se puede asegurar que efectivamente
todos los reactivos son expresin del mismo constructo subyacente y deben seguir, por tanto, la misma
tendencia. Sin embargo, cabe comentar aqu que muchos paquetes estadsticos tradicionales como el SPSS
no dan la opcin de sustituir los valores faltantes siguiendo la tendencia del individuo en vez de la
tendencia del grupo, por lo que la sustitucin de valores faltantes para una escala puede volverse una
tediosa tarea para el analista.
6. La estandarizacin estadstica (transformar linealmente las medidas para que tengan un promedio de
cero y desviacin estndar igual a uno) es un paso indispensable en la creacin de los ndices,
precisamente porque es necesario eliminar el efecto de las magnitudes y de las unidades de medida en
cada uno de los indicadores, previo a su combinacin en una sola medida compuesta. Al estandarizar cada
uno de los componentes del ndice nos aseguramos que todos ellos estarn dados en las mismas unidades
(desviaciones estndar por arriba o por debajo del promedio), para luego combinarlos apropiadamente y
darles las ponderaciones o pesos convenientes. El proceso de estandarizacin estadstica es menos
necesario en las escalas, porque como ya fue explicado antes, usualmente todos los tems de una escala
estn en el mismo formato y utilizan las mismas categoras de respuesta. Valga aclarar en este punto que
cuando hablamos aqu de estandarizacin estadstica no nos estamos refiriendo al llamado proceso de
estandarizacin de un instrumento, trmino muy utilizado en psicologa y que involucra estudios de
validez y confiabilidad para poblaciones especficas, el establecimiento de baremos y estndares de
interpretacin para sus puntajes.
7. Interpretabilidad. Como ya fue comentado antes, las escalas resultan ms claras de interpretar pues
estn representando una sola dimensin o constructo. De hecho, el propsito fundamental de una escala es
lograr una aproximacin vlida al nivel que exhibe el examinado en el constructo de inters.

Cmo decidir entre un ndice o una escala?


Enfrentado con la disyuntiva de construir un ndice o una escala, el analista de datos debe considerar,
primeramente, el propsito sustantivo de la medida. Esperamos que analizando las siete diferencias que se
enunciaron en la seccin anterior se puedan tomar decisiones ms acertadas tanto desde el punto de vista
terico como metodolgico. Debe enfatizarse aqu que los ndices son muy buenos como medidas
resumen y medidas sumativas, pero que sus problemas inherentes de interpretabilidad los hacen menos
atractivos para propsitos de diagnstico. Por ejemplo el Promedio de Admisin no se puede usar para
hacer diagnsticos en cuanto a la capacidad de aprendizaje de un estudiante ni tampoco para decir qu
carrera debera estudiar. Igualmente observando solamente el valor del ndice de Desarrollo Humano no
podramos identificar si un pas determinado necesita invertir ms en educacin, infraestructura de salud o
generacin de produccin o fuentes de empleo. La clave es usar la herramienta correcta para cada
propsito.

Interpretaciones de normas o de criterios


Otro tema asociado que adems es poco conocido en Estadstica es el tema de los modelos de
interpretacin de puntajes. En este caso hablamos de dos esquemas bsicos: el modelo de interpretacin
con referencia a normas y el modelo de interpretacin con referencia a criterios. En el caso del modelo de
normas, la interpretacin se basa en la posicin relativa del puntaje especfico en relacin con los dems.
En este tipo de modelos los puntajes no se interpretan en trminos de estndares absolutos, como s es el
caso de medidas creadas bajo un modelo de criterios. Por ejemplo, en el caso del ndice de Desarrollo

Escalas o ndices en la medicin de constructos

23

Humano, sabemos que un pas con un valor de 0.95 en el ndice exhibe mayor desarrollo humano que uno
con un valor de 0.85, pero decir por ejemplo que un pas con un valor de 0.95 est cerca del Desarrollo
Humano mximo, dado que el valor ms alto que puede tomar el ndice, por construccin, es 1, es una
interpretacin que requiere de ms elementos tericos y sustantivos para poder sustentarse
adecuadamente.
Los ndices y escalas no necesariamente presentan diferencias en trminos de ser ms susceptibles unos
u otros para cierto tipo de interpretacin, aunque por su misma naturaleza pareciera que las escalas pueden
de forma ms razonable pensarse ms apropiadas para intentar interpretaciones de criterio, que suelen,
evidentemente, ser las ms exigentes.

Ejemplo 1: ndice de calidad de vida para nios con enfermedades terminales


Un equipo de profesionales, liderado por el Dr. Juan Irola del Hospital de Nios en San Jos Costa
Rica, construy una versin del instrumento para ser aplicada en una prueba piloto. El instrumento incluye
tres dimensiones: Aspectos mdicos, aspectos de la cuidadora y aspectos del medio ambiente. La prueba
piloto incluy una muestra de 63 nios, cada uno de ellos recibi puntuaciones dos veces en cada
dimensin, estas puntuaciones fueron asignadas por distintos examinadores calificados profesionalmente,
que adems haban recibido instrucciones previas en trminos de cmo usar el instrumento.
En Aspectos Mdicos y Aspectos de la Cuidadora, por tratarse de escalas, cada una originalmente con
10 tems, se aplicaron procedimientos derivados de la teora psicomtrica para establecer su grado de
consistencia interna (ndice de discriminacin y Alpha de Cronbach). Con base en estas medidas se tom
la decisin de eliminar algunos tems. El indicador de Aspectos del Medio Ambiente es un ndice y por
eso no se utilizaron mtodos psicomtricos. Tambin se calcul la correlacin entre los puntajes totales
otorgados por los dos examinadores de cada nio como un indicador de la concordancia entre jueces,
obtenindose valores mayores a 0.8.
Se gener la calificacin en cada una de las tres dimensiones dividiendo el total de puntos logrados
entre el nmero mximo de puntos posible en el instrumento. El ndice de calidad de vida se calcul
haciendo un promedio ponderado de las tres dimensiones, dando doble ponderacin a los aspectos
mdicos.
Se debati en trminos de cmo establecer los baremos o estndares para la calificacin, si utilizando
un modelo de normas o de criterios. Finalmente se decidio seguir un modelo de criterios y el equipo de
profesionales, basado en sus propios conocimientos y experiencia, estableci los siguientes parmetros de
interpretacin absoluta para el ndice: Menos de 50%: Calidad de Vida baja; 50 a 75%: Calidad de Vida
media, y, ms de 75%: Calidad de Vida alta. (Ziga & Montero, 2007).

Ejemplo 2: Un ndice de educacin para jvenes en riesgo social


Como parte de una evaluacin de un programa para generar empleabilidad en jvenes de comunidades
en situacin de exclusin social, se deseaba construir un indicador de resultado que permitiera monitorear,
a lo largo del tiempo, el comportamiento de la dimensin Educacin en este tipo de poblacin.
Educacin es uno de los componentes del constructo Empleabilidad, que en trminos sencillos, puede
definirse como todas aquellas capacidades que le dan oportunidades a una persona de insertarse
laboralmente.
La poblacin meta estuvo compuesta por jvenes entre 13 y 18 aos de comunidades de bajo nivel
socioeconmico de la regin central de Costa Rica que haban completado la educacin primaria. Los
datos fueron recolectados por medio de una encuesta aplicada a una muestra de 977 jvenes. (Montero,
2006).

24

Montero -Rojas

A partir de la encuesta, las preguntas que se propusieron inicialmente para incluir en el ndice de
educacin fueron las siguientes:
1. Cul fue el ltimo ao de estudios que aprobaste?
2. Cul fue el ltimo ao de estudios que cursaste?
3. En el ciclo lectivo pasado (2003) estuviste estudiando?
4. En este ciclo lectivo (2004) vas a estar estudiando?
5. En general, En el ltimo perodo lectivo que cursaste, cul fue tu promedio de notas en cada una de
las siguientes materias? Para propsitos de control de calidad de la informacin suministrada por el
adolescente, el entrevisador(a) preguntaba tambin si era posible que le mostrara sus reportes de notas, lo
cual frecuentemente sucedi.
6. Cuntas veces tuviste que repetir grados en primaria, en la escuela?
El procedimiento que se sigui en este ejemplo fue el siguiente:
1. Corregir por el efecto de la edad. Primeramente se corrigi el efecto de la edad en aquellas variables
del ndice que estuvieran afectadas por sta. Esto se realiz para las dos primeras variables, aos
aprobados y aos cursados. Lo que se hizo en estos dos casos para eliminar el efecto de la edad del
adolescente fue dividir el valor de la variable entre la edad en aos cumplidos del chico(a), de manera que
se reflejara ms claramente la dimensin que se desea estudiar: Aos aprobados y cursados de educacin
en concordancia con la edad cronolgica.
2. Imputacin de valores faltantes. Para efectos de esta primera aproximacin se trabaj imputando los
valores faltantes con el promedio de la serie. Debe mencionarse que, en ningn caso, los valores faltantes
representaron ms de un 15% de las respuestas.
3. Estandarizar todas las variables. Debido a las diferentes unidades de medida y magnitudes de las
variables del ndice se hizo necesario estandarizarlas a todas, generando variables con promedio 0 y
desviacin estndar igual a 1. Como se anot anteriormente, en general, la estandarizacin previa de las
variables o componentes es una condicin necesaria para la correcta construccin de un ndice.
4. Obtener el ndice bruto como el promedio (simple o ponderado) de las variables estandarizadas.
a. Primera aproximacin, promedio simple: En este esquema se le dio exactamente la misma
importancia relativa en el ndice a cada una de las seis variables. Dado que se trabaj con las variables
estandarizadas, el ndice vino dado, sencillamente, por el promedio simple de las seis variables y de esta
manera todas tuvieron el mismo peso en el ndice.
b. Segunda aproximacin, promedio ponderado: Debido a que, segn la opinin de esta autora y de
acuerdo con el marco terico, no todas las variables tienen la misma importancia como indicadores de la
dimensin Educacin, se decidio ensayar una segunda aproximacin con el siguiente esquema de
ponderaciones: Variable 1 (aos aprobados): 0.3, Variable 2 (aos cursados): 0.15, Variable 3 (estudiando
ao pasado): 0.1, Variable 4 (estudiando este ao): 0.1, Variable 5 (promedio de notas): 0.25 y Variable 6
(veces repiti primaria): 0.1. De tal forma que el ndice vino dado por un promedio ponderado de las seis
variables, reflejando el peso relativo que se deseaba dar a cada una de acuerdo con consideraciones
sustantivas.
5. Estandarizar el ndice bruto. El ltimo paso en el proceso implic estandarizar el ndice bruto, de
manera que el promedio fuera igual a cero y la desviacin estndar igual a 1. De esta manera se facilitan

Escalas o ndices en la medicin de constructos

25

enormemente las interpretaciones, pues se sabe que los valores particulares del ndice nos indican a
cuntas desviaciones estndar, por encima o por debajo del promedio, se encuentran los individuos
especficos. Como es evidente, en este caso se buscaba una interpretacin referida a normas. La tabla 2
presenta las estadsticas descriptivas de las variables del ndice, an sin estandarizar.
Tabla 2
Estadsticas descriptivas de las variables del ndice (sin estandarizar)
Frecuencia

Mnimo

Mximo

Media

Desviacin
estndar

Aos aprobados

972

,06

,72

,479

0,083

Aos cursados

967

,06

,72

,502

0,078

Qu hizo ciclo lectivo 2003

977

,0

1,0

,845

,362

Qu hizo ciclo lectivo 2004

977

,0

1,0

,832

,374

Promedio de notas

839

30,6

100,0

75,962

8,900

Grados repetidos en primaria

977

,0

4,0

,377

,660

Toral

833

Desde el punto de vista de la aplicacin de muchos de los procedimientos de anlisis estadstico, es


conveniente que la distribucin de los puntajes del ndice se aproxime al modelo de la distribucin normal.
(Tabachnick & Fidell, 2001). Es claro que la distribucin observada de los puntajes en la primera
aproximacin (Figura 1a) se desva del modelo normal.
Seguidamente se presenta el histograma correspondiente a la segunda aproximacin (Figura 1b). En
ste se nota un comportamiento de los puntajes ms cercano al del modelo normal. Aunque las
ponderaciones en este caso se eligieron pensando ms bien en criterios tericos y sustantivos, es claro que
tambin contribuyen a darle la forma deseada a la distribucin del ndice. Por todo lo anterior se prefiere
entonces trabajar con el sistema de ponderaciones propuesto en la segunda aproximacin.
(a)

(b)

Zscore(INDICE)

Zscore(INDICE2)

160

100

140

80
120

100

60
80

40

40

F re q u e n cy

F re q u e n cy

60

S td . D e v = 1 .0 0
20

20

S td . D e v = 1 .0 0

M e a n = 0 .0 0
N = 9 7 7 .0 0

M e a n = 0 .0 0
N = 8 3 3 .0 0

.2

.7

.2

.7

.2

-.

.2

.7

-.

-1

-1

.2

.7

.2

Z s c o r e ( IND IC E )

-2

-2

-3

.2

.7

.2

.7

.2

-.

.2

.7

.2

.7

.2

.7

-.

-1

-1

-2

-2

-3

-3

Z s c o r e ( IND IC E 2 )

Figura 1. Histogramas del ndice estandarizado. (a) Primera aproximacin. (b) Segunda aproximacin

26

Montero -Rojas

Conclusin
Finalmente, a modo de conclusin general, debemos resaltar la importancia que reviste para los
investigadores el conocimiento a profundidad del marco conceptual de referencia y las diversas opciones
metodolgicas que existen para la construccin y validacin de ndices y escalas. Debera quedar claro, a
partir de lo mostrado en este artculo, que estas decisiones no pueden tomarse superficialmente. Aunque
hay una variedad de metodologas y tcnicas disponibles, la escogencia de cualquiera de ellas debe
basarse en una decisin informada y fundamentada, que considere igualmente, el propsito o propsitos
de la medida que se desea generar o evaluar.

Referencias
Anastasi, A. & Urbina, S. (1998). Tests Psicolgicos. Mxico: Prentice Hall Hispanoamericana.
Babbie, E. (2000). Fundamentos de la Investigacin Social. Mxico: Thomson.
Cortada de Kohan, N. (2001, Diciembre). Constructos psicolgicos y variables. Psicologa y Psicopedagoga.
Publicacin virtual de la Facultad de Psicologa y Psicopedagoga de la USAL, 2(2). Obtenido de
http://www.salvador.edu.ar/psic/ua1-9pub02-8-03.htm
Gmez, M. (1997). Elementos de Estadstica Descriptiva. San Jos, Costa Rica: EUNED.
Kerlinger, F.N. (1988). Investigacin del Comportamiento. Mxico: McGraw-Hill.
Martnez, M. (2005). Psicometra: Teora de los tests psicolgicos y educativos. Madrid: Sntesis S.A.
Montero, E. (2006). Outcome Evaluation of the Project Stop Exclusion, Create Value: Final Report. Informe final
de investigacin. San Jos Costa Rica: Centro Centroamericano de Poblacin, Universidad de Costa Rica.
Montero, E.; Villalobos, J. & Valverde, A. (2007). Factores institucionales, pedaggicos, psicosociales y
sociodemogrficos asociados al rendimiento acadmico en la Universidad de Costa Rica: un anlisis multinivel.
RELIEVE: Revista Electrnica de Investigacin y Evaluacin Educativa. 13(2), 215-234. Obtenido de
http://www.uv.es/RELIEVE/v13n2/RELIEVEv13n2_5.pdf
Nunnally, J. C. & Bernstein, I. J. (1995). Teora Psicomtrica (3 ed). Mxico, D.F.: McGraw-Hill Latinomericana.
Tabachnick, B. G. & Fidell, L. S. (2001) (4 th ed.). Using Multivariate Statistics. Boston MA: Allyn & Bacon.
United Nations Development Programme (2007). Human Development Report 2007/2008. Fighting climate change:
Human solidarity in a divided world. New York: Palgrave Macmillan.
Ziga, M. & Montero, E. (2007). Teora G: un futuro paradigma para el anlisis de pruebas psicomtricas.
Actualidades en Psicologa. 21(108), 117-144.

Manuscrito recibido en Octubre de 2006


Aceptado para publicacin en Septiembre de 2007

Das könnte Ihnen auch gefallen