Sie sind auf Seite 1von 17

Capítulo seis

Pruebas de inteligencia

Desde el momento de su introducción durante la primera década de este siglo, los tests de inteligencia se han
utilizado con mucha frecuencia en Estados Unidos y otros países, no sólo como una ayuda en la toma de
decisiones académicas, vocacionales y clínicas respecto a las personas, sino también para estudiar diferencias
de grupo en las capacidades mentales. Estos usos de los tests de inteligencia han dado lugar a gran cantidad de
controversias respecto de la naturaleza y significado de la inteligencia y las consecuencias personales y sociales
que se confía dependen de estas pruebas. En los libros de psicología diferencial (Minton y Schneider, 1980;
Willerman, 1979), se han revisado adecuadamente las investigaciones sobre las diferencias en inteligencia
individual y de grupo, de modo que en este capítulo no abordamos este tema extensamente. En su lugar, se
presenta al estudiante una variedad de tests de inteligencia y la forma en que se utilizan. Los tests de
inteligencia no constituyen la ocupación exclusiva de muchos psicólogos practicantes, como sucedía a
principios de siglo, sino que la evaluación de las capacidades mentales es todavía parte de las actividades de los
psicólogos en varios escenarios.

HISTORIA Y TERMINOLOGÍA

El término inteligencia, que en la actualidad es muy común, era casi desconocido en el lenguaje cotidiano de
hace un siglo. Durante la última parte del siglo xix, el filósofo Herbert Spencer y el caballero científico Francis
Galton, motivados por los escritos de Charles Darwin acerca del origen de las diferencias entre las especies,
volvieron a introducir el término latín inteligencia para referirse a las diferencias individuales en la capacidad
mental. Estos hombres y sus seguidores creían que en los seres humanos existe un grado innato de inteligencia
general, que se distingue de las capacidades especiales.
A diferencia de Spencer, Galton no se conformaba con filosofar sobre la naturaleza de la inteligencia.
Intentaba demostrar sus fundamentos hereditarios por medio del estudio de árboles genealógicos y desarrolló
varias pruebas de discriminación sensorial y tiempo de reacción que esperaba midieran los componentes de la
inteligencia. El psicólogo estadounidense James McKeen Cattell estudió en forma extensa éstas y otras pruebas
sensoriomotrices (medidas de la velocidad del movimiento, fuerza muscular, sensibilidad al dolor,
discriminación de pesos y aspectos similares), pero probaron ser relativamente inútiles como indicadores del
logro en el trabajo escolar y otras tareas que se supone requieren de inteligencia.
Por completo diferente del procedimiento analítico para tratar de medir los componentes de la inteligencia
era el planteamiento que adoptó el psicólogo francés Alfred Binet. Al definir la inteligencia como "la capacidad
para juzgar bien, razonar bien y entender bien", Binet y Simón (1916, página 192) sostuvieron que la inteligencia
de una persona se manifiesta en su desempeño en una variedad de tareas y puede medirse por medio de las
respuestas a una muestra de esas tareas. Ya que su trabajo al diseñar las primeras pruebas de inteligencia estaba
motivado por el problema para identificar a los niños con retraso mental en el sistema escolar de París, es natural
que el grupo de pruebas que eligió Binet presentaba muchas tareas del tipo escolar.
Binet y su socio, Simón, publicaron su primer grupo de pruebas de inteligencia (30 pruebas cortas
dispuestas en orden desde la más fácil hasta la más difícil) en 1905. Su trabajo posterior llevó a la publicación en
1908 de una escala de Binet-Simon revisada que consistía en 58 tareas ordenadas por niveles de edad desde los 3
hasta los 13 años. Las tareas estaban agrupadas por niveles de edad y correspondían a lo que la investigación por
parte de Binet señalaba que podían hacer los niños normales de una edad determinada. La edad mental (EM) de
un niño se determinaba por la cantidad de pruebas que resolvía satisfactoriamente en cada nivel; una edad mental
bastante menor que la edad cronológica del niño indicaba retraso mental. Una revisión final de la escala se
publicó en 1911 (cuadro 6-1), pero después de la muerte prematura de Binet durante ese mismo año, Estados
Unidos se convirtió en el escenario para el desarrollo posterior de la prueba de Binet.

lefiniciones de inteligencia

Desde los primeros trabajos de Binet, se han desarrollado muchas pruebas de inteligencia nuevas y han tenido
lugar muchas investigaciones y teorías sobre la naturaleza de la inteligencia. Los educadores han considerado a
la inteligencia como la capacidad para aprender, los biólogos como la capacidad para adaptarse al entorno, los
psicólogos como la capacidad para deducir las relaciones entre los objetos y eventos y los teóricos de la
información como la capacidad para procesar información (Wechsler, 1975). Ciertos escritores se oponen al
término inteligencia con sus connotaciones respecto a que la capacidad mental general es innata y proponen que
se remplace con un término como capacidad académica general o capacidad educativa general.
No todas las pruebas que se estudian en este capítulo se denominan de manera específica tests de
inteligencia; en vez de ello, se proponen como medidas de la capacidad mental general. En este sentido, deben
diferenciarse de las medidas de capacidades especiales que se analizan en el capítulo 7. Sin embargo, la
diferencia entre las pruebas de capacidad mental general (inteligencia) y las pruebas de capacidades especiales
no es muy marcada y ciertas pruebas de capacidad académica descritas en este capítulo podrían corresponder
también las que se mencionan en el capítulo 7.
Los reactivos de las pruebas de inteligencia representan un intento por evaluar las diferencias individuales
en los efectos de las experiencias comunes para casi todas las personas, sobre todo en la cultura occidental. Se
supone que, cuando se exponen a las mismas experiencias, las personas que tienen inteligencia más elevada se
beneficiarán más de éstas que los individuos con inteligencia más baja. Como consecuencia, en la medida en que
las personas que elaboran las pruebas tienen éxito, las diferencias entre las calificaciones que obtienen los
individuos en las pruebas de inteligencia deben ser más una cuestión de variaciones en la capacidad mental
básica que de variaciones en la experiencia.
existe un solo límite de tiempo; en otras pruebas los reactivos se agrupan como conjuntos de subpruebas con
límites de tiempo separados.
La forma más común de clasificar las pruebas de inteligencia es por medio de la dicotomía individual en
comparación con la de grupo. Las pruebas de inteligencia, individuales, son de alguna manera diferentes en su
punto central a las pruebas de inteligencia de grupo, que pueden aplicarse simultáneamente a muchos sujetos.
El punto central de las pruebas individuales es más global o general; su propósito principal es evaluar una
característica general (Tyler y Walsh, 1979). Por otra parte, el punto central de las pruebas de grupo tiende a ser
más limitado: predecir el desempeño académico u ocupacional. Además, aplicar una prueba de inteligencia
individual, por lo general, toma más tiempo que la aplicación de una prueba de grupo. Sin embargo, el
examinador que aplica una prueba individual puede prestar mayor atención al sujeto y, como consecuencia,
alentarlo y observarlo mejor. Además, las calificaciones de las pruebas individuales no son tan dependientes de
la capacidad para leer como aquellas de grupo.
Las ventajas en la aplicación de una prueba de grupo se hacen evidentes en el hecho de que se aplican
muchas más pruebas de grupo que individuales. También, a pesar de lo que han declarado algunos de los
seguidores de las pruebas individuales, las pruebas de grupo no necesariamente son menos confiables y válidas
que las individuales. Cuando el criterio es el aprovechamiento en el trabajo escolar (notas o calificaciones de
pruebas de aprovechamiento), ocasionalmente las pruebas de inteligencia de grupo tienen incluso coeficientes
de validez más altos que las individuales, variando entre .50 y .70.
Las pruebas de inteligencia de grupo se utilizan con más frecuencia para la observación inicial en escuelas
y negocios, para continuar con las pruebas individuales en los casos en que las calificaciones del sujeto son
bajas y/o se requiere mayor información sobre sus fortalezas y debilidades. Los psicólogos prefieren las
pruebas de inteligencia individuales en clínicas, hospitales y otros escenarios donde se realizan diagnósticos
clínicos y donde sirven no sólo como medidas de la capacidad mental general, sino además como medio para
obtener un panorama del funcionamiento de la personalidad y las incapacidades.

TESTS ADMINISTRADOS INDIVIDUALMENTE

Los instrumentos que se derivan del trabajo de Alfred Binet, Lewis Terman y David Wechsler son las pruebas
de inteligencia que se aplican de forma individual más populares. A través de los años, las pruebas que
desarrollaron Terman y Wechsler se han utilizado para evaluar las capacidades intelectuales de niños y adultos
en amplia variedad de circunstancias. Otras pruebas individuales, algunas que representan variaciones o
extensiones de las series de Stanford-Binet y Wechsler, están diseñadas específicamente para evaluar
capacidades mentales de niños y personas con incapacidades lingüísticas y/o físicas.

Antiguas ediciones de la Escala de Inteligencia de Stanford-Binet

En Estados Unidos, se publicaron tres traducciones al inglés y adaptaciones de la escala de Simon-Binet. H. H.


Goddard de la Vineland Training School preparó una, Frederic Kuhlmann de la Universidad de Minnesota
preparó otra y Lewis Terman de la Stanford University la tercera. Terman publicó la más popular de estas
revisiones, la Escala de Inteligencia de Stanford-Binet, en 1916.
La escala de 1916. Al igual que las escalas de Binet-Simon anteriores, la escala de Stanford-Binet de 1916
era una escala de edades en la cual las pruebas se agrupaban en niveles de edad cronológica. Terman seleccionó
reactivos de las escalas de Binet-Simon, así como reactivos por completo nuevos que representaban una amplia
muestra de tareas que presumiblemente requieren inteligencia. Los esfuerzos también se hicieron para incluir
tareas que no eran tan dependientes de las experiencias escolares específicas de aprendizaje.
Un criterio para incluir un reactivo en la escala de Stanford-Binet era que un porcentaje cada vez mayor de
niños en niveles de edad sucesivos debían ser capaces de responderlo correctamente. Por ciertas razones
estadísticas relacionadas con la conservación de una escala de cociente de inteligencia (CI) constante en todos
los niveles de edad, el requerimiento del porcentaje para el pase era más bajo para los reactivos que se incluían
en las subpruebas en los niveles más avanzados que para los reactivos en los niveles inferiores. En cualquier
caso, el criterio del porcentaje de pase servía como medio objetivo para asegurar que cada reactivo de la prueba
se ubicara en los niveles de edad apropiados.
En la escala de Stanford-Binet la edad mental (EM) y el cociente de inteligencia de un sujeto dependía de la
cantidad de subpruebas que se aprobaban en niveles de edad sucesivos. El CI se determinaba dividiendo la edad
mental (EM) del sujeto, el número total de meses de crédito que obtenía en la prueba, por su edad cronológica
(EC) en meses y después multiplicando el cociente resultante por 100. En símbolos, el porcentaje de CI se
calculaba como

Durante muchos años, la Escala de Inteligencia de Stanford-Binet constituyó un estándar contra el cual se
evaluaban otras pruebas de inteligencia. No obstante la prueba tenía varias desventajas. Por ejemplo, la versión
de la escala de 1916 se estandarizó con base sólo en 1,000 niños y 400 adultos. De acuerdo con los estándares
actuales, la muestra no se seleccionó con detenimiento y no era representativa de la población estadounidense de
esa época. Dos desventajas más de la escala de 1916 fueron la insuficiencia para someter a prueba a los adultos
y los niños muy pequeños y la falta de una segunda forma para permitir otra aplicación de la prueba. Por tanto,
en 1937, Terman y su socio, Maud Merrill, publicaron una versión revisada y actualizada de la escala de
Stanford-Binet.

La escala de 1937. La versión de la Escala de Inteligencia de Stanford-Binet de 1937 tenía más suelo y techo
que la escala de 1916, dos formas paralelas (L y M) y una estandarización más adecuada. La escala de 1937 se
estandarizó de modo estratificado en 100 niños en cada intervalo de edad de medio año desde la edad de 1 Vi
hasta 5 Vi, 200 niños de cada intervalo de nivel de edad de 6 a 14 años y 100 personas de cada intervalo de edad
de 15 a 18 años. Se sometieron a la prueba igual cantidad de niños y niñas en 17 comunidades de 11 estados,
pero el muestreo se limitó a individuos blancos nacidos en Estados Unidos quienes, como grupo, tenían una
condición socieconómica arriba del promedio. Como consecuencia, la muestra no era realmente representativa
de toda la población estadounidense.
Se utilizaron tres criterios para incluir un reactivo en la escala: 1) se juzgaba si el reactivo era una medida
del comportamiento inteligente, 2) el porcentaje de niños que respondía de manera correcta al reactivo
aumentaba con la edad cronológica y 3) los niños que aprobaban el reactivo tenían una edad mental media
bastante más alta que aquellos que no lo pasaban. Los reactivos se agruparon en intervalos (niveles) de medio
año desde el Año II hasta el Año V y en intervalos de un año a partir
del Año VI hasta el Año XIV; había también un nivel de Adulto Promedio y tres niveles de Adulto Superior
(Adulto Superior I, II y III). Las seis subpruebas en cada nivel del Año II al Año V otorgaban un crédito de un mes
cada una; del Año VI al Año XIV, las subpruebas otorgaban un crédito de 2 meses cada una y a las seis
subpruebas en los niveles de Adulto Superior I, II y III se les asignaba un crédito de 4, 5 y 6 meses,
respectivamente.
Al someter a prueba a un niño con la escala de Stanford-Binet, el examinador establecía primero la edad
básica en la prueba. La edad basal era el nivel más alto en el cual el niño aprobaba todas las subpruebas. Después,
las pruebas continuaban hasta que se alcanzaba la edad tope, el nivel más bajo en el cual el niño reprobaba todas
las pruebas. La edad mental se calculaba sumando la edad base a la cantidad de créditos que se recibían por pasar
cada subprueba hasta la edad tope. Después, el CI se calculaba mediante la fórmula 6.1.

La escala de 1960. La tercera edición de la Escala de Inteligencia de Stanford-Binet, publicada en 1960,


consistía en una actualización de los mejores reactivos de las formas L y M de la escala de 1937. Al igual que las
anteriores, la tercera edición se utilizaba para medir la inteligencia de individuos desde 2 años hasta la edad
adulta. El procedimiento para aplicar la prueba era similar al de la escala de 1937, aunque se introdujeron ciertos
cambios. Había una subprueba alterna en cada nivel de edad para emplearse cuando no se aplicaban subpruebas
particualares o se aplicaban de manera incorrecta. El tiempo de aplicación también podía reducirse en ciertos
casos al aplicar sólo cuatro pruebas seleccionadas en lugar de seis en cada nivel. Otro cambio fue que se
proporcionaron CIs de desviación. El CI promedio, como cualquier otra norma de edad, no satisfacía los
requerimientos de igualdad de las undidades de edad. Además, no tenía ningún significado cuando se aplicaba a
adultos porque no había una respuesta satisfactoria a la pregunta sobre qué edad cronológica debía utilizarse
como denominador del promedio de EM/EC/ al someter a prueba a los adultos. Se sugirió que los 14,16 y 18 años
constituían la edad en la cual cesa el crecimiento mental y, por tanto, es apropiado utilizarlas como denominador
al calcular el CI. Debido a esos problemas para determinar el CI, se decidió cambiar de un CI de razón a una
escala de CI de desviación con una media de 100 y desviación estándar de 16. En ocasiones, se seguía reportando
la razón CI y en el manual de la escala de Stanford-Binet de 1960 se proporcionaban los cuadros para calcularlo.
El grupo de estandarización para las Formas L-M de la escala de Stanford-Binet de 1960 consistía en 4,500
niños de edades entre 2 Vi y 18 años que presentaron la Forma L o M de la escala de 1937 entre 1950 y 1954. Al
darse cuenta de la necesidad de normas actualizadas, el editor logró que la prueba se aplicara en 1972 a una
muestra nacional estratificada de 2,100 niños (100 niños en cada intervalo de medio año de 2 a 5 Vi años y en cada
intervalo de un año de 6 a 18 años). La muestra fue más representativa de la población general de Estados Unidos
que las muestras normativas anteriores. Con base en la estandarización de 1972, en 1973 se publicó un manual
revisado de la tercera edición (Terman y Merrill, 1973). En este manual se reportaron los coeficientes de
confiabilidad test-retest de más de .90, así como en las primeras dos ediciones, se proporcionaron correlaciones
moderadas con los grados escolares y las calificaciones de las pruebas de aprovechamiento (.40 a .75).

Cuarta edición de la escala Stanford-Binet

Los autores de la cuarta edición de la Escala de Inteligencia de Stanford-Binet (SB-IV) son R. L. Thorndike, E.
Hagen y J. Sattler y la publicó Riverside Publishing Company en 1986. Este instrumento se elaboró tomando en
cuenta las necesidades de los psicólogos clínicos, escolares y de otras áreas, quienes utilizan la información
obtenida de las pruebas de inteligencia. Esta versión más
reciente de la escala de Stanford-Binet conserva una continuidad histórica con las versiones anteriores, pero en
términos de sus bases teóricas y psicométricas, contenido y procedimiento de prueba, presenta una diferencia
comparada con sus predecesoras. Como muchas pruebas modernas, la SB-IV se elaboró mediante el uso de
procedimientos psicométricos avanzados, como la teoría de las respuestas de reactivos (escala de Rasch) y un
análisis que tiene una influencia étnica. Además, se diseñó no sólo para ayudar en la identificación de los
individuos con retraso mental y superdotados, sino también para proporcionar información de diagnóstico con
respecto de incapacidades de aprendizaje específicas. Con respecto de los prejuicios sexuales y étnicos, se
omitieron aquellos reactivos que se juzgó injustos o que mostraban diferencias estadísticas atípicas entre los
sexos o los grupos étnicos.

El modelo teórico y las pruebas Un modelo jerárquico de tres niveles forma la base teórica de la SB-IV. El
modelo consiste en un factor de inteligencia general ( g ) en el primer nivel, tres factores amplios (capacidades
cristalizadas, fluidez en las capacidades analíticas y razonamiento verbal abstracto) en el segundo nivel. Los
factores de razonamiento verbal y cuantitativo en el tercer nivel, comprenden el factor de las capacidades
cristalizadas en el segundo nivel y el factor visual abstracto en el tercer nivel comprende el factor de fluidez en las
capacidades analíticas en el segundo nivel.
Así como las anteriores, la cuarta edición de la escala de Stanford-Binet intenta medir la inteligencia desde
los 2 años hasta la edad adulta. Existen 15 pruebas: de tres a cuatro pruebas en cada una de las tres categorías más
amplias del Nivel 3 (Razonamiento Verbal, Razonamiento Visual/ Abstracto, Razonamiento Cuantitativo),
además de tres pruebas de Memoria a Corto Plazo. Cada prueba está organizada en una serie de niveles que
consisten en dos reactivos cada uno; casi todas las pruebas incluyen reactivos muestra para que los sujetos se
familiaricen con la naturaleza de la tarea específica de la prueba.

Aplicación. El tiempo total de prueba para la escala completa es de 75 minutos aproximadamente, con
variaciones de acuerdo con la edad del sujeto y, por tanto, de la cantidad de pruebas que presenta. La naturaleza
adaptativa o de etapas múltiples de la escala requiere la aplicación de la Prueba de Guía (Vocabulario) en primer
lugar a fin de determinar el nivel de entrada en las otras pruebas. El nivel de entrada en la Prueba de Guía se
determina por la edad cronológica (EC) del sujeto y el nivel básico es el nivel más alto en el cual el sujeto aprueba
ambos reactivos en dos niveles consecutivos. La aplicación de la Prueba de Ruta continúa hasta que el sujeto
reprueba tres o cuatro reactivos en dos niveles consecutivos, el más alto de los cuales es el nivel crítico. El nivel
de entrada para las 14 pruebas restantes se determina a partir de un cuadro mediante una combinación del nivel
crítico en la Prueba de Guía y la EC del sujeto. La aplicación de la prueba comienza en el nivel de entrada y
continúa hacia abajo hasta que el sujeto aprueba ambos reactivos en dos niveles consecutivos y hacia arriba hasta
que reprueba tres o cuatro reactivos en dos niveles consecutivos. El más alto de estos niveles es la edad tope del
sujeto para esa prueba.

Calificación. Las calificaciones brutas en cada una de las 15 pruebas consiste en la cantidad de reactivos
aprobados. Las calificaciones en cada prueba se convierten, en cada grupo de edad, en calificaciones de edad
estándar que tienen una media de 50 y una desviación estándar de 8. Las calificaciones brutas en las cuatro áreas
(Razonamiento Verbal, Razonamiento Visual/Abstracto, Razonamiento Cuantitativo, Memoria a Corto Plazo),
que son la suma de las calificaciones brutas en tres de las cuatro pruebas que comprenden esa área, se convierten
en calificaciones de edad estándar que tienen una media de 100 y una desviación estándar de 16. Por último, una
calificación general compuesta, que consiste en la suma de las calificaciones de las cuatro áreas, se convierte en
escala de calificaciones de edad estándar con una media de 100 y una desviación estándar de 16. El rango de las
calificaciones de edad estándar generales compuestas es de 36 a 164, que equivale a un rango de calificación i de
- 4 a + 4 (véase la figura 6-1).

Estandarización. La cuarta edición de la escala de Stanford-Binet se estandarizó en 5,013 individuos entre los
2 y 23 años 11 meses de edad en 47 estados y el Distrito de Columbia. La muestra de estandarización estaba
formada por48 % de hombres y 52 % de mujeres, 75 % eran de raza blanca, 4 % negros 6 % eran hispanos, 3 %
asiáticos y de las islas del Pacífico y 2 % pertenecían a otros grupos étnicos. Los sujetos que eran estudiantes se
estratificaron también de acuerdo con su posición relativa a su grupo escolar. A pesar de los esfuerzos por
seleccionar una muestra de estandarización que fuera verdaderamente representativa de la población de Estados
Unidos, la muestra contenía cantidades desproporcionadas de individuos con niveles socioeconómicos y
educativos muy elevados. Al calificar la prueba, se hizo el intento de corregir este problema, pero no se logró del
todo. Otros problemas son que los factores que mide la escala no son uniformes en todos los niveles de edad y la
información sobre la confiabilidad que proporciona el manual es insuficiente. Sin embargo, los coeficientes de
división por mitades y test-retest, que se calcularon con base en las medidas obtenidas durante un intervalo de 2 a
8 meses, indican que la confiabilidad de las 15 pruebas, las cuatro áreas y la combinación es satisfactoria.

Pruebas de Wechsler

A pesar de que, desde la revisión de 1937, en la escala de Stanford-Binet se han incluido subpruebas en el nivel de
los adultos, la prueba no era una medida muy satisfactoria de la inteligencia en los adultos. Como consecuencia,
en 1939, David Wechsler, psicólogo del Bellevue Hospital en Nueva York, diseñó una prueba de inteligencia
individual específica para adultos. A esta primera versión de la prueba (la Forma I de la Escala de
Wechsler-Bellevue), Wechsler agregó una segunda forma en 1947 (la Forma II de la Escala de
Wechsler-Bellevue). En 1955, The Psychological Corporation publicó una versión completa y reestandarizada de
la Forma I de la Escala de Wechsler-Bellevue con el nombre de Escala de Inteligencia para Adultos de Wechsler
(WAIS). La WAIS se revisó, se volvió a estandarizar y se publicó una vez más en 1981, con el nombre de Escala
de Inteligencia para Adultos de Wechsler, Revisada (WAIS-R), para evaluar la inteligencia de adultos entre 16 y
74 años de edad.

Escala de Inteligencia para Adultos de Wechsler, Revisada (WAIS-R). Como se describe en el cuadro
6-2, las seis subpruebas verbales (V) y cinco de ejecución (P) de la WAIS-R son Información (V),
Completamiento de Dibujos (P), Retención de Dígitos (V), Ordenamiento de Figuras (P), Vocabulario (V),
Diseño con Cubos (P), Aritmética (V), Ensamble de Objetos (P), Comprensión (P), Símbolos en Dígitos (P) y
Semejanzas (V). Al aplicar la WAIS-R, las subpruebas verbales y de ejecución se alternan en el orden antes
mencionado. En cada subprueba, los reactivos se organizan en orden de dificultad ascendente y una subprueba en
particular se interrumpe cuando el sujeto reprueba una cantidad específica de reactivos en forma sucesiva. La
aplicación de las 11 subpruebas se lleva aproximadamente 75 minutos.
La calificación bruta de un sujeto en cada subprueba de la WAIS-R se convierte en una escala de calificación
estándar que tiene una media de 10 y una desviación estándar de 3. Se llevan acabo sumas separadas de las seis
calificaciones en escala que se obtienen en las subpruebas verbales, las cinco calificaciones en escala de las
subpruebas de ejecución y las calificaciones en escala de las 11
Cuadro 6-2 Descripciones de las subpruebas de la Escala de Inteligencia para Adultos de
Wechsler, Revisada (WAIS-R)

Información. Treinta y tres preguntas de información general que deben responderse con pocas palabras o
números. Las preguntas se organizan en orden de fácil a difícil. La prueba empieza con el reactivo 5; los
reactivos del 1 al 4 se aplican si el sujeto reprueba ya sea el reactivo 5 o el 6. La prueba se interrumpe cuando el
sujeto reprueba siete reactivos consecutivos. Las respuestas se califican con 0 o 1. Los antecedentes familiares
y culturales afectan las respuestas.
Figuras incompletas. Veintisiete figuras en tarjetas, a cada una le falta una parte. Al sujeto se le dan 20 segundos
por figura para indicar qué falta. La prueba empieza con ei reactivo 1 y se interrumpe cuando el sujeto reprueba
siete reactivos consecutivos. Las respuestas se califican con 0 o 1. La prueba se diseñó para medir la agudeza
visual, memoria y atención a los detalles.
Retención de dígitos. Siete series de dígitos que deben repetirse hacia adelante y siete series que deben
repetirse hacia atrás. La prueba de los "dígitos que se recitan hacia adelante" empieza con tres dígitos que el
examinador lee en voz alta (un dígito por segundo). Se pide al sujeto que repita cada serie en el momento en
que termina el examinador. Se dan dos oportunidades en cada extensión de la serie (dos conjuntos de dígitos
diferentes). La prueba de los "dígitos que se repiten hacia adelante" continúa hasta que el sujeto reprueba las
dos oportunidades de una serie o tiene éxito en nueve dígitos hacia adelante. En la prueba de los "dígitos que se
repiten hacia atrás" se pide al sujeto que repitá los dígitos hacia atrás después de que el examinador termina de
decirlos hacia adelante. La prueba empieza con dos dígitos que deben repetirse hacia atrás y continúa hasta
que el sujeto reprueba ambas oportunidades en una serie o tiene éxito en ocho dígitos hacia atrás. La
calificación en cada conjunto de "dígitos que se repiten hacia adelante" o "dígitos que se repiten hacia atrás" es
0,1 o 2; la calificación total es la suma de las calificaciones parciales de los "dígitos hacia adelante" y los "dígitos
hacia atrás". La prueba está diseñada para medir la memoria inmediata, pero los intervalos de atención y la
comprensión afectan las calificaciones.
Ordenamiento de figuras. Diez grupos de tarjetas, cada tarjeta contiene una pequeña figura. Se pide al sujeto que
ordene las figuras en cada conjunto de tarjetas para formar una historia. El límite de tiempo es de 60 segundos
en los conjuntos del 1 al 4,90 segundos en los conjuntos del 5 al 8 y 120 segundos en los conjuntos 9 y 10. La
prueba se interrumpe cuando el sujeto reprueba cinco conjuntos consecutivos. Las respuestas se califican con
0,1 o 2, dependiendo de la precisión. La prueba mide la capacidad para ordenar en secuencia, así como la
planeación social, el humory la capacidad para anticipar.
Vocabulario. Treinta y siete palabras que deben definirse, en orden de dificultad ascendente. La prueba empieza
con el reactivo 1 para los sujetos que tienen poca capacidad verbal, de otra forma comienza con el reactivo 4. La
prueba se interrumpe cuando el sujeto reprueba seis palabras seguidas. Las respuestas a cada palabra se
califican con 0,1 o 2 dependiendo del grado de comprensión de la palabra que se expresa. La prueba está
diseñada para medir el conocimiento de las palabras, una habilidad que está muy relacionada con la capacidad
mental general.
Diseño con cubos. Diez diseños geométricos rojos y blancos se presentan en tarjetas; se pide al sujeto que copie
cada diseño con cuatro o nueve cubos. En los primeros dos diseños se permiten dos intentos y en cada diseño
sucesivo se permite un intento. La prueba se interrumpe cuando se reprueban cuatro diseños seguidos. La
calificación de base es 0, 1 o 2 puntos en los diseños 1 y 2 y 0 o 2 puntos en los diseños del 3 al 10, con puntos
extra por un desempeño rápido y perfecto. La prueba está diseñada para medir la capacidad de percibir y
analizar un patrón visual en las partes que lo componen. En términos de sus correlaciones con las calificaciones
totales en la Escala de Ejecución y las calificaciones de la prueba en general, el "Diseño con cubos" se
considera una de las mejores pruebas de ejecución.
Cuadro 6-2 (concluye)

Aritmética. Quince problemas aritméticos en orden de dificultad ascendente. La prueba empieza con el reactivo 3 y
se interrumpe después de cinco fallas consecutivas; los reactivos 1 y 2 se presentan en caso de reprobar los
reactivos 3 y 4. Se permiten quince segundos en los reactivos del 1 al 4, 30 segundos en los problemas del 5 al
10,60 segundos en los problemas del 11 al 14 y 120 segundos en el problema 15. Las respuestas se califican con
0 o 1, además de puntos extra por un desempeño rápido y perfecto en ciertos problemas. La prueba mide el
conocimiento elemental de la aritmética, y la capacidad para concentrarse y razonar en forma cuantitativa.
Ensamble de objetos. Cuatro rompecabezas de figuras de cartón se presentan al sujeto en un formato previamente
ordenado, con instrucciones de que una las piezas se utiliza para formar algún objeto. Se presentan los cuatro
rompecabezas, el limite de tiempo es de 120 segundos para los rompecabezas 1 y 2 y 180 segundos para los
rompecabezas 3 y 4. La calificación para cada rompecabezas se determina por el número de "cortes" que se unen
de manera correcta; se dan puntos extra por un desempeño rápido y perfecto. La prueba está diseñada para
medir el pensamiento, los hábitos de trabajo, la atención, la persistencia y la capacidad para visualizar una forma
final con base en sus partes.
Comprensión. Dieciocho preguntas en orden de dificultad ascendente que requieren respuestas detalladas. Las
preguntas se presentan hasta que el sujeto reprueba seis reactivos consecutivos. Las respuestas se califican con
0,1 o 2 dependiendo de la calidad y el grado de comprensión que se expresa. La prueba mide el conocimiento
práctico, el juicio social y la capacidad para organizar la información.
Símbolos en dígitos. Se pide al sujeto que llene cada uno de los 93 cuadros con el símbolo del código apropiado
para el número que aparece en el cuadro superior. La prueba empieza con una serie de práctica, después de la
cual se dan al sujeto 90 segundos para llenar los 93 cuadros en blanco con los símbolos correctos que copia de
unas claves que se presentan antes. El rango de calificaciones es de 0 a 93 puntos. La prueba está diseñada para
medir la atención y persistencia en una tarea perceptual motriz sencilla.
Semejanzas. Catorce reactivos del tipo "¿En qué se parecen A y B?" Los reactivos se presentan en orden de
dificultad ascendente hasta que el sujeto reprueba cinco reactivos seguidos. Las respuestas se califican con 0, 1
o 2, dependiendo de la calidad y el grado de comprensión que se expresa. Esta prueba está diseñada para medir
el pensamiento lógico o abstracto; la capacidad para ordenar en categorías y generalizar.
Importancia del diagnóstico de las calificaciones de la WAIS y la WAIS-R. Al diseñar el WAIS,
Wechsler planeaba obtener algo más que sólo un estimado de la "capacidad agregada o global de un sujeto, para
actuar en forma intencional, pensar de manera racional y manejar con eficiencia su entorno". Se pensó que una
diferencia significativa entre los CIs verbales y de ejecución de una persona y el patrón de calificaciones
(dispersión) en las 11 subpruebas era una característica de ciertos tipos de trastornos mentales y, por tanto,
resultaba potencialmente útil en un diagnóstico clínico. Por desgracia, los resultados de la investigación no
confirmaron ninguna de las hipótesis de Wechsler con respecto de la importancia del diagnóstico en la dispersión
de subpruebas.
Un problema que se enfrenta al tratar de analizar la dispersión de las subpruebas de la WAIS-R es el hecho
de que las calificaciones en las subpruebas no son muy confiables y, en algunos casos, tienen correlaciones
sustanciales entre sí. Como consecuencia, la diferencia entre las calificaciones que obtiene una persona en dos
subpruebas determinadas deben ser muy grandes antes de considerarse significativas. Sin embargo, las grandes
diferencias entre las calificaciones en escala de las subpruebas y entre los CIs verbales y de ejecución son de cierta
utilidad en el diagnóstico de daño cerebral orgánico y psicopatología y para diferenciar entre la inteligencia y la
oportunidad. Por ejemplo, un CI verbal bastante más bajo que un CI de ejecución puede ser el resultado de una
experiencia lingüística limitada o de "restricciones culturales".

Escala de Inteligencia de Wechsler para Niños, tercera edición (WISC-lll). En 1949, se publicó la
Escala de Inteligencia de Wechsler para Niños (WISC), una extensión hacia abajo de la Forma I de la Escala de
Wechsler-Bellevue. En 1974, The Psychological Corporation publicó una revisión de la WISC, la WISC-R, y en
1991, se publicó una segunda revisión, la Escala de Inteligencia de Wechsler para Niños, tercera edición
(WISC-III). La WISC-III, que está diseñada para niños entre 6 y 16 años y 11 meses de edad, consiste en las seis
subpruebas verbales y las siete subpruebas de ejecución que se mencionan en el cuadro 6-3. Las 10 subpruebas
centrales pueden aplicarse en un periodo de 50 a 70 minutos y las pruebas complementarias en 10 a 15 minutos.
Como en el caso de la WAIS-R, las supruebas verbales y de ejecución de la WISC-III se aplican alternadas. Los
CIs Verbal, de Ejecución y de Escala Completa, con base en la misma escala de calificaciones estándar que la
WAIS-R, se determinan sumando las calificaciones en escala equivalentes a las calificaciones brutas obtenidas en
las cinco pruebas verbales y cinco pruebas de ejecución aplicadas. Además, en la WISC-III se puede calificar
cuatro factores: Comprensión Verbal, Organización Perceptual, Libertad de la Distracción y Velocidad de
Procesamiento.
La WISC-III se estandarizó en muestras representativas de 100 niños y 100 niñas estadounidenses en cada
uno de los 11 grupos de edad de entre 6 y 16 años. Las muestras también se estratificaron por región geográfica,
nivel de educación de los padres y raza. Otras muestras de niños presentaron tanto la WISC-III como con la
WAIS-R o la WPPSI-R, dependiendo de su edad. La confiabilidad test-retest prueba de la WISC-III, obtenida al
volver a aplicar la escala después de un periodo de 4 a 8 semanas, es satisfactoria. Además, se han realizado
varios estudios de validación con distintos grupos clínicos de niños.

Escala de Inteligencia para Edad Preescolar y Primaria de Wechsler, Revisada (WPPSI-R). El


tercer miembro de la familia de pruebas de Wechsler, la Escala de Inteligencia para Preescolar y Primaria, se
publicó por primera vez en 1967 y una revisión de ésta, la WPPSI-R, en 1989. Las seis subpruebas verbales y
seis subpruebas de ejecución de la WPPSI-R son, en orden de aplicación. Armado de Objetos (P), Información
(V), Diseño Geométrico (P), Comprensión (V), Diseño con Cubos (P), Aritmética (V), Laberintos (P),
Vocabulario (V), Completamiento de Figuras (P), Semejanzas (V), Clavijas de Animales (P) y Enunciados (V).
Las dos últimas son subpruebas complementarias. Diseñada para niños que tienen entre 3 y 7 años de edad, la
WPPSI-R se estandarizó durante 1987-1989 en una muestra nacional de niños estadounidenses de 3 a 7 años.
Otras variables de estratificación que se emplearon para hacer la muestra más representativa de la población en
Estados Unidos de entre 3 y 7 años de edad fueron sexo, etnicidad y niveles educativo y ocupacional de los
padres. Al igual que la WAIS-R y la WISC-III, la WPPSI-R da como resultado CIs Verbal,
de Ejecución y de Escala Completa separados con base en una escala de calificaciones estándar con una media
de 100 y desviación estándar de 15.

SOMPA. La WISC-R o la WPPSI se aplican como parte del Sistema de Evaluación Pluralista Multicultural
(SOMPA) (de The Psychological Corporation). El SOMPA es un planteamiento, que tiene dos componentes,
para evaluar las capacidades cognoscitivas, capacidades sensoriomotrices y comportamiento adaptativo de niños
de entre 5 y 11 años de edad. El primer componente del SOMPA, Entrevista con los Padres, consiste en tres
medidas (Inventario de Comportamiento Adaptativo para Niños, Escalas Socioculturales, Inventario de Historia
de la Salud) y puede realizarse en inglés o en español. El segundo componente del SOMPA, Materiales de
Evaluación del Estudiante, incluyen Tareas de Destreza Física, medidas de Peso por Estatura, Agudeza Visual y
Agudeza Auditiva, así como el Test Gestáltico Visomotorde Bender y la WISC-R o la WPPSI. En conjunto, los
dos componentes del SOMPA representan tres modelos de evaluación psicológica: un modelo médico, un
modelo de sistema social y un modelo pluralista. Con base en la información que se obtiene de las distintas
evaluaciones, se determina el potencial estimado de aprendizaje (ELP) de un niño, que toma en cuenta los
antecedentes familiares, el nivel socioeconómico y otros factores culturales. Están disponibles formas separadas
para niños anglosajones, negros e hispanos de entre 5 y 11 años de edad. 1 Sin embargo, el planteamiento del
SOMPA no se utiliza tanto como antes y quizá pronto tenga sobre todo un interés histórico.

Otras pruebas de inteligencia individuales de amplio rango

A pesar de ser las pruebas de inteligencia individuales más populares en Estados Unidos, las series de pruebas de
Stanford-Binet y Wechsler no son, de ninguna manera, las únicas baterías de amplio rango para evaluar la
capacidad mental general. Tampoco son las pruebas de capacidad mental más populares en otros países. En el
Reino Unido, merecen mención las Escalas Británicas de Capacidades (B AS), que se revisaron y volvieron a
estandarizar en Estados Unidos como las Escalas de Capacidades Diferenciales (DAS) (de The Psychological
Corporation). El propósito básico de la DAS, al igual que las B AS, es proporcionar perfiles de las capacidades a
fin de analizar y diagnosticar las dificultades de aprendizaje en los niños, evaluar cambios en las capacidades a
través de los años e identificar, seleccionar y clasificar a los niños (de 2 Vz a 17 años de edad) con incapacidad
mental. Las DAS consisten en 19 pruebas: Semejanzas, Matrices, Razonamiento Secuencial y Cuantitativo,
Semejanzas de Figuras, Elaboración de Patrones, Construcción con Bloques, Copiado, Comparación de Formas
Parecidas a las Letras, Memoria de Dígitos, Memoria de Diseños, Reconocimiento de Figuras, Memoria de
Objetos, Vocabulario, Definiciones de Palabras, Comprensión Verbal, Lectura de Palabras, Ortografía,
Habilidades Numéricas Básicas y Velocidad de Procesamiento de la Información. Estas pruebas se agrupan en
cuatro áreas de capacidad: verbal, no verbal, espacial y de diagnóstico. Se aplican de ocho a doce subpruebas en
cada nivel de edad, con un tiempo total de 45 a 65 minutos. Además, se incluyen en la batería tres subpruebas de
aprovechamiento (Lectura de Palabras, Ortografía y Habilidades Numéricas Básicas), que requieren de un
tiempo total de prueba de 15 a 20 minutos. Las calificaciones brutas de cada prueba se convierten en
calificaciones de capacidad independientes de la edad del sujeto. Las calificaciones de capacidad entonces
pueden convertirse en calificaciones T y rangos percentilares con base en las calificaciones que obtuvo una

Das könnte Ihnen auch gefallen