Sie sind auf Seite 1von 77

CAPITULO

CASTIGO

N.

H . A z r in

y W. C.

H olz

INTRODUCCIN

Pocos D E
, psiclogos o legos, enfocaramos el problema
dei castigo en trminos neutrales. Ms bien, nuestra reaccin ante el
uso dei castigo muchas vecs parece estar determinada por opiniones precientficas. En cierta poca, el uso dei castigo fue ampliamente sancio
nado. Por ejemplo, antiguamente, en los Estados Unidos el sistema
educativo y las prcticas penales dependan enormemente de la eliminacin de la conducta por medio dei castigo. Actualmente, la opinin
pblica parece estar en contra dei uso dei castigo. Se han planteado mltiples tipos de preguntas evaluativas acerca dei castigo, como: ,;Debe
emplearse el castigo? ,;Es efectivo el castigo? ,;Produce el castigo solamente cmbios temporales en la conducta? jEs el castigo menos efectivo
que el reforzamiento? El neutralismo cientfico exige que no formulemos
ningn juicio, sino hasta que la evidencia experimental sea completa
mente definitiva. Es con este espritu que analizamos el problema dei
castigo: ,:qu papel desempena el castigo en la conducta?
Primero examinaremos la metodologia en que se han basado los
experimentos sobre castigo, pues la validez de los datos experimentales
no puede sobrepasar lo adecuado de los procedimientos empleados para
obtener los datos. Nuestro examen de la metodologia no consistir en una
simple enumeracin de los diferentes procedimientos utilizados; ms bien,
se evaluarn criticamente los procedimientos en trminos de la p ro b a bilidad que tengan de ser adecuados para aislar los efectos dei p ro c e so
dei castigo. Uno de los propsitos primordiales de este tratamiento m e to n o so tro s

* La m ayor parte de la investigacin original que aqui se in f o r m a f u e finan


ciada por el Fondo de Salud M ental dei Estado de Illinois, por las s u b v e n c io n e s
dei N IM H 4925 y 4926 y p o r la subvencin dei NSF G16357R. E x p r e s a m o s nuestro
agradecim iento a los doctores D. F. Hake, K. M iller, R. R. H utchinson y T . AyHn
por haber ledo minuciosamente el manuscrito.
455

456

CAP. 9

C A ST IG O

dolgico es dar una direccin y proporcionar incentivos para el desarrollo


ulterior de una metodologia perfeccionada. Luego examinaremos diversas
variables relacionadas con la administracin dei castigo (como la intensidad dei castigo) y con otras variables relacionadas con aspectos que
determinan la efectividad de un estmulo punitivo en particular, como
el estado motivacional dei sujeto. Nuestra atencin se enfocar despus
en un examen detallado de los tipos de cmbios conductuales que, por lo
que se ha visto, se derivan dei uso dei castigo, como la recuperacin que
se produce durante el castigo y los aumentos de la emisin de respuestas
que se producen despus dei castigo. Slo despus de llevar a cabo este
examen de los hallazgos experimentales especficos acerca de los deter
minantes y los resultados dei castigo, trataremos de responder a preguntas
tan generales como: ^Es efectivo el castigo? Finalmente, nos ocupa
remos dei problema de determinar si el castigo es deseable. La respuesta
a este problema exigir que se tengan en consideracin hallazgos hechos
en varias reas que emplean la estimulacin aversiva.
METODOLOGIA
Definicin de castigo

Hay un gran nmero de definiciones informales dei castigo. En un


extremo se encuentra el tipo de definicin subjetiva en la que el cas
tigo se refiere a un estado desagradable subjetivo, como en el posfecto
molesto de Thorndike (1911). Sin embargo, las dificultades que plantea
la medicin de los estados subjetivos nos obligan a buscar otro camino.
Un segundo tipo de definicin de castigo implica designar al castigo como
una variable de pulsin, tal como han hecho Dollard y Miller (1950).
Puesto que este tipo de definicin se basa en inferencias acerca de la
conducta, seria preferible, como paso inicial, buscar en la propia conducta una definicin mnima. Un aspecto inequvoco dei castigo parece
ser el que esto reduce la emisin de una conducta cuando se dispone
como consecuencia de dicha conducta. Por tanto, la definicin mnima
ser' que el castigo es una consecuencia de la conducta que reduce la
probabilidad futura de dicha conducta. Enunciada de un modo ms
completo, el castigo es una reduccin de la probabilidad futura de una
respuesta especfica, como resultado de la administracin inmediata de
un estmulo ante esa respuesta. El estmulo se designa con el nombre
de estmulo punitivo, y todo el proceso se denomina castigo.
Hay varios aspectos de esta definicin que deben comentarse. Primero, la definicin no se efecta en trminos de un sentimiento subjetivo
o de un estado dei ser. Por tanto, ser incorrecto llamar punitivo a un

m e t o d o l o g a

457

estmulo, slo porque ese estmulo lleve a una expresin de infelicidad


o de un estado emocional. Segundo, para que un evento especfico sea
considerado estmulo punitivo, el evento debe ser producido por una
respuesta especfica. Una simple disminucin de las respuestas no es razn
suficiente para considerar punitivo a un procedimiento. Tambin la saciedad, la extincin, las drogas, una enfermedad, un cambio de estmulo,
etctera, pueden reducir las respuestas. Estos procedimientos se diferencian
claramente dei castigo en que no producen una reduccin de respuestas
que sean atribuibles a la produccin de un estmulo especfico (el estmulo
punitivo) por parte de la respuesta. Solamente designamos al proceso
con el nombre de castigo cuando se produce una reduccin de respues
tas como resultado de que las respuestas producen un estmulo especfico.
Un corolrio de esta definicin es que resulta contradictorio hablar de
castigo por no responder, pues no hay ninguna respuesta especificable
que produzca al estmulo punitivo. Un procedimiento de este tipo se
designa mejor con el nombre de escape o euitacin (Sidman, 1953). Un
tercer aspecto fundamental de esta definicin es que especifica la probabilidad futura de una respuesta. La reduccin de las respuestas durante
la presentacin real de un estmulo no indica que haya castigo. Si se
administra un choque intenso a las patas de un animal despus de una
respuesta, el choque puede producir reacciones, como la de saltar, que
son fisicamente incompatibles con la respuesta; pero esto no es suficiente
para dar al choque la categoria de estmulo punitivo. Asimismo, la administracin de comida produce como resultado una conducta consumatoria
que generalmente es incompatible con la respuesta. El cambio de la
frecuencia de respuesta que se produce de manera subsecuente a un es
tmulo define las propiedades reforzantes o punitivas de ese estmulo. Por
esta razn, nuestra definicin dei castigo se hace en trminos de una
reduccin de la probabilidad futura de la respuesta castigada.
La presente definicin de castigo se diferencia en varios aspectos de
las definiciones anteriores dei castigo. Una definicin (Dinsmoor, 1954;
Keller y Schoenfeld, 1950; Skinner, 1953) se rcfiere al castigo, en tr
minos de procedimientos, como la administracin de un estmulo aversivo
despus de una respuesta. Entonces, se define al estmulo aversivo como
un estmulo que aumenta la probabilidad de las respuestas que hacen
terminar ese estmulo. Esta definicin de aversividad requiere una demostracin de que puede emplearse la terminacin dei estmulo para reforzar
la conducta de escape. Cualquier reduccin que sea producto dei proce
dimiento de castigo se atribuye a la existencia de respuestas de escape
que interfieren o compiten de alguna manera con la respuesta castiga a
(Dinsmoor, 1954; Skinner, 1953). En esta definicin, el castigo es un
proceso secundrio en trminos dei procedimiento, pues para d e sig n a r o

458

CAP. 9

C A ST IG O

se debe hacer un condicionamiento de escape previo. Asimismo, el efecto


conductual dei castigo se considera un resultado secundrio o indirecto
de las respuestas de escape competitivas. La presente definicin considera
al castigo como un proceso primrio porque: a) no se requiere ninguna
evidencia independiente de que el estmulo mantendr a la conducta de
escape, y b) la caracterstica que define al castigo es medible directamente en trminos de la existencia de una reduccin de las respuestas.
Esta definicin parece tener varias ventajas. Virtualmente, ninguno
de los estdios dei castigo ha determinado inicialmente que la terminacin dei estimulo punitivo refuerce la conducta de escape. En ausncia
de esta determinacin, el estmulo no podra considerarse aversivo y la
definicin de procedimiento dei castigo no podra aplicarse a la mayora de los estdios que han implicado esta designacin. La presente de
finicin slo requiere que se obtenga una reduccin de la respuesta cuando
produce el estmulo. La segunda ventaja de definir al castigo en trminos
de una reduccin de la respuesta es que no se requiere ningn registro u
observacin de las respuestas de escape hipotticas, pero hasta ahora
no registradas, que se supone producen la reduccin de la respuesta. La
tercera ventaja de esta definicin es que dirige la atencin de investigador
a las variables independientes ms que a un conjunto interventor de conductas competitivas, a las que con frecuencia se les da un status de
exploratorios.
La presente definicin de un estmulo punitivo es similar a la defi
nicin de un estmulo reforzante en que requiere un cambio de la
probabilidad futura de una respuesta, como resultado de que la respuesta
produce ese estmulo. Las definiciones difieren solamente con respecto a
la direccin dei cambio de la probabilidad de la respuesta: un aumento
de la probabilidad de obtener reforzamiento positivo, una disminucin de la dei castigo. Ningn proceso es secundrio con respecto al otro.
Desarrollo de una tecnologia dei reforzamiento
como prerrequisito

De acuerdo con nuestra definicin, el proceso punitivo se caracteriza


por una reduccin de la tasa de respuestas. De ah se deduce que para
poder iniciar un estdio dei castigo debe haber un nivel de respuestas
preexistente. El procedimiento comn ha consistido en emplear reforza
miento positivo para condicionar la respuesta y mantenerla a una fre
cuencia que sea lo suficientemente alta para permitir observar que el
procedimiento de castigo reduce la emisin de respuestas. Rara vez se
ha utilizado el nivel operante de una respuesta (Baron y Antonitis, 1961).
La estabilidad y el orden de la tasa de respuestas reforzadas determinar

M E T O D O L O G IA

459

el grado en que cualquier cambio que se produzca en las respuestas


pueda ser atribudo definitivamente al castigo. Si la medida de la res
puesta es variable o impredecible antes de aplicar el castigo, no es posible
llegar a muchas conclusiones al agregar este ltimo.
I No fue sino hasta hace poco (Ferster y Skinner, 1957) que la tec
nologia dei reforzamiento lleg a un grado tal de desarrollo que ahora
se puede especificar la ocurrencia momento a momento de las respuestas
operantes condicionadas que emite un organismo particular. Historica
mente, el orden de los datos sobre las respuestas se ha obtenido me
diante promedios de grupo y de procedimientos de ensayos discretos
(Muenzinger, 1934). Los primeros trabajos operantes de Skinner (1938)
hicieron posible que Estes (1944) usara promedios de grupo que incluan
slo a cuatro sujetos, y prescindiera completamente de un procedimiento
de ensayos limitado que interrumpa constantemente el flujo de la con
ducta con un intervalo entre los ensayos. Ahora, los procedimientos de
reforzamiento de Ferster y Skinner (1957) hacen posible prescindir de los
promedios de respuestas, tanto dentro de los sujetos como entre ellos, y
ocuparse directamente de la ocurrencia de las respuestas de momento
a momento. Estos progresos hacen posible valorar con ms exactitud los
efectos dei castigo y permiten observar que los cmbios conductuales son
regidos por regias, sin tener que recurrir a artefactos estadsticos ni a
grandes grupos de sujetos.
El estmulo punitivo
REQUISITOS DEL ESTMULO PUNITIVO IDEAL"

Idealmente, un estmulo punitivo debe tener propiedades que permitan valorar el proceso dei castigo sin dejar penetrar factores extranos al
procedimiento. Primero, el estmulo punitivo debe tener una especificacin fsica precisa. Si las dimensiones pertinentes dei estmulo no pueden
medirse con exactitud y en unidades fsicas, estamos limitando desde el
principio los estdios, en trminos de su replicabilidad y su confiabilidad.
La segunda caracterstica deseable que debe tener un estmulo pu
nitivo es la consecuencia dei estmulo en trminos dei contacto real que
tiene con el sujeto. Un estmulo puede ser especificado precisamente
en su fuente y, sin embargo, su impacto sobre el sujeto puede ser muy
variable. Por ejemplo, un choque administrado a las patas de la rata a
travs de una rejilla puede especificarse exactamente en trminos de
la diferencia de potencial que hay en el estimulador; pero las variaciones de humedad dei aire tienen como resultado una gran v a r i a b i l i d a d
de la intensidad que acta realmente sobre el organismo.

460

CAP. 9

C A ST IG O

La tercera caracterstica dei estmulo punitivo ideal se refiere a la


capacidad que tiene el sujeto para escapar o para reducir al mnimo
la estimulacin por medio de alguna conducta no autorizada. En este
apartado no nos referimos a la uniformidad fsica dei estmulo punitivo,
excepto en la medida en que el sujeto puede controlaria. Por ejemplo,
la uniformidad dei choque administrado a las patas de la rata depen
de dei grado de contacto de la piei con el piso de rejilla. Este contacto se
halla siempre bajo el control de la conducta dei sujeto. Incluso, si se han
electrificado la barra de respuestas, las paredes, el techo y el piso de
rejilla, la rata puede cambiar de postura, y lo hace; salta, corre, baila,
trata de pararse en una barra, y usa las partes pilosas de su cuerpo para
responder. Todas estas conductas van a alterar la intensidad efectiva de
la estimulacin, a pesar de la constancia que tenga el choque al ser
medido en el piso de rejilla. Los problemas que origina este control
no autorizado van ms all de cualquier inters purista por la cons
tancia fsica. Supuestamente, el castigo logra su efecto en la conducta,
primordialmente por medio de un aumento de la cantidad de estimu
lacin que acta sobre el organismo. Si el sujeto puede hacer disminuir
esta estimulacin gracias a medios no autorizados o inidentificables, entonces los conteos de las respuestas carecen de significado, como se puede
notar en un estdio de Dinsmoor y Campbell (1956). Por otra parte,
puede parecer que no hay ninguna reduccin de las respuestas, como
lo evidencia el caso extremo que se representa en la figura 1, titu
lado el Desayuno en la cama, en el cual una rata aprendi a
presionar una palanca de respuestas con su pata mientras yaca sobre
su espalda, y eliminaba as la posibilidad de recibir choques al mismo
tiempo que seguia produciendo bolas de comida. Asimismo, la reduc
cin de las respuestas puede ser resultado de posturas desmanadas,
pero que reducen los choques, como la de poner solamente una pata
en la rejilla. La postura desmanada puede producir una reduccin de
respuestas que es slo una consecuencia indirecta dei estmulo punitivo.
En un estdio de Azrin, Hake, Holz y Hutchinson (1965) se estudi
este problema proporcionando experimentalmente una respuesta de esca
pe especfica. Se encontro que los efectos reductivos totales dei castigo
eran nulificados por la disponibilidad de la respuesta de escape.
La cuarta caracterstica dei estmulo punitivo ideal es que deben
haber pocas reacciones esquelticas ante ese estmulo. Al estudiar el
castigo, nos ocupamos de la reduccin de la probabilidad futura de una
respuesta. Si el estmulo punitivo produce reacciones esquelticas fuertes
y duraderas, entonces la produccin de estas reacciones per se puede
hacer disminuir la frecuencia de la respuesta. En tal caso, las reducciones de la respuesta se producirn debido a la simple incompatibilidad

M E T O D O L O G IA

F IG U R A

1.

e c h n d o se

461

D e s a y u n o en la c a m a . La rata h a a p re n d id o a ev ita r el ch oq u e d e la rejilla


sob re

su

e s p a ld a ,

m ien tras

p re sio n a

la

p a la n c a

de

la s

re sp u e sta s

con

su

p a ta

tra se ra p a r a p ro d u c ir b o la s de co m ida. (T om ad o de A z rin y H olz, d a to s n o p u b lica d o s.)

de las reacciones provocadas con la respuesta castigada, y no necesariamente debido a la aversividad dei estmulo punitivo. Pueden ilustrar
este problema los estdios que han utilizado choques aplicados a las
patas, en los que una observacin simple revela que a menudo las altas
intensidades dei choque, que interfieren fisicamente con la emisin de
la respuesta medida, producen la inmovilizacin parcial dei sujeto.
La quinta caracterstica dei estmulo punitivo ideal es que pueda
hacerse variar por una amplia gama de valores y que pueda producir
grados de reduccin de la respuesta que vayan desde ningn efecto, en
los valores ms bajos, hasta la reduccin completa de la respuesta, en los
valores ms altos. En ausncia de tal variacin, es imposible averiguar
cul es toda la gama de efectividad dei castigo.
Ya que hemos visto algunos de los critrios que se espera que llene
un estmulo punitivo, vamos a evaluar algunos de los estmulos utiliza
dos. El choque a las patas ha sido, con mucho, el estmulo ms usado.
La principal ventaja dei choque es que puede hacerse variar por toda la
gama de efectividad para reducir la respuesta. Pareceria ser que otra
ventaja de usar el choque es que ste puede especificarse con precision

462

CAP. 9

C A ST IG O

en unidades de medida fsicas (es decir, elctricas). Sin embargo, esta


especificidad aparente es ilusria, como puede verse en los ejemplos
anteriores que consideraban el choque a las patas en trminos de su
contacto real con el sujeto. Se han creado varios artefactos para dismi
nuir al mnimo la variabilidad dei choque administrado a las patas.
Dinsmoor (1958) ha usado rejillas tubulares grandes, a fin de reducir
al mnimo los corto circuitos entre ellas y aumentar al mximo el con
tacto dei sujeto con las rejillas. Skinner y Campbell (1947) han creado
un revolvedor para alternar la polaridad de cada rejilla y evitar as
que el animal apoye las patas en rejillas de la misma polaridad. Dins
moor (1961) invento un estimulador para reducir las variaciones dei
flujo de la corriente que pasa por el sujeto. Hoffman y Fleshler (1962)
han perfeccionado la tcnica dei revolvedor, con el fin de hacer alternaciones de polaridad ms rpidas y confiables. A pesar de estas mejoras sustanciales, el choque a las patas dei animal tiene las desventajas
siguientes: a) permite que haya escape no autorizado, y b ) permite
que haya variabilidad en la estimulacin real que llega al sujeto. La
produccin de reacciones esquelticas duraderas se ha reducido un poco
mediante el procedimiento de hacer que las duraciones de la estimu
lacin sean muy breves; Estes (1944), por ejemplo, us una descarga
corta dei capacitador (condensador).
En este momento podemos poner en duda que se tenga un control
tan preciso dei choque como estmulo punitivo. Ciertamente, en los
estdios dei condicionamiento de evitacin (Boren, Sidman y Hermstein, 1959) se han hallado pocos cmbios en las respuestas de evitacin
emitidas ante una amplia gama de intensidades de choque aplicadas a
las patas. Parece que se requiere un mnimo de intensidad para mantener las respuestas de evitacin, pero que ms all de ese punto, el
aumento de la intensidad produce pocos cmbios, o ninguno, en la tasa
de respuestas de evitacin. Por otra parte, se ha encontrado que las
respuestas castigadas son muy sensibles a los cmbios de intensidad
dei estmulo punitivo. En un estdio (Hake y Azrin, 1963), un au
mento de intensidad de 50 a 60 voltios (un cambio dei 20% ) produjo
una reduccin instantnea de aproximadamente el 50% en la tasa de
respuestas castigadas.
Puede explicarse la sensibilidad de las respuestas castigadas a la
intensidad dei choque, en comparacin con la insensibilidad de las res
puestas de evitacin, confrontando los procedimientos de castigo y de
evitacin en trminos de la frecuencia de los contactos habidos entre
el sujeto y el estmulo aversivo. En el condicionamiento de evitacin
de choques, las respuestas se emiten pronto con una tasa que es sufi
ciente para eliminar virtualmente todas las administraciones dei choque.

M E T O D O L O G A

463

El resultado final es que se emite un gran nmero de respuestas; pero


los choques son tan poco frecuentes que se necesita mucho tiempo para
poder descubrir la ausncia de choques. Como resultado de esto, encon
tramos que la conducta de evitacin persiste durante perodos largos
(Sidman, 1955). En el castigo por medio de choques, la situacin es
diferente, pues generalmente cada respuesta va seguida por el choque.
De este modo, el sujeto est haciendo contacto con el choque conti
nuamente, a menos que haya habido una supresin completa de la
respuesta castigada. En la supresin parcial, no hay problema para dis
criminar el momento preciso en que se suprime el choque. Por tanto,
la contingncia de hacer terminar el choque durante el castigo tiene
como resultado, generalmente, un cambio inmediato de la conducta
castigada (Azrin, 19606). Por la misma naturaleza de los procesos que
estudian, el control preciso parece ser esencial en los trabajos sobre el
castigo, mientras que en el caso de los estdios sobre el condicionamiento
de evitacin, tal vez no requieran ms que un estmulo efectivo al m
nimo para mltiples propsitos. El contacto continuo que hay entre
el sujeto y el estmulo aversivo explica tambin la sensibilidad que
muestran las respuestas de escape ante los cmbios de intensidad dei
estmulo aversivo (Barry y Harrison, 1957; Dinsmoor y Winograd, 1958;
Harrison, Abelson y Fisher, 1960; Kaplan, 1952).
DIFERENTES TIPOS DE ESTMULOS AVERSIVOS

Se han encontrado varios tipos de estmulos punitivos efectivos. Masserman (1946) ha empleado una rfaga de aire con gatos y una serpiente
de juguete con monos. Skinner (1938) us la bofetada de una^palanca,
con ratas. El ruido ha sido efectivo con humanos (Azrin, 1958; Flanagan, Goldiamond y Azrin, 1958; Herman y Azrin, 1964) y con pichones
(Holz y Azrin, 1962a). El estmulo punitivo que se ha utilizado ms
extensamente ha sido el choque elctrico administrado a travs de un
piso de rejilla.
Ya se ha visto que el choque a las patas tiene las siguientes desventajas: a) da lugar a variaciones en la intensidad con que se recibe verdaderamente; b) permite que respuestas de escape no autorizadas tengan
control de la intensidad y la duracin dei choque, y c) produce una
perturbacin esqueltica extremada. El choque punitivo se ha adminis
trado tambin a travs de electrodos implantados (Azrin, 1959<z) y de
electrodos de superficie (Hake y Azrin, 1963), lo cual reduce al mnimo
las variaciones fsicas de la intensidad dei choque, y evita que la con
ducta de escape no autorizada controle la intensidad. El problema de
las reacciones esquelticas extremas sigue existiendo, pero lo reduce al
mnimo la poca duracin que tiene generalmente la presentacin dei cho-

CAP. 9

464

C A STIG O

que. Estas reacciones perturbadoras se redujeron an ms al colocar los


electrodos en la cola de unos monos-ardilla que se mantenan sentados
sin sujecin alguna (Hake y Azrin, 1963). Este procedimiento elimino al
gran desequilibrio de la postura que produce generalmente el choque
a las patas. El ruido parece ser igualmente deseable, pues mediante el
uso de audfonos ha sido posible especificar con precisin y controlar la
intensidad dei estmulo que recibe el sujeto (Flanagan, Goldiamond, y
Azrin, 1958), o tambin a travs de sistemas de altavoces que producen
un campo sonoro uniforme (Holz y Azrin, 1962a). El ruido parece tener
muchas ventajas para usarlo en los estdios dei castigo. Su principal
desventaja es que carece de una amplia gama de efectividad. Incluso a
intensidades muy altas, el ruido no ha producido una reduccin com
pleta de la respuesta. A otros estmulos aversivos, como las bofetadas de
la barra, las serpientes, las rfagas de aire, etc., no se les ha aplicado la
prueba dei uso extensivo, pero no tienen mayores ventajas que el cho
que elctrico aplicado a las patas o que el ruido.
LA ESTIMULACIN AVERSIVA C O N D IC IO N A D A C O M O CASTIGO

Los estmulos punitivos que hemos descrito hasta ahora, se definen


en trminos de sus propiedades aversivas primarias. En teoria, debera
ser posible usar un estmulo punitivo que fuera efectivo debido a su asociacin con un estmulo aversivo primrio, ms que por cualquier propiedad aversiva que tuviera en s mismo. Parece que este tipo de castigo se
emplea frecuentemente en muchos tipos ordinrios de control de la con
ducta humana. Por ejemplo, cuando se castiga a un nino, la agresin
fsica se usa con poca frecuencia. El procedimiento ms frecuente es
fruncir el ceno o expresar frases que se suponen asociadas con eventos
aversivos ms naturales. En varios estdios se ha tratado de establecer
este castigo condicionado, que es el nombre con el que lo designare
mos (Barlow, 1952; Evans, 1962; Mowrer y Aiken, 1954; Mowrer y
Solomon, 1954). Los procedimientos empleados en estos estdios pueden
describirse, en trminos generales, de la manera siguiente: un estmulo
neutro, EC, es asociado con un choque elctrico, EIC, antes de condi
cionar de cualquier manera la conducta dei animal. Despus de varios
apareamientos dei EC y el EIC, el animal es condicionado a responder
por comida, pero sin que est presente ningn EC ni EIC. Una vez que
la respuesta ha sido condicionada, se hace que el EC se presente despus
de las respuestas. La reduccin de la frecuencia de estas respuestas que
asi se produce, se atribuye a los efectos punitivos condicionados que tiene
el EC en virtud de su asociacin previa con el choque EIC. Desafortu
nadamente, este paradigma bsico no permite hacer investigaciones a

M E T O D O L O G A

465

PR OCE DIM IE NTO

segundos

neutros

neutros

condicionada

D ESD E E L P R IN C IP IO H A S T A E L FIN
F IG U R A 2.
M to d o p a r a p ro d u c ir c a stig o co n d ic io n a d o .
(T om ad o de A z rin y H olz, d a to s n o p u b lica d o s.)

P a ra

la e x p lica c i n , v a se el texto.

largo plazo dei castigo condicionado, pues el EC pierde su efectividad


cuando deja de ser apareado con el EIC.
Experimentos recientes (Hake y Azrin, 1965) trataron de superar el
problema de mantener el castigo condicionado. La figura 2 muestra la
situacin experimental general y el procedimiento de control. Un pichn
fue reforzado con comida por responder en una tecla. El registro acumulativo que se encuentra abajo a la izquierda muestra la ejecucin obtenida, tpica de un programa IV. En el segundo segmento desde la derecha,
cada respuesta produjo un cambio de estmulo de 5 segundos que consistia
en un cambio de la iluminacin y un cambio dei nivel de ruido dei am

CAP. 9

466

C A STIG O

biente. Puede verse que el estmulo neutro produjo pocos cmbios en


la conducta, En el tercer segmento, el mismo estmulo neutro fue presentado a intervalos irregulares separados por un promedio de 6 minutos.
De nuevo, el estmulo neutro no afect la tasa de respuestas. Luego se
administro un choque elctrico breve a travs de los electrodos implan
tados en la regin posterior dei pichn. Este choque se administro al
final de la presentacin dei estmulo de 15 segundos, como se indica en
el cuarto segmento dei registro acumulativo. Este procedimiento es semejante al procedimiento de supresin condicionada que crearon Estes y
Skinner (1941). Puede verse que hubo una supresin de las respuestas
en presencia dei estmulo (EC), pero que la conducta no fue afectada
apreciablemente en ausncia dei EC. El segmento dei registro acumu
lativo que se encuentra a la derecha representa los resultados obtenidos
mediante el procedimiento de castigo condicionado, durante el cual cada
respuesta produjo al EC durante 5 segundos. Puede verse que la tasa
de respuestas se redujo de su nivel anterior de aproximadamente 80 res
puestas por minuto a un nivel de supresin casi completa. Durante el
castigo condicionado, la tasa de respuestas se recupero gradualmente, pero
de todos modos no pas de 20 respuestas por minuto. Una caracterstica
fundamental de este procedimiento es que se continuaron haciendo apareamientos dei EC con el EIC. Por tanto, el EC producido por la respues
ta sigui teniendo sus propiedades aversivas condicionadas y pudo ser
efectivo para suprimir la conducta castigada, tanto tiempo como estuvo
en efecto el procedimiento. Parece que el castigo condicionado no necesita ser un fenmeno transitorio; un estmulo que anteriormente era
neutro continuar suprimiendo las respuestas despus de las cuales se
presenta, si ese estmulo neutro es asociado ocasionalmente con el estmulo
incondicionado.
EL TIEMPO-FUERA DEL REFORZAMIENTO POSITIVO C O M O

ESTlMULO PUNITIVO

El perodo de tiempo-fuera constituye otro ejemplo de estmulo pu


nitivo condicionado. En la conocida ley de la extincin, cuando se supri
me el reforzador, disminuye la frecuencia de la respuesta anteriormente
reforzada. Si reforzamos alternadamente una respuesta en presencia de
un estmulo, pero no la reforzamos en presencia de otro estmulo, entonces puede designarse a este ltimo con el nombre de estmulo tiempofuera; es decir, tiempo-fuera dei reforzamiento positivo (Ferster y Skinner,
1957). Historicamente, el tiempo-fuera dei reforzamiento positivo se ha
considerado en sentido esttico, es decir, simplemente como un periodo
de tiempo que separa las oportunidades de responder. Tal es el caso, por
ejemplo, en los procedimientos de ensayos limitados, rampas, pasadizos,
procedimientos de eleccin, etc., en los que se designa al tiempo-fuera

467

M E T O D O L O G IA

M IN U T O S
F IG U R A 3.
gram a

IV

R egistro
de

a c u m u la tiv o

refo rzam ie nto

con

de

la s

com ida.

re sp u e sta s
En

el

de la com ida. Las r a y a s t ra z a d a s p or la

p lu m a

in d ic a n

de

la

s u s p e n d i
q u ie ra

a d m in istra c i n
la ilu m in a c i n

re sp u e stas

de
de

un
la

p e rio d o

em itid a s

registro

no

re g istra d o ra

tie m p o -fu e ra

de

por
se

un

El

papel

dei

re g istra d o r

la s

b a jo

un

p ro

a d m in istra c io n e s

(v a se eje m plos en la s flecha s)


un

m inu to

c m a ra expe rim e ntal, lo cu al evit

reforzam ie ntos.

p ich n

in d ica n

no

la

d u ra n te

el

o curren cia d e

corri

d u ra n te

el

cu a l

se

c u a le sp e rio d o

de tiem p o-fue ra. El tie m p o -fu e ra se a d m in istro in m e d iatam e n te d e sp u s de la p rim e ra re sp u e s


ta e m itid a, lu e g o de un in te rv alo de un m in u to tra n sc u rrid o a p a rtir dei tie m p o -fu e ra a n te
rior. (T o m a d o de A z rin y H olz, d a to s n o p u b licad o s.)

como un intervalo entre ensayos. Aunque en los mtodos de ensayos


limitados se han utilizado necesariamente periados de tiempo-fuera, no
se han notado las posibles propiedades dinmicas que tiene este tiempofuera. Slo en los ltimos anos se ha descubierto que un estmulo de
tiempo-fuera puede poseer propiedades reforzantes o aversivas y que, por
tanto, se puede controlar la frecuencia de las respuestas disponiendo
ese estmulo como consecuencia de las mismas.
Parece ser que la primera vez que alguien not las posibles propie
dades reforzantes o aversivas dei tiempo-fuera fue en un estdio de Herrnstein (1955), en el cual se alter la frecuencia de las respuestas dispo
niendo perodos de tiempo-fuera de duraciones variadas despus de las
respuestas. Hasta el momento, no se sabe bien por qu medios un estmu
lo de tiempo-fuera acta como estmulo punitivo. Si examinamos la
situacin simple en la que un pichn responde para obtener comida
en un programa de reforzamiento IV, podemos disponer un paradigma
de castigo haciendo que, por ejemplo, cada quincuagsima respuesta produzca un periodo de tiempo-fuera. Si el periodo de tiempo-fuera constituyera un estmulo punitivo, podramos esperar que disminuyera la tasa
total de respuestas para obtener comida. En nuestra propia experiencia
Ho se ha notado ninguna disminucin, como puede verse en la figura 3
(datos no publicados), en donde se le administro un tiempo-fuera de 60

468

CAP. 9

C A ST IG O

segundos a la primera respuesta emitida despus de un minuto. En


realidad, ya se haba notado anteriormente un aumento de la tasa total,
cuando los perodos de tiempo-fuera se introducan independientemente
de las respuetsas (Ferster y Skinner, 1957). Si aplicramos nuestra
definicin de estmulo punitivo, pareceria que el perodo de tiempofuera no llena los requisitos de estmulo punitivo, pues la ocurrencia
de un perodo de tiempo-fuera despus de la respuesta de picoteo no
redujo la probabilidad futura de esa respuesta.
Sin embargo, los efectos punitivos de un estmulo de tiempo-fuera
se han visto en varios estdios en los que el sujeto dispona de algn
modo de conducta alternativo. Por ejemplo, Ferster (1958) encontro
que el tiempo-fuera suprimia la conducta si haba un estmulo pretiempofuera disponible. Solamente las respuestas que se emitan ante el es
tmulo pretiempo-fuera eran castigadas por la accin dei tiempo-fuera.
Si el sujeto no emitia respuestas durante la presencia de este estmulo
breve pretiempo-fuera, entonces no se presentaba el perodo de tiempofuera. El sujeto podia tener un modo de conducta alternativo para evi
tar los perodos de tiempo-fuera, en el sentido de que el estmulo puni
tivo podia ser eliminado respondiendo en momentos diferentes, en vez
de dejar de responder. Ferster ampli an ms el uso dei tiempo-fuera
como estmulo punitivo al demostrar que un perodo de tiempo-fuera podia
eliminar selectivamente los tiempos entre respuestas (TERs) castigados,
mientras que no afectaba a los TERs no castigados. Este investigador
programo los periodos de tiempo-fuera de tal manera que se presentaran despus de TERs largos, pero no despus de TERs cortos. Como
resultado de esto, disminuy la frecuencia relativa de los TERs lar
gos. De nuevo, se hizo que el tiempo-fuera tuviera efectos de estmulo
punitivo, proporcionndole al sujeto un modo de responder alternativo
(TERs cortos) que eliminaba el estmulo punitivo sin tener que dejar
de responder por completo.
Un estdio posterior de Holz, Azrin y Ayllon (1963a) esclareci
an ms los medios posibles a travs de los cuales el perodo de tiempofuera podia actuar como estmulo punitivo. En este estdio, se condi
ciono a seres humanos para responder en un programa IV con el fin
de obtener cigarrillos como reforzamiento. En una parte dei experi
mento, los sujetos tenan a su disposicin un manipulando de respuestas.
Luego se programo un perodo de tiempo-fuera para que se presentara
por cada dcima respuesta emitida en ese manipulando. Los resultados
de este procedimiento concordaron con la regia general mencionada
anteriormente. Es decir, cuando no se tena ninguna respuesta alterna
tiva, el perodo de tiempo-fuera produca, cuando mucho, una supresin
parcial de las respuestas castigadas. En la segunda parte dei procedi-

M E T O D O L O G IA

469

miento se tenan dos respuestas, cualquiera de las cuales produca el


reforzamiento. Luego se programo el tiempo-fuera de la misma manera
como se haba hecho anteriormente, para que se presentara despus de
cada dcima respuesta emitida en uno de los manipulandos. En este
procedimiento de respuesta alternativo, el periodo de tiempo-fuera produjo una supresin casi inmediata y virtualmente completa en este mani
pulando. La emisin de respuestas se desplaz al manipulando en el
cual no se haba programado ningn periodo de tiempo-fuera como
estmulo punitivo. Entonces, parece que un periodo asociado con extincin, que constituye un periodo de tiempo-fuera, puede funcionar
como estmulo punitivo, pero no es muy efectivo comparado con otros
tipos de estmulos punitivos, como el ruido o el choque elctrico o, incluso,
con estmulos aversivos condicionados. No obstante, el tiempo-fuera pue
de ser un estmulo punitivo muy efectivo si el organismo dispone de
una respuesta alternativa que no s castigada y que produce reforzamientos. Se ha encontrado que la efectividad dei tiempo-fuera como
estmulo punitivo est en funcin de la duracin dei tiempo-fuera, lo
cual ha sido usado eficazmente para eliminar las respuestas incorrectas en un procedimiento de igualacin a la muestra (Ferster y Appel,
1961; Zimmerman y Baydan, 1963; Zimmerman y Ferster, 1963).
(I

EL CASTIGO POR M E D IO DEL "CO STO DE RESPUESTA"

El costo de respuesta es un tercer tipo de castigo condicionado que


ha utilizado Weiner (1962) con sujetos humanos que trabajaban para
obtener puntos en un cantador. Despus de que la conducta se haba
vuelto estable, dispuso las cosas de tal manera que cada respuesta restaba un punto de los que estaban en el contador. Esta sustraccin de
los puntos dei contador como consecuencia de una respuesta se deno
mino costo de respuesta. El efecto que tuvo este procedimiento fue
mayor que el que se observa generalmente cuando se ha empleado un
periodo de tiempo-fuera (que senala la ausncia de reforzamiento) como
estmulo punitivo. Weiner encontro una reduccin de las respuestas que
era inmediata y en algunos casos casi completa. En cada sujeto, la
contingncia dei costo de respuesta redujo el nmero de las respuestas
a una pequena fraccin dei nivel de las respuestas ,no castigadas. Pare
ceria, entonces, que el costo de respuesta es similar al choque elctrico
intenso en trminos dei grado de reduccin de la respuesta logrado.
Otra similitud con el choque elctrico intenso era que la contingncia
dei costo de respuesta no permitia que hubiera una recuperacin de las
respuestas castigadas durante el periodo de castigo. Hay dos aspectos
que parece necesario tener en cuenta al crear una situacin en la que
puede usarse el costo de respuesta: primero, debe haber algn nivel

470

CAP. 9

C A ST IG O

de reforzamiento positivo, a fin de tener la oportunidad de retirar ex


perimentalmente ese reforzamiento, y segundo, debe haber un reforzador condicionado, pues no parece posible disponer una situacin en
la que se pueda eliminar un reforzador primrio que el animal ya haya
obtenido. A pesar de estas limitaciones, el costo de respuestas parece
ser un estmulo punitivo que tiene un gran efecto en las respuestas de los
humanos. El procedimiento dei costo de respuesta es particularmente
interesante debido a su semejanza con el uso dei cambio monetrio.
Adems, el procedimiento dei costo de respuesta ejemplifica con detalle
el modo como puede considerarse que el reforzamiento positivo y el
negativo se encuentran situados a lo largo de un solo continuo. En
el procedimiento de Weiner, la adicin de un punto al contador de res
puestas constitua un reforzamiento. Por lo contrario, la sustraccin de
un punto dei contador de respuestas constitua un estmulo punitivo.
Es de suponerse que la ausncia de cmbios en el contador de respuestas
constituiria un estado de cosas neutral. El procedimiento de Weiner
parece proporcionar una oportunidad excelente para estudiar el refor
zamiento y el castigo concurrentes empleando una sola dimensin de
estmulo, a fin de programar tanto las consecuencias reforzantes como
las punitivas.
VARIABLES RELACIONADAS CON LA
ADMINISTRACIN DEL CASTIGO

Una vez que el estmulo punitivo ha sido especificado, su efecto


depende en gran parte de la manera como se administre el estmulo. El
estmulo punitivo puede presentarse gradualmente o de sbito, inmediatamente despus de una respuesta o de una demora. Puede ser ligero
o severo; se pueden castigar todas las respuestas o castigar slo algunas
de ellas. Puede disponerse que se presente continuamente o puede dejarse una pausa. Como se ha descubierto que estas consideraciones afectan el grado de reduccin obtenida, cada una de ellas ser examinada
en detalle.
Modo de presentacin

Es fundamental el modo como se presenta por primera vez el es


tmulo punitivo. La presentacin sbita dei castigo parece producir una
mayor reduccin de las respuestas castigadas que si se aumenta gradual
mente la intensidad dei castigo. Masserman (1946) informa que los
gatos siguen respondiendo bajo un castigo severo si el estmulo punitivo
ha sido introducido con baja intensidad y se ha aumentado gradualmente

A D M IN IS T R A C I N DEL C A ST IG O

471

durante un periodo. Asimismo, se ha notado (Azrin, Holz y Hake,


1963) que:
Fue necesario tener mucho cuidado al presentarle el castigo por primera
vez al sujeto. En un estdio previo dei castigo continuo se haba demos
trado que si se empleaba inicialmente una intensidad elevada (80 voltios
o ms), era probable suprimir las respuestas completamente y, por lo ge
neral, de manera irreversible. Si la presentacin inicial dei castigo se haca
a intensidades ms bajas (60 voltios o menos), la ejecucin se mantena
fcilmente, incluso cuando posteriormente se haca aumentar el castigo
a intensidades hasta de 130 voltios.
Brethower y Reynolds (1962) notaron que la presentacin inicial de
un castigo de intensidad elevada produca una gran reduccin de las
respuestas en un sujeto. En un estdio experimental directo de este pro
blema, Miller (1960) encontro que el castigo produca una reduccin
menor de la respuesta si la intensidad dei estmulo punitivo se aumentaba gradualmente en dias sucesivos. Parece entonces que la supresin
de las respuestas que produce el castigo se acentua al presentar sbitamente el estmulo punitivo con toda su intensidad. Este fenmeno no
se limita a la presentacin dei castigo. Se ha descubierto que un au
mento sbito y sustancial de la intensidad prevaleciente dei estmulo
punitivo tambin acenta el grado de supresin producido (Azrin, 1959a;
19606; Holz y Azrin, 1963).
An no se ha podido determinar la base de esta efectividad acentuada
dei castigo. Puede ser que la aparicin inicial* dei castigo sea especial
mente efectivo no slo debido a sus propiedades aversivas, sino tambin
porque constituye un cambio de estmulo muy dramtico. Es sabido que
la presentacin sbita de un estmulo novedoso por s mismo reduce la
emisin de las respuestas. Esta novedad puede combinarse con la aversidad dei estmulo punitivo, a fin de producir una reduccin inicial
profunda de las respuestas castigadas.
Una situacin semejante parece existir con respecto al reforzamiento
positivo que se da por medio de la administracin de comida. Cuando
se da comida a un pichn mediante un depsito operado por un solenoide ruidoso, el primer movimiento dei solenoide suele causar una perturbacin en la conducta dei animal. Entonces, paradjicamente, parece
que la administracin de reforzamientos comestibles realmente ha reducido la conducta. El procedimiento comnmente adoptado en tales
circunstancias es hacer que los animales se adapten al sonido dei solenoide,
antes de tratar de evaluar la efectividad dei reforzamiento comestible. Por
analogia, entonces, pareceria que el castigo se pudiera estudiar de modo
semejante, haciendo primero que el animal se adapte a la novedad
consumada dei estmulo punitivo, en vez de presentarle el estmulo pu-

472

CAP. 9

C A ST IG O

nitivo a intensidad elevada en la primera presentacin. En ausncia


de tales precauciones, puede suceder que la supresin extremada producida por la ocurrencia inicial de un castigo de gran intensidad constituya una confusin de las propiedades aversivas dei estmulo punitivo
con sus propiedades de estmulo novedoso. Esta explicacin no parece
dar cuenta por completo de la sensibilidad que muestran las respuestas
castigadas ante un aumento sbito dei castigo. Chung (1965) ha no
tado este efecto cuando se aumenta sbitamente el requisito de fuerza
de una respuesta.
Inmediatez dei castigo

Al definir el castigo afirmamos que el estmulo punitivo debe administrarse despus de la respuesta que se ha de castigar. Por implicacin,
afirmamos tambin que tal administracin debe ser inmediata para lograr
un mximo de efectividad. Estes (1944) plante la cuestin de si era
necesaria la inmediatez dei castigo. Llev a cabo un experimento con
trol en el que el estmulo punitivo no era administrado inmediatamente
despus de la respuesta, sino algn tiempo despus de la emisin de
la misma. Los resultados de este procedimiento de castigo mediato se compararon con los resultados de un procedimiento de castigo inmediato.
stos indicaron que el estmulo punitivo era igualmente efectivo si se
reducan las respuestas cuando era inmediato y cuando no lo era. En
un estdio, Hunt y Brady (1955) obtuvieron resultados similares. En am
bos estdios la administracin dei castigo se limit a un perodo de
menos de una hora. En estdios posteriores (Azrin, 1956) se obtuvieron
resultados similares en que el castigo inmediato no era ms efectivo que
el mediato durante la primera hora. Sin embargo, despus de ese mo
mento las respuestas se recuperaron sustancialmente y muchas veces
por completo durante el castigo mediato, mientras que durante el cas
tigo inmediato las respuestas se redujeron indefinidamente y muchas
veces por completo. Para una efectividad duradera, el estmulo puni
tivo debe administrarse inmediatamente.
Cuando se quiere administrar el castigo inmediatamente despus de
una respuesta, el procedimiento tcnico es directo; sin embargo, el es
tdio dei castigo mediato presenta algunos problemas metodolgicos.
Tcnicamente, se han empleado cuatro mtodos para programar el casti
go mediato. En uno de estos mtodos, el estmulo aversivo se administra
por medio de un aparato contador, independientemente de la conduc
ta dei sujeto (Azrin, 1956). La desventaja aparente de este mtodo es
que, ocasionalmente, el estmulo aversivo puede presentarse inmedia
tamente despus de una respuesta. A fin de evitar este apareamiento

A D M IN IS T R A C I N DEL C A ST IG O

473

ocasional dei estmulo aversivo con la respuesta, se ha utilizado un


segundo mtodo en el que el experimentador observa al sujeto y admi
nistra el choque solamente cuando el sujeto no est respondiendo. Algu
nos investigadores (Estes, 1944; Hunt y Brady, 1955) han empleado
una combinacin de estos dos mtodos con el fin de evitar coincidncias
accidentales de las respuestas con el estmulo punitivo. El tercer mtodo
ha consistido en administrar automticamente un estmulo punitivo siempre que ha transcurrido un tiempo fijo sin emitir una respuesta. Pare
ceria que este tercer procedimiento fuera a prueba de tontos para eli
minar cualquier coincidncia de la respuesta con el estmulo punitivo. Con
todo, ste es precisamente el mtodo que ha usado extensivamente Sidman (1953) para mantener la conducta en vez de eliminaria. Cuando
este mtodo se emplea al mismo tiempo que el reforzamiento positivo
para una respuesta (Azrin, 1958; Kelleher y Cook, 1959) las respuestas
aumentan en vez de disminuir, como seria el caso con el castigo.
El cuarto mtodo para evitar que la respuesta sea seguida por el
inicio dei estmulo punitivo consiste en abandonar el uso de un estmulo
punitivo discreto. En este mtodo de estimulacin no contingente, el
ms simple de todos, el estmulo punitivo se presenta como un evento
continuo, ms que discreto. Si el estmulo se presenta sin interrupcin,
no existe ninguna posibilidad de que el inicio o la terminacin dei es
tmulo coincida con la ocurrencia de una respuesta en particular. Este
mtodo de programar el castigo mediato evita las desventajas de los
tres mtodos anteriores. Con todo, el choque elctrico no puede usarse
fcilmente para comparar este mtodo de castigo mediato con el cas
tigo inmediato, pues el choque elctrico continuo da lugar a reacciones
esquelticas que pueden interferir con la emisin ^de respuestas. El ruido
es un estmulo punitivo ms adecuado para usarlo en presentaciones
continuas, pues el ruido continuo no parece producir reacciones esque
lticas interferentes. En un estdio en que se emple el ruido como
castigo inmediato, se hizo una comparacin con los efectos dei ruido
continuo (Azrin, 1958). El ruido se programo con sujetos humanos de
dos maneras: en el procedimiento de castigo inmediato se produca
un estallido ruidoso inmediatamente despus de cada respuesta, mientras que en el segundo procedimiento el ruido se administraba conti
nuamente. Se encontro que las respuestas se reducan mientras estaba
presente la contingncia punitiva en el procedimiento en el que el
ruido se administraba inmediatamente despus de las respuestas. Cuando
el ruido se administraba en una base continua, en vez de en una con
tingente sobre la respuesta, no se produca ninguna reaccin duradera.
Parece, entonces, que la inmediatez dei castigo es un determinante fun
damental dei grado de reduccin de respuestas obtenido. En los cuatro

474

CAP. 9

C A ST IG O

mtodos, slo en las etapas iniciales dei castigo tiene un efecto apreciable el castigo mediato, al reducir la emisin de respuestas.
Intensidad dei castigo

Se ha encontrado que la intensidad dei castigo es uno de los principales determinantes dei grado de reduccin de la respuesta que produce
el castigo. Todos los estdios de la intensidad dei castigo han descubierto que mientras mayor sea la intensidad dei estimulo punitivo, mayor ser la reduccin de las respuestas castigadas (Appel, 1963; Azrin,
19596; 1960a; Azrin, Holz y Hake, 1963; Brethower y Reynolds, 1962;
Dinsmoor, 1952; Estes, 1944). Cuando se ha aplicado un choque
elctrico, como en los estdios anteriores, la supresin ha sido virtual
mente completa en las intensidades altas (Appel, 1961; Azrin, 1959a).
Como se hizo notar anteriormente, la amplia gama de efectividad dei
choque elctrico constituye su principal ventaja. La severidad dei cho
que elctrico puede manipularse a lo largo de una gama lo suficien
temente amplia para producir cualquier grado de supresin deseada. No
todos los estmulos aversivos han resultado poseer el grado de efectividad
dei choque elctrico. Como se vio en la figura 3, el castigo de tiempofuera produjo poca supresin, incluso cuando la duracin de tiempo-fuera
era muy grande. De modo semejante, el castigo administrado por medio
dei ruido intenso no parece ser capaz de eliminar completamente las
respuestas dentro de la gama de intensidades practicable que ha sido
empleada. Utilizando seres humanos como sujetos, Azrin (1958) en
contro que haba poca supresin, relativamente, cuando la intensidad
dei castigo sonoro era de 105 decibeles o menos. Las intensidades grandes,
hasta de 135 decibeles, redujeron las respuestas aproximadamente en
un 50 por ciento. Cuando se usaron pichones como sujetos, Holz y
Azrin (1962a) encontraron que el castigo sonoro reduca las respuestas
en no ms dei 80 por ciento, aunque la intensidad dei ruido fuera de
138 decibeles. Cuando se us una bofetada de la barra como estmulo
punitivo, el grado de supresin parece ser igualmente pequeno (Skin
ner, 1938), aunque no se hizo ninguna manipulacin experimental de
la intensidad de la bofetada para determinar si se podia aumentar el
grado de supresin. Las rfagas de aire parecen ser muy efectivas. Masserman (1946) informo que haba una supresin completa cuando las
respuestas se castigaban con rfagas de aire. De nuevo, no se hizo ningn estdio de los cmbios dei grado de supresin como funcin de la
intensidad de la rfaga de aire. Es probable que la capacidad que
tiene el choque elctrico de producir cualquier grado de supresin que se
desee, explique en parte el uso generalizado dei choque elctrico como
estmulo punitivo.

A D M IN IS T R A C I N DEL C A STIG O

475

Programa de castigo
RAZN FIJA

En el caso ms simple, se administra un estmulo punitivo por cada


respuesta. Este programa de castigo puede disenarse como un castio-o
continuo por analogia con el reforzamiento positivo. Alternativamente
puede administrarse un estmulo punitivo por cada n respuestas (cas
tigo R F). La primera presentacin dei castigo RF produjo una aceleracin positiva en el periodo situado entre las administraciones sucesivas
dei estmulo punitivo (Azrin, Holz y Hake, 1963). En la exposicin
continua, surgi una tasa de respuestas uniforme sin ninguna aceleracin ni desaceleracin de las respuestas castigadas entre las administracio
nes sucesivas dei estmulo punitivo. La uniformidad de la tasa de respuestas
prevaleci cuando la razn de las respuestas no castigadas en relacin con
las castigadas se aumento de 1:1 a 1000:1; la uniformidad dei patrn de
respuestas no fue alterada por los cmbios de intensidad dei castigo ni
por el nivel de privacin de comida, aunque cada una de estas operaciones cambi la tasa de respuestas absoluta. La frecuencia de las respuestas
castigadas estuvo en funcin directa de la razn fija: mientras mayor era
la proporcin de respuestas castigadas, mayor fue la reduccin de la
respuesta. De este modo, el castigo continuo (RF 1) produjo la mayor
supresin. Zimmerman y Ferster (1963) encontraron la misma superioridad dei castigo continuo sobre el intermitente usando un periodo de
tiempo-fuera como estmulo punitivo. Hendry y Van-Toler (1964) en
contraron una aceleracin negativa de las respuestas bajo el castigo de
razn fija cuando las respuestas eran mantepidas con reforzamiento
continuo, en vez dei programa de reforzamiento de intervalo variable
que usaron Azrin, Holz y Hake (1963).
INTERVALO FIJO

Bajo el castigo en IF, el estmulo punitivo se administra a la primera respuesta que se emite despus de un tiempo fijo transcurrido
desde que se administro el castigo anterior. Hunt y Brady (1955) y
Azrin (1956) han utilizado este programa con algunas modificaciones.
En ambos estdios, se produjo una reduccin general de las respuestas
con las primeras administraciones dei estmulo punitivo. Se encontro que
despus de una exposicin prolongada al programa IF (Azrin, 1956),
la tasa de respuestas disminua a cero conforme se acercaba el momento
de administrar el castigo programado. La existencia de esta supresin
anticipatoria demuestra cmo puede restringirse especificamente el efecto dei castigo al momento en que el mismo ha sido programado. Este

476

CAP. 9

C A ST IG O

patrn temporal de las respuestas parece ser similar al patrn temporal


que se observa bajo el programa de reforzamiento IF con comida (Skin
ner, 1938), a excepcin de que se produce una aceleracin negativa, en
vez de una positiva.
An no se han estudiado extensivamente otros tipos de programas
de castigo. Al comparar el castigo continuo con un programa de castigo
intermitente, Estes (1944) encontro que el castigo continuo era ms
efectivo que el intermitente mientras el castigo estaba en efecto. Este
hallazgo concuerda con el descubrimiento acerca dei castigo de razn
fija, que tambin es un programa intermitente. En un estdio, se comparo
el programa de castigo IV con el IF y se encontro que el primero produca ms supresin (Azrin, 1956). Otro ejemplo de un programa de
castigo es el castigo diferencial de tasas altas de respuesta de Ferster
(1958).
Asueto sin castigo

Podra parecer que un periodo de asueto o tiempo-fuera de un


perodo de castigo permitiria ganar fuerza a la respuesta castigada. Los
resultados obtenidos indican que no es esto lo que sucede. Un mtodo
de proporcionar un asueto consiste en evitar que ocurra la respuesta
(no hay respuesta, no hay reforzamientos, no hay castigo) durante un
periodo entre las sesiones. Los resultados indican que la reimplantacin de
la situacin de castigo suprime las respuestas con igual intensidad (Masserman, 1946), a veces mayor (Azrin, 19596; 19606), que antes dei
asueto. Tambin se obtuvo este nivel de supresin cuando se interrumpi
brevemente una sola sesin (Azrin, 19606). Masserman (1946) cit un
ejemplo dramtico: dio un descanso de veinte meses a un gato cuyas res
puestas haban sido suprimidas por completo. Cuando se reintrodujo al
sujeto a la situacin experimental, las respuestas siguieron estando comple
tamente suprimidas, aunque se haba eliminado el estmulo punitivo.
Otro tipo de asueto permite que la respuesta sea reforzada mientras
el castigo se elimina temporalmente. Podra parecer que los reforza
mientos adicionales fortalecen la respuesta y que sta resiste los efectos
de cualquier castigo posterior. De nuevo, los hallazgos indican que lo
que sucede es que el retiro dei castigo tiene como resultado una su
presin igualmente grande (Brethower y Reynolds, 1962) o mayor (Azrin,
19606; Masserman, 1946) cuando el castigo se vuelve a aplicar pos
teriormente. El espacio temporal por si mismo no reduce los efectos
supresivos dei castigo.
Se ha visto que la efectividad dei estmulo punitivo es influida por
la intensidad, la frecuencia, la programacin y la distribucin temporal
dei estmulo. Tambin se ha encontrado que cada uno de estos factores

V A R IA B LE S Q UE INFLU YEN EN LOS EFECTOS DEL C A STIG O

477

desempena un papel primordial como determinante de la efectividad de


un estmulo reforzante; por ejemplo, se ha encontrado que el refor
zamiento demorado es menos efectivo (pero no inefectivo) para mantener la respuesta cuando se usa comida como reforzamiento (Skinner,
1938). Asimismo, se ha visto que el castigo demorado fue menos efectivo
(pero de ninguna manera inefectivo) para suprimir las respuestas; y se
ha encontrado que un periodo de descanso aumenta la efectividad de un
reforzador positivo (Ferster y Skinner, 1957; Reynolds, 1961) dei mismo
modo que hemos visto que un periodo de descanso o asueto aumenta
la efectividad dei castigo. El reforzamiento positivo y el castigo parecen comparables en otros aspectos, como veremos en secciones posteriores.
Como regia emprica, parece adecuado describir al castigo como un
proceso semejante al reforzamiento positivo en trminos de sus deter
minantes, pero opuesto al mismo en trminos de la direccin dei cambio
conductual; por ejemplo, la frecuencia es un determinante primordial
tanto de las respuestas reforzadas con comida (Skinner, 1938) como
de las respuestas castigadas. Un aumento de la frecuencia de la ad
ministracin de comida aumentar las respuestas reforzadas con comida,
pero un aumento de la frecuencia de la administracin dei castigo har
disminuir las respuestas castigadas. Ciertamente, es necesario hacer investigaciones adicionales a fin de dilucidar la generalidad de esta comparacin terica dei reforzamiento con el castigo. Sin embargo, a un
nivel descriptivo, el castigo y el reforzamiento estn entrelazados inextricablemente: la propia existencia dei proceso de castigo exige que
haya algunos procedimientos de reforzamiento concurrentes, como vere
mos en la seccin siguiente.
VARIABLES DEL REFORZAMIENTO QUE INFLUYEN
EN LOS EFECTOS DEL CASTIGO

Si una respuesta es castigada, pero no es reforzada de alguna ma


nera, se extingue por la ausncia de .reforzamiento, y el uso dei castigo
slo acelera la eliminacin de la respuesta. Dinsmoor (1952) ha expresado la misma opinin acerca de la existencia necesaria dei refor
zamiento.
Para que una persona pueda aprender a emitir en primer lugar una cierta
respuesta, supuestamente se requiere algn tipo de reforzamiento. Si el
reforzamiento se presenta como una simple consecuencia fsica dei acto,
no parece haber ninguna razn para suponer que el reforzamiento cese
siempre que se empieza a aplicar el castigo. En realidad, si el reforzamiento
se suprime durante mucho tiempo, se inicia la extincin, y tal vez deje de
haber respuestas que castigar (pg. 27).

478

CAP. 9

C A ST IG O

Una situacin punitiva duradera debe incluir tanto el reforzamiento


como el castigo de las respuestas. Examinemos varios aspectos dei re
forzamiento que se han revelado significativos para la efectividad dei
castigo.
Programas de reforzamiento

Ya que la respuesta castigada tambin es reforzada, la eleccin de


un programa de reforzamiento en particular debe ser importante para
determinar el efecto que va a tener un estmulo punitivo. En el caso
ms simple, cada respuesta es reforzada y castigada. Un programa de
reforzamiento continuo crea una situacin especial en la que el castigo
se administra en el mismo momento en que el organismo se acerca al
reforzamiento, como sucede en el estdio de Masserman (1946). Como
resultado de esto, la rfaga de aire punitiva elimin tanto la conducta
de alimentarse como la respuesta operante. Este problema se reduce al
mnimo si se utiliza un programa de reforzamiento intermitente en el cual
el estmulo punitivo no se aparee exclusivamente con el reforzamiento
de comida, pues las respuestas no reforzadas sern tambin castigadas.
Se ha encontrado que el tipo de reduccin de la respuesta que pro
duce el castigo depende dei tipo de programas de reforzamiento que
est manteniendo las respuestas castigadas. Cuando se usa nicamente
un programa de reforzamiento IV, las respuestas se emiten a una tasa
uniforme (Ferster y Skinner, 1957). El castigo de cada respuesta reduce
la tasa, pero no cambia esta uniformidad bsica (Azrin, 1960a; 19606;
Brethower y Reynolds, 1962; Dinsmoor, 1952; Holz y Azrin, 1961).
Cuando se usa un programa de reforzamiento IF, normalmente se
presenta una aceleracin positiva de las respuestas entre los reforzamientos
(Ferster y Skinner, 1957). Puede considerarse que el grado de esta ace
leracin de la respuesta es un tipo de discriminacin temporal o un
patrn. Se han creado dos medidas (Fry, Kelleher y Cook, 1960; Herrstein y Morse, 19756) para cuantificar el grado de aceleracin de la
respuesta. Cuando se administra un castigo por cada respuesta, puede
reducirse considerablemente el nmero de respuestas IF (Azrin, 1958;
Estes, 1944; Skinner, 1938), pero el grado de discriminacin temporal
permanece inmutable (Azrin y Holz, 1961).
Bajo el reforzamiento RF, la tasa de respuestas suele ser bivalente:
de inmediato despus dei reforzamiento se presenta un periodo de cero
respuestas, seguido por un cambio repentino a un encarreramiento de
la razn con una tasa de respuestas muy alta (Skinner, 1938). Cuan
do el castigo se administra a cada respuesta durante el reforzamiento RF,
la pausa posreforzamiento se alarga, pero hay slo una ligera reduc-

V A R IA B LE S Q UE INFLU YEN EN LOS EFECTOS DEL C A ST IG O

479

cin en la alta tasa de respuestas (Azrin, 19596). Dardano y Sauerbrunn


(1964a) encontraron el mismo resultado cuando se administraba un solo
castigo a la primera respuesta de la razn fija. La parte inicial dei encarreramiento de la razn parece ser muy sensible a los efectos dei casti
go. Esto puede verse en un segundo experimento de Dardano y Sauer
brunn (19646) en el que una larga pausa precedia al encarreramiento
de la razn cuando se administraba un choque intenso durante la parte
inicial de la razn. La pausa era ms corta cuando el choque intenso se
administraba durante la ltima parte de la razn. En un tercer experi
mento, Dardano y Sauerbrunn (1964c) encontraron que sus sujetos preferan un requisito de tasa elevada que no era castigada, a un requisito
de tasa baja que era castigada. El uso dei castigo durante el reforza
miento RF no se manifiesta en una tasa ms baja, como sera de esperarse por la definicin bsica dei castigo. La tasa de respuestas terminal
permanece constante; lo que se reduce es la tasa de respuestas total.
El procedimiento de reforzamiento puede disponerse tambin de una
manera tal que haya un reforzamiento diferencial de las tasas bajas. Este
programa rdb produce ordinariamente una emisin de respuestas de
tasa baja en la que los tiempos entre respuestas generalmente se aproximan al tiempo entre respuestas mnimo requerido para obtener refor
zamiento (Anger, 1956). Asimismo, se obtienen explosiones de res
puestas ocasionales; esto se nota en la alta frecuencia que tienen los
tiempos entre respuestas cortos en la distribucin dei tiempo entre res
puestas. Cuando se castiga cada respuesta durante el reforzamiento
rdb, estos tiempos entre respuestas cortos son eliminados, incluso con
bajas intensidades de castigo que no producen cmbios en el resto de
la distribucin de los tiempos entre respuestas (Holz, Azrin y Ulrich,
1963). En las intensidades de castigo ms altas, se alarga el tiempo modal
entre respuestas.
Hemos visto que la eleccin de un programa de reforzamiento en
particular para mantener la respuesta castigada, determina el patrn
temporal que tienen las respuestas durante el castigo. A fin de especificar
la naturaleza de la reduccin de respuestas que produce el castigo, se
debe especificar cul es el programa de reforzamiento que est manteniendo las respuestas. La simple afirmacin de que el castigo reduce
las respuestas castigadas es inadecuada y, ocasionalmente, inexacta.
Frecuencia dei reforzamiento

Se han efectuado dos estdios (Azrin y Holz, 1961; Estes, 1944)


en los que se ha comparado el grado de reduccin de las respuestas
que se produjo cuando el castigo se aplic durante la extincin, con el

CAP. 9

480

F IG U R A 4.
d iv e rsa s

prim ero, el
cada

Efectos

in te n sid a d e s
cual

se

de

la
de

extincin
c a stig o

a d m in istro

al

de

la s

re sp u e sta s

m anten id o.
in icio

respuesta. (T o m a d o de A z rin y

de

H olz,

No
la

em itid a s

hubo

sesin .

n in g n
El

c a stig o

en

un

in te rv a lo

refo rza m ie nto


se

C A ST IG O

a d m in istro

fijo

d e sp u s
d e sp u s

ante
dei
de

1 9 6 1 .)

grado de reduccin habido cuando el castigo se aplic durante el refor


zamiento. En ambos estdios se encontro que el castigo produca una
tasa de respuestas ms baja cuando se aplicaba durante los perodos
de extincin. Asimismo, en ambos estdios se demostro que en tanto se
mantuviera el castigo mientras duraba el perodo de extincin, el pro
ceso de extincin podia acortarse considerablemente, tanto con respecto
al nmero de respuestas como por lo que se refiere al tiempo que du
raba la extincin (vase la figura 4). Parece, entonces, que tanto una
frecuencia de reforzamiento reducida, como el castigo de gran intensi
dad operan en la misma direccin; ambos procedimientos reducen la
tasa de la respuesta. De este modo, cuando ambos se usan simultnea-

V A R IA BLE S Q UE INFLU YEN EN LOS EFECTOS DEL C A ST IG O

481

mente, la eliminacin de la conducta es ms rpida que cuando se


emplea slo el castigo o la extincin.
Hemos visto que la presencia o ausncia dei reforzamiento de la
respuesta castigada determina la efectividad dei castigo. Tambin sucede
que la adicin de un castigo altera la frecuencia dei reforzamiento de
la respuesta castigada. Como se dijo anteriormente, porlo general se usa
el castigo para contrarrestar un reforzamiento concurrente. Como la
administracin dei reforzamiento depende de la emisin de las respues
tas, la reduccin de stas mediante el castigo lleva generalmente a una
reduccin de la frecuencia de reforzamiento. Si se usa un programa
de reforzamiento RF, existe una interrelacin inversa entre la inten
sidad dei castigo y la frecuencia de reforzamiento (Azrin, 1959>), pues
la frecuencia de reforzamiento se reduce en proporcin directa a la
efectividad dei castigo. Bajo programas de intervalo, generalmente el n
mero de respuestas emitidas es mayor que el nmero necesario para
obtener la mxima frecuencia de reforzamiento. Por tanto, la reduccin
de la frecuencia de la respuesta por medio dei castigo lleva a poca o
ninguna reduccin de la frecuencia de reforzamiento, salvo cuando las
respuestas se suprimen casi completamente (Azrin y Holz, 1961; Holz,
Azrin y Ulrich, 1963). Es probable que muchos investigadores hayan
utilizado los programas de reforzamiento de intervalo debido a este
alto grado de independencia que hay entre el castigo y la frecuencia
de reforzamiento.
El programa de reforzamiento drb es especialmente til como m
todo para estudiar el castigo. Como el castigo produce pausas ms largas
entre las respuestas, a menudo la frecuencia de reforzamiento aumenta
durante el castigo (Holz, Azrin y Ulrich, 1963). Puede considerarse
que el castigo de las respuestas drb se hace en provenho dei sujeto
castigado (mayor frecuencia de reforzamiento positivo). En resumen, el
proceso dei castigo lleva indirectamente a una menor frecuencia de re
forzamiento en los programas de reforzamiento de razn, a una mayor
frecuencia de reforzamiento bajo el reforzamiento drb, y a pocos cmbios
bajo el reforzamiento de intervalo.
Una opinin comn acerca dei castigo pretende que ste interfiere
con la ejecucin deseable o productiva. El empleo dei reforzamiento drb
es un caso en el que el castigo de una respuesta aumenta realmente la
eficiencia de esa respuesta. De tal suerte, es inexacto considerar que
el empleo concurrente dei castigo y el reforzamiento constituye necesariamente una situacin de conflicto acerca de la recepcin dei
reforzamiento. En realidad, slo durante los programas de reforzamiento
de razn los efectos reductivos dei castigo llevan a una disminucin
dei reforzamiento.

482

CAP. 9

C A ST IG O

Motivacin para responder

La medida en que una respuesta reforzada con comida resiste los


efectos dei castigo depende dei grado de privacin de comida. Dinsmoor
(1952) encontro que el castigo reduca las respuestas si el sujeto era
privado de comida en mayor o menor grado. Sin embargo, con una considerable privacin de comida, las respuestas eran reducidas en una
proporcin ms pequena. Se ha encontrado que cuando ha estado en
efecto una larga historia de reforzamiento de IV con comida, la tasa
de respuestas no cambia apreciablemente como funcin dei grado de
privacin de comida (Ferster y Skinner, 1957). No obstante, cuando
se agrega el castigo despus de esta larga historia, la tasa de respuestas
castigadas parece ser extrahamente sensible, incluso, a cmbios ligeros de
privacin de comida (Azrin, 19606; Azrin, Holz y Hake, 1963). En
un caso, el castigo se volvi casi inefectivo al aumentar el grado de moti
vacin para emitir las respuestas castigadas (Azrin, Holz y Hake, 1963).
Sin embargo, si las respuestas han sido completamente suprimidas por
una motivacin baja para la comida, el aumento de la motivacin no
parece ser efectivo para restablecer las respuestas (Masserman, 1946;
Storms, Boroczi y Broen, 1962).
Nmero de respuestas disponibles

En la mayora de los estdios sobre el castigo, se pone a disposicin


dei sujeto una sola respuesta para obtener el reforzamiento. Cuando
esta respuesta tambin es castigada, el sujeto no tiene ningn medio
alternativo para obtener el reforzamiento de comida. Si el castigo hace
que el sujeto deje de responder por completo, no se produce ningn
reforzamiento. Consideremos ahora la situacin en la que el sujeto s
tiene a su disposicin alguna respuesta alternativa que no ha sido cas
tigada y que puede producir el reforzamiento. Hemos visto anteriormente
ejemplos de este caso en el experimento de Holz, Azrin y Ayllon (1963),
en una seccin anterior dedicada a los efectos dei tiempo-fuera. En este
punto podemos poner en tela de duda si los resultados de este experi
mento son aplicables a las situaciones punitivas en general, o si se limitan a las situaciones que utilizan las propiedades nicas de un periodo
de tiempo-fuera como estmulo punitivo.
Herman y Azrin (1964) llevaron a cabo un experimento en el
que se repitieron las caratersticas esenciales dei procedimiento de
Holz; sin embargo, en vez de emplear un tiempo-fuera como estmulo
punitivo, usaron un ruido. Los resultados obtenidos con ruido, como
se ve en la figura 5, fueron esencialmente los mismos que se obtuvieron

VA R IA BLE S Q UE INFLU YEN EN LOS EFECTOS DEL C A STIG O

483

M IN U TO S
F IG U R A 5.
nos

en

un

R egistros a c u m u la tiv o s de
p ro g r a m a

de

refo rzam ie nto

la s
IV .

re sp u e stas
No

se

c a s t ig a d a s

in d ic a n

la s

em itid a s

p o r su{etos

a d m in istra c io n e s

de

hum a
refo rza -

m ientos. El c a stig o era un so n id o m olesto e m itid o p o r un z u m b a d o r, q u e se a p lic a b a a ca d a


respuesta. (B a s a d o en d a to s to m a d o s de H e rm a n y A z rin ,

1 9 6 4 .)

con el tiempo-fuera. La tasa de respuestas en una situacin de respuesta


nica fue afectada slo ligeramente por una intensidad dada de cas
tigo sonoro; mientras que en una situacin de respuesta alternativa, la
tasa de respuestas castigada emitida en el mismo manipulando fue reducida por completo y casi inmediatamente. Parece que la situacin
de respuesta alternativa produce una mayor supresin de respuesta cas
tigada que una situacin de respuesta nica.
En un experimento adicional (Azrin, datos inditos) se usaron pichones como sujetos y un choque con un electrodo como estmulo puni
tivo, a fin de estudiar los efectos de una situacin de respuesta alterna
tiva en comparacin con una situacin de respuesta nica. Como
manipulandos, se usaron dos teclas de respuesta circulares. Los picoteos
en cualquier tecla eran reforzados segn un programa de reforzamiento
con comida RF 25. Cuando se pona a disposicin dei sujeto una sola
tecla, mediante el procedimiento de cubrir la segunda tecla, las 25 res
puestas dei requisito de razn fija tenan que ser emitidas en el manipu
lando disponible. Cuando dispona de las dos teclas, el sujeto podia
distribuir las 25 respuestas de cualquier manera; una parte, todas o
ninguna de las 25 respuestas podan emitirse en un manipulando dado.
El castigo por medio de un choque en la cola se administraba a cada
una de las respuestas emitidas en una de las teclas. Cuando slo haba
un manipulando (situacin de respuesta nica), se registraba un castigo

CAP. 9

484

C A ST IG O

IN T E N SID A D D E L CASTIG O ( V O L T IO S )
F IG U R A 6.
Los

d a to s

H a b a

La
se

ta sa

tom aro n

d o s teclas de

lle n a r el req u isito


a u m e n to

ca d a

con

in te nsid ad .

re sp u e sta
n ativa).

un

p ic h n

c a s t ig a d a s
que

com o

h a b a

Este

fu nci n

sid o

de

re fo rza d o

la

in te n sid a d

b a jo

un

dei

castigo.

p ro g r a m a

RF 2 5 .

respuesta; la s resp ue stas e m itid a s en a m b a s teclas e ra n efectiva s p a ra


concurrente

d escargas

a lte rn ativa)
(T om ad o

re sp u e stas

de

RF. El c a stig o se a d m in istro a

p re fe rida , de m a n e ra
se

de

de

d ie z

voltio s,

p ro ce d im ien to

se

teclas

con

de A z rin

to d a s

con el p ro g ra m a

am bas
Holz,

d e ja n d o

llev

d a to s

de
no

la s

RF de

cabo

p a sa r
con

resp ue sta

re sp ue sta s

com ida .
por
la

La
lo

em itid a s

m en os

tecla

d e scu b ie rta s

en

in te n sid a d
cinco

p re fe rid a
(con

la

d ei

d ia s

cubierta

resp ue sta

tecla

ca stigo
p a ra
(sin
a lter

p u b licad o s.)

por cada respuesta. Cuando se disponia de ambos manipulandos en la


situacin de respuesta alternativa, slo se castigaban las respuestas emi
tidas en un manipulando (el manipulando preferido).
Una parte de los resultados de este experimento se resumen en la
figura 6, que muestra la tasa de respuestas emitida en el manipulando
castigado con diversas intensidades de choque. Puede verse que la tasa
de respuestas emitida en el manipulando castigado estuvo en funcin
inversa de la intensidad dei choque, como se muestra en la parte supe
rior, en la seccin sobre la intensidad dei castigo. No se puede observar
ninguna reduccin de las respuestas superior a aproximadamente 40
voltios en la situacin de respuestas nica; a 50 voltios, la tasa se redujo
slo en un 10%. Incluso a 60 voltios, la tasa de respuestas sigui siendo
de aproximadamente el 70% de la tasa no castigada. En la situacin de
respuesta alternativa, el castigo no tuvo un efecto ms pronunciado.
A 50 voltios, se suprimieron completamente las respuestas emitidas en
el manipulando castigado, aunque la misma intensidad de castigo pro-

V A R IA B LE S Q UE INFLU YEN EN LOS EFECTOS DEL C A ST IG O

485

dujo una reduccin muy pequena en la situacin de respuesta nica.


Por tanto, podemos llegar a la conclusin de que la situacin de respuesta
alternativa hace que una intensidad de choque dada produzca una ma
yor supresin que en una situacin de respuesta nica, ya sea que el
estmulo aversivo sea un periodo de tiempo-fuera, un ruido molesto, un
choque con electrodo o que los sujetos sean seres humanos o pichones.
Escape de un estmulo punitivo

Acabamos de estudiar la situacin en la que el sujeto dispone concurrentemente de una respuesta alternativa no castigada mientras se
castiga una respuesta diferente. Consideremos ahora la situacin en la
que el sujeto tiene un medio para escapar de la situacin en la que
la respuesta es castigada, a una situacin en la que la respuesta no es
castigada. En el procedimiento punitivo comn, el sujeto tiene la opcin
de responder y recibir tanto el castigo como el reforzamiento, o de no
responder, en cuyo caso no recibe ninguna de las dos cosas. El procedi
miento de respuesta alternativa difiere dei procedimiento comn en que
hay una segunda respuesta que proporciona la misma frecuencia de
reforzamiento y no proporciona ningn castigo. En el tercer procedi
miento que examinamos ahora, al sujeto se le da la oportunidad de
escapar enteramente de la situacin relacionada con el
castigo.
El procedimiento es el siguiente:
un pichn es reforzado concomida
segn un programa de reforzamiento de razn fija a fin de establecer
una frecuencia de respuestas elevadas. Luego se administra el castigo en
forma de un choque elctrico despus de cada respuesta, con lo cual se
construye el procedimiento comn de castigo y reforzamiento con comida
concurrentes. Luego se pone a disposicin dei sujeto una. segunda tecla
de respuestas. La respuesta emitida en esta segunda tecla de respuestas
no produce reforzamiento ni comida. En vez de eso, produce un cambio
de estmulos, que consiste en un cambio de la iluminacin y un cam
bio dei nivel de ruido dei ambiente. Ante este estmulo cambiado, el
sujeto puede responder enla tecla de respuesta comn y obtener comida
como reforzamiento, pero sin que se administre ningn castigo. Entonces,
la funcin de la respuesta de escape emitida en la segunda tecla de
respuestas es la de proporcionar un periodo de escape durante el cual
puede emitirse la respuesta sin ser castigada. Una vez emitida la respues
ta de escape, el periodo de seguridad dura hasta la administracin dei
reforzamiento. Inmediatamente despus de la comida reforzante, el sujeto
debe emitir otra respuesta de escape con el fin de reinstalar el periodo
de escape.

CAP. 9

486

C A ST IG O

IN T E N S ID A D D EL C AST IG O ( V O L T IO S )

F IG U R A 7.
Las

R e sp u e stas

re sp u e sta s

em itiera

una

se

de

un

c a s t ig a b a n

resp ue sta

de

p ich n

tp ico

en

concurrentem ente

e sca p e

en

otra

tecla

un

RF

(cu rva
de

25

de

continua),

respuesta,

lo

refo rzam ie nto


a
que

m en os

con

que

p ro d u c a

com ida.
el

un

sujeto
p erio do

d u ra n te el cual p o d a n em itirse la s re sp u e stas sin q u e se a p lic a ra el c a stig o (cu rva p u n te a d a ).


(T om ad o d e A zrin , H ake, H olz y H utch inson , 1 9 6 5 .)

La figura 7, basada en los datos de Azrin, Hake, Holz y Hutchinson


(1965), muestra los resultados de este procedimiento. Cuando no se
administro ningn castigo o se administro uno muy ligero, se emitieron
pocas respuestas de escape. Cuando la intensidad lleg a 40 voltios, el
sujeto estaba emitiendo respuestas de escape suficientes para permanecer
en la situacin segura durante casi toda la sesin experimental. La misma
figura muestra que las respuestas se desplazaron de la situacin estmulo
donde haba castigo a la situacin estmulo en la que no lo haba. En
este procedimiento, el castigo no solamente llev a una reduccin de las
respuestas castigadas, sino que retir al sujeto de la situacin estmulo
en la que se haba programado el castigo.
En la investigacin anterior se comparo experimentalmente este pro
cedimiento de escape con el procedimiento de castigo comn en el cual
ningn escape era posible. Los resultados de esta comparacin se muestran en la figura 8, tomada de Azrin, Hake, Holz y Hutchinson (1965).
El procedimiento de escape y castigo tuvo como resultado mayor supre
sin de respuestas castigadas que el procedimiento que no tena escape. La
lnea continua de la figura 8 indica la reduccin progresiva de las res
puestas como funcin de la intensidad dei castigo sin oportunidad de esca
par. En esta figura puede verse que no se obtuvo una supresin completa,
sino hasta que se alcanz una intensidad de 70 voltios. En 30 voltios se
observo poca o ninguna supresin cuando no haba ningn escape po-

VA R IA BLE S Q UE INFLUYEN EN LOS EFECTOS DEL C A STIG O

487

co

F IG U R A 8.
c o m p a ra d a
U na

so la

p eriodo,

T a sa
con

de

la

re sp u e stas

t a sa

resp ue sta

em itid a

q u e te rm in a b a

e ra n m a n te n id a s
1 9 6 5 .)

con

de

c a s t ig a d a s e m itid as,

re sp ue stas
en

una

c a s t ig a d a s
tecla

con el sigu ie n te

un

p ro g r a m a

RF

de

cuando

em itid a s

e sc a p e

reforzam iento.
25.

(T om ad o

n in g n
hay

e lim in a b a

el

L as
de

no h a y
cuando

re sp u e sta s
A zrin ,

H ake,

un

e sca p e

p osible,

e sca p e

posible.

c a stig o
p ara
H o lz

d u ra n te

un

ob ten er co m id a
y

H utchinson,

sible; sin embargo, en el procedimiento de castigo y escape (lnea


punteada), 30 voltios produjeron una eliminacin casi completa de las
respuestas castigadas. A la ligera intensidad de 40 voltios, la respuesta
castigada se redujo a un nivel cero. De tal suerte, una intensidad de cas
tigo que produjo poca o ninguna supresin en el procedimiento en el
que no haba la oportunidad de escapar, produjo una supresin completa
en el procedimiento de castigo y escape. A fin de evaluar la fuerza de
esta conducta de escape, en la tercera parte dei procedimiento se le pedia
al sujeto que emitiera ms de una respuesta para producir el periodo de
escape. Se encontro (vase la figura 9) que, si se empleaba el periodo
de escape como evento reforzante, podan mantenerse requisitos de razn
fija hasta de aproximadamente cien respuestas. Asimismo, cuando la
respuesta de escape se programaba segn un programa IF, surgia el pa
trn de respuestas IF comn. De este modo, parece evidente que la
tendencia a escapar de una situacin seriamente punitiva fue lo bastante
grande para mantener niveles sustanciales de respuestas de escape. Estos
resultados muestran que uno de los principales efectos que se producen
al castigar una respuesta es la generacin de una fuerte tendencia por
parte dei sujeto a escapar totalmente de la situacin punitiva. Esta ten
dencia a escapar de la situacin punitiva se ve incluso a intensidades
de castigo que no son lo bastante severas para suprimir la propia res
puesta castigada.

488

CAP. 9

C ASTIG O

ESCAPE RF D E L C A ST IG O

500

(/)<
>
<
_J

D
D

O<

B-44

10 M IN UTO S
F IG U R A
esca p e

9.

Las re sp u e sta s de escap e

dei castigo.

Los

p e rio d o s

de

son

re fo rza d a s en

escap e

se

in d ica n

en el registro de resp uestas. El p a p e l de registro n o


Los tres

registros

ex p e rim e ntale s

de

de

la s

un

re sp u e sta s em itid a s en
y H utch inson , 1 9 6 5 .)

re sp u e stas

sujeto.
una

de

D u rante
tecla

de

escap e
el

se

p e rio d o

resp ue sta

una
con

fija

ln e a

corri d u ra n te

tom aro n
de

ra zn
la

d e sd e

escape,

diferente.

se

p or un

o b licu a

p e rio d o de

corta

tra z a d a

lo s p e rio d o s de escape.
el

in icio

e stuvie ro n

(T om a d o

de

de

la s

sesion es

re fo rz a n d o

A z rin ,

H a ke ,

las
H olz

Hemos visto que el procedimiento de reforzamiento que se usa para


mantener una respuesta es un determinante fundamental de la efectividad
dei castigo sobre esa respuesta. La misma intensidad de castigo que eli
mina completamente las respuestas bajo un conjunto de procedimientos
de reforzamiento, puede no afectar a la respuesta de ninguna manera
bajo un conjunto diferente de procedimientos de reforzamiento. No es
suficiente especificar las variables relacionadas con la administracin dei
castigo, como lo son la intensidad, la inmediatez y lo gradual de su
aplicacin. Son igualmente importantes la frecuencia y el programa de
reforzamiento, la motivacin para responder, as como tambin la oportunidad de obtener el reforzamiento por medio de una respuesta no
castigada o en una situacin no castigada. La contribucin de estas
variables conductuales es enorme. No poder observar los efectos reductivos de un estmulo que se supone punitivo puede atribuirse a la situa-

C ARAC TERSTICAS DEL PRO CESO DE C A ST IG O

489

cin de reforzamiento utilizada y no a su inefectividad como estmulo


punitivo.
CARACTERSTICAS DEL PROCESO DE CASTIGO

Hemos examinado con algn detalle los diversos factores que determinan la efectividad dei castigo. Veamos ahora algunos de los cmbios
de la conducta que parecen ser resultado caracterstico dei uso dei cas
tigo. Primero, analizaremos los resultados de los estdios sobre el castigo
en trminos de la permanencia, la rapidez y el grado de supresin producidos durante el castigo prolongado. Luego, examinaremos algunos
cmbios distintivos que se producen en la conducta al terminar el castigo.
En seguida, nos ocuparemos de los aspectos discriminativos dei castigo,
que han tenido relativamente poco reconocimiento a pesar de su importancia. El aspecto discriminativo dei castigo se refiere a la relacin que
tiene un estmulo punitivo con otros eventos. Estos otros eventos pueden
referirse a la presencia o ausncia dei propio castigo (como en una
situacin donde hay castigo intermitente o periodos alternados de cas
tigo). El castigo puede asociarse discriminativamente con un estmulo
reforzante o con un periodo de reforzamiento, o incluso con un estmu
lo asociado al reforzamiento. Veremos que en la conducta hay cmbios
caractersticos como resultado dei castigo, pero que algunos de estos cm
bios se derivan de la asociacin nica que tiene el castigo con otros
eventos, ms que de las propiedades estrictamente aversivas dei estmulo
punitivo.
Permanencia de la supresin

Una de las caractersticas primordiales dei castigo es la virtual irreversibilidad o permanencia de la reduccin de la respuesta que se pro
duce, una vez que la conducta ha sido suprimida por completo. Los
investigadores han notado que la respuesta castigada no se recupera du
rante largo tiempo, incluso despus de que se ha retirado la contingncia
de castigo (Appel, 1961; Azrin, 19606); Masserman, 1946; Storms,
Boroczi y Broen, 1962). Por ejemplo, en un estdio (Azrin, 19606) en
el que se emple como estmulo punitivo un choque muy intenso, se
encontro que las respuestas se reducan a cero y no se recuperaban en
un periodo de seis dias, aunque ya no estuviera presente el castigo.
En ese estdio, se encontro que la probabilidad de obtener una supre
sin tan duradera estaba en funcin de la intensidad dei castigo. A inten
sidades de castigo bajas, no se presentaba este efecto duradero y par
cialmente irreversible dei castigo, Podra tratarse de explicar estos efectos

490

CAP. 9

C A ST IG O

duraderos dei castigo teniendo en cuenta lo absoluto dei grado de su


presin. El castigo intenso no solamente redujo las respuestas al nivel
incondicionado u operante, sino que las redujo a un nivel de cero abso
luto. Como el castigo se administra solamente despus de que se emite
una respuesta, el sujeto no tiene ninguna oportunidad de notar la ausn
cia dei castigo, a menos que responda. Si el castigo es tan severo que
elimine completamente las respuestas, entonces deja de existir la oportu
nidad de notar la ausncia dei castigo.
El mismo tipo de razonamiento se us anteriormente al analizar la
persistencia de la conducta de evitacin cuando se eliminaba la contin
gncia de choque. En los procedimientos de castigo y evitacin, la con
ducta dei animal puede alterarse de tal manera que elimine virtualmente
todo contacto entre ella misma y las presentaciones dei choque. Para
hacer comparaciones, podemos comparar el castigo con la extincin dei
reforzamiento con comida en trminos dei grado de reduccin de las
respuestas obtenido.
Sin embargo, la extincin lleva a una reduccin de las respues
tas; la extincin a largo plazo reduce la conducta al nivel incondicionado
u operante (Skinner, 1938), especialmente si se observa una recuperacin
espontnea. La existencia continua de respuestas durante la extincin, si
bien a un nivel operante, asegura que el animal ajuste su conducta
de acuerdo con cualquier cambio experimental dei procedimiento de
extincin. En contraste con la extincin, el castigo puede producir una
reduccin completa y duradera de las respuestas que evitarn el regreso
de las respuestas castigadas, incluso despus de que se haya eliminado el
castigo.
Rapidez de los efectos dei castigo

Q u tan rpidamente reduce el castigo a la conducta? Virtual


mente, en todos los estdios dei castigo se ha estado completamente de
acuerdo en que la reduccin de las respuestas que produce el castigo
es inmediata si el castigo es efectivo. Cuando los datos se han presentado en trminos de los cmbios que se presentan de momento a mo
mento, la reduccin de las respuestas se ha producido dentro de las
primeras administraciones dei castigo (Azrin, 1956, 1959a, 1959, 19606;
Dinsmoor, 1952) o en unos cuantos minutos (Estes, 1944). Por supuesto,
el grado (Estes, 1944) y la duracin (Azrin, 19606) de esta supresin
inicial est en funcin directa de la intensidad dei castigo. Una variacin menor de esta regia acerca de la inmediatez dei efecto, fue la efmera explosin de respuestas que se present despus de la introduccin
de la bofetada de la barra como estmulo punitivo (Skinner, 1938).

C ARAC TERSTICAS DEL PRO CESO DE C A ST IG O

F IG U R A
nido.
una

10.

Cada

R ecup e racin
c u rva

sesin d ia r ia de u n a

z a m ie n to

IV

con

co m p leta

rep resenta

el

de

Las

la s

registro

hora. En todo

com ida.

491

resp ue stas

a c u m u la tiv o

d uran te
de

la s

un

m om en to estuvo en accin

pequenas

ln e a s

o b licu a s

que

c a d a a d m in istra c i n dei reforzam iento. El c a stig o se ad m in istro


d u ra n te la sesin de castigo. (T om ad o de A zrin , 1 9 6 0 b .)

c a stig o

re sp u e sta s
hay

un
en

d e sp u s

ligero

e m itid a s

p ro g r a m a
el
de

de

regisrto
ca d a

m a nted ura n te
refor
in d ica n

resp ue sta

Recuperacin durante el castigo

As como se ha encontrado que el castigo intenso produce una supre


sin caracterstica, completa e irreversible, tambin se ha observado que
el castigo ligero permite que haya una recuperacin caracterstica dei
castigo. La figura 10, tomada de Azrin (1960a), muestra la ejecucin
de un pichn que fue reforzado con administraciones de comida. Cuando
se aplic por primera vez el castigo en forma de un choque elctrico
breve despus de cada respuesta, la tasa de respuestas disminuy sustancialmente a aproximadamente el 50% de la tasa no castigada durante
los primeros 30 minutos de castigo. Sin embargo, en los dias subsiguientes la tasa de respuestas ascendi gradualmente hasta que, hacia la
dcima hora, haba habido una recuperacin casi completa. Tambin

492

CAP. 9

C A ST IG O

hubo una recuperacin de las respuestas dentro de cada sesin mientras


el castigo estaba todavia en accin. E,n la misma serie de estdios, se
encontro que solamente haba un grado de recuperacin parcial con las
intensidades de castigo ms elevadas. Cuando la intensidad dei castigo
fue muy grande (aproximadamente de 100 voltios), no hubo ninguna
recuperacin. De tal suerte, el grado de recuperacin que hay durante
el castigo est en funcin de la intensidad dei castigo. Se ha encontrado
que este proceso de recuperacin caracteriza a muchas situaciones de
castigo. Se ha observado la recuperacin al usar la bofetada de una
barra con ratas (Skinner, 1938), el ruido con pichones (Holz y Azrin,
1962a), el choque a las patas con pichones (Azrin, 1956), el choque con
monos (Hake y Azrin, 1963) y el castigo condicionado con pichones
(Hake y Azrin, 1965). Sin embargo, no en todos los estdios ha habido
este proceso de recuperacin; esto se hizo evidente al usar el tiempofuera (Holz, Azrin y Ulrich, 1963). Por tanto, parece que el fenmeno
de la recuperacin depende no slo de la intensidad dei estmulo puni
tivo, sino tambin de otras variables, como la naturaleza dei estmulo
punitivo.
Recuperacin despus dei castigo
EFECTO DE CONTRASTE DEL CASTIGO

Otra caracterstica general de la conducta que surge durante el pro


ceso de castigo es un aumento de la conducta despus de la terminacin
dei castigo. La figura 11 muestra que cuando dej de administrarse el
castigo, las respuestas se emitieron a una tasa que excedi al nivel no cas
tigado. Esta tasa de respuestas extraordinariamente alta se mantuvo slo
temporalmente por supuesto, ya que las respuestas regresaron eventualmente
a la lnea-base no castigada comn. Se ha encontrado que el aumento
compensatorio se presentaba despus de usar intensidades de choque hasta
el punto de producir una supresin completa (Azrin, 19606). Pero, como
se not anteriormente, cuando hay una supresin completa de las res
puestas, tal vez la contingncia de castigo no lleve a la recuperacin
de las respuestas, y mucho menos a algn aumento compensatorio. La
figura 11 muestra tambin que el aumento compensatorio se presenta
despus de un castigo prolongado, incluso cuando la tasa de respuestas
habida durante el castigo se ha recuperado a su nivel anterior al castigo.
Una de las maneras de interpretar este aumento de las respuestas pos
terior al castigo (Estes, 1944) pretendia que la tasa aumentada compensaba la dismlnucin de las respuestas que haba producido el castigo.
Pero, como lo muestra la figura 11, este aumento se produca incluso

C AR A C TERSTICA S DEL PRO CESO DE C A ST IG O

F IG U R A

11.

Efecto

re fo rz a d a s con

que

tiene

co m id a de

un

la

a d ic i n

493

el

retiro

sujeto. El c a stig o fu e

un

dei

c a stig o

sob re

la s

ch oq u e elctrico b reve

resp ue sta s

que

se a p li-

ca b a d e sp u s de ca d a resp ue sta en los d ia s q u e se en cu en tran entre a q u e llo s rep resen ta d o s


por
en

la s
un

ln e a s

de

p ro g ra m a

rayas
IV

1.

verticales.
(T om ad o

de

El

refo rzam ie nto


A zrin ,

de

c o m id a

se

o b te n a

to d o s

los

d ia s

1 9 6 0 a ).

cuando la tasa de respuestas castigadas se recuperaba completamente


y no haba nada que compensar. Por tanto, puede ser ms adecuado
llamarlo efecto de contraste dei castigo, en vez de efecto compensatorio.
Siguiendo estos mismos lineamientos, se ha descubierto que el castigo
severo o prolongado reduce la respuesta a tal grado que las respuestas
extra emitidas en el fenmeno de contraste no igualan ni compensan la
reduccin de las respuestas habidas durante el periodo de castigo (Azrin,
19606; Estes, 1944).
La explicacin de este efecto de contraste dei castigo no es totalmente
clara. Ya hemos visto que su existencia no puede explicarse apelando
a un aumento compensatorio que compensa a las respuestas perdidas
durante el castigo. Hay otra explicacin posible. Sabido es (Ferster y
Skinner, 1957) que si se introduce un periodo de extincin o de tiempofuera en medio de una sesin, pueden incrementarse las respuestas pos
teriores a la extincin. Dicho de otra manera, parece que despus de
una frecuencia de reforzamiento pequena se presenta una tasa de res
puestas elevada. Reynolds (1961) ha elaborado con algn detalle este

494

CAP. 9

C A ST IG O

principio general. Se recordar que algunos procedimientos punitivos reducen simultneamente la frecuencia dei castigo en algn grado. Cuando
se elimina la contingncia de castigo, simultneamente, se est permitiendo que haya una mejor frecuencia de reforzamiento. Muy bien podra
ser que el aumento dei nivel de las respuestas que se observa al retirar
el castigo (aumento posterior al castigo) fuera realmente un producto
dei cambio de la frecuencia de reforzamiento, ms que dei cambio dei
castigo.
Si se emplea un programa de reforzamiento de razn para mantener
la conducta (Azrin, 19596), el aumento posterior al castigo puede explicarse en estos trminos, pues cualquier disminucin de la tasa de res
puestas lleva necesariamente a una disminucin correspondiente de la
tasa de reforzamiento. Sin embargo, cuando se emplea un programa
de reforzamiento de intervalo para mantener las respuestas, el grado de
reduccin dei reforzamiento es generalmente muy pequeno, a menos que
se supriman completamente las respuestas. Es improbable que esta dismi
nucin pueda explicar el aumento de las respuestas posteriores al castigo.
Adems, los resultados de experimentos que han utilizado un programa
drb de reforzamiento con comida evidencian que la frecuencia de refor
zamiento alterada no puede explicar el aumento de las respuestas poste
riores al reforzamiento. Como se menciono anteriormente, Holz, Azrin y
Ulrich (1963) encontraron que el castigo aumento realmente la frecuen
cia dei reforzamiento drb durante el periodo de castigo. No obstante, los
resultados mostraron que de todos modos se produca el aumento pos
terior al castigo al suprimir el castigo de las respuestas drb. En este
caso, el efecto de contraste dei castigo se presentaba despus de una
mayor frecuencia de reforzamiento, en vez de despus de una menor.
Pareceria, entonces, que hay dos tipos de fenmenos de contraste: uno
que se presenta en la transicin de una frecuencia de reforzamiento baja
a una mayor (contraste de reforzamiento) y el segundo, en la transicin
de una frecuencia de castigo elevada a una frecuencia de castigo ms
baja (contraste de castigo). Holz y Azrin (1962a) han comparado y
estudiado experimentalmente los dos tipos de fenmenos de contraste,
y han encontrado que se trata de procesos diferentes.
Recuperacin graduai despus dei castigo

Con anterioridad se vio que cuando se suspende el procedimiento


de castigo, se produce casi inmediatamente un nivel de respuestas inusitadamente alto. Este regreso inmediato de las respuestas ha sido obser
vado slo despus dei castigo continuo. El castigo intermitente lleva a
una recuperacin gradual de las respuestas despus de que se ha termi

C ARAC TERSTICAS DEL PRO CESO DE C A ST IG O

495

nado el castigo (Azrin, Holz y Hake, 1963; Estes, 1944). Vimos ante
riormente que el castigo intermitente produca durante el periodo de
castigo menos supresin que el castigo continuo. Podemos resumir esta
comparacin entre el castigo continuo y el intermitente de la manera
siguiente: el castigo continuo produce menos supresin que el intermi
tente mientras se mantiene la contingncia de castigo; sin embargo, des
pus de que se ha suprimido la contingncia de castigo, el castigo continuo
permite una recuperacin ms rpida de las respuestas, debido a que la
ausncia dei castigo puede discriminarse ms rpidamente.
Es probable que a intensidades de castigo muy altas, la relacin sea
ms complicada. Podra esperarse que el castigo continuo produjera una
supresin completa y que el castigo intermitente produjera solamente
una supresin parcial. Como la recuperacin se demora o desaparece
despus de una supresin completa, parece que a intensidades muy altas
el castigo continuo fuera ms efectivo que el castigo intermitente, tanto
en trminos de la permanencia como en el grado de supresin.
Discriminacin y generalizacin a travs dei castigo
D ISC RIM IN A CI N DE LAS CONDICION ES DE CASTIGO

Un procedimiento especialmente informativo para estudiar el castigo


consiste en presentar dos estmulos alternadamente, castigar las respues
tas emitidas ante un estmulo (de aviso) y dejar sin castigar las res
puestas emitidas ante el otro estmulo (periodo seguro). Este procedi
miento produce una reduccin de las respuestas durante el estmulo de
aviso, pero poca o ninguna reduccin durante el estmulo de seguridad
(Azrin, 1956; Brethower y Reynolds, 1962; Dinsmoor, 1952; Hunt y
Brady, 1955). Por tanto, puede usarse el castigo para producir una dis
criminacin entre dos situaciones estmulo. Cuando slo se administra
intermitentemente el estmulo punitivo durante el estmulo de aviso, en
contramos que el propio estmulo de aviso controla una tasa de respuestas
baja (Azrin, 1956; Hunt y Brady, 1955). En un estdio, por ejemplo,
las respuestas fueron castigadas en un promedio de una cada dos minutos
durante el estmulo de aviso (Azrin, 1956). Despus de un momento, la
tasa de la respuesta disminuy a cero tan pronto como apareci el es
tmulo punitivo, aunque todavia no se haba administrado un estmulo
punitivo durante esa presentacin particular dei estmulo de aviso.
GENERALIZACIN DEL CASTIGO

Cuando castigamos las respuestas en presencia de un estmulo y no


las castigamos en presencia de otro, la supresin se limita completamente

496

CAP. 9

C A ST IG O

al primero. Examinaremos ahora qu efecto produce el castigo en las


respuestas en presencia de otro estmulo. Los hallazgos afirman que alguna supresin de las respuestas se generaliza inicialmente en el periodo de
seguridad; pero despus de una exposicin prolongada, las respuestas
emitidas durante el periodo de seguridad se recuperan sustancialmente,
y generalmente llegan al nivel no castigado (Azrin, 1956; Dinsmoor,
1952; Honig y Slivka, 1964). En realidad, las respuestas emitidas durante
el periodo de seguridad llegan a alcanzar un nivel que sobrepasa al nivel
existente antes de aplicar el castigo ante el otro estmulo (Brethower y
Reynolds, 1962). Este aumento que se presenta ante el estmulo no cas
tigado es el mismo efecto de contraste dei castigo que ha sido descrito
anteriormente.
La figura 12, que representa un trabajo no publicado que llevamos
a cabo en nuestro laboratorio, muestra los resultados tpicos que se
obtienen cuando se administra un castigo a las respuestas ante un estmu
lo, pero no ante otro. Aunque esta figura se presenta primordialmente
para representar el fenmeno de generalizacin de la supresin, los re
sultados muestran tambin el fenmeno de la inmediatez dei efecto dei
castigo, el establecimiento de una discriminacin basada en el castigo
y la recuperacin comn que se presenta durante el castigo, as como
tambin el efecto de contraste dei castigo. Dos estmulos se alternan cada
diez minutos; la lnea de reajuste vertical de la pluma indica el momento
dei cambio. En el segmento superior no hay ningn castigo, y la tasa de
la respuesta es aproximadamente igual en ambos estmulos. Los reforzamientos de comida se han programado para las respuestas, pero no se
indican en el registro. En el segundo segmento, desde arriba se administra
un choque breve que tiene una intensidad de aproximadamente 60 vol
tios despus de cada respuesta omitida en presencia de un estmulo
(como lo indica el sombreado de la figura). Puede verse que las respues
tas se suprimieron ante ambos estmulos. Esta generalizacin de la su
presin dura diez dias. Las respuestas regresan hasta el onceavo dia
y, primordialmente, ante el estmulo seguro. Hacia el doceavo dia se
emiten muchas respuestas durante el estmulo ante el cual se castigan
las respuestas. Hacia el dia decimoquinto, las respuestas se emiten a una
tasa alta ante ambos estmulos, pero a un nivel ligeramente pequeno
durante el castigo.
Los efectos iniciales dei castigo, entonces, son reducir las respuestas
no solamente durante el estmulo ante el cual se castigan las respuestas,
sino tambin en presencia dei estmulo ante el cual no se castigan las
respuestas. Esta generalizacin de la supresin desaparece eventualmente
y las respuestas regresan a su nivel no castigado durante el estmulo
seguro. En realidad, la tasa de las respuestas emitidas durante el es-

C ARAC TERSTICAS DEL PRO CESO DE C A ST IG O

497

|er dia

2 o dia
10 dia

11 dia

12 dia

15o dia

M IN U T O S
F IG U R A

12.

p re sen ta

el

que

R egistros
m om en to

ilu m in a n

p ro g r a m a

IV

cion es

de

de

parte

la

choques.

p or
de

d etrs

Las

ca m b io
a

la

refo rzam ie nto

com ida.

Las

su p e rio r
zonas

e ra c a s t ig a d a con
y Holz, d a to s n o

a c u m u la tiv o s
dei

dos

(sin

tecla
con

luces

castigo)

s o m b re a d a s

de

de

la s

re sp u e sta s

un

estm u lo

de

respuesta.

co m ida ;
e stm u lo

se

representa

d e s ig n a n

un ch oq u e b reve
p u b licad o s.)

(1 0 0

en

la

la

el

de

de

un

un

color

Las

a lte rn a b a n
co nd icin

co nd icin

no

ln e a
de

e ra n

se

vertical

diferente

re fo rz a d a s

in d ic a n

la s

cada

d ie z

m inu tos.

en

que

no

estm u lo
de

La

otro

re sp u e sta s

registro

m ilise g u n d o s)

pichn.

60

la

en

la

voltios.

que

se

re

color,
en

un

a d m in istra El

registro

a d m in istra ro n

ca d a

(T o m a d o

resp ue sta
de

A z rin

tmulo seguro (dei dia doce al dia quince) es mayor que la tasa de
respuestas que se han obtenido antes de la aplicacin dei castigo, lo
cual muestra un efecto de contraste. Estos resultados no solamente revelan
el fenmeno de recuperacin que hay durante el castigo, sino tambin un
efecto de asueto dei castigo. La insercin dei periodo de seguridad

CAP. *9

498

C A ST IG O

o asueto alternando con el castigo tiene como resultado un mayor


grado de supresin de la respuestas, luego que ha terminado el asueto.
EL CASTIGO C O M O ESTMULO DISCRIM INATIVO

El principal efecto que tiene el castigo es disminuir la respuesta que


se est castigando. Adems, el estmulo punitivo puede adquirir propie
dades discriminativas; es decir, el estmulo punitivo puede llegar a fun
cionar como senal de algn otro evento. Las propiedades discriminativas
o de senal que tiene el estmulo punitivo no son especficas de ese es
tmulo como estmulo punitivo, sino que pueden ser adquiridas por cual
quier estmulo. Generalmente, en los estdios acerca dei castigo se han
pasado por alto las propiedades discriminativas dei castigo. Tradicional
mente, los efectos de un procedimiento de castigo han sido interpretados
en trminos de los efectos reductivos dei estmulo punitivo. No obstante,
como veremos posteriormente, las propiedades discriminativas pueden
aumentar, ocultar o incluso contrarrestar las propiedades supresivas comunes dei estmulo punitivo, y producen as lo que parece ser un efecto
paradjico dei castigo.
El castigo como estmulo discriminativo de otro estmulo puni
tivo. Un estmulo punitivo puede convertirse en estmulo discriminativo
de diferentes tipos de eventos. Consideremos primero la situacin en la
que un estmulo punitivo se convierte en estmulo discriminativo de otro
estmulo punitivo. Dinsmoor (1952) altem periodos fijos durante los
cuales se programo un castigo con periodos fijos en los que no se programo
ningn castigo. No se us ningn estmulo externo para indicar el cam
bio de un periodo al siguiente. En tales circunstancias, el nico medio
que tena el sujeto para predecir si se iba a aplicar el castigo era si se
haba castigado o no la ltima respuesta. En el experimento de Dinsmoor,
el sujeto aprendi pronto que la administracin dei estmulo punitivo
significaba que la siguiente respuesta tambin seria castigada. Esto podia
saberse por el hecho de que poco despus de que era castigada una res
puesta, haba una disminucin inmediata de la probabilidad de las
respuestas sucesivas. Inversamente, una vez que se dejaban de castigar
una o dos respuestas, haba una rpida recuperacin de la tasa de la
respuesta hasta alcanzar su nivel no castigado. En este procedimiento,
los sujetos usaban la aplicacin de un estmulo punitivo como sexual de
la aplicacin de un castigo subsiguiente.
Tambin puede disponerse el castigo de tal manera que la adminis
tracin dei mismo sea un estmulo discriminativo de la ausncia, ms
que de la presencia de estmulos punitivos adicionales. En un experimento
(Azrin, Holz y Hake, 1963), se programo un castigo RF. Cuando se
aplic por primera vez el castigo RF, las respuestas se suprimieron com

C ARAC TERSTICAS DEL PRO CESO DE C A ST IG O

499

pletamente despus de cada administracin dei estmulo punitivo. Pronto


aprendi el sujeto que la respuesta nunca era castigada inmediatamente
despus de la administracin de un estmulo punitivo. En consecuencia,
desapareci gradualmente el periodo de supresin completa despus dei
castigo. En el estado estable los sujetos reanudaron pronto la emisin
de respuestas inmediatamente despus de la administracin de cada
estmulo punitivo.
El castigo como estmulo discriminativo de la ausncia de comida
como reforzamiento. Tambin puede disponerse que el estmulo puni
tivo se convierta en estmuio discriminativo de la ausncia dei reforzamien
to de comida que haba estado manteniendo la respuesta. Existen varios
mtodos para producir tales propiedades discriminativas dei estmulo pu
nitivo. En la mayora de los estdios en los que el estmulo punitivo pudo
convertirse en estmulo discriminativo dei reforzamiento de comida, los
experimentadores no analizaron el problema desde el punto de vista que
adoptamos aqui. Por tanto, analicemos estos otros estdios despus de
examinar primero un experimento (Holz y Azrin, 1961) que asoci
explicitamente el estmulo punitivo con el reforzamiento, de tal manera
que se pudieran estudiar directamente las propiedades discriminativas.
En este experimento, se alternaron perodos de reforzamiento intermi
tente con comida con perodos de extincin. No hubo ningn estmulo
externo. En estas circunstancias, el sujeto no tena manera de discriminar
las condiciones de reforzamiento de las de extincin. Entonces, se dispuso el procedimiento de tal manera que todas las respuestas eran casti
gadas durante el periodo de extincin, pero ninguna era castigada durante
el periodo de reforzamiento. Este procedimiento de castigo diferencial le
proporciono al sujeto un estmulo discriminativo de la presencia o ausn
cia de reforzamientos potenciales. El resultado de esta asociacin selectiva dei castigo con la extincin fue que el estmulo punitivo produjo
grandes reducciones de las respuestas. Estas reducciones no podan atribuirse al estmulo punitivo, pues la intensidad de este estmulo produca
ordinariamente poca o ninguna supresin. De este modo, vemos que
intensidades de castigo muy bajas o inefectivas de otra manera, produ
cen una reduccin sustancial de las respuestas si el castigo ligero se asocia
diferencialmente con un periodo de no reforzamiento.
El castigo como estimulo discriminativo de la presencia de re
forzamiento. Tambin puede disponerse el castigo de tal manera que su
administracin sea estmulo discriminativo de la presencia de comida como
reforzamiento. En la segunda parte dei experimento de Holz y Azrin
(1961), todas las respuestas fueron castigadas solamente durante el pe
riodo de reforzamiento. Tambin este procedimiento permiti al sujeto

500

CAP. 9

C A ST IG O

usar la aplicacin dei estmulo punitivo como un medio para reconocer


si el reforzamiento estaba disponible. El resultado de este procedimiento
fue invertir completamente los efectos comunes dei castigo. La tasa de
respuestas aument realmente en el periodo durante el cual se programo
el castigo y disminuy en el periodo en el que no haba ningn castigo.
Este mayor nivel de las respuestas durante el castigo se present a una
intensidad de castigo que haba producido la supresin de la respuesta,
en las circunstancias ms comunes en las que el estmulo no tena pro
piedades discriminativas. Se present el fenmeno, aparentemente paradjico, de que la iniciacin dei castigo produca un aumento de las
respuestas, en vez de la disminucin usual. Este empleo dei estmulo
punitivo como estmulo discriminativo de la comida como reforzamiento,
es comparable a la utilizacin de un estmulo neutro como estmulo
discriminativo de la comida como reforzamiento. Se ha encontrado que
cuando se asocia especificamente un estmulo neutro, como el clic dei
comedero, con la administracin de comida, el estmulo neutro aumenta
la tasa de respuestas durante la extincin. Se ha considerado que este
aumento de la tasa de respuestas surge dei reforzamiento condicionado
que proporciona el clic dei comedero (Skinner, 1938). El procedimiento
empleado por Holz y Azrin (1961) sustituy el estmulo neutro por un
estmulo punitivo. Por tanto, podemos considerar que el estmulo puni
tivo ha adquirido propiedades de reforzador condicionado.
Propiedades aversivas y discriminativas dei castigo. Anteriormen
te subrayamos que muchos procedimientos que se disenaron para estudiar
los efectos dei castigo pueden haber permitido inadvertidamente que llegaran a ser dominantes las propiedades discriminativas dei estmulo pu
nitivo. En los resultados antes citados, se vio que los efectos dei castigo
podan ser modificados enormemente si se asociaba explicitamente el
castigo con la presencia o ausncia dei estmulo reforzante. Los resultados
se interpretaron en trminos de las propiedades discriminativas dei es
tmulo punitivo, ms que en trminos de las propiedades aversivas. No
obstante, el control discriminativo se estudia comnmente con la presen
cia continua de un estmulo neutro (Ferster y Skinner, 1957). Consi
derar a un estmulo punitivo como estmulo discriminativo es un poco
extraordinario, porque necesariamente el estmulo es producido por la
respuesta, en vez de ser continuo. Holz y Azrin (19626) analizaron ex
perimentalmente las propiedades discriminativas dei castigo empleando
un procedimiento de control en el que se administraba un estmulo neu
tro a manera de choque elctrico breve. Se encontro que el estmulo
neutro producido por la respuesta podia adquirir propiedades discrimi
nativas si ese estmulo se asociaba diferencialmente con la presencia o
ausncia de las administraciones de comida. En muchos casos, no era

C AR A C TERSTICA S DEL PRO CESO DE C A ST IG O

501

necesario apelar a las propiedades aversivas dei choque, pues podan


obtenerse esencialmente los mismos resultados usando un estmulo neutro
como un destello de luz, en vez dei choque elctrico.
Examinemos ahora los resultados de un procedimiento que se utilizo
para estudiar el castigo (Estes, 1944; Skinner, 1938). En este procedi
miento, primero se refuerza a una rata con pelotillas de comida en un pro
grama de reforzamiento intermitente, a fin de establecer un nivel de res
puestas sustancial. Luego que el nivel de las respuestas reforzadas con
comida se ha estabilizado, se aplica la extincin. Simultneamente, se administran choques elctricos breves o bofetadas con la barra a cada una de
las respuestas. La pregunta que se ha planeado al utilizar este procedimiento
es si el uso concurrente dei castigo facilita la reduccin de las respuestas que
se presenta durante la extincin. En este procedimiento, se deja durar el
castigo y la extincin hasta que el nivel de las respuestas es muy bajo.
Entonces se elimina la contingncia de castigo y se le permite al animal
seguir respondiendo, pero todavia sin darle comida como reforzamiento.
La razn para hacer terminar el periodo de castigo es que se quiere ver
si la reduccin de las respuestas persiste durante el periodo de extincin,
incluso despus de que el castigo ha dejado de estar ah. El resultado
caracterstico de este procedimiento es que el uso concurrente dei castigo
y la extincin lleva a una reduccin de las respuestas mayor de la que
produce el uso de la extincin unicamente. Adems, se ha encontrado
que una vez que se elimina el castigo, las respuestas muestran un sbito
aumento de frecuencia, incluso cuando todavia est en accin el periodo
de extincin. Este sbito aumento de las respuestas que se produce des
pus de la terminacin dei castigo, ha sido propuesto como evidencia
de que los estmulos punitivos no debilitan verdaderamente a las res
puestas, sino que slo las suprimen. (Este punto de vista se examinar
con detalle en una seccin posterior.)
Aunque los resultados anteriores se interpretaron originalmente en
trminos de las propiedades aversivas dei choque, en base a nuestro
anlisis precedente podemos ver que el choque tambin puede haber ad
quirido propiedades discriminativas. Se recordar que en la parte original
dei procedimiento, las respuestas eran reforzadas y no se programaba
ningn castigo. De tal suerte, la disponibilidad de los reforzamientos de
comida pudo haberse asociado potencialmente con la ausncia de cas
tigo. En la segunda parte dei procedimiento, la extincin se aplic junto
con el castigo. Este procedimiento produce ahora una asociacin dife
rencial entre el castigo y la extincin, as como tambin una asociacin
diferencial dei no castigo con el reforzamiento. El estmulo punitivo pudo
haberse convertido en senal de que no haba comida disponible. Si este
razonamiento es correcto la terminacin dei periodo de castigo debe lie-

50 2

CAP. 9

R EFO R Z A M IEN T O

E X T IN C I N

C A ST IG O

SO LAM ENTE

HORAS
F G U R A

13.

Se u d o co stigo .

p ro g r a m a

IV

horas.

refo rzam ie nto

El

de

T a sa

de

refo rzam ie nto


no

se

re sp ue stas

con

co m ida,

a d m in istro

de

un

d u ra n te

d uran te

el

p ich n
una

que

se si n

p e rio d o

que

se

en cuentra

in in te rru m p id a
se

d e s ig n a

con

m ente ex tin ci n . D urante el p e rio d o que se d e s ig n a com o R > luz v e rd e , ca d a


h a c a

r a m b ia r

m iiise g u n d o s.

de

b ia n c o

(T om ad o de

verd e

A z rin

la

ilu m in a ci n

H olz, d a to s

no

de

la

tecla

de

respuesta,

en
de

un
siete

s o la

resp ue sta

d u ra n te

400

p u b licad o s.)

var a un aumento de las respuestas, pues la terminacin dei castigo re


instala a los estmulos discriminativos de que el reforzamiento est disponible. Entonces, a un nivel terico, parece posible explicar los cmbios
de la conducta en base a las propiedades discriminativas dei choque, ms
que en base a las propiedades aversivas.
Este anlisis terico fue evaluado en nuestro laboratorio siguiendo
el mismo procedimiento anteriormente descrito, pero sustituyendo el uso
dei choque elctrico por un destello de luz neutro. Primero, se reforz
a un pichn por responder en una tecla en un programa IV 2 de refor
zamiento con comida. Este programa estuvo en efecto durante un mes
aproximadamente. Durante ese tiempo, se iluminaba por detrs la tecla
con una luz blanca: no haba ninguna otra luz durante las sesiones
experimentales. Luego se duplico con sus detalles esenciales el procedi
miento seguido por Estes, pero no se aplic ningn castigo. En vez de
eso, cada respuesta produca en la tecla un cambio de iluminacin de 400
miiisegundos, de la luz blanca usual a una luz verde. Al mismo tiempo,
se suspendan los reforzamientos con comida. El efecto de este procedi
miento puede verse en la figura 13 (datos no publicados) que muestra
que el uso concurrente dei seudocastigo (es decir, la luz verde y el
periodo de extincin) produjo una rpida disminucin de las respuestas

C AR A C TERSTICA S DEL PRO CESO DE C A ST IG O

503

hasta un nivel cercano a cero. En la segunda parte dei procedimiento se


elimin el seudocastigo: la luz verde breve dej de presentarse despus
de cada respuesta. Se sigui entonces con el periodo de extincin. Puede
verse que la eliminacin de la luz verde produjo un aumento de las res
puestas rpido e inmediato. En realidad, el nivel de las respuestas sobrepas ligeramente al nivel que se haba observado anteriormente, durante
el reforzamiento. Luego disminuy gradualmente el nivel de las res
puestas hasta alcanzar otra vez un nivel cercano a cero. El gran nmero
de respuestas de extincin que se emiti cuando las respuestas dejaron de
producir la luz verde, muestra que el hacer que la luz verde se presentara despus de las respuestas acelero considerablemente la extincin.
Este es el mismo resultado que se obtuvo en los experimentos que
emplearon un choque elctrico; es decir, la adicin de un choque elctrico
despus de una respuesta acelero considerablemente el proceso de ex
tincin. Asimismo, el procedimiento presente produjo un aumento inme
diato de las respuestas cuando se elimin la luz verde, el mismo modo
que el procedimiento que emplea un choque produjo un aumento inme
diato de las respuestas cuando se suspendi el choque. De acuerdo con
nuestro anlisis terico, en este procedimiento se obtuvieron los mismos
resultados usando un estmulo neutro en vez de un estmulo aversivo. Por
tanto, no es necesario atribuir estos cmbios de conducta a las propie
dades punitivas dei choque. El resultado de este experimento hace evi
dente que debe prestarse mucha atencin a las propiedades discrimi
nativas que puede haber adquirido gracias a la presentacin de los
choques.
Este control discriminativo que ejercen los estmulos punitivos no
debe considerarse caracterstica nica de esos estmulos. El control dis
criminativo tambin se da comnmente con los estmulos reforzantes
positivos. Un ejemplo conocido es el programa de intervalo fijo con co
mida como reforzamiento, en el que la administrcin de comida se
convierte en estmulo discriminativo de la ausncia de comida, lo cual
produce un nivel menor de respuesas despus de cada administracin de
comida (Skinner, 1938). Inversamente, cuando se emplea un programa
mixto rfc de extincin de reforzamiento con comida, la administracin
de la comida se convierte en estmulo discriminativo de la posibilidad de
otras administraciones de comida. En un programa tal, se refuerza cada
respuesta de, por ejemplo, veinte respuestas. Luego, sin ningn aviso, se
deja de reforzar las respuestas durante, por ejemplo, diez minutos. Los
resultados de un procedimiento de esta naturaleza, llevado a cabo en
nuestro laboratorio, se pueden ver en la figura 14 (datos inditos). En
el primer dia de extincin despus de veinte reforzamientos con comida,
se emitieron mltiples respuestas de extincin. Sin embargo, puede verse

504

CAP. 9

F IG U R A

14.

a lte rn a d o s

R egistro
de

a c u m u la tiv o

refo rzam ie nto

de

co ntin uo

la s
y

de

re sp u e stas

e m itid a s

extincin.

Un

p or

un

p ich n

z u m b id o

de

resp ue sta

C A ST IG O

en

p erio do s
s e n a la

la

d is p o n ib ilid a d dei p rim er reforzam ie nto; de a h en a d elante, el sujeto n o tiene n in g n


e stm u lo d isc rim in a tiv o p a r a d isc rim in a r entre el p e rio d o de extincin y el de reforzam iento.
Cada

refo rzam ie nto

p ro d u c a

d o ra ,

lo

al

cual

a d m in ist ra b a

daba
en

sucesin

una

registro
r p id a .

pequena

la

defleccin

a p a rie n c ia

(T o m a d o de

de
A z rin

una
y

h a cia
b a rra

a b a jo

de

s lid a

H olz, d a to s n o

la

cuando

p lu m a
la

re g istra

co m id a

se

p ub lica d o s.)

que en el cuarto dia slo se emitieron dos o tres respuestas durante la


extincin. El sujeto haba aprendido que si una sola respuesta no era
seguida por la administracin de comida, entonces las otras respuestas
tampoco seran seguidas por la administracin de comida. La presencia
o ausncia de la comida haba adquirido un control discriminativo. Los
periodos repetidos de reforzamiento y de extincin establecieron un con
trol discriminativo que hizo disminuir el nmero de respuestas de ex
tincin, invirtiendo as la relacin comn en la que el nmero de res
puestas emitidas en la extincin aumenta en funcin dei nmero de
reforzamientos (Perin, 1942). Los efectos de una consecuencia conductual deben analizarse en trminos de sus propiedaes discriminativas y de
sus propiedades reforzantes o punitivas.
Respuestas correctas y respuestas incorrectas. El hecho de tener en
cuenta las posibles propiedades discriminativas dei estmulo punitivo ayuda a esclarecer otros tipos de procedimientos de castigo, en los que se
obtuvieron resultados aparentemente paradjicos. En el pasado, un pro
cedimiento empleado con frecuencia para estudiar el castigo era la situa
cin de eleccin con dos respuestas, una de las cuales se llamaba correcta
y la otra incorrecta. Este tipo de procedimiento fue utilizado por Thorndike (1932), Muenzinger, (1934) y Tolman, Hall y Bretnall (1932).
Operacionalmente, el llamarlas correcta o incorrecta slo significa
que la respuesta correcta es la que va seguida por un reforzamiento

C AR A C TERSTICA S DEL PRO CESO DE C A ST IG O

50 5

positivo, y la incorrecta es la que no va seguida por el mismo. Cuando


el procedimiento se dispone de tal manera que la respuesta correcta es
castigada, en realidad estamos diciendo que una respuesta es castigada
y reforzada, mientras que la otra no es castigada ni reforzada. En estas
circunstancias, el castigo y los reforzamientos se asocian entre si; entonces,
la ausncia dei castigo puede convertirse fcilmente en senal o estmulo
discriminativo de la ausncia de reforzamiento. Asimismo, la presencia
dei castigo puede convertirse en estmulo discriminativo de la presen
cia dei reforzamiento. De acuerdo con nuestro anlisis terico, podramos
esperar que el castigo de una respuesta correcta pudiera producir un
aumento de la probabilidad de esa respuesta, en contraste con la situa
cin en la que no se programo ningn castigo. Esencialmente, estos
mismos resultados se han obtenido en los experimentos anteriormente
mencionados; es decir, se encontro que la adicin dei castigo a la res
puesta correcta no produca el gran resultado de reducir la respuesta
en cuestin. Estos resultados parecen paradjicos y como tales se han
presentado, en vista de las supuestas propiedades aversiva dei cho
que elctrico. Sin embargo, estos resultados se desprenden razonablemente
de las propiedades discriminativas que se adquirieron indudablemente
por medio dei choque. De acuerdo con nuestro anlisis terico, no im
portaria si el castigo se administrara a la respuesta correcta o la inco
rrecta, en tanto que el procedimiento fuera consistente. Podra esperarse
que el castigo de la respuesta correcta o de la incorrecta tuviera como
resultado un aprendizaje ms rpido que el que se produce cuando no
hay castigo, pues cualquiera de los procedimientos punitivos proporciona
estmulos discriminativos.
El castigo durante el condicionamiento de evitacin. Las propiedades
discriminativas de un estmulo punitivo parecen ser efectivas en la situa
cin en la que una respuesta es castigada por medio dei mismo estmulo
que se haba empleado anteriormente para mantener una conducta de
evitacin. En el procedimiento de evitacin de Sidman (1953), una
respuesta pospone la administracin dei choque durante un tiempo fijo.
Si no hay respuestas, los choques se producen uno tras otro a una
frecuencia predeterminada. Los resultados de este procedimiento han indi
cado, por lo general, que el choque elctrico adquiere propiedades dis
criminativas, pues la administracin dei choque se convierte en la ocasin
para emitir una respuesta con el fin de posponer otras aplicaciones dei
choque. Esta propiedad discriminativa que tiene el choque durante el
condicionamiento de evitacin de choques, puede verse tambin en los
estdios en los cuales se mantuvo una alta tasa de respuestas programando
choques inevitables (Sidman, Herrnstein y Conrad, 1957), pues es de
suponerse que el choque constituy la ocasin para emitir las respuestas.

506

CAP. 9

C A STIG O

Este anlisis un poco especulativo de la situacin dei condicionamiento


de evitacin nos hace comprender algunos resultados obtenidos por Black
y Morse en su estdio de la evitacin de choques en perros (1961). En
sus procedimientos, se entren a unos perros a evitar un choque elctrico
emitiendo una respuesta de saltar. De acuerdo con nuestro anlisis te
rico, podramos esperar que el choque adquiriera propiedades discrimi
nativas, es decir, que la administracin dei choque fuera la ocasin ante
la cual la respuesta de saltar hara terminar el choque o lo evitaria.
Despus de proporcionarle al sujeto una historia de condicionamiento de
evitacin de choques, Black y Morse administraron el choque como es
tmulo punitivo de la respuesta de saltar. El resultado fue un aumento
temporal de las respuestas castigadas, como seria de esperar dadas las
propiedades discriminativas adquiridas por el choque. Eventualmente,
las administraciones adicionales dei estmulo punitivo suprimieron las res
puestas. Migler (1963) obtuvo un aumento semejante de las respuestas
cuando los choques se administraron como estmulos punitivos de res
puestas que se estaban reforzando concurrentemente con el escape dei
choque. Appel (1960) encontro este mismo aumento de las respuestas
cuando el castigo de stas se alternaba con la evitacin dei choque en
un programa mixto. Vemos de nuevo que el efecto reductivo dei castigo
puede ser invertido por una historia previa o por un procedimiento con
currente que permite al choque adquirir propiedades discriminativas.
Hemos visto varios cmbios caractersticos que se producen en la
conducta como consecuencia dei castigo. Algunos de los cmbios estn
en funcin de la aversividad dei estmulo punitivo, como la inmediatez
dei efecto, la reduccin potencialmente completa de la respuesta, el efec
to de contraste dei castigo, la generalizacin de la supresin y la recu
peracin que hay durante el castigo. Otros efectos dei castigo estn en
funcin de las propiedades discriminativas que este adquiere, como el
aumento de la supresin o la facilitacin paradjica.
Adems, hemos visto que el castigo es un proceso complejo porque
su efectividad depende no slo de la administracin dei estmulo puni
tivo, sino de las caractersticas dei procedimiento de reforzamiento que
mantiene a la respuesta castigada. As, el procedimiento de reforzamiento
puede interactuar con el procedimiento de castigo, de tal manera que
el efecto primordial de este ltimo es consecuencia de las propiedades
discriminativas dei estmulo punitivo y no necesariamente dei castigo por
si mismo. En vista dei nmero de interacciones, grande y generalmente
insospechado, que hay entre los procedimientos de castigo y de refor
zamiento, no es sorprendente que se haya llegado a conclusiones contradictorias acerca dei castigo. Por un lado, tal vez urja abandonar el
uso dei castigo debido a su inefectividad; por otro lado, se considera que

EFECTIVID AD DEL C A STIG O

507

el castigo es factor fundamental, en gran parte, de los desordenes mentales crnicos. Ahora que hemos revisado algunos de los hallazgos experimentales bsicos, examinemos detenidamente algunos de estos pro
blemas generales.
PROBLEMAS GENERALES: EFECTIVIDAD DEL CASTIGO
c,Es el castigo efectivo para eliminar la conducta?

Muchas veces se ha sugerido que no debera usarse el castigo. Una


de las razones para hacer esta afirmacin es que se supone que el cas
tigo no es muy efectivo para eliminar la conducta. No obstante, hay pocas
evidencias que sostienen esta afirmacin. A manera de una generaliza
cin descriptiva, podemos decir que el castigo puede ser muy efectivo;
en muchos estdios se ha producido una supresin completa de las res
puestas. Verdaderamente, muchas veces la supresin de las respuestas ha
persistido durante largo tiempo, incluso despus de que se ha eliminado
la contingncia de castigo. Aunque, ciertamente, en mltiples estdios
se ha producido slo una supresin parcial, seria errneo llegar a la
conclusin de que no era posible producir una supresin mayor. Debe
recordarse que en la mayora de las investigaciones se fortaleci delibera
damente una respuesta con reforzamiento positivo, de tal manera que
hubiera una lnea-base conductual estable sobre la cual se pudieran
evaluar los efectos reductivos dei castigo. De tal suerte, no es aventurado
afirmar que los investigadores deliberadamente han dejado de utilizar
intensidades de castigo lo bastante severas para producir una supresin
completa, pues la existencia de una supresin completa hace imposible
la evaluacin cuantitativa dei grado de reduccin alcanzado. La pregunta de si el castigo es efectivo o no puede contestarse de una manera
simple, pues se sabe que la efectividad depende de todos los factores hasta
ahora estudiados. Podra darse una contestacin definitivamente afirma
tiva si la pregunta se volviera a formular de la manera siguiente: ,;puede
el castigo reducir la conducta? En realidad, el grado en que elimina la
conducta puede constituir un problema.
iCmo debe disponerse el castigo para que tenga
un mximo de efectividad?

Vimos anteriormente que el castigo puede ser muy efectivo para eli
minar la conducta. Imaginemos que se nos asigna la tarea de eliminar
la conducta por medio de castigo. Resumamos brevemente algunas de las
circunstancias que, segn se ha encontrado, elevan al mximo su efec-

50 8

CAP. 9

C A ST IG O

tividad: a) el estmulo punitivo debe disponerse de tal manera que no


haya ningn escape no autorizado posible; b) el estmulo punitivo debe
ser tan intenso como sea posible; c) la frecuencia dei castigo debe ser tan
intensa como sea posible lo ideal es aplicar estmulo punitivo a cada
respuesta; d) el estmulo punitivo debe administrarse inmediatamente des
pus de la respuesta; e) no debe aumentarse gradualmente la intensidad
dei estmulo punitivo, sino que ste debe aplicarse a una intensidad mxi
ma; /) deben evitarse los periodos prolongados de castigo, especialmente
en lo que se refiere a las intensidades bajas dei castigo, pues de esta
manera puede haber un efecto de recuperacin; cuando se usan inten
sidades bajas de castigo, lo mejor es aplicarlas solamente durante un
corto tiempo; g) debe tenerse gran cuidado en que la administracin
dei estmulo punitivo no se asocie diferencialmente con la administra
cin de reforzamiento de otro modo, el estmulo punitivo puede adquirir
propiedades reforzantes condicionadas; h ) la administracin dei estmulo
punitivo debe constituir una senal o estmulo discriminativo de que un
periodo de extincin est en marcha; i) debe reducirse el grado de motivacin para emitir la respuesta castigada; j) debe reducirse igualmente
la frecuencia de reforzamiento positivo de la respuesta castigada; k) debe
haber una respuesta alternativa que no sea castigada, pero que produzca
el mismo o mayor reforzamiento que la respuesta castigada; por ejemplo,
puede esperarse que el castigo de la conducta criminal sea ms efectivo
si existe una conducta no criminal que produzca las mismas ventajas
que la conducta criminal; e) si no hay ninguna respuesta alternativa, el
sujeto debe tener acceso a una situacin diferente en la que obtenga
el mismo reforzamiento sin ser castigado; m) si no es posible adminis
trar el propio estmulo punitivo despus de una respuesta, entonces sigue
habiendo un mtodo de castigo efectivo; puede asociarse un estmulo
condicionado con el estmulo aversivo, y este estmulo condicionado puede
administrarse despus de una respuesta para lograr el castigo condicio
nado, y n ) puede usarse como castigo una reduccin dei reforzamiento
positivo cuando no es posible aplicar el castigo fsico, por razones prcticas, legales o morales. En tales situaciones, el castigo mediante el re
forzamiento positivo puede llevarse a cabo disponiendo la ocurrencia de
un periodo que tenga una frecuencia de reforzamiento reducida (tiempofuera) o disponiendo una disminucin dei reforzamiento condicionado
(costo de respuesta). Ambos mtodos exigen que el sujeto tenga un nivel
elevado de reforzamiento al empezar; de otro modo, no es posible retirar
el reforzamiento. Si va a emplearse un castigo no fsico, parece deseable
proporcionarle al sujeto una historia sustancial de reforzamiento, con el
fin de tener la oportunidad de retirarle el reforzamiento como medio
de castigo de las respuestas indeseables.

EFECTIVIDAD DEL C A ST IG O

509

c,Cmo

puede un estmulo ser inefectivo y seguir


siendo llamado estmulo punitivo?

Examinemos de nuevo nuestra definicin anterior dei estmulo puni


tivo como la consecuencia de una respuesta que reduce la probabilidad
futura de esa respuesta. Surge el problema de cmo designar a un es
tmulo que reduce a una respuesta en un momento, pero no reduce a
otra en otro momento; por ejemplo, si la respuesta castigada es mantenida por un programa de reforzamiento frecuente y existe un fuerte
estado de privacin, entonces el castigo puede ser inefectivo aunque se
aplique a intensidades altas. Por tanto, existe un dilema para definir
como estmulo punitivo a un estmulo de una intensidad dada, cuando
no puede notarse ninguna disminucin de la probabilidad de la respuesta
castigada. El punto crtico es que la efectividad dei castigo depende, en
gran medida, de las variables de reforzamiento que estn manteniendo
la respuesta. Si no se puede obtener una reduccin de las respuestas
usando un evento que se conoce como punitivo, estos resultados slo
sirven para indicar que las variables que mantienen a la respuesta casti
gada estn contrarrestando el efecto reductivo dei castigo.
c,Cmo puede ser que un sujeto parezca
gozar con el castigo?

En algunos casos, parece que el sujeto pudiera gozar con el castigo.


Este tipo de observacin ha estado relacionado con el problema general
de si el castigo es efectivo y de si debe aplicarse ste. Ya hemos visto
cmo una respuesta puede seguir emitindose sin que se reduzca su fre
cuencia, a pesar dei uso de un procedimiento de castigo. Las variables
de reforzamiento pueden eliminar fcilmente los efectos reductivos. Lo
que estamos analizando ahora es el fenmeno en el cual el uso dei pro
cedimiento punitivo ha aumentado realmente la frecuencia de la respues
ta, por encima de la frecuencia que existia antes de aplicar el castigo. Este
tipo de fenmeno se ha observado a menudo en el campo de la psico
logia clnica, donde se le da el nombre de masoquismo; en criminologa,
donde se le llama autopunicin, y en psicologia infantil, donde se le
denomina medio de llamar la atencin. Constituye un ejemplo de este
fenmeno el nino que parece portarse mal deliberadamente, hasta que la
madre suspende lo que est haciendo y lo regana o le da una tunda.
Puede encontrarse una explicacin de este efecto dei castigo en los hallazgos referentes a las propiedades discriminativas dei castigo, en los cuales se vio que el castigo aumenta la frecuencia de una respuesta si se
ha asociado un reforzamiento positivo con el estmulo punitivo.

510

CAP. 9

C A STIG O

Considrese el ejemplo dei masoquismo patolgico. Es comn que


se preste asistencia mdica y se sienta simpatia por una persona que ha
sufrido alguna lesin. Suponiendo que la asistencia y la simpatia sean
reforzadores positivos, estos reforzadores estn siendo asociados selectivamente con un estmulo aversivo que es la lesin. En el caso dei maso
quismo, la respuesta de maltratarse a uno mismo produce tanto el re
forzamiento (la simpatia) como el estmulo aversivo (la lesin). Si no se
tienen simpatia y asistencia cuando 110 hay lesin, entonces se ha llenado
el paradigma bsico para establecer las propiedades discriminativas dei
castigo, pues la presencia dei dolor se asocia selectivamente con el refor
zamiento, mientras que la ausncia dei dolor se asocia con la ausncia
de reforzamiento. Se deduce entonces que la conducta masoquista puede
eliminarse de dos maneras: a) retirando cualquier exceso de atencin
o de simpatia cuando se sufre la lesin, y b) dndole simpatia y aten
cin al indivduo por conductas que no sean la de lesionarse. El mismo
razonamiento se aplica a la eliminacin de la conducta criminal en adul
tos y a la eliminacin de conductas indeseables en los ninos. El padre que
slo presta atencin al nino cuando se porta mal (y, en consecuencia,
es castigado) ha transformado inadvertidamente el estmulo punitivo en
un estmulo reforzante condicionado. El resultado final puede ser que el
indivduo parezca estar buscando el castigo. Este fenmeno no debe
interpretarse como una contradiccin en cuanto a la efectividad dei
castigo, sino ms bien como una confirmacin de la efectividad dei refor
zamiento condicionado.
COMPARACIN DEL CASTIGO CON OTROS
PROCEDIMIENTOS
Comparacin del castigo con otros mtodos de
estimulacin aversiva

Hasta ahora, hemos considerado al castigo como un proceso comple


tamente aislado; sin embargo, es posible comparar al castigo con otros
tipos de programas de control aversivo tanto en trminos del procedi
miento usado, como en trminos de los resultados obtenidos. Sidman ha
aportado un medio simple y til para representar los programas de evita
cin (1953). Se usa la designacin R-CH para denominar el tiempo
transcurrido entre la respuesta y el estmulo aversivo. La designacin
CH-CH se usa para designar el tiempo transcurrido entre el estmulo
aversivo y la ausncia de una respuesta. El castigo puede describirse de
modo semejante en trminos de intervalos R-CH y CH-CH. En el para
digma del castigo, la respuesta produce inmediatamente el estmulo aver-

EL C A ST IG O Y O TRO S PR O C ED IM IE N T O S

511

sivo; por tanto, podemos decir que en el castigo el intervalo R-CH es


igual a cero. Por otro lado, en el castigo el intervalo CH-CH es infini
tamente grande, pues no se administra ningn estmulo aversivo a menos
que se emita una respuesta. De este modo, podemos darle un valor de
infinito al intervalo CH-CH. Mientras el castigo puede describirse como
un procedimiento en el que el intervalo R-CH es igual a cero y el inter
valo CH-CH es infinitamente largo, el condicionamiento de evitacin o
de escape tiene un intervalo R-CH mayor de cero y un intervalo CH-CH
menor que infinito. El castigo se diferencia dei condicionamiento de es
cape y dei de evitacin en trminos de si la respuesta tiene como resultado
un aumento o una disminucin de la estimulacin aversiva. Esta dife
rencia bsica entre el castigo por un lado y el condicionamiento de escape
y de evitacin por el otro, se refiere a la relacin existente entre la res
puesta y la direccin dei cambio de la estimulacin aversiva que acta
sobre el sujeto. Vemos que al analizar los efectos de la estimulacin
aversiva en la conducta, es necesario especificar la relacin temporal que
existe entre la estimulacin aversiva y la conducta que se emite.
Tambin puede hacerse una comparacin entre el procedimiento de
castigo y el procedimiento de supresin condicionada creado por Estes
y Skinner (1941). Al igual que el procedimiento de castigo, el de su
presin condicionada sirve para reducir las respuestas. El procedimiento
de supresin condicionada se diferencia dei castigo, el escape y la evi
tacin en que se deja sin especificar la relacin existente entre el estmulo
aversivo y una respuesta especfica. En vez de eso, lo que se especifica
es la relacin existente entre el estmulo aversivo y algn estmulo neu
tro. Esta diferencia esencial de procedimiento entre la supresin condi
cionada y los otros tres procedimientos se manifiesta en los resultados
obtenidos. En el castigo, el escape y el condicionamiento de evitacin, la
direccin dei cambio de las respuestas puede determinarse analizando
la direccin dei cambio de la estimulacin aversiva que se produce como
resultado de la emisin de las respuestas. En la supresin condicionada,
el estmulo aversivo no tiene ninguna relacin fija con las respuestas, sino
ms bien con un estmulo que anteriormente era neutro. An no se ha
podido determinar por qu el procedimiento de supresin condicionada
debe llevar a una reduccin y no a un aumento de las respuestas que
se emiten, pues el estmulo aversivo no tiene ninguna relacin fija con'
estas respuestas. Puesto que, tanto el procedimiento de supresin condi
cionada como el de castigo reducen las respuestas, podramos preguntarnos cul de los dos procedimientos es ms efectivo para eliminar las
respuestas que se estn emitiendo. En un estdio en el que se compararon
experimentalmente los dos procedimientos, se encontro que el castigo produca una supresin de las respuestas mucho mayor que la que produca

512

CAP. 9

C A ST IG O

el procedimiento de supresin condicionada (Azrin, 1956). La gran su


presin de las respuestas que produce el castigo indica que la relacin
existente entre la respuesta y el estmulo aversivo sigue siendo un factor
fundamental. Los efectos que tienen los estmulos aversivos se desprenden
de un modo completamente directo de la relacin existente entre las
respuestas y los estmulos aversivos. Si las respuestas producen el estmulo
aversivo, se presenta una tasa de respuestas menor. Si las respuestas no
producen ningn cambio en el estmulo aversivo, entonces hay poco o .nin
gn cambio en las respuestas. Si las respuestas eliminan el estmulo aver
sivo, se produce un aumento de la tasa. Una aparente excepcin de la
regia general es el procedimiento de supresin condicionada; sin embargo,
tambin en este procedimiento se ha encontrado que una especificacin
de la relacin existente entre la respuesta y el choque aumenta el grado de
supresin obtenido.
c,Qu produce un aprendizaje ms rpido:
la recompensa o el castigo?

A menudo se ha planteado la pregunta de si el castigo es ms o menos


efectivo que la recompensa para ensenar una nueva conducta. Esta pre
gunta carece de significado si acatamos la definicin tcnica de castigo,
pues el castigo es un mtodo para eliminar la conducta, mientras que
el reforzamiento es un mtodo para producir o mantener la conducta.
Un tipo especial de situacin experimental ha causado la falsa impresin de que el castigo aumenta o ensena nuevas conductas. Esta es la
situacin de eleccin en la que el sujeto es obligado a elegir una de entre
varias alternativas en cada ensayo. En esta situacin de eleccin, un
decremento de la proporcin de la respuesta castigada tiene como resul
tado, necesariamente, un aumento de la proporcin de la respuesta no
castigada. Por tanto, se pueden malinterpretar los resultados pretendiendo que significan que el castigo de una respuesta lleva generalmente a un
aumento de otras respuestas. Como hemos visto en los estdios en que
se utilizo una respuesta alternativa no castigada, haba un aumento si las
respuestas no castigadas eran adems reforzadas. Sin embargo, no se sabe
que la eliminacin de una respuesta mediante el castigo tenga como re
sultado un aumento de las respuestas no castigadas, a menos que estas
respuestas estn al mismo tiempo bajo el control de algn procedimiento
de reforzamiento. Slo vemos un aumento de la respuesta no castigada,
sin ningn reforzamiento evidente de esa respuesta, cuando el sujeto es
obligado a elegir entre dos respuestas en cada ensayo. De este modo,
es inadecuado considerar al castigo como un mtodo para ensenar nue
vas conductas. El castigo es un mtodo para eliminar la conducta. Se

EL C A ST IG O Y O TRO S PR O C ED IM IE N T O S

513

puede reformular la pregunta en trminos de la efectividad relativa dei


escape o de la evitacin comparada con el reforzamiento, pues el escape,
la evitacin y el reforzamiento son mtodos para ensenar nuevas conductas. Sin embargo, el castigo y la recompensa son procesos antagnicos.
Comparacin dei castigo con otros mtodos
para eliminar la conducta

El castigo es un mtodo para eliminar la conducta; la supresin con


dicionada es otro mtodo. Como se vio anteriormente, la comparacin
de ambos mtodos revel que el castigo era ms efectivo que la supre
sin condicionada en trminos de la reduccin de las respuestas. Asimismo, es posible que comparemos el castigo con algunos de los otros
mtodos que se usan comnmente para eliminar la conducta. Aun cuando
resulta arriesgado comparar procedimientos generales entre si, creemos
que de todos modos es posible comparar los procedimientos cuando se
eligen parmetros que han resultado ser efectivos al mximo en cada
procedimiento; por ejemplo, la extincin es un procedimiento general
para eliminar respuestas. No obstante, la velocidad con que la extin
cin elimina las respuestas depende en gran medida de varios factores,
especialmente de la intermitencia dei programa de reforzamiento que se
us antes de la extincin (Skinner, 1938). La extincin parece ser efectiva al mximo despus de un reforzamiento continuo. Es posible com
parar el grado de reduccin de las respuestas que hay durante la extincin
despus de un reforzamiento continuo, con el grado de reduccin ob
servado en los estdios sobre el castigo cuando se han usado parmetros
dei procedimiento de castigo que son efectivos al mximo. De esta ma
nera, es posible que comparemos estos dos procedimientos en los valores
paramtricos en los que cada procedimiento se acerca al mximo de
efectividad.
En un experimento (Holz y Azrin, 1963), se hizo una comparacin
entre el cambio de estmulo, la extincin, la saciedad y el castigo en
trminos de la efectividad de estos cuatro procedimientos, a fin de reducir
respuestas que se haban mantenido de acuerdo con un programa drb
de reforzamiento con comida. Una de las diferencias que se encontraron
entre los efectos de estos procedimientos fue el patrn de respuestas. Al
analizar la distribucin de los tiempos entre respuestas, Holz y Aznn
hallaron que: los procedimientos de extincin, de saciedad y de castigo
llevaron a diferentes distribuciones de TERs (tiempo entre respuestas)
cuando se igualaron las tasas totales de respuesta. Las distribuciones que
hubo durante la saciedad y la extincin fueron ms planas que las distri
buciones que se obtuvieron durante el castigo (pg. 403).

514

F IG U R A

CAP. 9

15.

R ep resen tacin

e sq u e m tic a

del

cu rso

tem po ral

de

la

reduccin

de

C A ST IG O

la s

res

p u e sta s q u e p ro d ucen la extincin, el ca m b io d e estm u lo , la sa c ie d a d y el castigo. (T om a d o


de A z rin

H olz, d a to s n o

p u b licad o s.)

Los tres diferentes procedimientos, as como el efecto del cambio de


estmulos, difirieron tambin en trminos del efecto reductivo total. Fueron
analizados de acuerdo al grado en que se eliminaron las respuestas. Los
critrios empleados consistieron en establecer si un procedimiento: a) re
duce la tasa de respuestas inmediatamente despus de aplicar ese proce
dimiento; b) reduce las respuestas tanto tiempo como el procedimiento
est en efecto; c) reduce a cero la tasa de respuestas mientras el proce
dimiento est en efecto, y d) mantiene la reduccin de las respuestas
despus de suspender el procedimiento.
Las conclusiones totales se resumen en la tabla 1, que describe cada
uno de los cinco procedimientos reductivos en trminos de la inmediatez,
la duracin, la medida y el grado de irreversibilidad de la reduccin
de las respuestas. Tambin se incluye un quinto procedimiento: la sujecin fsica. La figura 15 representa esquemticamente los cmbios de
la respuesta que se observan comnmente durante y despus del uso del
castigo, la saciedad, la extincin y el cambio de estmulo.
Parece que el castigo puede ser por lo menos tan efectivo como la
extincin, la saciedad, el cambio de estmulo y la eliminacin fsica en tr
minos del grado, el alcance, la duracin y la irreversibilidad de la reduc
cin de las respuestas. Debe recordarse que la anterior comparacin entre

EL C A ST IG O Y O TROS PR O C ED IM IE N T O S

515

los procedimientos se basa en un conjunto de parmetros, en los cuales


cada procedimiento se acerca a su mximo de efectividad. Si se eligen otros parmetros menos efectivos, como la saciedad parcial, la extin
cin despus de un reforzamiento intermitente, el castigo ligero, etc., entonces puede alterarse fcilmente el orden de superioridad de estos
mtodos.
TABLA
C o m p a r a c i n

d e

v a r i o s

L A

T A S A

p r o c e d i m i e n t o s

D E

q u e

r e d u c e n

R E S P U E S T A S

Procedim iento

Efecto
inmediato

Efecto
duradero

Supresin
total

Efecto
irreversible

Cambio de estmulos
Extincin
Saciedad
Sujecin fsica
Castigo

s
no
s
s
s

no
s
s
s
s

no
no
no
s
s

no
no
no
no
s

F u e n t e :

Holz y Azrin (19636).

Podra insistirse en que la extincin puede hacerse ms efectiva que


el castigo instituyendo una extincin completa. Si nunca se reforz una
respuesta, entonces dificilmente seria posible aplicar el castigo, pues rara
vez se emitiria la respuesta. Sin embargo, para una clase de conducta
grande, esta ausncia total dei reforzamiento es imposible. El mundo
fsico proporciona a menudo contingncias de reforzamiento que no pueden eliminarse fcilmente. Mientras ms rpido nos movemos en el es
pado, ms pronto llegamos a donde vamos, ya sea que el movimiento
consista en caminar o en conducir un automvil. Por tanto, el correr y
el apresurarse sern reforzados inevitablemente. Solamente se podra extinguir el correr y el apresurarse mediante el procedimiento imposible
de eliminar todos los eventos reforzantes que se producen como resul
tado dei movimiento en el espacio. Debe emplearse algn otro mtodo
reductor, como el castigo.
c,Es general el efecto dei castigo, mientras que el
dei reforzamiento es especfico?

Nuestro anlisis anterior se refiri a una comparacin entre el cas


tigo y otros mtodos para reducir la conducta. Tambin se ha comparado
el castigo con el reforzamiento positivo, que es un metodo para aumen
tar la conducta. Uno de los puntos que se afirman comnmente es que

316

CAP. 9

C A ST IG O

la accin del castigo sobre la respuesta castigada es ms general que la


del reforzamiento sobre la respuesta reforzada. Ya hemos visto que
cuando se aplicaba por primera vez el castigo, haba una perturbacin
general de la conducta durante el estmulo ante el cual no se haban
castigado las respuestas, y tambin durante el estmulo ante el cual se
haban castigado las respuestas. La observacin simple de una rata que
ha recibido choques a menudo, revela que el animal se congela des
pus de recibir un estmulo punitivo. De tal suerte, parece que la aplica
cin inicial del castigo produce una alteracin general de la conducta.
No obstante, los hallazgos experimentales hasta ahora revisados no apoyan
la afirmacin de que este efecto general sea una caracterstica particular
del castigo y no lo sea del reforzamiento. Por ejemplo, Sidman (1958)
descubri que, bajo el reforzamiento positivo, cuando una respuesta era
reforzada o extinguida en una situacin de respuesta mltiple, se produca
una generalizacin y las otras respuestas eran afectadas de manera similar
en la misma direccin. Igualmente, la observacin simple del proceso de
condicionamiento muestra que durante la adquisicin de la respuesta,
la rata recibe a menudo su primer reforzamiento despus de presionar una palanca accidentalmente. Comnmente, en las cercanias de
la palanca se produce un aumento general de la actividad. Al condi
cionar pichones a picotear una tecla para obtener comida como re
forzamiento, se observa el mismo aumento general de la actividad des
pus de los primeros estmulos reforzantes. Despus de que se administran
varios reforzamientos, se observa generalmente que el aumento de la
actividad da lugar a un aumento selectivo de la frecuencia de presin
de la palanca (Skinner, 1938).
Asimismo, la observacin simple de un sujeto castigado revela que
el estmulo punitivo produce inicialmente una reduccin de la actividad
general; pero sta da lugar otra vez a una reduccin selectiva de la res
puesta castigada, si el estmulo punitivo se administra inmediatamente
despus de esa respuesta.
Notamos anteriormente (Azrin, 1956) que cuando los choques no
se administraban inmediatamente, se produca una reduccin temporal
de las respuestas. Como las respuestas eran reforzadas y se emitan a una
tasa moderada, era posible que hubiera coincidncias ocasionales entre
el choque y una respuesta. Por tanto, la reduccin de las respuestas que
produce un choque mediato no puede interpretarse en el sentido de que el
castigo tiene un efecto general, pues las coincidncias ocasionales entre
el choque y la respuesta pueden explicar la reduccin. Parece que se
puede hacer el mismo tipo de consideracin en cuanto al reforzamiento
positivo. Skinner (1948) not que haba un aumento de la actividad
general cuando el reforzamiento de comida se administraba al azar (con-

LA BASE T E RICA DEL C A ST IG O

517

ducta supersticiosa). Adems, Skinner (1938) informo que cuando se


administraba al azar la comida como reforzamiento, se produca un mantenimiento duradero de una respuesta existente. De este modo, tanto el
reforzamiento como el castigo tienen efectos generales en la conducta
si no se tiene cuidado de disponer el reforzador o el estmulo punitivo
para que se presente inmediatamente despus de la respuesta medida. Por
otra parte, la especificidad de los efectos dei castigo se observo claramente
cuando la respuesta no castigada ante un estmulo no se veia afectada
al castigar la misma respuesta emitida ante otro estmulo. Podemos re
sumir estos resultados afirmando que el reforzamiento con comida y el
castigo parecen ser anlogos en que ambos procedimientos afectan ini
cialmente a la conducta en general; pero despus de una exposicin
prolongada, el efecto se limita a la respuesta particular que se est ma
nipulando. El efecto dei castigo no parece ser ms general que el dei
reforzamiento.
LA BASE TERICA DEL CASTIGO

En varios estdios dei proceso de castigo se ha tratado de formular


una teoria acerca de por qu el castigo reduce la frecuencia de la res
puesta castigada. Ya se hizo mencin de que se ha considerado que el
castigo logra su efecto debido a sus posefectos molestos. Esta explicacin
no parece ser muy til, pues, a nivel animal, es imposible obtener un
informe subjetivo dei grado de molstia. Incluso a nivel humano, este
tipo de explicacin es inadecuado debido al aspecto necesariamente sub
jetivo que tiene el reporte verbal dei sujeto.
Teoria de la respuesta competitiva

Se ha dado una explicacin terica ms reciente de por qu el castigo


es efectivo (Dinsmoor, 1954; 1955). Esta explicacin afirma que la fre
cuencia de la respuesta castigada disminuye debido al aumento de la
frecuencia de las respuestas que compiten con la respuesta castigada.
Un ejemplo seria la emergencia de respuestas de retirarse en una rata
que ha sido castigada por presionar una palanca. En este estdio, nuestra posicin ha sido neutral con respecto a qu tan adecuada es la teoria
de la respuesta competitiva para explicar los efectos dei castigo. Slo en
los ltimos anos se ha tratado de disponer experimentalmente las res
puestas competitivas y de estudiar los efectos que tiene el castigo en
estas respuestas competitivas. Hasta que estas respuestas competitivas sean
medidas de una manera ms completa y directa, parece preferible posponer nuestro dictamen acerca de esta explicacin de los efectos dei castigo.

518

CAP. 9

C A STIG O

Hasta este momento, la mejor indicacin de la existencia de estas


respuestas competitivas es la ausncia de la respuesta castigada; esta me
dida es idntica, operacionalmente, a una medida directa del grado de
reduccin de la respuesta castigada. En cierto modo, ha existido la misma
situacin con respecto al reforzamiento positivo. La teoria actual acerca
de los determinantes de las propiedades reforzantes de un estmulo reforzante se encuentra en un nivel descriptivo. Si sucede que un estmulo
aumenta la respuesta cuando se administra inmediatamente despus de
esa respuesta, entonces se le clasifica como estmulo reforzante. Thorndike
propuso una explicacin de por qu un estmulo es reforzante, en tr
minos de las consecuencias satisfacientes; pero al igual que en el caso
del castigo, quienes desean hacer un anlisis conductual del proceso de
reforzamiento no han encontrado aceptable este tipo de explicacin.
Asimismo, se ha propuesto una teoria de la respuesta competitiva, a fin
de explicar los cmbios que se observan durante el reforzamiento posi
tivo y la extincin. Por una parte, el aumento que se observa en la fre
cuencia de la respuesta reforzada se explica en base a la extincin de
respuestas competitivas inferidas. As pues, la disminucin que se observa
en la frecuencia de una respuesta extinguida se ha explicado en base a
un aumento de la frecuencia de estas respuestas competitivas inferidas.
Como ha hecho notar Marx (1963) en un comentrio reciente acerca
de la teoria de la respuesta competitiva del reforzamiento positivo, actualmente muy pocos investigadores utilizan esta teoria. En la actualidad,
parece que lo ms adecuado es considerar que el castigo se encuentra
en el mismo nivel descriptivo que se ha adjudicado al reforzamiento
positivo, sin apelar a cmbios de la conducta que hasta ahora han sido
inferidos, ms que medidos directamente.
En el estdio presente no se han tratado de explicar los efectos
del castigo, excepto en la medida en que la identificacin de las variables
independientes constituye una explicacin. Ms bien, se ha considerado
que la reduccin de la respuesta que produce el castigo es un proceso
primrio que se deduce directamente de la definicin de castigo. En la
actualidad, parece ms til describir la naturaleza y la medida de los
cmbios conductuales que se presentan durante el castigo e identificar
las variables independientes causantes de estos cmbios. Las investigaciones acerca del castigo se han interesado frecuentemente en las implicaciones que tiene un cambio conductual dado para alguna teoria que se
enuncia en trminos de la reduccin del miedo, la ansiedad, la supresin
emocional, respuestas competitivas, respuestas proprioceptivas, pulsiones
mayores, pulsiones menores, pulsiones condicionadas, neurosis, etc. Hasta
el momento en que los trminos anteriores se refieren a eventos directa
mente medibles, el hecho de usarlos aumentar slo relativamente nues-

LA BASE TE RICA DEL C A ST IG O

519

tra comprensin dei castigo. Ms bien, el uso de estos trminos irnpide


al investigador concentrar su atencin en la reduccin observable de las
respuestas como un fenmeno que es interesante por s mismo y no como
un ndice de algn proceso subyacente que desafia la medicin di
recta.
^Debilita el castigo a la conducta, o simplemente
la suprime?

Otro enfoque terico sobre el proceso dei castigo se ha ocupado dei


problema de si el castigo debilita verdaderamente a la conducta. Por
implicacin, se infiere que el reforzamiento positivo fortalece verdadera
mente a la conducta. Se hace la sugerencia de que los efectos dei refor
zamiento positivo son genuinos, mientras que los cmbios que produce
el castigo slo son aparentes. Resulta difcil saber exactamente por qu
debe considerarse que el aumento de la conducta que produce el castigo
slo es aparente. La interpretacin que proponemos es que muchas veces
se ha encontrado que el efecto dei castigo es reversible. Salvo en inten
sidades muy altas de castigo, la eliminacin de la contingncia de castigo
tiene como resultado un retorno a la conducta anteriormente castigada.
En este sentido, no puede haber dudas acerca dei efecto temporal dei
castigo. No obstante, la mayora de los otros procedimientos para elimi
nar la conducta deben considerarse tambin temporales segn este crit
rio cuando se aplica a la extincin, la saciedad, el cambio de estmulo, la
sujecin fsica y la supresin condicionada. Debemos concluir, por tanto,
que el castigo s debilita verdaderamente a la respuesta, en el mismo
sentido que otros procedimientos para reducir la conducta la debilitan,
como ya lo hemos visto (figura 15 y tabla 1). En realidad, el castigo
parece ser potencialmente ms efectivo que otros procedimientos para
debilitar a una respuesta.
Puede interpretarse de otra manera la creencia comn de que el castigo
no debilita verdaderamente a la conducta. Esta interpretacin se deriva
de las formulaciones tericas que utilizan el concepto de fuerza de la
respuesta. Hull (1943), por ejemplo, us el concepto de fuerza de h
bito, y Skinner (1938) emple alguna vez el concepto de reserva refleja.
Segn este concepto de fuerza de la respuesta, se tienen varias me
didas de la fuerza de la respuesta, entre ellas la frecuencia de la
respuesta y el nmero de respuestas emitidas durante la extincin. Si
la nocin de fuerza de la respuesta ha de ser de alguna utilidad, entonces se supone que las diversas medidas de la fuerza de la respuesta deben
covariar. El que estas medidas no covaren ha sido una fuente de dificultades. Considerando, por el momento, solamente el reforzamiento po-

520

CAP. 9

C A ST IG O

sitivo, se sabe que la tasa de respuesta est en funcin de la frecuencia


de reforzamiento (Skinner, 1938). La tasa de respuestas mxima se
emite bajo el reforzamiento continuo, cuando excluimos el tiempo real
que es necesario para administrar y consumir el reforzamiento. Si la
tasa de respuestas y la resistencia a la extincin son dos medidas equiva
lentes de la fuerza de la respuesta, entonces debemos esperar que el
reforzamiento continuo lleve a mayor resistencia a la extincin. Por
supuesto, se ha descubierto que lo que sucede es precisamente lo con
trario: el reforzamiento continuo tiene como resultado poca resistencia a
la extincin. Si la resistencia a la extincin se toma como la verdadera
medida de la fuerza, entonces debe considerarse dbil la alta tasa de
respuestas que se emite durante el reforzamiento continuo.
Esta misma nocin de la fuerza de la respuesta parece ser la causante de la afirmacin de que el castigo no debilita la conducta, a pesar
de las pruebas que demuestran que durante el castigo hay una reduccin
extremada de la conducta. De acuerdo con la nocin de la fuerza de la
respuesta, cualquier reduccin de la tasa de respuestas durante el castigo
debe ir acompaada por una disminucin de la resistencia a la extincin,
pues las dos medidas deben covariar. Si la mejor medida de la fuerza
de la respuesta es la tasa de la respuesta, entonces habra que considerar
que el castigo debilita verdaderamente a la conducta. Por otro lado, si
la mejor medida de la fuerza de la respuesta es la resistencia a la ex
tincin, entonces habra que considerar al castigo inefectivo para debilitar
la conducta. En la actualidad, parece ser ms fructfero abandonar la
nocin de la fuerza de la respuesta y considerar la tasa de la respuesta,
por un lado, y la resistencia a la extincin, por el otro, como dos enti
dades diferentes.
La conclusin de que el castigo no debilita a la respuesta se basa
en la recuperacin de las respuestas anteriormente castigadas que tiene
lugar durante la extincin (Estes, 1944). No obstante, los resultados
obtenidos en diversos estdios del castigo no apoyan la idea de que el
castigo produce solamente una debilitacin aparente de la respuesta, en
tanto tomemos precauciones para impedir que las propiedades discrimi
nativas o reforzantes condicionadas acrecienten el efecto del estmulo
punitivo. Se recordar que el castigo haca disminuir la resistencia a la
extincin en tanto se mantuviera la contingncia punitiva mientras du
rara el periodo de extincin. Se ha encontrado en otros estdios que
la recuperacin de las respuestas que tiene lugar durante la extincin
es resultado de la terminacin del castigo. Con todo, hemos visto (fi
gura 13) que esta recuperacin durante la extincin no est en funcin,
probablemente, del proceso de castigo, sino ms bien de las propiedades
discriminativas adquiridas por el estmulo punitivo. La base emprica

ASPECTO S INDESEABLES DEL C A ST IG O

521

de la pretendida inefectividad dei castigo parece estar sujeta a una reinterpretacin.


ASPECTOS INDESEABLES DEL CASTIGO
^Podemos eliminar el castigo como mtodo
de control conductual?

Hemos visto que, aparte dei castigo, existen varios mtodos para eli
minar la conducta. Por cualesquiera razones, tal vez queramos emplear
otros mtodos que no sean el castigo. ,;En qu medida es factible este
objetivo? A nivel de instituciones, parece que seria posible eliminar el
uso dei castigo fsico. Es concebible que se puedan cambiar los reglamentos administrativos de tal manera que dejen de aplicarse castigos
pblicos en forma de azotes, golpes u otros maltratos fsicos. A nivel de
la conducta individual, parece un poco ms difcil eliminar el uso dei
castigo fsico, pero de todos modos no es imposible. Sin embargo, hay
un tipo de castigo que parece ser virtualmente imposible eliminar: el de
las contingncias punitivas de que dispone el mundo fsico. Siempre que
interactuamos con el mundo fsico, hay muchas contingncias punitivas
esperndonos. Un buen ejemplo de esto seria cualquier conducta que nos
mueve a travs dei espacio, como caminar, correr o alcanzar. No tenemos
ms que cerrar los ojos mientras corremos, para damos cuenta dei grado
en que las contingncias punitivas rodean nuestro movimiento. El gra
do en que se aplican verdaderamente estas contingncias punitivas puede
verse en los esfuerzos iniciales que hace el nino pequeno para aprender
a caminar o a correr. Tan poderosas son estas contingncias punitivas
potenciales, que existen incluso cuando dormimos. La respuesta de rodar
en la cama y caerse es castigada inmediata y duramente por la colisin
con el suelo. Parece ser que para eliminar las contingncias punitivas
que impone el mundo fsico seria .necesario eliminar toda conducta que
implicara una interaccin con el mundo fsico.
Entonces, parece que es posible eliminar el castigo fsico como pro
cedimiento institucional; incluso parece posible, aunque no mucho, que
pueda eliminarse el castigo como actividad individual. Pero parece haber
pocas probabilidades, o ninguna, de eliminar el castigo dei mundo fsico
en un futuro cercano. Incluso en los lugares donde el castigo es admi
nistrado por una persona o por una institucin, no parece probable que
se pueda eliminar fcilmente al tiempo-fuera y al costo de respuesta
como mtodos de castigo. El castigo por tiempo-fuera parece usarse con
ms frecuencia que el castigo fsico cuando se trata de la conducta hu
mana. Eliminar el tiempo-fuera como contingncia punitiva significaria

52 2

CAP. 9

C A ST IG O

eliminar las multas, el encarcelamiento, el despido de un empleo, la negacin de favores o el retiro de privilgios. Parece que actualmente lo
correcto es afirmar que el castigo es un mtodo de control conductual
que se usa con frecuencia, y que su eliminacin en un futuro cercano
parece bastante improbable. El castigo parece haber arraigado entre
nosotros.
Concomitantes emocionales

Una razn que se esgrime con frecuencia para tratar de eliminar el


castigo es que los estmulos aversivos en general, y el castigo en par
ticular, producen estados emocionales perturbadores o indeseables. Nos
otros analizaremos estos estados emocionales solamente si tienen como
resultado una perturbacin conductual crnica. No obstante, no parece
ser evidente que podamos atribuir un estado emocional tal al uso de
los estmulos aversivos especificamente. Por ejemplo, en el procedimiento
de evitacin de Sidman, los estmulos aversivos se programan a una
frecuencia elevada. Con todo, la observacin simple de un animal du
rante la evitacin de Sidman no muestra generalmente ningn signo de
zozobra despus del periodo de adquisicin inicial. En vez de eso, se ha
encontrado que los sujetos que se hallan bajo la evitacin de Sidman
distribuyen sus respuestas en un patrn temporal bien definido, que est
bien adaptado para afrontar las contingncias de la evitacin. Asimismo,
la observacin simple de un pichn que est siendo castigado no revela
mayores signos de zozobra o de vacilacin conductual que los que se
observan durante procedimientos alternativos, como el de extincin. Hunt
y Brady (1955) han obtenido evidencias experimentales respecto a los
efectos no perturbadores del castigo. Estos investigadores encontraron po
os efectos emocionales, que se midieron por medio de la defecacin de
las ratas, cuando se usaba el choque como castigo, en comparacin con las
ocasiones en que se empleaba un choque no contingente. Igualmente,
Hearst (1965) encontro que, aun cuando el choque no contingente pro
duca una perturbacin duradera en una discriminacin establecida, al
usarse el choque como castigo slo se produca una perturbacin tem
poral. A nivel humano, la observacin simple no indica tampoco que se
produzca un desajuste emocional crnico en el nino que se ha quemado
al tocar un radiador caliente. Ms bien, parece que la experiencia simplemente hiciera disminuir la probabilidad de que el nino tocara otra
vez el radiador. A pesar de lo grave que pueda ser la quemada sufrida,
hay poca evidencia de que la experiencia haya causado una perturbacin
conductual crnica en tales casos. Como es improbable que alguna vez
se elimine el castigo que aplica el mundo fsico, es una suerte que tales

ASPECTO S INDESEABLES DEL C A ST IG O

5 23

castigos no parezcan generar una compulsin emocional de naturaleza


crnica.
Perturbacin social

Es en el rea de la perturbacin social donde el castigo s parece ser


capaz de producir cmbios conductuales de largo alcance, en trminos
de que producen una incapacidad para vivir una existencia efectiva.
Cuando castigamos una respuesta, generalmente deseamos producir una
disminucin de esa respuesta especfica, y al mismo tiempo deseamos que
los dems aspectos de la conducta dei indivduo permanezcan relativa
mente inmutables. Por ejemplo, un maestro puede castigar a un nino
por hablar en clase, en cuyo caso se desea eliminar la vocalizacin no
autorizada dei nino, pero que sus otras conductas permanezcan intactas.
Sin embargo, hemos visto que uno de los efectos colaterales dei proceso
de castigo era que reforzaba en el individuo tendencias a escapar de la
propia situacin punitiva. En trminos dei ejemplo que estamos citando,
esto significa que no slo seria de esperarse que el castigo de la voca
lizacin hiciera disminuir, sino tambin que aumentara la probabilidad
de que el nino abandonara la situacin dei saln de clases. Se fortaleceran conductas tales como llegar retrasado, irse de pinta y abandonar
la escuela. El resultado final seria la terminacin de la relacin social, lo
cual hara imposible cualquier control social adicional de la conducta
dei individuo. Este efecto colateral dei castigo parece ser uno de los
aspectos ms indeseables de que un individuo aplique un castigo a otro
individuo, pues el proceso de socializacin debe depender necesariamente de una interaccin continua con otros indivduos.
Agresin operante

Parece ser que cuando un organismo aplica un castigo fsico a otro,


se produce la agresin social. Aparentemente, hay dos tipos posibles de
agresin social. Denominaremos al primer tipo agresin operante. Ya
hemos visto que cuando se est castigando una respuesta, el individuo
puede eliminar la contingncia de castigo abandonando la situacin.
Otro modo de eliminar la contingncia de castigo seria destruir o inmovilizar al individuo que est administrando el estmulo punitivo (Del
gado, 1963). La conducta agresiva hacia el estmulo punitivo parece
desempenar la funcin de lograr precisamente ese propsito. Aunque las
evidencias experimentales acerca de la importancia de las consecuencias
de la agresin no son definitivas, se supone que una agresin de xito
contra la fuente dei estmulo punitivo tendr como resultado la elimi-

524

CAP. 9

C A S T IG O

nacin de los estmulos punitivos. El trmino agresin operante indica


que este tipo de agresin es mantenido por las consecuencias potencial
mente favorables de la agresin.
Agresin provocada

Llamaremos agresin provocada al segundo tipo de agresin (Ulrich


y Azrin, 1962). Se ha encontrado que este tipo de agresin tiene lugar
cuando se administran estmulos dolorosos a un organismo que se en
cuentra en compana de otro organismo, aunque el organismo que es
atacado no haya administrado el estmulo doloroso. La existencia de este
tipo de agresin no parece depender de ninguna consecuencia favorable.
El estdio de Ulrich y Azrin (1962) ilustra algunas de las caractersticas
de esta agresin provocada. En ese experimento, se colocaron dos ratas
en una cmara que contena un piso de rejilla. En ausncia del choque
a las patas, los animales no mostraban ningn signo de agresin; sin
embargo, cuando el experimentador administraba el choque a las patas,
las ratas daban la vuelta y se atacaban entre s. Se ha encontrado que
esta agresin provocada existe en varias especies y es provocada por
diferentes tipos de estimulacin dolorosa (Azrin, 1964; Azrin, Hake y
Hutchinson, 1965; Azrin, Hutchinson y Hake, 1963; Azrin, Hutchinson
y Sallery, 1964; Hutchinson, Ulrich y Azrin, 1965; Ulrich, Wolff y
Azrin, 1964).
Para nuestros propsitos, lo importante de esta lucha reflexiva es
que parece ser una respuesta general a la estimulacin aversiva. Como
el castigo fsico requiere de la administracin de estimulacin aversiva,
seria de esperarse que esta agresin social constituyera una reaccin pro
vocada ante el castigo fsico. A diferencia de la agresin operante, esta
agresin provocada no parece tener la funcin de reducir la estimulacin
aversiva, pues ninguno de los combatientes ha causado de alguna manera
la estimulacin aversiva. Ms bien, parece que cuando se aplica a un
organismo una estimulacin dolorosa intensa, entonces se produce una
agresin o un ataque contra los organismos cercanos. Nuestro principal
objetivo de eliminar una respuesta castigndola puede tener el efecto
completamente inesperado de producir agresin por parte del organismo
castigado. Adems, bajo esta agresin provocada, es de esperarse que
el indivduo castigado ataque a cualesquiera otros organismos cercanos,
incluso a los que no tienen ninguna relacin con la administracin del
estmulo punitivo.
Parece que las principales desventajas de usar el castigo son que,
cuando ste es administrado por un individuo: a) el indivduo casti
gado es ahuyentado del agente punitivo, lo cual destruye la relacin

R ESU M EN Y C O N C L U S IO N E S

52s

social; b ) el individuo castigado puede emitir agresin operante diri


gida hacia el agente punitivo, y c) incluso cuando el castigo es adminis
trado por medios fsicos y no por otro organismo, es de esperarse que
haya una agresin provocada contra los indivduos cercanos que no son
responsables dei castigo. Estas tres desventajas parecen ser fundamentales especialmente para la conducta humana, pues la supervivencia dei
organismo humano parece depender completamente dei mantenimiento
de relaciones sociales verdaderamente armoniosas.
RESUMEN Y CONCLUSIONES

A nivel de definicin, el castigo simplemente reduce la frecuencia


de la respuesta castigada. Como procedimiento reductivo, el castigo pa
rece ser por lo menos tan efectivo como la mayora de los dems proce
dimientos para eliminar respuestas. Los estmulos que se usan con ms
frecuencia en las investigaciones experimentales son los estmulos incondicionados, como el choque y el ruido; pero hay otros tipos de estmulos
punitivos, como el tiempo-fuera, el costo de respuesta y el castigo con
dicionado, que parecen emplearse con ms frecuencia que el castigo en
el control social de la conducta. Varios aspectos dei estmulo punitivo
han resultado ser fundamentales, como la intensidad, la frecuencia, la
programacin y la inmediatez dei castigo. Son por lo menos tan impor
tantes como stos, las variables de reforzamiento que mantienen a la
respuesta castigada, como la frecuencia y el programa de reforzamiento,
y tambin la oportunidad que tiene el sujeto de emitir modos de con
ducta alternativos. No se ha prestado suficiente atencin al papel que
desempenan estas variables de reforzamiento en la determinacin de
la efectividad dei castigo.
Se han identificado varios cmbios conductuales caractersticos que
tienen lugar durante el castigo, como lo inmediato de la reduccin de la
respuesta, la recuperacin gradual que se produce durante el castigo,
el efecto de contraste dei castigo, la generalizacin y la discriminacin.
Quiz el aspecto ms paradjico y confuso dei castigo haya sido la
capacidad que tiene un estmulo punitivo de convertirse en estmulo
discriminativo o estmulo reforzante condicionado. Esta confusin surge
cuando olvidamos que un estmulo punitivo sigue siendo un estmulo;
como tal, puede ser asociado inadvertidamente con estmulos reforzantes,
con perodos de reforzamiento, con perodos de extincin y con otros
estmulos punitivos. El resultado de una asociacin temporal selectiva
de esta naturaleza puede ser el de fortalecer, neutralizar o, incluso, mvertir el aspecto aversivo dei estmulo punitivo.

526

CAP. 9

C A ST IG O

Cuando castigamos una respuesta, nos interesamos primordialmente


en reducir la frecuencia de esa respuesta. Si no hemos pasado por alto
los efectos de las variables de reforzamiento o las variables discrimina
tivas, tenemos razones para creer que nuestro procedimiento de castigo
va a ser completamente efectivo para eliminar la respuesta indeseable.
Ni el estado emocional, ni la perturbacin conductual duradera son
necesariamente resultados indeseables del castigo; ni lo son tampoco la
gravedad de l reduccin de la respuesta, ni la generalizacin conduc
tual de los efectos punitivos indeseables. De hecho, es probable que todos
estos efectos sean muy tiles cuando un castigo fsico est dirigido, desde
el punto de vista evolutivo, a reducir la probabilidad futura de eventos
dolorosos y posiblemente destructivos. Dado que el castigo fsico constituye una parte inevitable y continua de nuestra interaccin con el mundo
fsico, los cmbios conductuales extensivos que produce el castigo seguirn constituyendo una parte til del repertorio conductual.
La desventaja primordial del castigo para los humanos puede ser
la perturbacin social que produce y no la severidad o generalidad de la
reduccin de la respuesta, o incluso la existencia de un estado emocional.
La existencia del animal humano depende completamente de la asis
tencia que le prestan otros seres humanos durante sus primeros anos de
vida. Incluso en las sociedades ms primitivas, esta dependencia sigue
existiendo durante toda la vida de la persona. Puede esperarse que el
castigo incapacite al indivduo para existir en la sociedad humana, en
la medida en que elimine o perturbe la interaccin social. Se ha encon
trado que el castigo produce tres fuentes de perturbacin: a) el escape
de una situacin en la que se administra un castigo; b) la agresin
operante, y c) la agresin provocada. Los primeros dos fenmenos son
un poco adaptativos desde un punto de vista de corto alcance, pues la
reaccin conductual del sujeto hace disminuir la probabilidad futura
del castigo. No obstante, el escape de la situacin social en la que se
administra el castigo tiene el infortunado efecto colateral de impedir
cualquier interaccin social futura en esa situacin. Esta conducta no
parece ser demasiado infortunada mientras se mantengan interacciones
sociales en otras situaciones no castigadas. La agresin operante parece
ser igualmente infortunada porque la agresin social perturba la relacin
social particular; pero, de nuevo, se podra esperar que la conducta
agresiva se emitiera solamente en aquella situacin en que la agresin
redujera el castigo.
Por otra parte, la agresin provocada no parece ser funcional, pues
la agresin se despliega incluso hacia indivduos que no estn relacio
nados de ninguna manera con el castigo. Por tanto, esta agresin no es
adaptativa como medio especfico para reducir la estimulacin aversiva

REFERENCIAS B IB L IO G R FIC A S

527

futura, pues se ataca tanto a indivduos punitivos como no punitivos.


Puede esperarse que la naturaleza indiscriminada de esta agresin per
turbe o termine relaciones sociales que de ninguna manera son puni
tivas.
Podemos concluir, por tanto, que la perturbacin de la conducta
social constituye la desventaja primordial dei uso dei castigo. Los cm
bios que se producen en la propia respuesta castigada parecen ser, dis
tintamente, de importancia secundaria para los productos sociales dei
uso dei castigo.
REFERENCIAS BIBLIOGRFICAS

Anger, D. (1956) The dependence of interresponse times upon the relative


reinforcement of different interresponse times. ]. exp. Psychol., 52, 145
Appel,1 6 LJ. B. (1960) Some schedules involving aversive control. /. exp. Anal.
Behav., 3, 349-359.
Appel, J. B. (1961) Punishment in the squirrel monkey saimiri sciurea.
Science, 133, 36.
Appel, J. B. (1963) Punishment and shock intensity. Science, 141, 528-529.
Azrin, N. H. (1956) Effects of two intermittent schedules of immediate and
nonimmediate punishment. /. Psychol., 42, 3-21.
Azrin, N. H. (1958) Some effects of noise on human behavior. /. exp. Anal.
Behav., 1, 183-200.
Azrin, N. H. (1959) A technique for delivering shock to pigeons. J. exp.
Anal. Behav., 2, 161-163(a).
Azrin, N. H. (1959) Punishment and recovery during fixed-ratio perfor
mance. /. exp. Anal. Behav., 2, 301-305 (b).
Azrin, N. II. (1960) Sequential effects of punishment. Science, 131, 605606(a).
Azrin, N. H. (1960) Effects of punishment intensity during variable-interval
reinforcement. /. exp. Anal. Behav., 3, 123-142 (b).
Azrin, N. H. (1964) Aggressive responses of paired animais. Trabajo ledo
en el Simposio acerca de la importancia de los aspectos mdicos.
Walter Reed Institute of Research, Washington, abril.
Azrin, N. H., Hake, D. F., Holz, W. C. y Hutchinson, R. R. (1965) Motivational aspects of escape from punishment. /. exp. Anal. Behav., 8,
31-44.
Azrin, N. H., Hake, D. F. y Hutchinson, R. R. (1965) Elicitation of aggression by a physical blow. /. exp. Anal. Behav., 8, 55-57.
Azrin, N. H. y Holz, W. C. (1961) Punishment during fixed-interval re
inforcement. /. exp. Anal. Behav., 4, 343-347.
Azrin N. H., Holz, W. C. y Hake, D. (1963) Fixed-ratio punishment. /.
exp. Anal. Behav., 6, 141-148.
Azrin, N. H. Hutchinson, R. R. y Hake, D. F. (1963) Pain-induced fighting
in the squirrel monkey. J. exp. Anal. Behav., 6, 620.

5 28

CAP. 9

C A ST IG O

Azrin, N. H., Hutchinson, R. R. y Sallery, R. D. (1964) Pain-aggression


toward inanimate objects. /. exp. Anal. Behav., 7, 223-228.
Barlow, J. A. (1952) Secondary motivation through classical conditioning:
One trial nonmotor learning in the white rat. Amer. Psychologist, 7,
273.
Baron, A. y Antonitis, J. J. (1961) Punishment and preshock as determinants of bar-pressing behavior. /. comp. physiol. Phychol., 54, 716
720.
Barry, J. J., Jr. y Harrison, J. M. (1957) Relation between stimulus intensity and strength of escape responding. Psychol. Rep., 3, 3-8.
Black, A. H. y Morse, P. (1961) Avoidance learning in dogs without a
warning stimulus. /. exp. Anal. Behav., 4, 17-23.
Boren, J. J., Sidman, M. y Hermstein, R. J. (1959) Avoidance, escape
and extinction as functions of shock intensity. /. comp. physiol. Psychol.,
52, 420-425.
Brethower, D. M. y Reynolds, G. S. (1962) A facilitative effect of punish
ment on unpunished behavior. /. exp. Anal. Behav., 5, 191-199.
Chung, S. H. (1965) Effects of effort on response rate. J. exp. Anal. Behav.,
8, 1-7.
Dardano, J. F. y Sauerbrunn, D. (1964) Selective punishment of fixedratio performance. /. exp. Anal. Behav., 7, 255-260(a).
Dardano, J. F. y Sauerbrunn, D. (1964) An aversive stimulus as a correlated block counter in FR performance. /. exp. Anal. Behav., 7,
37-43 (b).
Dardano, J. F. y Sauerbrunn, D. (1964) Selective punishment of concurrent progressive ratio behavior. /. exp. Anal. Behav., 7, 51-65 (c).
Delgado, J. M. R. (1963) Cerebral heterostimulation in a monkey colony.
Science, 141, 161-163.
Dinsmoor, J. A. (1952) A discrimination based on punishment. Quart J.
exp. Psychol., 4, 27-45.
Dinsmoor, T. A. (1954) Punishment: I The avoidance hypothesis. Psychol.
Rev., 61, 34-46.
Dinsmoor, J. A. (1955) Punishment: II An interpretation of empirical
findings. Psychol. Rev., 62, 96-105.
Dinsmoor, J. A. (1958) A new shock grid for rats. J. exp. Anal. Behav., 1,
182.
Dinsmoor, J. A. (1961) A wide range constant current shock stimulator.
/. exp. Anal. Behav., 4, 273-274.
Dinsmoor, J. A. y Campbell, S. L. (1956) Escape-from-shock training following exposure to inescapable shock. Psychol. Rep., 2, 43-49.
Dinsmoor, J. A. y Winograd, E. (1958) Shock intensity in variable-interval
escape schedules. J. exp. Anal. Behav. 1, 145148.
Dollard, J. y Miller, N. E. (1950) Personality and psychotherapy: An
analysis in terms oi learning, thinking, and culture. Nueva York:
McGraw-Hill.

REFERENCIAS B IB L IO G R FIC A S

529

Estes, W. K. (1944) An experimental study of punishment. Psychol. Monogr.,


57, (todo el nmero 263).
Estes, W. K. y Skinner, B. F. (1941) Some quantitative properties of anxiety.
]. exp. Psychol., 29, 390-400.
Evans, W. D. (1962) Producing either positive or negative tendencies to a
stimulus associated with shock. J. exp. Anal. Behav., 5, 335-337.
Ferster, C. B. (1958) Control of behavior in chimpanzees and pigeons by
time-out from positive reinforcement. Psychol. Monogr., 72 (Volumen
nm. 461).
Ferster, C. B. y Appel, J. B. (1961) Punishment of SA responding in
matching-to-sample by time-out from positive reinforcement. /. exp.
Anal. Behav., 4, 45-56.
Ferster, C. B. y Skinner, B. F. (1957) Schedules of reinforcement. Nueva
York: Appleton-Century-Crofts.
Flanagan, B., Goldiamond, I. y Azrin, N. H. (1958) Operant stuttering:
The control of stuttering behavior through response-contingent consequences. /. exp. Anal. Behav., 1, 173-177.
Fry, W. Kelleher, R. T. y Cook, L. (1960) A mathematical index of per
formance on fixed-interval schedules of reinforcement. /. exp. Anal.
Behav., 3, 193-199.
Hake, D. F. y Azrin, N. H. (1963) An apparatus for delivering pain-shock
to monkeys. /. exp. Anal. Behav., 6, 297-298.
Hake, D. F. y Azrin, N. H. (1965) Conditioned punishment. I. exp. Anal.
Behav., 8, 279-293.
Harrison, J. M., Abelson, R. M. y Fisher, G. L. Some relations between
the auditory system of the medulla and auditory stimulus functions.
/. exp. Anal. Behav., 3, 207-220.
Hearst, E. (1965) Stress-induced breakdown of an appetitive discrimantion.
J. exp. Anal. Behav., 8, 135-146.
Hendry, D. P. y Van-Toler, C. (1964) Performance on a fixed-ratio schedule with correlated amount of reward. /. exp. Anal. Behav., 7, 207209.
Herman, R. L. y Azrin, N. H. (1964) Punishment by noise in an alternative response situation. /. exp. Anal. Behav., 7, 185-188.
Herrnstein, R. J. (1955) Behavioral consequences of the removal of a discriminative stimulus associated with variable-interval reinforcement.
Tesis doctoral indita. Harvard University.
Herrnstein, R. J. y Morse, W. H. (1957) Effects of pentobarbital on intermittently reinforced behavior. Science, 125, 929-931.
Hoffman, H. S. y Fleshler, M. (1962) A relay sequencing device for
scrambling grid shock. J. exp. Anal. Behav., 5, 329330.
Holz, W. C. y Azrin, N. H. (1961) Discriminative properties of punish
ment. J. exp. Anal. Behav., 4, 225232.
Holz, W. C. y Azrin, N. H. (1962) Recovery during punishment by intense
noise. Psychol. Rep., 11, 655-657(a).

CAP. 9

530

C A ST IG O

Holz, W. C. y Azrin, N. H. (1962) Interactions between the discriminative


and aversive properties of punishment. /. exp. Anal. Behav., 5, 229234(b).
Holz, W. C., Azrin, N. H. y Ayllon, T. (1963) Elimination of behavior of
mental patients by response-produced extinction. /. exp. Anal. Behav.,
6, 407-412(a).
Holz, W. C., Azrin, N. H. y Ayllon, T. (1963) A comparison of several
procedures for eliminating behavior. J. exp. Anal. Behav., 6, 399.
Holz, W. C., Azrin, N. H. y Ulrich, R. E. (1963) Punishment of temporally spaced-responding. ]. exp. Anal. Behav., 6, 115-122.
Honig, W. K. y Slivka, R. M. (1964) Stimulus generalization of the effects
of punishment. /. exp. Anal. Behav., 7, 21-25.
Hull, C. L. (1943) Principies of behavior. Nueva York. Appleton-CenturyCrofts.
Hunt, H. F. y Brady, J. V. (1955) Some effects of punishment and intercurrent anxiety on a simple operant. /. comp. physiol. Psychol., 48,
305-310.
Hutchinson, R. R., Ulrich, R. E. y Azrin, N. H. (1965) Effects of age and
related factors on the pain-aggression reaction. /. comp. physiol. Psychol.,
59, 365-369.
Kaplan, M. (1952) The effect of noxious stimulus intensity and duration
during intermittent reinforcement of escape behavior. /. comp. physiol.
Psychol., 45, 538-549.
Kelleher, R. T. y Cook, L. (1959) An analysis of the behavior of rats and
monkeys on concurrent fixed-ratio avoidance schedules. /. exp. Anal.
Behav., 2, 203-211.
Keller, F. S. y Schoenfeld, W. N. (1950) Principies of psychology. Nueva
York: Appleton-Century-Crofts.
Marx, M. H. (1963) The need for more specific formulation of the competing response interpretation of extinction. Psychol. Rep., 12, 729-730.
Masserman, J. H. (1946) Principies of dynamic psychiatry. Filadlfia:
Saunders.
Migler, B. (1963) Experimental self-punishment and superstitious escape
behavior. ]. exp. Anal. Behav., 6, 371-385.
Miller, N. E. (1960) Learning resistance to pain and fear effects over learn
ing, exposure, and rewarded exposure in context. J. exp. Psychol., 60,
137-145.
Mowrer, O. H. y Aiken, E. G. (1954) Contiguity vs drive-reduction in
conditioned fear: Temporal varations in conditioned and unconditioned
stimulus. Amer. J. Psychol., 67, 626-638.
Mowrer, O. H. y Solomon, L. N. (1954) Contiguity vs drive-reduction in
conditioned fear: The proximity and abruptness of drive-reduction.
Amer. J. Psychol., 67, 15-25.
Muenzinger, K. F. (1934) Motivation in learning: I Electric shock for correct responses in the visual discrimination habit. ]. comp. Psychol., 17,
439-448.

REFERENCIAS B IB L IO G R F IC A S

531

Perin, C. T. (1942) Behavior potentiality as a joint function of the amount


of training and the degree of hunger at the time of extinction. J. exp.
Psychol., 30, 93-113.
Reynolds, G. S. (1961) Behavioral contrast. /. exp. Anal. Behav., 4, 5771.
Sidman, M. (1953) Avoidance condi tioning with brief shock and no exteroceptive warning signal. Science, 118, 157-158.
Sidman, M. (1955) On the persistence of avoidance behavior. ]. abnorm.
soc. Psychol., 50, 217-220.
Sidman, M. (1958) By-products of aversive control. /. exp. Anal. Behav., 1,
265-280.
Sidman, M., Herrnstein, R. J. y Conrad, D. G. (1957) Maintenance of
avoidance behavior by unavoidable shock. /. comp. physiol. Psychol.,
50, 553-557.
Skinner, B. F. (1938) The behavior of organisms. Nueva York: AppletonCentury-Crofts.
Skinner, B. F. (1948) Superstition in the pigeon. /. exp. Psychol., 38,
168-172.
Skinner, B. F. (1953) Science and human behavior. Nueva York: Macmillan.
Skinner, B. F. y Campbell, S. L. (1947) An automatic shocking grid
apparatus for continuous use. /. comp. physiol. Psychol., 40, 305-307.
Storms, L. H., Borocszi, G. y Broen, W. E. (1962) Punishment inhibits an
instrumental response in hooded rats. Science, 135, 1133-1134.
Thordinke, E. L. (1911) Animal intelligence: Experimental studies. Nueva
York: Macmillan.
Thorndike, E. L. (1932) The fundamentais of learning. Nueva York: Teachers College.
Tolman, E. C., Hall, C. S. y Bretnall, E. P. (1932) A disproof of the law
of effect and a substitution of the laws of emphasis, motivation, and
disruption. /. exp. Psychol., 15, 601-614.
Ulrich, R. E. y Azrin, N. H. (1962) Reflexive fighting in response to
aversive stimultion. J. exp. Anal. Behav., 5, 511-520.
Ulrich, R. E., Wolff, P. C. y Azrin, N. H. (1964) Shock as an elicitor of
intra-and inter-species fighting behavior. Anim. Behav., 12, 14-15.
Weiner, H. (1962) Some effects of response cost upon human operant be
havior. /. exp. Anal. Behav., 5, 201-208.
Zimmerman, J. y Baydan, N. T. (1963) Punishment of SA responding of
humans in conditional matching-to-sample by time-out. /. exp. Anal.
Behav., 6, 589-597.
Zimmerman, J. y Ferster, C. B. (1963) Intermittent punishment of SA
responding in matching-to-sample. ]. exp. Anal. Behav., 6, 349-356.

Das könnte Ihnen auch gefallen