Sie sind auf Seite 1von 16

SEMANA 4

PSICOLOGA DEL APRENDIZAJE

Lea esto primero. UNIACC, semana 4

CONDICIONAMIENTO OPERANTE O INSTRUMENTAL (1)

INTRODUCCIN
El denominador comn de los fenmenos que se ha estudiado en la
habituacin, sensibilizacin y condicionamiento clsico, es que un organismo no
tiene control sobre los estmulos a los que se expone (Rosas, Garca & Callejas,
2005).
En el condicionamiento operante o instrumental, los estmulos que
encuentra un organismo son resultado directo de su conducta, a la cual
comnmente se hace referencia como dirigida a metas. As, el control de la
conducta se da por las consecuencias de sta, a diferencia del condicionamiento
clsico, en que el control conductual se origina producto de la sealizacin
ambiental. La conducta operante o instrumental es el comportamiento que se
da por haber sido previamente instrumental en la generacin de ciertas
consecuencias (Domjan y Burkhard, 1990). Por ejemplo, los estudiantes estudian
porque eso les permite mejorar sus notas, los nios hacen pataletas cuando en el
pasado han logrado conseguir lo que quieren con esa conducta, metiendo la llave
en el auto un conductor puede poner en marcha el motor e introduciendo una
moneda en una mquina de bebidas una persona puede conseguir una gaseosa.
En estos ejemplos, algn aspecto de la conducta del sujeto sirve de instrumento
para provocar la aparicin de un estmulo consecutivo, es decir una
consecuencia (Domjan, 2003).
Es un hecho obvio para cualquiera, que las consecuencias de una accin
pueden determinar la futura repeticin de esa misma accin. Si miramos el suelo y
nos encontramos por casualidad un billete de $10.000, seguiremos mirando el
suelo por algn tiempo. No siempre es tan evidente la forma en que las
consecuencias influyen en la conducta futura. Esta clase est dedicada a mostrar
la relacin conducta consecuencia.

Lea esto primero. UNIACC, semana 4

A continuacin, se revisan los fundamentos tericos y empricos del


condicionamiento operante y las diferentes clases de contingencias que existen
entre la conducta operante -o instrumental- y sus consecuencias. (Ver video B.F.
Skinner).

1. PRIMERAS INVESTIGACIONES SOBRE CONDICIONAMIENTO OPERANTE


O INSTRUMENTAL.

Los primeros experimentos de laboratorio sobre la conducta instrumental


fueron realizados por Thorndike, presentados como tesis doctoral en 1898. La idea
inicial de Thorndike, influido por la teora de la evolucin de Darwin, era estudiar la
inteligencia animal. Para ello, Thorndike dise cajas problema para gatos, perros
y pollos. En uno de sus clsicos experimentos se encerraba un gato deprivado de
comida en la caja problema y, fuera de ella, a la vista del animal, se dejaba un
trozo de pescado. El animal poda escaparse de la caja-problema, por ejemplo,
corriendo un cerrojo. Entre las mltiples respuestas que un animal encerrado
puede dar, ste terminaba realizando el movimiento correcto y sala de la caja.
Thorndike lo volva a poner en la situacin experimental y meda el tiempo que
tardaba el animal en escaparse en cada ensayo. De esta forma, encontr una
correlacin negativa entre el tiempo que el gato tardaba en escaparse y el nmero
de ensayos realizados con xito. Es decir, el aumento de ensayos haca que el
animal realizara la respuesta de forma ms rpida (Domjan y Burkhard, 1990).
Thorndike interpret los resultados de sus experimentos en funcin del
aprendizaje de una asociacin o conexin entre los estmulos de la caja y el
movimiento especfico de la respuesta de huda. Las consecuencias de la
respuesta exitosa (escapar de la caja, comerse el alimento) slo servan para
fortalecer la asociacin entre los estmulos de la caja y dicho movimiento.
Despus de observar diversas especies animales en diferentes cajas- problemas,
2

Lea esto primero. UNIACC, semana 4

Thorndike formul uno de los principios ms importantes del aprendizaje, la ley


del efecto (Domjan y Burkhard, 1990). Segn dicha ley, si una respuesta en
presencia de un estmulo es seguida por un suceso satisfactorio, la asociacin
entre el estmulo (E) y la respuesta (R) se fortalece. Si la respuesta es seguida por
un suceso molesto, la asociacin E-R se debilita (Domjan, 2003, p.127).
De acuerdo con la ley del efecto, los animales aprenden una asociacin
entre la respuesta y los estmulos presentes en el momento de la respuesta. La
consecuencia de la respuesta no est implicada en la asociacin. La
consecuencia, satisfactoria o molesta, simplemente sirve para fortalecer o debilitar
el lazo, asociacin o conexin, entre la respuesta y la situacin estimular (Domjan
y Burkhard, 1990).
Skinner (1938) critica los aspectos tericos de la ley del efecto y la
reformula como la ley de reforzamiento, concedindole una importancia capital
dentro del condicionamiento operante (Domjan y Burkhard, 1990). Skinner enfatiz
el efecto de fortalecimiento tanto de los reforzadores primarios como secundarios.
De igual modo, resalt el control de los estmulos sobre la conducta, es decir, el
hecho que la conducta operante ocurre en presencia de estmulos que preparan la
ocasin para ella (Bouton, 2007)

2. APROXIMACIONES AL ESTUDIO DEL CONDICIONAMIENTO OPERANTE

A medida que los estudios de aprendizaje operante o instrumental han


aumentado, el rango de tareas utilizadas es mucho menor, siendo algunas de
stas estndar, lo que facilita la comparacin de resultados en diferentes
laboratorios. A continuacin, revisaremos los procedimientos estndar ms
utilizados para el estudio de la conducta operante (Domjan, 2003).
a) Procedimiento de ensayo discreto.
b) Procedimiento de operante libre.
3

Lea esto primero. UNIACC, semana 4

c) Moldeamiento.

a) Procedimientos de ensayo discreto


Son similares al mtodo de Thorndike, en el que cada ensayo de
entrenamiento acaba con la retirada del animal del aparato y la respuesta
instrumental se realiza slo una vez durante cada ensayo. Ejemplos de esto
son las cajas problemas y los laberintos. En estos ltimos, la conducta puede
cuantificarse midiendo la velocidad de la carrera, es decir, el tiempo que
demora el animal desde la caja de salida hasta la meta, y la latencia de
respuesta, esto es, el tiempo que demora el animal en abandonar la caja de
salida.

b) Procedimientos de operante libre


Permiten al animal que repita la respuesta una y otra vez sin restricciones. Este
mtodo fue ideado por B.F. Skinner (1938) para estudiar la conducta de una
manera ms continua y durante perodos ms prolongados de lo que es
posible en los laberintos. Este mtodo permite observar los cambios en la
frecuencia y distribucin temporal de la respuesta (Rosas, Garca &
Callegas, 2005). As, Skinner propuso el concepto de operante como la forma
de dividir la conducta en unidades medibles con significado (Domjan, 2003, p.
129).

c) Entrenamiento y moldeamiento al comedero


Al introducir una rata en la caja Skinner, stas, por lo general, no presionan la
palanca, por lo tanto hay pasos preliminares que permiten establecer la
conducta de presin de palanca.
-

Entrenamiento al comedero: comprende un condicionamiento


clsico, en el que las ratas aprenden cuando la comida est
disponible en el comedero. El sonido del dispensador de
comida (EC) se empareja con la entrega de una bolita de comida
4

Lea esto primero. UNIACC, semana 4

en el comedero (EI). Una vez aprendida esta asociacin, el


sonido genera una respuesta de seguimiento de signo, es decir,
el animal se dirige al comedero y coge la bolita de comida.
-

Moldeamiento: el moldeamiento es el procedimiento que se


utiliza para generar una nueva conducta e implica el
reforzamiento de aproximaciones sucesivas a la conducta
meta y el no reforzamiento de las forma de respuesta
anteriores. Al principio, la comida se entrega si el animal hace
cualquier cosa remotamente relacionada con la respuesta
deseada. Por ejemplo, se puede alimentar a la rata cada vez que
se para sobre las patas traseras en cualquier lugar de la caja de
Skinner. Una vez que esta respuesta es estable, slo se le
entregar alimento si se para sobre las patas cerca de la palanca
de respuesta, no reforzando nuevamente si se para en otras
partes. As sucesivamente, se refuerza cada aproximacin del
sujeto a la conducta objetivo, hasta alcanzarla. (Ver video
Moldeamiento de respuesta)

La tasa de respuesta como medida de la conducta operante


Para cuantificar o medir la conducta operante en el laboratorio, se utiliza
la tasa de respuesta (frecuencia de la respuesta por minuto, por
ejemplo). sta permite obtener una medida de la probabilidad de
respuesta operante en el futuro. Las respuestas ms probables ocurren
frecuentemente y tienen una alta tasa de respuesta, mientras que las
respuestas improbables que ocurren de vez en cuando, muestran una
tasa baja. La tasa de respuesta tambin puede ser utilizada en
contextos clnicos, en los cuales permite obtener una medida de la
probabilidad de emisin de una conducta problema.

Lea esto primero. UNIACC, semana 4

3. PROCEDIMIENTOS DE CONDICIONAMIENTO OPERANTE

En todas las situaciones de condicionamiento operante la respuesta


produce una consecuencia; conducir a la velocidad adecuada para evitar un
accidente o una sancin, que un nio reciba el objeto deseado luego de una
pataleta, estudiar y sacarse buena nota o quitarle las llaves del auto a un joven por
llegar tarde a casa son formas de condicionamiento operante.
Una consecuencia placentera se denomina tcnicamente estmulo
apetitivo

mientras

que

una

consecuencia

molesta

se

denomina

tcnicamente estmulo aversivo. La respuesta instrumental puede


proporcionar el estmulo, como cuando al chico de la puerta de al lado se le
paga por cortar el csped. En este caso se dice que surte efecto una
contingencia positiva entre la respuesta y el estmulo consecuente. De
forma alternativa, la respuesta instrumental puede retirar o eliminar un
estmulo, como cuando se cierra una ventana para evitar la entrada de la
lluvia. En este caso se dice que existe un efecto de contingencia negativa
entre la respuesta y su consecuencia. Que el resultado de un procedimiento
de condicionamiento sea un aumento o una disminucin en la tasa de
respuesta depende tanto de la contingencia respuesta-consecuencia como
de la naturaleza de la consecuencia (Domjan, 2003, p.134).

Lea esto primero. UNIACC, semana 4

En la figura 1, se muestran los cuatro procedimientos de condicionamiento


operante o instrumental. stos se diferencian en el tipo de estmulo (apetitivo o
aversivo) que es controlado por la respuesta y en si la respuesta produce o elimina
el estmulo.

TIPOS DE PROCEDIMIENTOS DE CONDICIONAMIENTO INSTRUMENTAL


NOMBRE DEL

CONTINGENCIA

PROCEDIMIENTO

RESPUESTA-CONSECUENCIA

RESULTADO

Positivo: la respuesta produce un

Reforzamiento o incremento

estmulo apetitivo.

en la tasa de respuesta.

Positivo: la respuesta produce un

Supresin o disminucin en

estmulo aversivo.

la tasa de respuesta.

Reforzamiento negativo

Negativo: la respuesta elimina o

Reforzamiento o incremento

(Escape o evitacin)

previene la ocurrencia de un

en la tasa de respuesta.

Reforzamiento positivo

Castigo (Castigo positivo)

estmulo aversivo.
Entrenamiento

de

(RDO)

omisin

Negativo: la respuesta elimina o

Supresin o disminucin en

previene la ocurrencia de un

la tasa de respuesta.

estmulo apetitivo.
Figura 1: Reproducida de Domjan, 2003, p. 134.

a) Reforzamiento positivo: la respuesta instrumental aproxima o produce un


estmulo apetitivo, por tanto existe una contingencia positiva entre la respuesta
y un estmulo apetitivo. El reforzamiento positivo produce un aumento en la
probabilidad de emisin de la respuesta (Domjan, 2003). Recibir un bono por
realizar bien el trabajo, que un nio reciba un elogio por estudiar el tiempo
acordado con sus padres o por ordenar su dormitorio, ser acariciado y elogiado
por cocinar un plato para su novio o novia y que una rata hambrienta reciba
una bolita de comida por apretar una palanca, son ejemplos de este tipo de
reforzamiento.

Lea esto primero. UNIACC, semana 4

b) Castigo: la respuesta instrumental aproxima o produce un estmulo aversivo,


por tanto, existe una contingencia positiva entre la respuesta y un estmulo
aversivo. El castigo produce una disminucin en la probabilidad de emisin de
la respuesta (Domjan, 2003). Son ejemplos de castigo: dar una reprimenda a
su hijo por cruzar la calle solo o por no hacer sus tareas, ser criticado por llegar
tarde a una reunin de trabajo y que su profesor le ponga nota 1,0 en el
examen luego de haberlo descubierto copiando a su compaero.
c) Reforzamiento negativo: la respuesta instrumental finaliza o previene un
estmulo aversivo, por tanto, existe una contingencia negativa entre la
respuesta y un estmulo apetitivo. El reforzamiento negativo produce un
aumento en la probabilidad de emisin de la respuesta. Existen dos tipos de
reforzamiento negativo: escape y evitacin (Domjan, 2003):
-

Escape: el estmulo aversivo se presenta, pero puede ser eliminado


por la respuesta instrumental (Domjan, 2003). Se puede escapar del
molesto sonido de una radio si la apagamos. Se puede escapar del
cine cuando la pelcula es mala. Puede comprarle a su hijo lo que
desea para escapar de su vergonzosa pataleta en el supermercado y
una rata puede saltar a una plataforma de seguridad para escapar de
un shock.

Evitacin: la respuesta instrumental previene la entrega de un


estmulo aversivo (Domjan, 2003). Se puede prevenir un accidente
de trabajo si se siguen las reglas de seguridad, se hace la revisin
del auto para evitar que presente fallas en el futuro, le puede decir a
su pareja que le duele la cabeza o que est muy ocupado para evitar
una discusin, puede tener permanentemente a un beb en brazos
para evitar que llore. En el laboratorio se programa que una rata
reciba una descarga elctrica luego de presentar un estmulo de
aviso. Sin embargo, si la rata salta a una plataforma durante el
estmulo de aviso, no se presenta la descarga.

Lea esto primero. UNIACC, semana 4

d) Entrenamiento de omisin: la respuesta instrumental previene o elimina un


estmulo apetitivo, por tanto existe una contingencia negativa entre la
respuesta y un estmulo apetitivo. El entrenamiento de omisin produce una
disminucin en la probabilidad de emisin de la respuesta. Este mtodo es el
preferido para disuadir la conducta humana pues, al contrario del castigo, no
implica la presentacin de un estmulo aversivo (Domjan, 2003). Ejemplos de
esto son: no permitir a un nio ver televisin durante un tiempo, luego de haber
hecho algo malo; y retirar la licencia por conducir en estado de ebriedad.

En ocasiones, el entrenamiento de omisin se denomina reforzamiento


diferencial de otras conductas o RDO, debido a que el individuo recibe
peridicamente un estmulo apetitivo, con la condicin que se dedique a
realizar una conducta diferente a la especificada por el procedimiento. La
realizacin de la respuesta crtica deviene en la omisin de la recompensa, que
podra haber sido entregada si el individuo hubiese realizado una conducta
alternativa. Por lo tanto, el entrenamiento de omisin implica el reforzamiento
de otras conductas (Domjan, 2003). Es esto ltimo lo que lo diferencia del
procedimiento de extincin en condicionamiento instrumental. (Ver video
Omisin con automoldeamiento)

4. ELEMENTOS FUNDAMENTALES DEL CONDICIONAMIENTO OPERANTE

La respuesta operante o instrumental


La mayora de los experimentos en condicionamiento instrumental estudian
reacciones motoras voluntarias, como presionar una palanca, pero hay
otros tipos de respuesta que tambin son investigadas. En los estudios de
biofeedback, por ejemplo, la recompensa es contingente a la ejecucin de
una respuesta biolgica como un cambio en la presin sangunea. Tambin,
mediante

terapia

conductual,

se

pueden

condicionar

reacciones

conductuales altamente especficas como la conducta verbal y patrones de


9

Lea esto primero. UNIACC, semana 4

conducta social compleja. La recompensa afecta, adems, al ritmo de la


conducta y su variabilidad o estereotipia (Tarpy, 1997). Se pueden crear
nuevas unidades de conducta o reforzar conductas ya existentes.

El reforzador
Los incrementos, tanto en la calidad como en la cantidad del reforzador,
producen tasas ms elevadas de respuestas (Domjan, 2003). Sin embargo,
la eficacia de un reforzador depende no slo de sus propiedades, sino
adems de cmo se compara con otros reforzadores que el individuo ha
experimentado.

La

investigacin

ha

demostrado

que

una

buena

recompensa es tratada como especialmente buena luego del reforzamiento


con una recompensa pobre, y una recompensa pobre se trata como
especialmente pobre luego del reforzamiento con una buena recompensa
(Domjan y Burkhard, 1990). Este fenmeno es conocido como contraste
sucesivo positivo y negativo.
El contraste positivo se refiere a una elevada respuesta por una
recompensa favorable resultado de una experiencia anterior con una
consecuencia menos atractiva (Domjan, 2003, p. 145). Por ejemplo, si
usted reciba un sueldo de cien mil pesos y le ofrecen ciento cincuenta mil
pesos en otro lugar, puede experimentar ste ltimo sueldo, que sigue
siendo bajo, como especialmente bueno, producto de haber recibido un
sueldo menor y por tanto mostrar un aumento en su respuesta. Por el
contrario, el contraste negativo se refiere a una respuesta disminuida por
una recompensa desfavorable debido a una experiencia anterior con una
consecuencia mejor (Domjan, 2003, p. 145). Por ejemplo, imagine que
usted tiene un buen sueldo de 4.000.000 de pesos y se lo bajan a
3.500.000 pesos, que sigue siendo un buen sueldo, como especialmente
mal, producto de que ha tenido un sueldo mejor.

10

Lea esto primero. UNIACC, semana 4

La relacin respuesta reforzador


La conducta operante o instrumental produce y es controlada por sus
consecuencias. En algunos casos, existe una fuerte relacin entre lo que
una persona hace y la consecuencia de esa conducta, por ejemplo, si echa
una moneda en una mquina de bebidas, se conseguir una bebida. En
otros casos, no hay relacin entre la conducta y la consecuencia, as, usted
puede llevar una prenda de vestir especial a una prueba y obtener buena
nota, pero la nota no estara relacionada con la prenda de vestir. Por ltimo,
la relacin entre la respuesta y la consecuencia puede ser probabilstica,
por ejemplo, puede hacer varias llamadas telefnicas antes de que
encuentre a alguien que pueda ayudarle a resolver un problema (Domjan,
2003).
La relacin entre respuesta y reforzador consiste en dos factores
independientes. Uno implica la medicin del tiempo entre la respuesta y el
reforzador. A esto se le denomina contigidad temporal. El segundo
componente de la relacin entre respuesta y reforzador implica causalidad:
la medida en que la respuesta instrumental es necesaria y suficiente para la
presentacin del reforzador, a lo que se denomina contingencia entre
respuesta y reforzador. Los factores temporales y causales son
independientes unos de otros (Domjan y Burkhard, 1990), aun cuando estos
dos aspectos de la relacin respuesta-reforzador actan en conjunto para
producir el aprendizaje.

La relacin causal, o contingencia, asegura que el reforzador es


entregado slo tras la ocurrencia de la respuesta instrumental
especificada. La relacin de contigidad asegura que otras
actividades no se interpongan entre la respuesta especificada y el
reforzador para interferir en el condicionamiento de la respuesta
crtica (Domjan, 2003, p. 159).

11

Lea esto primero. UNIACC, semana 4

a)

Efectos de la contigidad temporal: el condicionamiento operante

o instrumental requiere la presentacin del reforzador inmediatamente


despus de la ocurrencia de la respuesta. La razn es que se ha
demostrado experimentalmente que este tipo de aprendizaje se altera
demorando el reforzador tras la ocurrencia de la respuesta instrumental
(Domjan, 2003).

El condicionamiento instrumental es sensible a la demora del reforzador


pues, tras la realizacin de una respuesta especfica que se quiere
reforzar, el organismo no para de hacer cosas. Esto dificultar que la
respuesta se asocie con el reforzador y ms bien ste podra asociarse a
las respuestas que ocurren entre medio (Domjan, 2003). Para solucionar
este problema, se puede utilizar un reforzador condicionado o
secundario. ste es un estmulo condicionado que ha sido previamente
asociado con el reforzador y puede ser entregado inmediatamente
despus de la respuesta instrumental, as se puede retrasar la entrega del
reforzador primario. Las confirmaciones verbales en el adiestramiento,
como bueno y eso es son reforzadores condicionados, los que pueden
proporcionar reforzamiento inmediato para la conducta esperada (Domjan,
2003).

Un buen ejemplo del uso de reforzadores condicionados lo constituye el


procedimiento de economa de fichas, el que se utiliza en terapia
conductual para el tratamiento de la enuresis. En este caso, el nio o nia
debe juntar, por ejemplo, 10 caritas felices para recibir un premio, y para
ganar una carita feliz debe pasar una noche sin orinar en su cama.

12

Lea esto primero. UNIACC, semana 4

b)

La contingencia respuesta reforzador: La contingencia respuesta-

reforzador se refiere al hecho de que la entrega del reforzador es


dependiente de la ocurrencia previa de la respuesta instrumental
(Domjan, 2003, p. 149). Una fuerte contingencia entre la respuesta
operante y el reforzador significa que la respuesta controla el reforzador,
es decir, que el reforzador suceda depende de si ha ocurrido la respuesta
instrumental (Domjan, 2003). Por ejemplo, si usted le dice a su hijo que si
hace las tareas podr salir a jugar, entonces salir a jugar depende de que
su hijo haga las tareas y as el tiene control sobre el reforzador. Del
mismo modo, el nio controla los castigos cuando stos son consecuencia
directa de su conducta.

La mayora de las investigaciones sobre los efectos del control sobre los
reforzadores se han centrado sobre los efectos del control en la
estimulacin aversiva, cuyos primeros estudios fueron realizados por
Seligman, Overmier y Maier (1967, en Domjan, 2003). Ellos investigaron
los efectos de la exposicin a una descarga incontrolable en el
aprendizaje posterior de escape-evitacin en perros y descubrieron que la
exposicin a una descarga elctrica incontrolable dificulta el aprendizaje
posterior, fenmeno al que se ha denominado efecto de indefensin
aprendida (Domjan, 2003).

13

Lea esto primero. UNIACC, semana 4

5. ETAPAS DEL CONDICIONAMIENTO OPERANTE O INSTRUMENTAL

Adquisicin: la adquisicin es la etapa durante la cual la conducta es


adquirida y es evidente cuando la conducta especificada se fortalece
debido a su relacin con la consecuencia. La fortaleza de la conducta se
mide en trminos del aumento en la probabilidad de emisin o de la
frecuencia de la conducta, una disminucin en el nmero de errores,
una disminucin en el tiempo que demora en completar la respuesta, un
aumento en la velocidad de la conducta o una tendencia a persistir en la
respuesta (Tarpy, 1997)

Extincin: durante la extincin, se elimina la consecuencia luego de


ocurrida la respuesta. El resultado de este procedimiento es una
disminucin de la fuerza de la respuesta que implica una disminucin
gradual en la ejecucin. Al igual que en el condicionamiento pavloviano,
el procedimiento de extincin produce una disminucin en la respuesta,
pero no la elimina totalmente, pues puede ocurrir una recuperacin
espontnea luego de un tiempo transcurrido desde la extincin (Tarpy,
1997).

Efectos del procedimiento de extincin: cuando se introduce la


extincin luego de un periodo de reforzamiento, al principio hay un
aumento en las respuestas; luego de esto, la respuesta disminuye
gradualmente. Adems, puede haber una pequea y temporal
recuperacin de la respuesta debido al transcurso del tiempo llamada
recuperacin espontnea. La reaccin emocional inducida por el retiro
de un reforzador esperado se denomina frustracin (Domjan y Burkhard,
1990).

14

Lea esto primero. UNIACC, semana 4

Referencias
Bouton, M.E. (2007). Learning and Behavior: A contemporary Synthesis. U.S.A.:
Sinauer Associates, Inc.
Domjan, M. & Burkhard, B. (1990). Principios de aprendizaje y conducta. Madrid:
Debate.
Domjan, M. (2003). Principios de aprendizaje y conducta (5.ed.). Espaa:
Thomson.
Rosas, J.M., Garca, A. & Callejas, J.E. (2005). Fundamentos del aprendizaje
Humano. Jan: Ediciones del Lunar.
Tarpy, R.M. (1997). Contemporary Learning: Theory and Research. U.S.A.:
McGraw-Hill.

15

Das könnte Ihnen auch gefallen