Sie sind auf Seite 1von 12

3.2.

CONDICIONAMIENTO OPERANTE (INSTRUMENTAL)

El condicionamiento operante es una expresin introducida por F. Keller y W. Shoenfeld (1950) en sustitucin del trmino condicionamiento tipo R de Skinner, de acuerdo a estos autores existen algunos estmulos que tienen la propiedad de poder fortalecer las respuestas que las producen. Al fortalecimiento se le puede denominar Condicionamiento Operante y los estmulos pueden ser considerados como pertenecientes a una clase denominada estmulos reforzadores. El condicionamiento operante en trminos genricos se define como el proceso por el cual una conducta (operante) es alterada o modificada por las consecuencias que producen su propia ejecucin. Este trmino tambin se utiliza como sinnimo de ciencia experimental de la conducta (Reynolds, 1968). La conducta operante opera o produce cambios en el medio ambiente (consecuencias). Estos cambios en el medio ambiente pueden ser la presentacin o eliminacin de estmulos; la eliminacin o presentacin de estmulos dan lugar a las consecuencias de la conducta. Las consecuencias de la conducta operante pueden ser reforzantes o aversivas. Si una consecuencia es reforzante, la conducta que la produjo tender a incrementar su probabilidad de ocurrencia futura; si la consecuencia es aversiva, la conducta que la produjo tender a decrementar su probabilidad de ocurrencia futura. Cuando a una conducta le sigue la presentacin de un estmulo, se dice que la contingencia es positiva. El trmino positivo seala que luego de la emisin de la conducta se le ha sumado (+) un estmulo. Cuando a la conducta le sigue la eliminacin de un estmulo, se dice que la contingencia es negativa, el trmino negativo seala que luego de la emisin de la conducta se le ha restado o quitado (-) un estmulo. CLASIFICACIN DE LOS ESTMULOS Los estmulos pueden ser reforzados o aversivos en virtud de su funcin o efecto que tenga sobre la conducta operante. Estmulos Reforzadores: Los estmulos reforzadores o reforzantes, son cualquier evento o estmulo que contingente a la emisin de una conducta produce un cambio (incremento) en la probabilidad futura de dicha conducta. Los reforzadores se pueden clasificar de manera muy diferente: 1) De acuerdo a su funcionalidad, en positivos y negativos (Skinner, 1953), 2) De acuerdo a su naturaleza en condicionados e incondicionados (Skinner, 1953), 3) De acuerdo a su uso en manipulables y consumibles (Bijou y Baer, 1966), 4) De acuerdo a su ubicacin, en intrnsecos y extrnsecos (Tharp y Wetsel, 1969), y 5) De acuerdo a la intencin del agente que los administra, en naturales y arbitrarios (Fester, 1967), etc. Para los fines del curso vamos a definir slo la clasificacin que hace Skinner de los reforzados. Skinner clasifica los reforzadores de acuerdo a dos criterios: segn su naturaleza y segn su funcionalidad.

a) Segn su naturaleza: En virtud de que si las propiedades reforzantes del estmulo reforzador son innatas o
adquiridas, los reforzadores pueden ser incondicionados o primarios y condicionados o secundarios. Los Reforzadores Primarios.- Son aquellos cuyas propiedades reforzantes estn determinadas por el valor que tienen para la supervivencia de la especie a la cual pertenece el organismo (historia filogentica), y no se deben a un proceso de condicionamiento. Por ejemplo: el agua, el alimento, la actividad sexual, el aire, un ruido fuerte, presin de un objeto agudo, etc. Los Reforzadores Secundarios.- Son aquellas cuyas propiedades reforzantes estn basadas en la historia personal de cada organismo, debido a que han precedido o acompaado la presentacin de un reforzador incondicionado. Por ejemplo: el dinero, las notas, la aprobacin social, los regaos, etc.

b) Segn su funcin: En dependencia de si las propiedades reforzantes estn determinadas por la presentacin de
estmulos o por la eliminacin o evitacin de estmulo contingente a la emisin de la conducta y pueden ser positivos o negativos. Reforzadores Positivos.- Son aquellos eventos o estmulos cuya presentacin despus de emitida una conducta incremente su futura probabilidad de ocurrencia. Ejemplo: el dinero, la comida, etc.

Reforzadores Negativos.- Son aquellos eventos o estmulos cuya eliminacin incrementa la probabilidad de ocurrencia de la conducta que los elimina. Ejemplo: notas desaprobatorias, regaos, etc. ESTMULOS AVERSIVOS: Existen dos criterios para determinar si un estimulo es aversin o no: 1) Si fortalece la conducta que lo elimina y, 2) Si una conducta reduce su probabilidad como consecuencia de la presentacin de ese estmulo (Sller y Schonfeld, 1950). Existen dos clases de estmulos aversivos: condicionados e incondicionados, se ha investigado los efectos de los siguientes estmulos aversivos: choque elctricos (Gibben, 1967), esfuerzo manejando el vigor de la respuesta (Chung Shing-Ho, 1965) sera mediante chorros de aire (Veiss y Laties, 1961), golpes dados con la palanca (Skinner, 1938), luz a altas intensidades (Kaplan, 1965), ruido, sonidos fuertes (Azrin, 1958), pellizcos en la cola del animal (Bradie y Beren, 1958), tiempo fuera de reforzamiento positivo (Morse y Herroisten, 1956) estos son estmulos aversivos incondicionados y sirven de base a los estmulos aversivos condicionados. MODALIDADES DEL CONDICIONAMIENTO OPERANTE. En dependencia de si la contingencia (relacin entre la respuesta y el estmulo) es positiva o negativa, y de si el estmulo que se presenta (+) o se elimina (-) es reforzador o aversivo. Se determina la consecuencia (reforzante o aversiva) en relacin del efecto que dicha consecuencia tiene sobre la conducta que la produjo (incremento o decremento de su probabilidad de ocurrencia futura) ha dado lugar a cuatro modalidades bsicas del condicionamiento operante: reforzamiento positivo, reforzamiento negativo, castigo positivo y castigo negativo. Las modalidades de reforzamiento (positivo o negativo) incrementa la probabilidad de ocurrencia de la conducta, las modalidades de castigo (positivo o negativo) decrementan la probabilidad de ocurrencia de la conducta.

OPERACI N E Estmulo Reforzador Estmulo Aversivo

PRESENTACIN

ELIMINACIN

Reforzamiento Positivo (Incremento) Castigo Positivo (Decremento)

Castigo Negativo (Decremento) Reforzamiento Negativo (Incremento)

REFORZAMIENTO Es el procedimiento esencial para el establecimiento y fortalecimiento de una respuesta condicionada. Esta expresin fue introducida por Ivn Pvlov (1927) y est implcita en todas las operaciones de condicionamiento descritas por l. El trmino reforzamiento tiene dos significados distintos: uno fctico y el otro terico. En su sentido fctico, el reforzamiento se refiere a cualquiera de una amplia variedad de condiciones que pueden introducirse en una situacin de aprendizaje para aumentar la probabilidad de ocurrencia de una determinada respuesta. En el reforzamiento lo que se fortalece no es la respuesta que precede a la presentacin del reforzador, ya que esta respuesta ha ocurrido y no se puede cambiar, sino la probabilidad futura de las respuestas que pertenecen a esa clase. Estas condiciones pueden consistir en presentar un estmulo condicionado y a continuacin, despus de un intervalo presentar un estmulo incondicionado (condicionamiento clsico) que es necesario para la formacin de la respuesta condicionada (los estmulos incondicionados E.I. reciben el nombre de reforzadores), y tambin la presentacin de un cierto tipo de estmulos en una relacin temporal con una respuesta (Skinner) en donde un reforzador si sigue a una respuesta (condicionamiento operante). El significado terico de reforzamiento vara considerablemente. Hull lo iguala

con al reduccin del impulso; Skinner y Tolman lo manejan como estmulo; para Thorndike, es un satisfacer o un perturbador; Guthrie lo considera como algo que altera una situacin; Sheffield, Denny y Adelman lo ven como una causante de conducta. Una definicin terica aceptable es la que seala que el reforzamiento es el proceso mediador de aceptacin de la accin (adiente o abiente) por retroalimentacin. La accin abiente es la que tiende a apartar el organismo de la fuente de estimulacin la accin adiente tiende a aproximar o exponer al organismo al estmulo. El reforzamiento implica la aceptacin de la actividad desencadenada o emitida por el organismo en funcin de sus resultados a travs de un proceso de feed-back o retroalimentacin por el cual el acontecimiento ulterior fortalece el acontecimiento previo. Esta retroinformacin es esteroceptiva, es decir relacionadas con las propiedades del estmulo y, propioceptivas, es decir relacionada con las propiedades del estmulo y, propioceptivas, es decir relacionada con las propiedades del estmulo y, propioceptivas e interoceptivas, o sea, dependiente del carcter mismo de la respuesta y de su relacin con los cambios en el estado de necesidad del organismo (Ral Gonzales, 1971). REFORZAMIENTO POSITIVO: Como procedimiento consiste en la presentacin de un reforzador (positivo) contingente a la emisin de una conducta operante. El proceso conductual que se observa, es un incremento en la tasa de respuesta que pertenecen a la clase de la emisin de la operante reforzada. El trmino positivo, sugiere que el reforzador se aada o se suma a la situacin en que se presenta la conducta. Ejemplo: Darle un dulce a un nio tan pronto se lave las manos. Para definir el reforzamiento positivo no basta con especificar el procedimiento, sino que tambin se debe sealar el efecto de dicha operacin. El reforzamiento positivo es el principio fundamental sobre el cual descansa el anlisis experimental de la conducta, y que tambin recibe el nombre de condicionamiento operante (Reynolds, 1974). PARADIGMA DEL REFORZAMIENTO OPERANTE (Millenson, 1974) Todo paradigma conductual consistir de un presupuesto, un procedimiento, un proceso y un resultado. El presupuesto frecuentemente contiene una descripcin del estado conductual anterior a la ejecucin del procedimiento de una sucinta de lo que hace el experimentador; el proceso informa brevemente lo que ocurre con el tiempo en aspectos importantes de la conducta segn se siga aplicando el procedimiento y el resultado es el estado final del proceso. Cuando la conducta ha cesado de cambiar significativamente debido al procedimiento empleado, se ha alcanzado el resultado. Representacin del Paradigma: Presupuesto 1) Respuesta emitida con una frecuencia superior a cero. 2) Un reforzador adecuado.

Procedimiento: Presntase a continuacin de cada emisin del operante elegido, al estmulo reforzador R Er+. Proceso: Un incremento difcil es la tasa del operante, su rpida incorporacin a un cuerpo de conducta y un estrechamiento de la topografa operante. Resultado: Igual que el proceso. REFORZAMIENTO NEGATIVO: Se refiere al reforzamiento (fortalecimiento) de una respuesta mediante la eliminacin del estmulo (estmulo aversivo). Con frecuencia se confunde este procedimiento con el castigo; sin embargo este ltimo no incrementa la frecuencia de una respuesta, sino la suprime. En el reforzamiento negativo una respuesta da por terminada la presentacin de un estmulo, consecuentemente la respuesta volver a repetirse en condiciones semejantes. (La respuesta es el medio a travs del cual se retira o excluye aquel estmulo, es decir, la desaparicin del estmulo debe ser una consecuencia de la conducta). Por lo general en el reforzamiento negativo se hacha mano a los estmulos aversivos, de manera que cuando el sujeto de la R desaparece el E aversivo dicha respuesta se vuelve ms probable en el futuro. Ejemplo: rascarse cuando nos pica algo, estudiar por sustituir una nota. El reforzamiento negativo puede ser de dos clases: a) de evitacin, cuando el E aversivo no est presente an dentro de la situacin y b) de escape, cuando el estmulo aversivo ya est presente. Ms detalladamente, en el reforzamiento negativo de evitacin (secundario) la respuesta da por terminada la presentacin de estmulos aversivos condicionados; mientras que el reforzamiento negativo de escape (primario) la respuesta da por terminada la presentacin de estmulos aversivos incondicionados. FACTORES Y PARMETROS DEL REFORZAMIENTO

FACTORES DEL REFORZAMIENTO. El reforzamiento no puede reducirse solamente a la presentacin de una consecuencia reforzante contingente a la conducta. Existe evidencia experimental que el proceso de reforzamiento es complejo, y que es necesario tener en cuenta ciertos factores que van a facilitar u obstruir tal proceso. Los factores del reforzamiento ms estudiados son aquellos que provienen del organismo, del estmulo y de la respuesta. (Gonzles, 1971). a) FACTORES DEL ORGANISMO. Est relacionado con las necesidades del organismo, las necesidades son estados carenciales en el organismo, que si no lo corrigen lo perturban o matan. El reforzamiento segn Hull es producido por un cambio en el estado de necesidad, en el sentido de reduccin (reduccin del impulso). b) FACTORES DEL ESTMULO. Las propiedades sensoriales del estmulo son tambin factores del reforzamiento. Schoenfeld, realiz experimentos utilizando las propiedades dulces de la sacarina que carece de valor nutritivo como reforzador, los resultados fueron: 1) La sacarina tiene un alto valor reforzante como la comida. 2) La sacarina acta como mejor reforzador que una solucin de dextrosa, ms nutritiva pero menos dulce. Las evidencias empricas apoyan que las propiedades gustativas de la sacarina son un elemento reforzante. c) FACTORES DE RESPUESTA. La accin de organismo (la respuesta) se puede manifestar tambin intrnsecamente reforzadora. investigado papel de 3 tipos de respuestas: exploratoria, consumatorias y dominantes. 1) Se ha

RESPUESTAS EXPLORATORIAS. Meyers y Miller lograron un aprendizaje de laberinto con ratas utilizando como reforzador el acceso de los animales a un comportamiento que podan explorar. La respuesta exploratoria emitida actuaba como reforzador. 2) RESPUESTAS CONSUMATORIAS. Las respuestas consumatorias son el final de una serie de acciones del organismo que le ocasionan un estado de adaptacin a la situacin. Kagan y Ber Keen, lograron que un grupo de ratas aprendieran a oprimir una palanca que les permitiera correr en una rueda giratoria (las ratas vivan en espacios reducidos). 3) RESPUESTAS DOMINANTES. Son aquellas respuestas que preferentemente emite un organismo cuando tiene la ocasin de hacerlo; estas respuestas pueden actuar como reforzadores de otras respuestas emitidas previamente. Harlow ha demostrado que la respuesta manipulatoria muy intensa en los monos acta como un reforzador, si es que siguen a otras conductas como resolver problemas mecnicos.

PARMETROS DE REFORZAMIENTO. Los parmetros de reforzamiento se refieren a como determinadas dimensiones del estmulo reforzador controlan la ejecucin en la situacin del aprendizaje. El trmino parmetros, se utiliza como sinnimo de variable independientemente y se refiere a una variable cuyo valor se mantiene constante, mientras cambia el valor de otras variables. El trmino de parmetro de reforzamiento se refiere a las dimensiones del reforzador que pueden variar independientemente, como por ejemplo, frecuencia, proximidad temporal con la respuesta, magnitud, composicin, etc. Los cuatro principales parmetros de reforzamiento son: la magnitud, la demora de reforzamiento, el intervalo entre estmulos y los programas de reforzamiento. a) MAGNITUD DE REFORZAMIENTO. La magnitud del reforzamiento abarca dos propiedades diferentes de los reforzadores: la cantidad y la calidad.

La cantidad se especifica por medio de alguna medida fsica: peso, volumen o disposicin del comedero para el organismo. La calidad se especifica usualmente segn las preferencias del organismo (un reforzador de alta calidad es aquel que un organismo prefiere en lugar de otros). La magnitud del reforzamiento se refiere generalmente a la cantidad de reforzador que se administra en cada operacin de reforzamiento (puede referirse al nmero de gramos administrados o el tiempo que permanece disponible para el animal el depsito de granos). Los experimentos demuestran que la cantidad de reforzamiento influye sobre la ejecucin de la situacin de aprendizaje; la ejecucin aumenta a mayor magnitud en el reforzamiento (la funcin es negativamente acelerada, es decir, las ejecuciones que al inicio son bastante altas van decreciendo conforme el organismo se va saciando). b) DEMORA EN EL REFORZAMIENTO. Entre la emisin de la respuesta y la ocurrencia del reforzador transcurre un periodo de tiempo. Experimentos demuestran y sugieren que las respuestas cercanas en espacio o tiempo al reforzamiento se aprenden ms rpidamente que las respuestas lejanas a l; es decir, si un reforzador sigue inmediatamente a una respuesta, estas se fortalecen ms rpidamente que cuando se demore la presentacin del reforzador. A la relacin temporal entre la ocurrencia de una conducta y las consecuencias reforzantes (en base al tiempo que media entre ambos) se le denomina Gradiente Temporal de Reforzamiento para sealar que al efecto del mismo ser mayor cuando ms cerca est el reforzador de la conducta. Por ahora parece improbable que el aprendizaje pueda efectuarse si la demora del reforzamiento pasa de unos cuantos segundos (6 8). En los aprendizajes humanos el reforzador de tipo secundario sirve de enlace entre la conducta y el reforzador primario. c) INTERVALO ENTRE ESTMULOS. Se refiere al tiempo que transcurre entre la iniciacin de un estmulo a condicionarse y del estmulo incondicionado (slo es aplicable este parmetro al condicionamiento clsico). Los estudios experimentales demuestran que la separacin ptima entre ambos estmulos es de 5 seg.; tanto los intervalos mayores o menores ocasionan un condicionamiento ms pobre. d) PROGRAMAS DE REFORZAMIENTO El reforzamiento puede administrarse consistentemente en cada respuesta, o en cada ensayo o puede efectuarse en alguna fraccin de estos. Los arreglos alternativos as descritos son condiciones de reforzamiento continuo y parcial o intermitente. La manera como se prescribe el reforzamiento para las conductas dan lugar a los programas de reforzamiento. Un Programa de Reforzamiento. Se define como un plan o procedimiento que determina cundo, cmo y cunto tiempo estar funcionando una contingencia de reforzamiento. Consiste en especificar la probabilidad para cada respuesta elegida en un momento determinado en los cuales la presentacin el reforzador es contingente o discontinua, es decir el reforzador contingente a una conducta es presentada todas las veces, esto da lugar a un reforzamiento continuo, o es presentado algunas veces y otras no, esto da lugar al reforzamiento intermitente. REFORZAMIENTO CONTINUO. Es la accin de reforzar cada una de las respuestas emitidas por el sujeto. (El reforzador se administra en cada ensayo correcto y para cada R. esperada). REFORZAMIENTO INTERMITENTE. Son los que solamente refuerzan algunas respuestas del total de respuestas emitidas por el sujeto. El reforzamiento intermitente se administra de acuerdo a un programa en el que el reforzador se da en base a contingencias temporales o a una cierta cantidad de respuestas correctas. Los programas de reforzamiento intermitente se establecen en funcin de: 1) El reforzamiento puede administrarse sobre las bases determinadas por el nmero de respuestas y el tiempo. 2) Que la contingencia temporal o de respuesta puede ser regular o irregular.

Los programas basados en el tiempo, son denominados de Intervalo, y los basados en el nmero de respuestas de Razn. A los programas regulares se les denomina fijos y a los programas irregulares se les denomina variables. Esto da lugar a cuatro programas simples de reforzamiento intermitente: 2 de razn y 2 de intervalo que pueden ser fijos o variables.

1. PROGRAMAS DE RAZN. Tienen como criterio el nmero de respuestas para el presentar el reforzador. En estos
programas el paso del tiempo no guarda ninguna relacin con la entrega del reforzador. Puede ser de dos tipos: DE RAZN FIJA (R.F.). Se presenta el reforzador cada vez que el organismo emite determinado nmero fijo de respuestas que son siempre los mismos contados a partir del reforzamiento anterior. Un R.F. de 20, se reforzar al organismo cuando haya emitido 20 respuestas a partir del reforzamiento anterior. Ejemplo: el llamado trabajo al destajo en donde al obrero se le paga por determinada cantidad de productos que haya realizado (una docena de camisas por ejemplo). El valor del programa lo da la cantidad de respuestas requeridas para el reforzamiento (RF20). DE RAZN VARIABLE (R.V.). En este tipo de programas se distribuyen los reforzamientos de acuerdo a una serie de razones al azar, teniendo un determinando promedio y cayendo dentro de los valores extremos arbitrarios, es decir, el reforzador se administra de acuerdo a un nmero determinado de respuestas, eligiendo valores que difieren de reforzamiento a reforzamiento al azar. Los promedios de dichos valores da la razn valor del programa. Ejemplo: suponga que se eligen para reforzamiento las siguientes razones (Nro. de R): 5, 8, 3, 1, 3, la razn promedio es 4, por lo tanto es un programa de RV4. La serie podr repetirse indefinidamente o bien, se podrn alterar sus valores cuidando el porcentaje de 4, un ejemplo de la vida diaria, las mquinas tragamonedas y los juegos de azar parecen controlados por este tipo de programas. 2. PROGRAMAS DE INTERVALO. Se define en funcin del tiempo reforzando la primera respuesta esperada o correcta que da el organismo luego de haber transcurrido el tiempo establecido. Si antes de dicha lapso el organismo emitiera algunas respuestas, stas no se reforzaran. Pueden ser de dos tipos: 1) INTERVALO FIJO (I.F.). Se establece en base a un determinado tiempo (en segundos o minutos) medido a partir del ltimo reforzamiento al trmino del cual se refuerza l a primera respuesta En este programa aparece un fenmeno denominado Festoneo, que describe un espaciamiento en las ejecuciones del organismo al inicio del intervalo, para incrementar el mismo al cumplirse el tiempo fijado para el reforzamiento. Los exmenes que se programan para fecha determinada, hacen por ejemplo que el estudiante durante los primeros das no estudie muy poco, para incrementar la conducta de estudiar faltando un da u horas para el examen. El valor del programa lo determina el lapso que debe transcurrir para reforzar la primera respuesta que ocurre (IF60).

3) PROGRAMAS DE INTERVALO VARIABLE (I.V). Se estructuran eligiendo de antemano diversos intervalos de


tiempo de diferente duracin, presentndose el reforzador a la primera respuesta esperada o correcta emitida despus de cumplirse el intervalo respectivo de tiempo, que se computa a partir del ltimo reforzamiento obtenido. En este programa, los reforzamientos se disponen de acuerdo a serie de intervalos diferentes entre s, teniendo un determinado promedio. Por ejemplo, supngase la siguiente serie de intervalos: 2, 3, 5, 2, el promedio de la serie es 3, por lo tanto ser un programa de IV3. Las conductas de llamar por telfono a una persona y las rabietas de un nio, son conductas que en la vida diaria parecen controlables por este tipo de programas. CARACTERSTICAS DE LOS PROGRAMAS DE REFORZAMIENTO INTERMITENTE. Los programas de reforzamiento intermitentes, se estructuran con la finalidad de mantener ejecuciones altas de respuestas, con bajo reforzamiento y, resistentes a la extincin, sin embargo, algunos programas generan o controlan de manera particular ejecuciones ms altas que otras as como, algunos son ms resistentes a la extincin que otros. Por ejemplo, en cuanto al nivel de ejecucin, (Nro, de R emitidas) los programas de razn producen frecuencias ms altas de respuestas que los de intervalo en el tiempo (las R son ms constantes). Entre los programas de razn, los de Razn variable (RV) producen mayor cantidad (o controlan mayor cantidad) de la R que los programas de Razn Fija (RF). Los programas de razn producen formas constantes de R (a la misma velocidad). Los programas de variables generan R ms resistentes a la extincin y entre ellos los de I.V. producen respuestas ms duraderas pero pausadas (resistentes a la extincin). OTROS TIPOS DE PROGRAMAS DE REFORZAMIENTO INTERMITENTE. Adems de los programas de Razn y de intervalo, existen otros programas de reforzamiento que reciben el nombre genrico de Programas de Reforzamiento Diferencial. (Ribes, 1974).

Los programas de reforzamiento diferencial se estructuran combinando los criterios de tiempo y el Nro. de R. El objetivo de estos programas diferenciales es lograr que el sujeto responda con frecuencias ms elevadas o reducidas de respuestas (a diferencia de los otros programas de razn y de intervalo, en los cuales el objetivo es elevar el nivel de respuestas que da el sujeto, as como su mantenimiento en el tiempo). Los programas diferenciales pueden ser de dos tipos: de Tasas y de Pausas; y estos a su vez pueden ser de tasa altas o bajas y de pausas cortas o largas (segn se desee incrementar o reducir el nivel de ejecucin de un sujeto). A. PROGRAMAS DE REFORZAMIENTO DIFERENCIAL DE TASAS. El objetivo de este programa es que el sujeto presente una R. a una frecuencia muy alta o muy baja () y se estructuran en base a un mnimo o mximo de Rs., en un mximo o mnimo de tiempo; de tal manera de que si el sujeto no cumple con un criterio establecido, se pospone la presentacin del reforzador, hasta que cumpla dicho criterio (). Los programas diferenciales de tasas pueden ser de tasas altas y de tasas bajas. 1. PROGRAMA DIFERENCIAL DE TASAS (D.T.A.). Este programa se estructura especificando un mnimo de respuestas en un mximo de tiempo. Por ejemplo, si se desea que un nio lea a cierta velocidad, se puede especificar el nmero de palabras u hojas que debe leer como mnimo, y el tiempo mximo que debe hacerlo. Si el sujeto lee igual o mayor cantidad de palabras y hojas en el tiempo fijado se le administra reforzamiento, si lee menor cantidad de palabras u hojas pierde reforzamiento y vuelve a iniciarse un nuevo periodo. (3 hojas en 30 minutos por ejemplo). Se emplea para incrementar la conducta de leer (velocidad de lectura). 2. PROGRAMA DIFERENCIAL DE TASAS BAJAS (D.T.B.). Este programa se estructura especificando un mximo de respuestas en un mnimo de tiempo (lo que se espera es que el sujeto decremente su nivel de respuestas). Ejem.: Si deseamos que un sujeto decremente su emisin de palabras soeces estableceremos un mximo de respuestas (5 por ejemplo) soeces admisibles dentro de un mnimo de tiempo (una hora). Si el sujeto dice ms de 5 palabras (6) en ese lapso pierde reforzamiento, pero se emite 5 o menos R soeces se reforzar (el prximo criterio puede ser por ejemplo 3 palabras soeces en una hora; es decir, el criterio se puede ir variando hasta que el sujeto muestre escasas respuestas). B. PROGRAMAS DE REFORZAMIENTO DIFERENCIAL DE PAUSAS. Estos programas persiguen un mantenimiento de frecuencias bajas o elevadas de conducta, slo que el criterio que especifica en base al tiempo que debe transcurrir entre R y R (pausa entre respuestas y deben ser de pausas cortas y de pausas largas). 1. PROGRAMA DIFERENCIAL DE PAUSAS CORTAS (D.P.C.). En este programa se refuerza al sujeto si no tarda ms de cierto lapso de mximo tiempo entre cada R (mximo de tiempo que debe transcurrir entre R y R). Lo que se desea es incrementar la velocidad en la cual responde el sujeto. Por ejemplo tenemos un sujeto que habla demasiado lento y especificamos que el tiempo mximo que debe de ocurrir entre palabra y palabra es de 4 seg. si el sujeto tarda ms de 4 seg. entre cada palabra se pospone el reforzamiento hasta que el sujeto emita 2 palabras que estn separadas entre si por 4 seg.; con lo cual se puede conseguir que el sujeto hable ms rpidamente. 2. PROGRAMA DIFERENCIAL DE PAUSAS LARGAS (D.P.L.). Este programa se estructura en base al mnimo de tiempo que debe transcurrir entre dos respuestas sucesivas, con lo cual se desea mantener frecuencias bajas de conducta. Por ejemplo, tenemos un sujeto que fuma en exceso y deseamos que fume menos, se puede especificar un tiempo mnimo que debe transcurrir entre cada R de fumar, por ejemplo 10 minutos establecidos no se le refuerza y se le pospone el reforzador, si el sujeto enciende un cigarrillo antes de los 10 minutos establecidos no se le refuerza y se le pospone el reforzador, si el sujeto enciende el cigarrillo despus de 10 minutos de haber terminado de fumar el cigarrillo anterior, recibe reforzamiento. () Interesa el nmero de respuestas que va a dar el sujeto en un periodo de tiempo prefijado. 3.3. CASTIGO:

CONSIDERACIONES GENERALES El castigo desde hace mucho tiempo se ha utilizado como una forma de aprendizaje para hacer que un sujeto adquiera patrones de conducta adecuados o para evitar la repeticin de conductas consideradas como inadecuadas (ejemplo, el padre castiga a su hijo para que estudie o para que no llegue tarde a casa). Dentro de estas consideraciones se supone que el castigo es lo opuesto al reforzamiento positivo o por lo menos acta en forma opuesta (lo cual no es vlido,

lo opuesto al reforzamiento positivo es la extincin). El trmino castigo en cuanto a su acepcin popular se ha asimilado a la aplicacin de consecuencias dolorosas, fsicamente hablando; para los psiclogos la concepcin del trmino es mucho ms amplia, en algunos casos puede estar relacionado con la presentacin de estmulos punitivos, en otros es simplemente decir no eso est mal hacer que el sujeto se retire de la situacin en que se comporta: decirle que se vaya a su cuarto porque se ha comportado mal o quitar su bicicleta a un nio porque no ha hecho sus tareas, todos estos ejemplos funcionan como castigo aunque no produzcan dao corporal en el sujeto. Toda conducta que un sujeto emite de manera consistente es que ha sido reforzada y de alguna u otra manera tiene una utilidad funcional en el sujeto (por ejemplo, hacer rabietas para conseguir lo que se quiere). El proceso del castigo es un fenmeno muy complicado, si comprende alguna conducta que se ha reforzado positivamente, por lo cual es necesario tener en consideracin tres factores potenciales de interaccin, para observar la efectividad del castigo: la frecuencia con que se ha reforzado la conducta de manera positiva, otras conductas del sujeto reforzadas negativamente por el estmulo aversivo que pueden incrementarse y el estado emocional que se origina en el individuo por la accin de la presentacin de las consecuencias aversivas. Ferster, seala que el castigo no elimina una conducta sino solamente la reprime, es decir el efecto del castigo consiste en reducir la operante reforzada, y que esta reduccin se describe mejor y con ms propiedad si se le llama represin de conducta que eliminacin de la misma. El castigo no es entonces lo opuesto al reforzamiento positivo y solo reduce la conducta temporalmente, salvo en condiciones extremas. El castigo requiere siempre de la presentacin de estmulos aversivos, pero cuando esto ocurre, estn presentes otros factores que tambin pueden influir en la conducta, por ejemplo: Las caractersticas o rasgos de la situacin, en el momento de ocurrir el castigo, se pueden convertir en estmulos condicionados que producirn los mismos reflejos en el organismo que el E aversivo. El castigo puede reducir la frecuencia de muchas ejecuciones adems de las respuesta castigada como consecuencia de los estados emocionales generados por el estmulo aversivo (influyen en el estado de las conductas que el sujeto est emitiendo). El estmulo aversivo, propio del castigo puede reforzar indirectamente conductas operantes incompatibles de manera tan enrgica que parecen haber tenido un efecto sobre la conducta castigada. De acuerdo a este ltimo factor, algunos tericos sealan que el castigo debilita una respuesta reforzando conductas incompatibles, al servir el castigo como reforzador negativo para otras conductas en donde la aparicin de la conducta incompatible es un resultado inevitable del procedimiento del castigo, ya que el mismo especifica que el estmulo aversivo acompaar a la conducta castigada y no a otra y que es necesario que el sujeto pueda emitir una conducta con la cual finalice la accin del estmulo castigador. CASTIGO: DEFINICIN En trminos generales el castigo es la reduccin de la futura probabilidad de una R especfica como resultado de la produccin inmediata de un estmulo para esa conducta. El estmulo se denomina estmulo castigador (Azrin y Holz, 1966). El castigo se conceptualiza entonces, como la consecuencia que sigue a una conducta y que la suprime reduciendo su probabilidad de ocurrencia (la consecuencia es aversiva). PROCEDIMIENTOS EMPLEADOS EN EL ESTUDIO DEL CASTIGO. Existen dos procedimientos generales empleados en el estudio del castigo: a) Castigo de una respuesta durante el periodo de extincin. b) Se castiga una respuesta y al mismo tiempo se le administra un programa de reforzamiento positivo. Los resultados sealan que los efectos supresores del castigo son pequeos cuando simultneamente se refuerza la conducta y los efectos supresores son mayores cuando la respuesta se encuentra en periodo de extincin (Azrin y Holz, 1961). TIPOS DE CASTIGO:

Experimentalmente se ha estudiado tres modalidades diferentes de castigo, que involucran la utilizacin de estmulos aversivos incondicionados y condicionados, y de estmulos reforzadores positivos condicionados e incondicionados.

1. CASTIGO POSITIVO.- Consiste en la presentacin (aplicacin) de un E aversivo o punitivo como consecuencia de


la emisin de una conducta cuyo efecto es la presin de dicha conducta por reduccin de su probabilidad futura de ocurrencia. Ej.: el manotn que aplica el padre a su hijo cada vez que ste habla palabras soeces.

2. CASTIGO NEGATIVO.- La caracterstica fundamental de este tipo de castigo es que se utiliza cuando el sujeto
tiene a la mano algn reforzador positivo que es susceptible de ser retirado. El castigo negativo o costo de respuesta, consiste en quitarle al sujeto un reforzador que ya tiene como consecuencia la emisin de una conducta, ello ocasionar la reduccin de la respuesta cuya consecuencia es la prdida del reforzador. Ejem. que el padre le quite la propina al hijo por no haber cumplido con realizar las tareas.

3. TIEMPO FUERA DE REFORZAMIENTO.- Consiste en retirar al sujeto de la situacin de reforzamiento como


consecuencia de una conducta que deseamos suprimir, es decir, en el tiempo fuera de reforzamiento lo que se hace es sacar al sujeto de la situacin cuando el sujeto emite la conducta inadecuada, como consecuencia, el sujeto pierde contacto con los estmulos reforzantes y discriminativos que mantienen su conducta. Por ejem. si un nio no presta atencin en clase y se dedica a juguetear, se le toma del brazo y se le retira del aula y se le lleva en un lugar especial en donde no haya reforzadores a la mano; el nio se quedar all durante un rato y despus ser integrado a la situacin de estudio.

4. SOBRECORRECCIN.- Consiste en hacer que el sujeto restituya en el ambiente los efectos que su conducta
inadecuada ha producido en l: por ejemplo: que recoja el papel que tir al suelo o que limpie las inscripciones que hizo sobre la pared. Puede considerarse un tipo de sobrecorreccin con prctica positiva (ms propiedades aversivas). Por ejem. segn el caso anterior, que el sujeto recoja todos los papeles tirados en el suelo o que limpie todas las inscripciones que hay en la pared. PARMETROS DEL CASTIGO. Se han estudiado varios parmetros del estmulo castigador: A. INTENSIDAD DEL ESTMULO CASTIGADOR. Se ha logrado la supresin total de la R con E. castigadores de intensidades elevadas. Church (1936) separa 3 niveles de intensidad: a) Intensidad dbil.- Si la intensidad del estmulo castigador es baja, esto no tiene influencia notable sobre la conducta sin embargo, el estmulo puede servir de seal para el organismo. b) Intensidad moderada.- Si la intensidad del estmulo castigador es moderada se puede obtener dos efectos diferentes: b.1. Una supresin temporal de la respuesta, en donde la respuesta vuelve a presentarse completamente. b.2. Una supresin parcial de la respuesta, en donde la respuesta se vuelve a presentar en el futuro pero de manera incompleta, algunos aspectos de la respuesta original desaparecen del todo. c) Intensidades altas.- Si la intensidad del estmulo castigador es alta, se consigue una supresin total, es decir, la respuesta castigada desaparece completamente y no reaparece nunca ms. B. MANERA DE INTRODUCIR EL ESTMULO CASTIGADOR. El estmulo castigador si se introduce repentinamente puede mucha mayor supresin de la respuesta, que si el mismo se introduce a bajas intensidades y de manera gradual. C. INTERVALO ENTRE RESPUESTA Y CASTIGO. El castigo para que tenga efecto supresor sobre una conducta especfica, debe ser administrado inmediatamente despus de dicha conducta; se la presentacin se demora va perdiendo efectividad gradualmente. Hay algunas evidencias experimentales que sealan que parmetros temporales menores a una hora no afectan la eficacia del

castigo (estmulo punitivo), en cambio tiempos mayores a una hora si alteran su eficacia (Estes, 1944 Hunt y Brady, 1955; Azrin, 1956). D. PROGRAMAS DE CASTIGO. Se ha estudiado el efecto del castigo bajo programas de Razn fija y de Intervalo fijo. En lo relacionado con los programas de razn fija (R.F.) se han observado que cuando mayor es la proporcin de respuestas castigadas mayor es la reduccin de las mismas; de tal manera que un programa de reforzamiento continuo tendra mayores efectos supresores (un E. punitivo para cada respuesta). En cuanto a los programas de intervalo fijo (I.F.) se han observado una supresin anticipatoria, es decir, las respuestas caen al nivel de cero cuando se acerca al momento de recibir castigo. CARACTERSTICAS DEL CASTIGO. Se han observado una serie de cambios de conducta que pueden ser consecuencia del castigo:

a) Supresin permanente.- Se han encontrado una completa reversibilidad una vez que la respuesta se ha suprimido,
esta probabilidad de obtener supresin semejante an despus de dejar de aplicar el castigo est en relacin directa con la intensidad del estmulo castigador.

b) Rapidez de los efectos.- Esta es su caracterstica ms importante, la supresin de la conducta castigada en inmediata
bajo la accin del estmulo castigador (es tambin funcin de la intensidad).

c) Recuperacin despus del castigo.- Es factible observar un aumento de las respuestas castigadas despus de que
termina el castigo, este efecto se le denomina fenmeno de contraste (las respuestas ocurren en proporcin mayor que antes de comenzar el castigo).

d) Discriminacin.- Las bajas intensidades del estmulo castigador ayudan al sujeto a discriminar ms rpidamente
cuando se le asocia a estmulos discriminativos.

e) Generalizacin.- El castigo no slo reduce la frecuencia de las respuestas que preceden al castigo sino tambin otras,
es decir, la supresin se generaliza. EFECTOS COLATERALES Algunos tericos sealan que el castigo produce efectos colaterales adems de los sealados anteriormente:

a) Efectos emocionales.- El castigo produce temor, miedo, terror, vergenza o culpa; as como odio a la persona que
castiga o a otras personas que no tienen ninguna relacin con ello.

b) Produce cierto tipo de agresin.- El castigo produce algunas veces agresin ya sea dirigida hacia la persona que
castiga o a otras personas que no tienen ninguna relacin con ello.

c) Causas de separacin y aislamiento.- A veces el castigo genera o lleva al sujeto a escapar de la situacin total en la
cual recibe castigo. Ejemplo: el nio no quiere ir a la escuela porque la maestra lo castiga. d) Puede producir trastornos de conducta, neurosis, masoquismo y trastornos gstricas como las lceras por ejemplo. 3.4. LA EXTINCIN

El trmino extincin se ha estado utilizando indistintamente, como proceso y como procedimiento. Como proceso para hacer referencia a la explicacin del fenmeno, ya sea en trminos comportamentales o en trminos fisiolgicos. Desde este punto de vista es la conducta la que se extingue. Como procedimiento, la extincin consiste en dejar de presentar el estmulo reforzador, luego de las respuestas condicionada. Desde este punto de vista es el reforzador el que ha estado manteniendo una conducta, lo que se extingue. DEFINICIN DE EXTINCIN: La extincin puede definirse como un procedimiento en el cual una respuesta que ha sido reforzada en el pasado, deja de ser reforzada en un momento determinado. El efecto bsico de la extincin es una reduccin gradual en su fuerza, haciendo que el organismo regrese al nivel previo que tenan antes del reforzamiento.

Ejemplo: Si un nio llora y la madre deja de levantarlo en brazos el nio reducir su frecuencia de llanto. El fenmeno de la extincin es vlido tanto para las respuestas condicionadas mediante la modalidad clsica como para la modalidad operante, aunque el efecto de las respuestas sometidas a extincin son diferentes. En la modalidad clsica la extincin se produce al presentar al estmulo condicionado. La RC decrementar su fuerza gradualmente hasta llegar a cero. (El EC luz se presenta slo sin ser apareado con alimento). En la modalidad operante, la extincin se produce al dejar de reforzar una conducta anteriormente reforzada, la RC. inicialmente incrementar su fuerza, para luego descender al nivel que tena antes de ser reforzada (nivel operante). Este efecto de incremento inicial de la respuesta se dice que es efecto emocional que produce en el organismo la supresin del estmulo reforzante. (Si un nio cada vez que era levantado en brazos por la madre, y ahora ya no es cargado por ella, inicialmente el llanto ser mayor, para posteriormente ir decrementando su fuerza hasta el nivel de ser levantado en brazos). El curso que sigue la extincin es muy variable dependiendo de las experiencias del organismo antes, durante y en el momento de la extincin. En tres parmetros se puede resumir el curso que siguen las respuestas sometidas a extincin: A. La tasa a la que baja la frecuencia de la respuesta (nivel operante). B. El nmero total de las respuestas emitidas antes de que cese la accin de responder o que se llegue a su nivel operante. C. Su nivel final, por debajo del cual la frecuencia de la respuesta no descender durante un periodo de tiempo relativamente largo. Estos parmetros de extincin estn influenciados por diversas variables, algunas de las cuales actan antes de que comience la extincin y otras cuando la extincin y ha comenzado. En conjunto estos parmetros son responsables de lo que se denomina resistencia a extincin, que consiste en una estimacin general de la resistencia en la tendencia a emitir una respuesta despus de que sta ha dejado de ser reforzada. VARIABLES QUE AFECTAN LA EXTINCIN. Se han estudiado cuatro variables o parmetros que van a hacer ms o menos resistentes a una respuesta a la extincin, estos son:

1) EL PROGRAMA DE REFORZAMIENTO, con el cual se mantiene previamente la conducta. Las conductas


sometidas a un programa de reforzamiento continuo, sern ms fciles de ser afectadas por la extincin que las conductas reforzadas intermitentemente.

2) LA MAGNITUD DE REFORZADOR Y EL NMERO DE REFORZAMIENTO, recibidos antes de la extincin.


Si el reforzador administrado para una conducta ha sido de alta calidad y cantidad la conducta ser ms resistentes a la extincin. Asimismo, la conducta ser ms difcil a la extincin si ha recibido un gran nmero de reforzamientos anteriormente.

3) LA MAGNITUD DE EXTINCIONES, previas que haya tenido el organismo. A mayor nmero de extinciones ms
rpidamente ocurrir la extincin y a menor nmero ms difcil ser la extincin.

4) LA MAGNITUD DE LA MOTIVACIN, del organismo durante la extincin. Por lo general la extincin ser ms
lenta cuando se lleve a cabo con un nivel de privacin alto. RECUPERACIN ESPONTANEA: La respuesta sometida a extincin reaparecer algunas veces espontneamente despus de cierto tiempo. La recuperacin de la respuesta es generalmente parcial. Pvlov encontr que despus de someter a extincin una respuesta condicionada de salivacin esta ocurra espontneamente ante el EC, pero con una fuerza menor a la que tena cuando fue condicionada. La recuperacin espontnea es una funcin negativamente acelerada del tiempo transcurrido desde la extincin; la reaparicin ocurre rpidamente al comienzo y se nivela al paso del tiempo (Ellson, 1938). La recuperacin espontnea depende de tres factores:

a) La fuerza original de la respuesta condicionada: a mayor fuerza de la R.C. mayor ser el nmero de veces que se recupere espontneamente. b) El nmero de ensayos de extincin: a mayor cantidad de ensayos de extincin, menor ser el nmero de veces que aparezca RC sometida a extincin. c) El nmero de veces que la R se ha extinguido y re-condicionado: a mayor cantidad de extinciones y recondicionamientos mayor ser la recuperacin espontnea de la R.C.

Das könnte Ihnen auch gefallen