Sie sind auf Seite 1von 13

INDICE

CONDICIONAMIENTO OPERANTE(EXPERIMENTAL) ........................ 4


DE THORNDIKE A SKINNER ...................................................................... 5
PROGRAMAS DE REFORZAMIENTO ......................................................... 7
PROCEDIMIENTOS DE CONDICIONAMIENTO ....................................... 8
Condicionamiento de evitación: .................................................................. 9
tipos de refuerzos ................................................................................. 10
. Fases del condicionamiento operante -----------------------------------------11
Conclusiones--------------------------------------------------------------------------12

1
INTRODUCCIÓN

En el presente trabajo nos enfocaremos en El Condicionamiento Operante o


Teoría de los Refuerzos, explicando los planteamientos de su autor y
descubridor, el Sr. B.F Skinner como una forma de aprendizaje en la que la
consecuencia (el estímulo reforzador) es contingente a la respuesta que
previamente ha emitido el objeto de investigación (ratones). El condicionamiento
operante implica la ejecución de conductas que operan sobre el ambiente.

El condicionamiento operante es un tipo de aprendizaje asociativo que tiene que


ver con el desarrollo de nuevas conductas en función de sus consecuencias, y
no con la asociación entre estímulos y conductas reflejas existentes como ocurre
en el condicionamiento clásico, como es el que un ratón camine por un laberinto
empezando por la entrada hasta llegar a la salida.

El nombre condicionamiento operante es el que dio Skinner, aunque hoy se


prefiere el de condicionamiento instrumental, por ser más descriptivo,
especialmente para el aprendizaje humano, aunque para todos en general, en
este caso nuestro objeto de estudio son ratones. Para él ambos son iguales en
tanto en cuanto ambos dan lugar a consecuencias reforzantes.

El condicionamiento operante constituye uno de los mecanismos de aprendizaje


de mayor importancia teórica y práctica: por una parte, es seguramente el más
investigado y mejor comprendido, y por otra es fuente de algunas de las más
significativas aplicaciones de la psicología a problemas concretos.

2
OBJETIVOS

 Describir y comprender los conceptos fundamentales de la teoría


operante o del reforzamiento de Skinner y sus repercusiones en el campo
de la educación.
 Conocer y explicar los principales aspectos de la teoría operante o del
reforzamiento de Skinner.
 Conocer los procedimientos del moldeamiento para la enseñanza de
nuevas conductas que no existen en el repertorio conductual del sujeto.
 Adquirir una visión integral sobre el proceso del aprendizaje desde el
punto de vista de la teoría Operante o del reforzamiento de Skinner.

3
1. CONDICIONAMIENTO INSTRUMENTAL

El condicionamiento instrumental o condicionamiento operante es un tipo de


aprendizaje que sucede cuando los hechos son un resultado directo de la
conducta del individuo. Es decir, mediante el condicionamiento instrumental, las
acciones o conductas de un individuo pueden ser modificados por sus
consecuencias.

Según el condicionamiento instrumental, para que tenga lugar el aprendizaje de


una respuesta (R), esta respuesta tiene que predecir un reforzador, es decir una
consecuencia positiva.

La relación entre la conducta y sus consecuencias es uno de los factores más


importantes en el control de la conducta instrumental. En el condicionamiento
instrumental es muy importante la contigüidad temporal y la contingencia que se
establece entre la respuesta y el reforzador, es decir, la relación que se creará
entre ambos factores.

4
1.1. DE THORNDIKE A SKINNER: PRIMEROS ESTUDIOS EN
CONDICIONAMIENTO OPERANTE

En 1898 Edward Thorndike realizó varios experimentos con gatos que


mostraban que si una conducta era seguida de una consecuencia positiva para
el organismo que la realizó, la probabilidad de que el organismo volviese a
ejecutar dicha conducta aumentaba.

Para Thorndike, la explicación del aprendizaje estaba en las conexiones que se


establecen entre estímulos y respuestas (algo conocido como conexionismo o
asociacionismo) a partir del ensayo y error; De esta manera, los organismos
adquieren de manera progresiva aquellas conductas que producen
consecuencias positivas, mientras se suprimen aquellas conductas que llevan a
consecuencias desagradables. En otras palabras, la recompensa aumenta las
respuestas, mientras que el castigo las elimina. De ahí, su Ley del Efecto.
Paralelamente, Thorndike pensaba que la repetición de una respuesta fortalece
la conexión entre el estímulo y la respuesta, mientras que la falta de práctica,
debilita esta conexión. A este principio lo llamó Ley del Ejercicio.

Si bien las ideas de Thorndike se recuerdan más como antecedentes de las


teoría modernas que por su valor actual, la influencia de ideas como el poder de
la recompensa en el aprendizaje han sido claves en el desarrollo posterior de las
teorías del aprendizaje, lo que hace de este investigador una figura muy
relevante.

Posteriormente, Burrhus Frederic Skinner desarrolló el concepto de


condicionamiento operante o instrumental a partir de las ideas de Thorndike.

Skinner se planteaba dos problemas en la investigación sobre la conducta


basada en consecuencias:

5
 Si utilizamos cajas-problema o laberintos, la conducta
que observamos es discreta.
 ¿Cómo dividir la conducta en trozos analizables,
cuando en el mundo real vemos que es un continuo Para
dar solución a estos problemas:
 Diseñó un dispositivo (caja de Skinner) que
permitiese al organismo emitir la conducta sin restricciones
para así poder medir conductas semejantes a las que
ocurren en el mundo real.

Planteó la idea de operante: una unidad conductual que se


define por los efectos que opera en el ambiente (da lugar al nombre de
condicionamiento operante).

Explicación gráfica de la caja de Skinner.

Se ha de
tener en cuenta que Skinner no habla de asociación estímulo-respuesta, sino de
incremento de la fuerza de la respuesta por las consecuencias que la siguen.

6
Las respuestas a una situación que van seguidas por un refuerzo, se fortalecen
y tienen mayor probabilidad de repetirse en el futuro.

1.2. PROGRAMAS DE REFORZAMIENTO

Un programa de reforzamiento es una pauta o una regla que determina cuándo


y cómo se va a entregar un reforzador tras realizar una respuesta determinada.
Hay cuatro tipos de programas de reforzamiento.

1.2.1. Programa de razón fija: este programa consiste en la administración


de una recompensa tras un número determinado de respuestas.

1.2.2. Programa de intervalo fijo: es programa consiste en que la respuesta


es recompensada después de haber transcurrido un determinado
intervalo fijo de tiempo (que no varía, es siempre el mismo).
1.2.3. Programa de razón variable: este programa consiste en que la
recompensa está determinada por el número de respuestas emitidas.
Pero este número de respuestas emitidas puede variar de un momento
a otro (por ejemplo: unas veces se puede dar la recompensa tras haber
emitido la conducta dos veces, y otras se dará al haber emitido la
conducto cuatro veces. Pero nunca se dará la recompensa sin haber
emitido la respuesta).

1.2.4. Programa de intervalo variable: este programa consiste en que la


respuesta es reforzada después de haber transcurrido un cierto
periodo de tiempo. Este período de tiempo es variable, por lo que
puede variar de un momento a otro (por ejemplo: en algunos casos se
dará tras 10 segundos, en otros tras 5 segundos, etc.).

7
1.3. PROCEDIMIENTOS DE CONDICIONAMIENTO
Existen cuatro procedimientos o tipos de condicionamiento instrumental
1.3.1. refuerzo positivo:
Es un objeto, evento o conducta cuya presencia incrementa la frecuencia
de la respuesta por parte del sujeto. Se trata del mecanismo más efectivo
para hacer que tanto animales como humanos aprendan. Se denomina
“refuerzo” porque aumenta la frecuencia de la conducta, y “positivo”
porque el refuerzo está presente. Refuerzos positivos típicos son las
alabanzas, los regalos o las aportaciones monetarias. Sin embargo, hay
que tener en cuenta que en ocasiones algo que ordinariamente se
considera desagradable puede funcionar como refuerzo positivo, ya que
de hecho incrementa la probabilidad de la respuesta

1.3.2. Refuerzo negativo:


Un refuerzo negativo es un objeto, evento o conducta cuya retirada
incrementa la frecuencia de la respuesta por parte del sujeto. Al igual que
el anterior, se denomina “refuerzo” porque aumenta la frecuencia de la
conducta, pero “negativo” porque la respuesta se incrementa cuando el
refuerzo desaparece o se elimina. En el refuerzo negativo se pueden
distinguir dos procedimientos:

1.3.2.1. Condicionamiento de escape:


En este caso, la frecuencia de una respuesta aumenta porque interrumpe
un estímulo aversivo, es decir, un suceso que está ocurriendo y que el sujeto
considera desagradable. Un ejemplo típico sería el de un animal que aprieta una
palanca porque así elimina una corriente eléctrica o el de un padre que le compra
una chuchería a su hijo para dejarle de oír llorar.

8
1.3.2.2. Condicionamiento de evitación:
En este caso, la frecuencia de una respuesta aumenta porque pospone o evita
un estímulo aversivo futuro. Un ejemplo típico sería el de un alumno que estudia
para evitar una mala nota.
1.3.3. Entrenamiento de omisión:
Se produce cuando la respuesta operante impide la presentación de un refuerzo
positivo o de un hecho agradable; es decir, consiste en retirar el estímulo positivo
de una conducta para así provocar la extinción de la respuesta. Un ejemplo
importante es el de “tiempo fuera”, en el que se retira la atención de un niño
aislándolo durante un cierto período de tiempo.
1.3.4. Castigo:
El castigo provoca la disminución de una conducta porque el suceso que la sigue
es un estímulo aversivo. Un ejemplo típico es castigar a una rata con una
pequeña corriente eléctrica cuando pulsa una palanca. Aunque el castigo puede
ser en ocasiones muy eficaz para hacer que desaparezca una conducta, se
recomienda utilizarlo lo menos posible, ya que tiene muchos efectos adversos o
no deseados. En muchas ocasiones la conducta solo desaparece temporalmente
o únicamente en los contextos en los que es probable el castigo. Además, genera
gran cantidad de consecuencias secundarias (como frustración, agresividad,
etc.) que pueden hacer que se detenga el proceso de aprendizaje. Por eso, en
la aplicación de castigos es importante seguir ciertas reglas, como reforzar al
mismo tiempo conductas alternativas a la castigada, aplicarlo inmediatamente
después de la conducta que se quiere suprimir, o ser constante (ya que castigar
una conducta solo a veces produce un efecto contrario al que se desea).

9
1.4. TIPOS DE REFUERZOS
Lo que es o no es un refuerzo durante el condicionamiento operante depende
del individuo y de las circunstancias en que se encuentra en ese momento. Por
ejemplo, unas galletas pueden suponer un refuerzo para un perro hambriento,
pero no para uno que acaba de comer carne.
Los refuerzos se pueden dividir en dos grandes grupos: los primarios o
intrínsecos y los secundarios o extrínsecos.
Se dice que un reforzador es primario o intrínseco cuando la respuesta es
reforzante por sí misma, es decir, cuando la respuesta es un sí una fuente de
sensaciones agradables y la acción se fortalece automáticamente cada vez que
ocurre. Existen varios tipos de conductas que son intrínsecamente reforzantes.
Por ejemplo, las respuestas que satisfacen necesidades fisiológicas, como beber
cuando se tiene sed o comer cuando se tiene hambre, son intrínsecamente
agradables para la mayoría de los organismos. Muchas actividades sociales o
que brindan estimulación sensorial o intelectual son también con frecuencia
intrínsecamente reforzantes, al igual que la sensación de progreso en una
habilidad. También pueden ser reforzantes por sí mismas todas las conductas
que ayudan a un organismo a evitar algún daño. Sin embargo, las actividades
intrínsecamente gratificadoras no siempre son reforzantes desde el principio; por
ejemplo, se necesita cierta habilidad antes de que una actividad que requiere
competencia (como tocar un instrumento musical, por ejemplo) se vuelva
inherentemente satisfactoria.
Los refuerzos secundarios o extrínsecos son aprendidos, y en ellos el premio o
gratificación no es parte de la actividad misma, sino que obtienen su carácter de
refuerzo por asociación con los reforzadores primarios. Por ejemplo, las
recompensas monetarias se convierten en refuerzo porque permiten a su vez
conseguir refuerzos primarios. Un tipo de reforzadores extrínsecos
especialmente importante, que pueden influir enormemente cuando se trata de
modificar la conducta humana, son los reforzadores sociales como el afecto, la
atención o la aprobación.
En la vida real, diversos reforzadores intrínsecos y extrínsecos se encuentran
habitualmente entremezclados en un mismo suceso reforzante.

10
1.5. FASES DEL CONDICIONAMIENTO OPERANTE

1.5.1. Adquisición:
La adquisición de la respuesta se refiere a la fase del aprendizaje en que la
respuesta es seguida por reforzadores. Durante la adquisición la respuesta se
vuelve más fuerte o más frecuente, debido a su relación con la consecuencia
reforzante.

1.5.2. Generalización:
Las respuestas fortalecidas mediante procedimientos operantes en un conjunto
de circunstancias tienden a extenderse o a generalizarse en situaciones
similares, al igual que ocurre en el condicionamiento clásico. Cuando más
parecidos sean los contextos, más probable es la generalización.

1.5.3. Discriminación:
Los individuos desarrollan también discriminaciones al reforzarse las respuestas
en una situación, pero no en otra.
Extinción: Cuando se retira el reforzamiento para alguna respuesta particular,
dicha conducta disminuye su frecuencia gradualmente hasta que solo ocurre con
la misma frecuencia con que ocurría antes del reforzamiento. Sin embargo, es
importante advertir que en muchas ocasiones, después de que se retiren los
reforzadores, se advierte inicialmente un aumento de la cantidad de respuesta y
de la frustración antes de que empiece la disminución.

1.5.4. Recuperación espontánea:


Al igual que en el condicionamiento clásico, las respuestas que se han
extinguido vuelven a aparecer algunas veces, es decir, se da una recuperación
espontánea después de un descanso

11
2. CONCLUSIONES

 La conducta humana, está guiada y dirigida por refuerzos, los cuales son
de carácter motivador para dirigir una conducta. Son fundamentales en el
aprendizaje sabiendo utilizarlos, para lograr una respuesta esperada en
los seres humanos.
 Las recompensas más simples pueden condicionar formas complejas de
comportamiento humano
 Es un tema cotidiano que influye directamente en el comportamiento de
los seres humanos, así nos dejan experiencias en nuestras relaciones,
para en otra ocasión aprender de ellos.
 Cuándo se produce por asociación entre una conducta y sus
consecuencias hablamos de Condicionamiento Operante.
 La investigación de Skinner sobre condicionamiento operante nos lleva a
la conclusión de que las recompensas más simples pueden condicionar
formas complejas de comportamiento.
 La teoría de Skinner acerca de los refuerzos, explica que cuando una
respuesta otorga satisfacción o placer al ejecutante, esta tiene más
posibilidades de ser repetidas, como lo demuestra el ratón encerrado en
la caja.

12
BIBLIOGRAFIA

(http://www.redalyc.org/pdf/805/80550206.pdf)
(http://www.youblisher.com/p/761768-Libro-de-Psicologia-del-Aprendizaje_pdf)

13

Das könnte Ihnen auch gefallen