Efectos de La Integración de Diferentes Respuestas en La Regla de Peso Temporal

Regla De Peso Temporal 1
Efectos de la integración de diferentes

respuestas en la regla de peso temporal
Daniel Ortega; Giordano Montiel y Ricardo Pichardo
Universidad Univer Milenium

Plantel Ciencias de la Salud Toluca Estado de México
Proyecto
Jueves 1 de Marzo del 2018

En la investigación respecto a la conducta de selección se hace referencia a las causas

que provocan que los operantes ejecuten una u otra conducta ante varias opciones de
respuesta. En diversos estudios con humanos (Hastie y Dawers, 2001) se habla sobre una
“deliberación racional” para formular situaciones donde se racionaliza acerca de las
diferentes opciones de respuesta. Como la elección que se lleva a cabo al momento de
comprar víveres en el supermercado o cuando elegimos una ruta para evitar
congestionamiento vehicular. Sin embargo en los estudios con animales humanos y no
humanos es complicado observar esta reflexión, lo que dificulta el estudio de dicha elección
de respuesta. A pesar de ello existen investigaciones que han intentado hacer evidentes si los
mecanismos psicológicos que están implícitos son iguales entre animales humanos y no
humanos.
Hacieno una revisión de la literatura encontramos que se hace referencia a diferentes
líneas de investigación respecto a la elección de respuesta:
En la literatura de condicionamiento operante el estudio de la elección se ha llevado a

cabo a partir del estudio de programas concurrentes en los que 2 o más programas de
reforzamiento están disponibles simultáneamente cada uno con un manipulado diferente, y el
sujeto o participante es libre de distribuir sus respuestas entre alternativas disponibles
(Herrnstein, 1961). A partir de estos programas se han desarrollado diferentes procedimientos
experimentales y modelos teóricos para explicar la conducta de elección en diferentes
situaciones experimentales. Por ejemplo, la ley de igualación (Davison y McCrthy, 1988;
Williams, 1988), el modelo de elección contextual de (Grace, 1994; 1996), o la teoría de la
reducción de la demora (Fantino, 1969). Estos modelos hacen diferentes suposiciones sobre los
mecanismos de la conducta de elección y cada uno ha proporcionado resultados significativos
con un gran número de experimentos en programas concurrentes (Mazur, 2001). (López
Romero, Alvarado, Cabrera, Luna, & Vila, 2013)
Mazur, (1996) estudió el efecto de la posible integración de experiencias

anteriormente reforzadas durante múltiples bloques de entrenamiento en una última elección
entre varias opciones de respuesta. Diseñó un experimento donde registró las respuestas en
palomas usando un programa concurrente de reforzamiento en el que cambiaba la magnitud
de reforzamiento relativo a cada uno de los elementos del diseño de forma sucesiva durante
varios ensayos. Una primera condición contenía en una de las opciones un reforzador con
“mayor saliencia” en comparación con la otra, y en la segunda condición ambas opciones
tenían el mismo valor en saliencia durante los ensayos restantes. Los resultados de su
experimento demostraron una preferente inclinación en la última sesión por la opción que
proporcionaba mayor magnitud de reforzamiento y hubo indiferencia en la elección en el
contexto donde ambas opciones tenían la misma cantidad de reforzamiento. Mas sin en
cambio la preferencia de respuesta cambiaba luego de un intervalo de 24 hrs dentro de la
condición en una de la opciones era “más rica”. Pero en la otra condición donde las dos
opciones contienen el mismo reforzamiento durante todos los ensayos en la elección después
de 24 hrs se notó indiferencia entre las opciones de respuesta.
Se ha demostrado que la integración de la información de eventos pasados determina

la elección de respuestas en eventos presentes, según la regla de peso temporal (RPT). La
configuración de la integración está sujeta a parámetros temporales y valores subjetivos.
Cuando se aprenden dos experiencias, durante una prueba inmediata la experiencia más
reciente adquiere mayor peso, pero con el continuar del tiempo en una prueba posterior,
ambas experiencias serán equivalentes en su peso, en otras palabras, la recencia desaparece,
y el valor subjetivo de las dos experiencias será similar.
La integración de información basada en dos parámetros básicos de las experiencias
y el aprendizaje; distancia temporal relativa (recencia) y el valor subjetivo que tiene
(Davenport y Davenport, 1994). La regla de peso temporal expresa una relación inversa entre
estos dos factores, dicho en otras palabras; cuando el peso de la recencia es mayor, el peso
del valor subjetivo es menos y viceversa. Los factores se muestran en la siguiente formula:
𝑛=𝑗 𝑛=𝑗
(1) 𝑉𝑤 = ∑ (𝑄 ∗ 1/𝑇) ÷ ∑
𝑛=1 𝑛=1
Donde vw representa el valor de estimación temporal de una experiencia, Q el valor

subjetivo estimado y 1/T el valor de recencia. Cuando se requiere una respuesta de elección
entre dos alternativas, se debe calcular el valor de estimación temporal de una segunda
experiencia además se debe tener en cuenta la estimación temporal total de ambas
experiencias, lo que se expresa en la ecuación 2. Donde la elección de la opción B es la
proporción de vwB en relación a vwA: (2) vwB= vwB/vwA+vwB
La RPT supone la integración de las experiencias vividas en base a dos variables, la
recencia (distancia temporal relativa 1/T) y el valor subjetivo (Q), en la ecuación 1 se
representa como (Q * 1/T) el cual va cambiando con el avance del tiempo, haciendo así que
Q aumente al disminuir 1/T y esto lleva a que las experiencias tienden a igualarse una vez
perdida la recencia por lo que se mostrará la elección de la experiencia que haya adquirido
un mayor valor subjetivo (Q).
Una posible predicción básica basada en estas ideas seria que al aumentar el intervalo
de retención luego de un entrenamiento de tres experiencias (A y B) la elección dependerá
de la recencia de cada elección y de su valor subjetivo. Cuando el valor es mayor en A,
durante una prueba inmediata se elegirá la última opción reforzada. Sin embargo al aumentar
el intervalo de retención entrenamiento-prueba se notara un efecto de recencia-primacía en
donde habrá una preferencia por A e incrementa proporcionalmente al aumentar el intervalo
de retención de una prueba con demora, esto debido a que el valor que tiene A es en promedio
mayor al que tiene B (Vila, López-Romero y Alvarado. 2010).
La presente investigación se pretende determinar el efecto de cuatro diferentes modos
de respuesta con el fin de colaborar en línea de investigación que se sugiere en artículo de
López Romero, Alvarado, Tamayo, & Vila, (2011). Aunado a esto, la investigación pretende
ser usada de referencia dentro de ambientes experimentales y clínicos.
Método
Participantes
Se pedirá la colaboración voluntaria e informada a cuarenta estudiantes universitarios
de entre 19 y 21 años de edad, alumnos de la Universidad Univer Milenium Plantel Ciencias
De La Salud Toluca Edo. Méx., con buena salud y sin consumo de medicamentos al inicio
del estudio. A todos los participantes se les informará de las condiciones éticas del estudio y
se les asignará créditos en una de las asignaturas que cursan por su participación.
Aparatos y situación experimental
El experimento se llevará a cabo en un aula de cómputo de la Universidad Univer
Milenium Plantel Ciencias de la Salud Toluca Edo. Méx. de 5 x 7m aproximadamente, el
cual cuenta con sillas negras, con 6 mesas e iluminación artificial. Se utilizarán veinte
ordenadores, en los cuales se instalará el programa SuperLab 4.0 for Windows (Cedrus Co.)
en donde los participante tendrán que resolver una tarea experimental individualmente, y que,
además, se utilizará para programar la tarea experimental, presentar los estímulos y registrar
las respuestas.
Tarea experimental
La tarea consiste en plantear una situación donde los participantes tienen que elegir
entre cuatro opciones de respuesta que serán presentadas de manera alterna y con diferencia
en la magnitud del reforzador dependiendo del ensayo en el que se encuentre el experimento,
ya sea en recencia o primacía. La pantalla del PC simula la superficie de una mesa donde a
lo largo de ésta se situarán cuatro máquinas dispensadoras de cartas, en el orden de izquierda
a derecha los colores respectivos de cada una de las máquina serán Rojo, Amarillo, Azul y
Verde. Las máquinas darán una carta al hacer clic con el cursor del ratón sobre el botón
indicado como “Tomar carta” que se encontrará situado bajo cada máquina dispensadora.
Las cuatro máquinas aparecerán de forma simultánea en cada ensayo pero sólo una es la que
otorgará una mayor cantidad de reforzador, la posición de ésta máquina será
contrabalanceada luego de la fase de entrenamiento. La tarea de los participantes consiste en
dar clic hasta obtener la carta con mayor cantidad de reforzador, y finalmente en la fase de
prueba Las cuatro máquinas se mostrarán simultáneamente 15s pero en diferente posición
para evitar sesgos en la preferencia de lugar que podría llegar a presentarse. Dando lugar a la
elección de cada principiante sobre hacer clic en cualquiera de las cuatro opciones
disponibles, A B C o D.
Procedimiento
La asignación de los participantes a cuatro grupos se realizará de manera aleatoria.
Los participantes tomaran asiento frente al ordenador y, a continuación, en una primera
pantalla aparecerán las instrucciones que deben seguir para realizar la tarea. Una vez que los
experimentadores comprueben que no existen dudas la sesión experimental iniciara tomando
en cuenta el grupo asignado. De acuerdo al diseño de la tabla 1 los participantes recibirán
cuatro fases de entrenamiento y una prueba. Cada fase de entrenamiento estará compuesta
por 16 ensayos respuesta-consecuencia para las cuatro opciones de respuesta, seguidos por
un intervalo de retención y Finalmente una prueba de elección que mostrara a los
participantes las cuatro opciones simultáneamente durante 4 bloques de 15s, registrándose
todas las respuestas de los participantes (ver tabla 1). La magnitud de reforzamiento en la
primera fase será mayor para A que para B, C y D en los grupos de primacía (GP) (A>D>C>B
0hrs y A>D>C>B 24hrs) mientras que la magnitud de reforzamiento para A, B, C y D en la
segunda, tercera y cuarta fase mantendrán el mismo valor de reforzador. En los grupos de
recencia (GR) se invierte la secuencia de los valores del reforzamiento, la primera, segunda
y tercera fase mantendrá el mismo valor de reforzamiento, mientras que en la cuarta fase la
magnitud de reforzamiento será mayor para A que para B, C y D (A>D>C>B 0hrs y
A>D>C>B 24hrs). Los grupos también serán diferentes en el intervalo de entrenamiento-
prueba, en donde la prueba de elección se realizara inmediatamente después de concluir el
entrenamiento para dos grupos (GP0 y GR0) y para los dos grupos restantes la prueba se
realizara 24 horas después del entrenamiento (GP24 y GR24). Se realizara un registro de las
respuestas emitidas durante la prueba de elección de cada una de las opciones de respuesta
durante 60s.
Diseño Experimental
Grupos Bloque 1 Bloque 2 Bloque 3 Bloque 4 Intervalo Prueba
GP0 A (+++) A (+) A (+) A (+) 0hrs

B (+) B (+) B (+) B (+)
C (++) C (+) C (+) C (+)
GP24 D (+++) D (+) D (+) D (+) 24hrs
¿A, B,
C o D?
GR0 A (+) A (+) A (+) A (+++) 0hrs
B (+) B (+) B (+) B (+)
C (+) C (+) C (+) C (++)
GR24 D (+) D (+) D (+) D (+++) 24hrs
Tabla 1. Se representa el diseño experimental en el que el nombre del grupo indica el momento en
que la magnitud del reforzador se presentará con un cambio (Grupos de primacía: GP, y grupos de
recencia GR) y el intervalo de tratamiento-prueba (0hrs-24hrs) A, B, C y D son las opciones de
respuesta, en ellas se llevara a cabo el cambio en la magnitud del reforzador.
Referencias
Devenport, L., & Devenport, J. (1994). Time-dependet averging of foraging information in least
chipmunks and golden-mantled groud squirles. Animal behaivor, 47, 787-802.
Hastie, R., & Dawnes, R. (1996). Rational choice in an uncertain world. sage publications.
López Romero, L. J., Alvarado, A., Cabrera, R., Luna, D., & Vila, J. (2013). La elección en humanos
como una función del valor subjetivo y distancia temporal de las experiencias previas.
international Journal of Psychology and Psychological Therapy, 13 (3), 329-337.
López Romero, L. J., Alvarado, A., Tamayo, C., & Vila, J. (2011). La integración de experiencias
pasadas y recientes determina la elección en humanos. Revista Mexicana de investigación
psicológica, 3(1), 113-120.
Mazur, J. (1996). Past experience, recency, and spontaneous recovery in choice behaivor. Animal
learning & Behaivor, 24, 1-10.
Apendice
ACTIVIDAD MES 1 2 3 4 5 6 7 8 9 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 3 3
ES 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
1. Febre X X X
Recolección ro
de
información
2. Elección X
del tema
3. Objetivos X X X
4. Diseño X X
Experimental
5. Pregunta de X X
Investigación
6. Búsqueda X X X X X X X
de
herramientas
digital
7. X X X
Elaboración
de marco
teórico
8. X _
Justificación
9. Propuesta X _
de análisis de
datos

Efectos de La Integración de Diferentes Respuestas en La Regla de Peso Temporal

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Efectos de La Integración de Diferentes Respuestas en La Regla de Peso Temporal

Hochgeladen von

Copyright:

Verfügbare Formate

Regla De Peso Temporal 1

Efectos de la integración de diferentes

Daniel Ortega; Giordano Montiel y Ricardo Pichardo

Universidad Univer Milenium

Jueves 1 de Marzo del 2018

En la investigación respecto a la conducta de selección se hace referencia a las causas

En la literatura de condicionamiento operante el estudio de la elección se ha llevado a

Mazur, (1996) estudió el efecto de la posible integración de experiencias

Se ha demostrado que la integración de la información de eventos pasados determina

Donde vw representa el valor de estimación temporal de una experiencia, Q el valor

Grupos Bloque 1 Bloque 2 Bloque 3 Bloque 4 Intervalo Prueba

GP0 A (+++) A (+) A (+) A (+) 0hrs

Das könnte Ihnen auch gefallen