PROGRAMAS DE REFORZAMIENTO
Docente:José Armando Martínez
IntegrantesÁngeles Jara, ElizabethDomínguez Nodré, Lucy
Francia Huapaya, JosselinQuezada Carhuavilca, Alejandro
2015
La mayoría de la gente utiliza el término aprendizaje para referirse a la adquisición de nueva conducta.
• Un niño que no podía andar en bicicleta, ahora la maneja con habilidad y facilidad.
• Un estudiante universitario para quien la ecuación F = ma antes no significaba nada, ahora la utiliza para resolver problemas de física.
Pero se ha visto que el aprendizaje también incluye cambios en los cuales no aparece nueva conducta. Uno de ellos es un incremento en la tasa de conducta.
• Un niño que antes andaba en bicicleta una vez a la semana, ahora lo hace todos los días.
EJEMPLOS:
EJEMPLOS:
• Un estudiante de física que solía resolver problemas con la formula ecuación F = ma, en una tasa de uno cada 10 minutos, ahora resuelve de 2 a 3 en cinco minutos.
El patrón que describe la entrega de reforzamiento se denomina programa de reforzamien.
Un programa de reforzamiento es la regla o criterio que determina que ocurrencia de una respuesta será seguida por el reforzador. Existe un numero infinito de formas en que podría establecerse dicho programa. La entrega del reforzador podría depender de que suceda cierto numero de respuestas, del transcurrir del tiempo, de la presencia de ciertos estímulos, de la ocurrencia de otras respuestas o de cualquier cantidad de factores (Domjan, 2010, p 186.).
Michael
Domjan
se refuerza una respuesta cada vez que ocurre.se refuerza una respuesta cada vez que ocurre.
Una rata recibe
comida cada vez que presiona
una palanca.
Cada vez que un alumno
participa, y su profesor o alumnos lo
felicitan.
Cada reforzamiento fortalece la conducta, el reforzamiento continuo dirige a un incremento muy rápido en la tasa de respuestas. Es
especialmente útil, entonces, cuando la tarea es moldear alguna conducta nueva.
El reforzamiento se da cada vez que el sujeto cumple con un determinado numero de repuestas que se ha establecido de antemano.
De manera más concreta, el programa sería
llamado una razón fija X o RF X.
• Si se le dice a un niño que por cada tareas que realice se le dará un juguete, la razón fija será 6.
• La entrega del reforzador después de cada décima respuesta de presión de palanca en un estudio con ratas de laboratorio.• Que paguen por la venta de cada 5 celulares.
• Un vendedor de una editorial recibe una comisión cada cinco ventas.
Ejemplos:
Características:
Cuando está en efecto un programa de razón fija que requiere más de una respuesta se presenta un patrón de respuestas distinto. Una vez que se inicia la conducta, la tasa de respuestas es alta y estable, pero puede haber una pausa antes de iniciar el número requerido de respuestas.
Registro Acumulativo es una forma particular de representar la manera en que una respuesta se repite a lo largo del tiempo.
El sujeto no realizó la respuesta entre los puntos A y B.Entre los puntos B y C ocurrió una tasa lenta de respuestas
Las respuestas ocurrieron con mayor frecuencia entre los puntos C y D, pero el sujeto hizo una pausa en D. Después de reanudar la respuesta, la pluma llegó a la parte superior de la
página (en el punto E) y regresó a la parte inferior para nuevas respuestas.
Este registro acumulativo de una paloma cuya respuesta se estabilizó un programa RF 120.
Cada entrega del alimento es indicada por las pequeñas desviaciones hacia abajo de la pluma registradora. El ave dejaba de responder después de cada entrega de alimento; pero cuando reiniciaba el picoteo, respondía a una tasa elevada y estable.
pausa posreforzamie
nto Tasa cero de
respuestas que ocurre justo después de
cada reforzamiento
La tasa elevada y estable de respuestas
que completa cada requisito de razón.
carrera de la razón.
Los reforzamientos ocurren después de una cantidad variable de respuestas, no después de un número fijos. Esta cantidad difieren de reforzamiento en
reforzamiento.
• si un sujeto trabajara en un servicio de auto lavado en el que tuviese que trabajar con carros de diferentes tamaños. Dicha situación sigue siendo un programa de razón, pues el lavado de cada automóvil depende todavía de la cantidad de respuestas o de esfuerzo que haga, aunque se requiere una cantidad diferente de respuestas para la entrega de cada reforzador.
Ejemplos:
• Una paloma que de 10 respuestas para obtener el primer reforzador, 13 para obtener el segundo, 7 para el tercero y así sucesivamente.
• Los apostadores que juegan en una maquina tragamonedas también están respondiendo en un programa de razón variable. Tienen que jugar en la maquina para ganar
• Siempre se requiere un determinado número de golpes para terminar un hoyo en el golf, pero al inicio del juego la mayoría de los jugadores no saben con certeza cuántos golpes necesitarán.
Como no es posible predecir el número de respuestas
requeridas por reforzamiento,las pausas predecibles en la
tasa de respuestas son menos probables
Los organismos responden a una tasa bastante estable en
los programas de RV.
Los Programas de razónvariable se observa un patrón
de respuestas más estable
La respuesta se refuerza únicamente si ocurre luego de que ha transcurrido una cantidad establecida de tiempo después de un
punto de referencia, la última entrega del reforzador o el inicio del ensayo.
La cantidad de tiempo que tiene que
pasarantes que una respuesta sea reforzada se
mantiene constante de un ensayo al
siguiente
En una lavadora se requiere una cantidad fija de tiempo para completar cada ciclo de lavado. No importa cuántas veces abra la lavadora antes
que haya transcurrido el tiempo requerido, no será reforzado con la ropa limpia. Una vez que termina el ciclo, el reforzador está disponible y a partir
de ese momento puede sacar su ropa limpia en cualquier momento.
Los exámenes en la UNFV, se aplican sólo dos exámenes que se distribuyen de manera uniforme durante el semestre.
Los estudiantes dedican poco esfuerzo al estudio al inicio del semestre o justo después del examen parcial. Normalmente empiezan a estudiar una o
dos semanas antes de cada examen y la tasa del estudio aumenta con rapidez a medida que se acerca el día del examen.
Un programa de IF4 para el picoteo de las palomas.
En este programa, un ave sería reforzada por el primer picoteo emitido después que hayan transcurrido cuatro minutos desde el inicio del ciclo del programa. (después de los cuatro minutos)
Como nunca se refuerzan los picoteos realizados antes de los cuatro minutos del
ensayo, los participantes aprenden a esperar para responder únicamente al final del periodo del IF .
El desempeño en un programa de intervalo fijo
refleja la precisión del sujeto para
discriminar el tiempo.
La tasa de respuestas aumenta a medida que se acerca el momento en que estará disponible el siguiente reforzador. Este incremento en la tasa de respuestas se manifiesta en el registro acumulativo, hacia el final del intervalo fijo, como una aceleración..
Es cuando las respuestas sólo se refuerzan si ocurren después que ha transcurrido un lapso variable desde el inicio del ensayo o el ciclo del
programa.
Un mecánico que no puede decirle cuánto tiempo le llevará arreglarle el carro le impone un programa de intervalo variable. El carro no estará listo por cierto tiempo, durante el cual los intentos por recogerlo no serán reforzados. No puede predecirse cuánto tiempo tiene que transcurrir antes que el carro esté listo.
Un profesor realiza exámenes sorpresa
En un adolescente que cumple con sus obligaciones sin establecer un tiempo concreto; cuando lo estime oportuno el adulto reforzará al adolescente con un premio.
La primera comida esté disponible cuando haya transcurrido al menos un minuto desde el inicio de la sesión, la segunda comida estará lista cuando
hayan transcurrido al menos tres minutos desde la anterior, y el tercer reforzador quedará disponible cuando hayan pasado al menos dos minutos
desde la anterior y así sucesivamente.
el sujeto tiene que realizar la respuesta instrumental para
obtener el reforzador. Los reforzadores no son
gratuitos,sólo se entregan si el individuo responde
después que terminó el intervalo variable.
Consisten de varias combinaciones de programas simples.
Programa múltiple Un programa mixto
Programa en cadena programa
tándem
programas
cooperativos
programas concurrentes
Una respuesta está bajo el control de dos o más programas simples, cada uno asociado con un estímulo particular.
Una respuesta está bajo el control de dos o más programas simples, cada uno asociado con un estímulo particular.
el picoteo se refuerza bajo un programa IF
10", cuando se enciende una luz roja.Pero bajo uno RV 10
cuando aparece una luz amarilla.
el picoteo se refuerza bajo un programa IF
10", cuando se enciende una luz roja.Pero bajo uno RV 10
cuando aparece una luz amarilla.
Una paloma que ha aprendido a picotear un disco para obtener grano.
Una paloma que ha aprendido a picotear un disco para obtener grano.
se pone en un programa múltiple
se pone en un programa múltiple
Ambos programas de reforzamiento se alternan, con los cambios indicados por las modificaciones en el color de la luz.
Ambos programas de reforzamiento se alternan, con los cambios indicados por las modificaciones en el color de la luz.
EJEMPLO:
Es igual a un programa múltiple excepto porque no hay un estímulo(como las luces roja y amarilla) asociado con el cambio en los
reforzamientos.
Es igual a un programa múltiple excepto porque no hay un estímulo(como las luces roja y amarilla) asociado con el cambio en los
reforzamientos.
En un programa MIX IF 10" RV 10. picotear el disco se reforzará en
unprograma IF 10" por quizá 30
segundos y luego en uno RV 10 por 60 segundos, pero no existe
indicación clara de que el programa ha cambiado.
El reforzamiento se proporciona sólo cuando se completa la última serie de programas.
El reforzamiento se proporciona sólo cuando se completa la última serie de programas.
Una paloma esta en programa cadena cuando esta: RF 10 IF 15” RV 20
El ave picotea un disco rojo; después de la décima respuesta el disco cambia de rojo a amarillo. El disco amarillo señala que está en curso un programa IF 15';
después de 15 segundos, picotear el disco lo cambia de amarillo a verde. Picotear el disco verde da como resultado, después de un promedio de 20 respuestas,
COMIDA.
El disco se vuelve rojo otra vez, indicando que el programa RF 10 está de nuevo en vigor. Obsérvese que, a diferencia del programa múltiple, el pájaro recibe comida sólo después
de completar la respuesta requerida del último programa.
se presenta el reforzamiento por completar dos o más programas sucesivos.
se presenta el reforzamiento por completar dos o más programas sucesivos.
La terminación de un programa (IF 10") marca el inicio del siguiente (RF 20). La terminación del segundo programa da como
resultado el reforzamiento.
Un programa tándem es idéntico a uno en cadena, excepto en que en el primero no existe evento distintivo (luz o
zumbido) que señala el término de un programa y el inicio del siguiente.
Conforman programas que otorguen el reforzamiento dependiendo de la conducta de dos o más organismos.Conforman programas que otorguen el reforzamiento dependiendo de la conducta de dos o más organismos.
Dos palomas que reciben comida por picotear un disco cuando ambos lo han hecho
un total de 20 veces. Uno podría picotear el disco a una tasa de 10
veces por minuto, mientras el otro lo hace 40 veces por minuto. Tan
pronto como la cantidad total de picoteos llega a 20,
cada uno recibe comida.El reforzamiento que consigue el individuo es parcialmente dependiente de la
conducta de la otra parte.El reforzamiento que consigue el individuo es parcialmente dependiente de la
conducta de la otra parte.
Se forma un grupo de estudiantes para trabajar juntos en un proyecto. Cada uno en el grupo
“recibe la misma responsabilidad” en el proyecto con respecto a la contribución de cada quien. Se
supone que los estudiantes comparten el trabajo de igual manera. No obstante, el
reforzamiento no es contingente en cuanto a cómo es compartido el trabajo, sino en la producción del grupo como un todo. Un
resultado común es que algunos miembros del grupo hacen más de lo que les correspondía,
mientrasotros hacen menos.
En los programas concurrentes, dos o más programas están disponibles de manera inmediata.
En los programas concurrentes, dos o más programas están disponibles de manera inmediata.
Un pichón tiene la opción de picotear un disco rojo en un programa de RV 50, o uno
amarillo bajo un programa de RV 20. En otras palabras, el programa concurrente implica una decisión. En el ejemplo dado,
el animal puede elegir el disco amarillo y el programa de RV 20.
Las operantes son emitidas por los organismos. Por ejemplo: El perro corre, camina y juguetea; el ave vuela el chimpancé brinca de árbol en árbol; el bebé balbucea vocalmente. La creación de nuevas operantes, o el incremento de la frecuencia de las operantes ya existentes, se lleva a cabo mediante estímulos reforzantes que van después de la conducta. Para incrementar la tasa de ocurrencia de una respuesta que ya existe en el repertorio de un organismo, solo es necesario que las ocurrencias de esa conducta vayan seguidas de estímulos reforzantes.
UNIOPERANTES
UNIOPERANTES
Asimismo, Karen Pryor (1984) señala que: La intensidad, cantidad y tipo del reforzador también desempeñan una función en la determinación del poder del reforzamiento. Un sujeto recibe no sólo reforzamiento explícito por realizar una respuesta operante específica, sino también recompensas intrínsecas de las otras actividades que pueda realizar. Por tanto, el reforzamiento total incluye las recompensas extrínsecas programadas tanto como las fuentes de reforzamiento no programadas.
UNIOPERANTES
UNIOPERANTES
son un conjunto organizado de programas operantes simples. En ese sentido, la cantidad y calidad de variables, el tipo de tarea o tareas, de programa, la complejidad de la situación experimental y los procesos conductuales a investigar, nos permiten identificar diferentes niveles
de complejidad conductual en investigaciones científicas en el variación conjunta nos permitirían abordar procesos conductuales
complejos.
Por ejemplo los procesos psicológicos superiores, vistos a la luz de otras
perspectivas, como lo histórico cultural y la Psicología piagetiana, podemos
subrayar que el nivel cualitativo es diferente. Por el hecho de que
intervienen procesos lingüísticos, simbólicos, lógicos, históricos, sociales,
afectivos, subjetivos, motivacionales, morales, voluntarios, consientes y
autoconscientes.