4. refuerzo intermitente

16
4. REFUERZO INTERMITENTE:

Transcript of 4. refuerzo intermitente

4.  REFUERZO  INTERMITENTE:    

Caso  Jan  y  las  clases  de  matemá=cas  •  Problema:  Se  distrae  en  clase  de  matemá0cas,  comete  muchos  errores  

•  Obje=vo:  mejorar  ritmo  de  trabajo  con  programa  de  elogios  

•  Opera=vo:  Primeros  dos  dias:  por  cada  2  problemas  buenos  se  le  decía  “buen  trabajo”  

•  Segundo  par  de  días,  por  cada  4  problemas  resueltos.  Luego  cada  8;  y  luego  cada  16  problemas  resueltos.  

•  Resultado:  Efecto  posi0vo,  y  al  dar  elogio  aumentaba  velocidad  de  trabajo.    

Un  programa  de  refuerzo  puede  ser:    A.  De  refuerzo  con=nuo,  à  que  premia  cada  comportamiento  deseado,  o  bien  la  situación  opuesta,    B.  De  ex=nción:  à  No  se  refuerza  ninguna  aparición  de  un  comportamiento  deseado,  con  lo  que  éste  se  reduce  a  un  mínimo  o  desaparece  por  completo.    C.  De  refuerzo  intermitente,  que  se  sitúa  entre  estos  dos.    Cualquier  regla  que  especifique  un  procedimiento  para  que  sólo  en  algunas  ocasiones  se  refuerce  un  comportamiento  se  denomina  programa  de  refuerzo  intermitente.    

Fases  del  programa  de  refuerzo  intermitente:  

•  Fase  de  adquisición:  En  que  un  comportamiento  se  condiciona  o  se  aprende  

•  Fase  de  mantenimiento:  Periodo  posterior  en  que  queda  bien  establecido.  

Ventajas  del  refuerzo  intermitente:  Los  programas  de  reforzamiento  intermitente  son  preferibles  a  los  con0nuos  (como  el  reforzamiento  posi0vo)  por  varias  razones:    •  a)  Man0ene  su  eficacia  porque  la  saciedad  se  da  más  lentamente.  

•  b)  Los  comportamientos  suelen  tardar  más  en  ex0nguirse.  

•  c)  Se  suele  trabajar  de  manera  más  estable  en  algunos  programas  intermitentes.  

•  d)  Es  más  probable  que  el  comportamiento  persista.  

Hay  4  =pos  de  programas  de  refuerzo  intermitente.    

Todos  se  subdividen  en  fijos  y  variables:      1.   De  Razón    (RF),  (RV)  2.   De  Intervalo  simple      (IF),  (IV)  3.   De  Intervalo,  con  margen  limitado  (MLF),  

(MLV)  4.   De  Duración  (DF),  (DV)  

Trabajo  de  tarea:  

A.  Traer  ejemplo  de  los  8  casos    1.   De  Razón    (RF),  (RV)  2.   De  Intervalo  simple  (IF),  (IV)  3.   De  Intervalo,  con  margen  limitado  (MLF),  (MLV)  4.   De  Duración  (DF),  (DV)  •  B.  Leer  capítulo  10  “Moldeado”,  y  cuál  es  la  diferencia  entre  “moldeado”  y  “modelado”  en  modificación  de  conductas.  

1.  Programa  de  razón:    

•  De  Razón  Fija(RF):  El  refuerzo  se  produce  cada  vez  que  se  emite  un  número  determinado  de  respuestas.  Ej.:  entrenador:  “A  hacer  20  abdominales  antes  del  descanso”    RF=20.  Bono  de  ventas  por  cada  5  carros  vendidos  à  RF=5.  Caso  de  Jan  y  matemá0cas…razon  fija  que  se  ha  cambiado,  pero  es  RF  

•  De  Razón  variable  (RV),  la  can0dad  de  respuestas  cambia  de  forma  impredecible  en  cada  ensayo.    (Por  cada  10  personas  que  entran,  vende  1  carro  en  promedio,  RV=10)  ….a  veces  cada  dos,  a  veces  cada  15  logra  una  venta.  Máquinas  tragamonedas  son  otro  ejemplo,  jugadores  no  saben  cuantas  veces  deben  apostar  para  ganar  el  pote.  

•  Habitualmente,  en  los  programas  de  razón  variables  la  respuesta  se  man0ene  con  valores  más  altos  que  en  los  de  razón  fija;  y  los  programas  de  razón  variable  producen  comportamientos  más  resistentes  a  la  ex0nción,  que  programas  de  razón  fija  del  mismo  valor.  Ejemplos  de  programas  de  razón  variable:  Pedir  una  cita  a  alguien,  jugar  en  el  tragamonedas,  lanzar  el  anzuelo…    

2.  Programas  de    intervalo  simple:  

•  El  único  requisito  para  lograr  la  recompensa  será  que  la  persona  emita  la  conducta  cuando,  debido  al  0empo  transcurrido,  el  refuerzo  estrá  ya  disponible;  Por  ejemplo:  El  Pago  de  la  quincena.  

 Los  programas  de  intervalo  fijo  (IF)  generan:    •  (a).  Una  taza  de  respuesta  que  aumenta  gradualmente  a  medida  que  se  acerca  el  

final  del  intervalo  y    •  (b).  Una  pausa  post-­‐refuerzo,  simplemente  no  aparece  la  conducta  per0nente,  y  

cuanto  más  0empo  transcurre  entre  refuerzos,  más  prolongada  es  la  pausa.    Ejemplo:  Niños  juegan  en  jardin,  à  hambre  antes  de  hora  de  almuerzo,  à  entran  mucho  a  cocina.  Luego  de  almorzar  ya  no.  

En  un  programa  de  refuerzo  de  intervalo  variable  (IV),  la  duración  de  los  intervalos  entre  refuerzos  cambia  de  forma  impredecible.  Los  programas  de  intervalos  variables  generan  una  taza  de  respuesta  rela0vamente  estable,  sin  pausa  post-­‐refuerzo  o  a  lo  sumo  muy  breve.    •  Ejemplo:  Comprobar  si  tenemos  mensajes  en  el  correo  electrónico  à  estos  pueden  

aparecer  en  cualquier  momento.  

3.  Programas  de  intervalos  con  margen  limitado  (ML):    

•  Es  esencialmente  un  plazo  límite  para  cumplir  el  requisito  de  respuesta  de  un  programa  de  refuerzo.  Esto  es,  una  vez  que  se  ha  “establecido”  el  refuerzo,  se  “oferta”  su  disponibilidad  durante  un  periodo  limitado.    

•  Ejemplo  (ML  Fijo):  Esperar  el  bus,  que  pasa  cada  20  minutos.  El  bus  se  toma  en  un  margen  limitado,  (un  minuto,  de  cada  20).    

•  Ejemplo  (MLV):  Esperar  por  maletas  en  el  aeropuerto,  transcurrido  un  0empo  indeterminado  aparecerán  las  maletas.    

4.  Programas  de  duración:    •  En  un  programa  de  duración,  el  refuerzo  se  produce  después  de  

que  la  conducta  haya  aparecido  con0nuamente  durante  un  periodo  de  0empo.  En  un  programa  de  duración  fija  (DF),  el  periodo  de  0empo  durante  el  que  hay  que  generar  la  conducta  se  man0ene  estable  entre  los  refuerzos.  Los  de  duracion  fija  se  encuentran  abundantemente,  los  de  duración  variable  ,  el  0empo  varía  en    función  de  varios  factores  independientes  

•  Ejemplos:  •  (DF):  Los  empleos  por  horas,  día,  mes.  •  (DV):  Esperar  que  despeje  el  tráfico    para  cruzar  una  calle  muy  transitada.    •  Tratar  de  hacer  fuego  mediante    fricción  de  palos.    

Programas  de  refuerzo  concurrente:  

•  En  la  mayoría  de  las  situaciones,  contamos  con  varias  opciones  diferentes  (niños  llegan  a  casa  y  pueden:    

•  Ver  televisión,  navegar  por  Internet,  hacer  los  deberes,  charlar,  etc….)    

•  Es  probable  que  cada  comportamiento  esté  reforzado  mediante  un  programa  dis0nto,  pero  debido  a  su  coincidencia  temporal  en  un  momento  determinado,  los  denominamos  programas  concurrentes  de  refuerzo.    

Errores  en  la  aplicación  del  refuerzo  intermitente:  

El  riesgo  más  habitual  podría  calificarse  como  el  uso  irregular  de  la  ex=nción.  Por  ejemplo,  los  cuidadores  suelen  tratar  de  ignorar  los  berrinches  infan0les,  pero  como  estos  persisten,  al  final,  desesperados  “se  rinden”  a  las  demandas  de  atención  o  de  lo  que  sea.    Muchas  veces  padres,  madres  y  docentes  argumentan  que  ceden  a  las  presiones  infan0les  porque  “la  ex0nción  no  estaba  funcionando”,  sin  embargo,  es  probable  que  el  refuerzo  intermitente  resultante  genere  el  mismo  comportamiento  con  más  frecuencia  y  con  mayor  resistencia  a  la  ex0nción  que  si  se  hubiera  reforzado  con0nuamente.  

Directrices  para  un  uso  adecuado  del  refuerzo  intermitente:  

El  uso  adecuado  de  los  programas  de  refuerzo  intermitente  para  facilitar  y  mantener  los  comportamientos  deseables  requiere  ajustar  a  las  siguientes  pautas:    1.      Elegir  un  programa  que  sea  apropiado  para  la  conducta  deseada.  2.      Elegir  un  programa  cuya  administración  resulte  sencilla.  

3.      U0lizar  los  instrumentos  y  materiales  adecuados  para  determinar  con  comodidad  y  presión  cuando  hay  que  reforzar  una  conducta.    4.      Inicialmente,  la  frecuencia  del  refuerzo  ha  de  ser  suficientemente  alta  como  para  mantener  la  conducta  deseada;  posteriormente  se  irá  reduciendo  hasta  que  cada  refuerzo  logre  mantener  la  tasa  de  conducta  deseada.      5.      Hay  que  informar  a  las  personas  de  los  programas  de  refuerzos  que  se  están  aplicando  en  términos  claros  que  comprendan  plenamente.  El  rendimiento  de  los  par0cipantes  es  más  eficaz  si  conocen  las  reglas  específicas  que  han  de  seguir  para  ajustarse  al  programa  vigente.  

BibliograYa:    Mar0n,  Garry;  Pear,  Joseph  (Univ.  de  Manitoba)  Modificación  de  conducta.  Qué  es  y  cómo  aplicarla  Pearson  Pren0ce  Hall    Octava  edicion  Traducción  al  español:  Vivas  Fernández,  Laura;  Suengas  Goenechea,  Aurora,  Facultad  de  Psicología  Universidad  Complutense  de  Madrid  Litográfica  Ingramex,  S.A.  de  C.V.  México  D.F.  455p.p.  ISBN  978  84832  2380-­‐2