Aprenentatge i Condicionament (Apunts)

88
1 Tema 1: Conceptes previs 1.1 Concepte i definició d’aprenentatge Aprenentatge : Canvi relativament permanent en els mecanismes de conducta, resultat de l’experiència (coses que puc o no puc fer) amb els esdeveniments ambientals. L’aprenentatge pot fer/generar canvis interns en l’organisme, conseqüentment, no s’observa directament sinó a través de la conducta. En resum: L’aprenentatge és: - Un canvi relativament permanent. - Que afecta als mecanismes de conducta. - Resultant de l’experiència. Conducta/comportament : Existeixen dos tipus: Conducta heretada (innata) o conducta no apresa. Una persona neix amb certes formes de coneixement. Responem de manera reflexa. Aquest tipus de conducta ajuda a la supervivència primària. Conducta apresa. Les persones, en funció de la seva pròpia experiència, responem d’una manera o una altra. A partir de l’experiència es modifiquen o es tenen unes determinades conductes. L’aprenentatge té com a funció/objectiu l’adaptació a les circumstàncies que nosaltres afrontem. L’aprenentatge dóna flexibilitat a la nostra conducta. 1.2 Aprenentatge i execució Execució (contrari a aprenentatge): accions o respostes observables d’un organisme en un moment concret. Gràcies a l’execució i als canvis observables de conducta deduïm l’aprenentatge, ja que aquest no és observable. Existeix també l’aprenentatge latent: quelcom que aprens però que no manifestes directament i de manera immediata. 1.3 Aprenentatge i altres causes dels canvis de conducta Perquè sigui aprenentatge , el canvi en la conducta ha de ser: Relativament permanent (podem oblidar): l’aprenentatge no és transitori. Si una conducta es modifica i després torna a ser com abans (en poc temps) no existeix aprenentatge.

description

Aprendizaje y condicionamento, Psicología

Transcript of Aprenentatge i Condicionament (Apunts)

Page 1: Aprenentatge i Condicionament (Apunts)

1

Tema 1: Conceptes previs

1.1 Concepte i definició d’aprenentatge

Aprenentatge: Canvi relativament permanent en els mecanismes de conducta, resultat de

l’experiència (coses que puc o no puc fer) amb els esdeveniments ambientals. L’aprenentatge

pot fer/generar canvis interns en l’organisme, conseqüentment, no s’observa directament sinó

a través de la conducta. En resum: L’aprenentatge és:

- Un canvi relativament permanent.

- Que afecta als mecanismes de conducta.

- Resultant de l’experiència.

Conducta/comportament: Existeixen dos tipus:

Conducta heretada (innata) o conducta no apresa. Una persona neix amb certes

formes de coneixement. Responem de manera reflexa. Aquest tipus de conducta ajuda

a la supervivència primària.

Conducta apresa. Les persones, en funció de la seva pròpia experiència, responem

d’una manera o una altra. A partir de l’experiència es modifiquen o es tenen unes

determinades conductes. L’aprenentatge té com a funció/objectiu l’adaptació a les

circumstàncies que nosaltres afrontem. L’aprenentatge dóna flexibilitat a la nostra

conducta.

1.2 Aprenentatge i execució

Execució (contrari a aprenentatge): accions o respostes observables d’un organisme en un

moment concret. Gràcies a l’execució i als canvis observables de conducta deduïm

l’aprenentatge, ja que aquest no és observable.

Existeix també l’aprenentatge latent: quelcom que aprens però que no manifestes directament

i de manera immediata.

1.3 Aprenentatge i altres causes dels canvis de conducta

Perquè sigui aprenentatge , el canvi en la conducta ha de ser:

Relativament permanent (podem oblidar): l’aprenentatge no és transitori. Si una

conducta es modifica i després torna a ser com abans (en poc temps) no existeix

aprenentatge.

Page 2: Aprenentatge i Condicionament (Apunts)

2

Resultat de l’experiència amb els esdeveniments ambientals. Aprendre implica tenir

experiència.

Que afecta als mecanismes de la conducta.

L’aprenentatge s’estudia inferint-lo de la conducta, a través de les execucions. No obstant,

també pot haver-hi aprenentatge sense que es doni un canvi de conducta (no és l’únic que

modifica la conducta). No observarem canvi de conducta quan:

1. La fatiga. La fatiga disminueix la conducta, però el canvi que provoca no és degut a

l’aprenentatge, ja que, quan els subjecte ha descansat, la conducta torna a recuperar-

se. És a dir: el canvi produït és transitori.

2. Alteracions de l’estat motivacional, emocional o fisiològic de l’organisme. La fam o la

set, per exemple, originen canvis en l’execució que no són deguts a un aprenentatge,

sinó una necessitat. Quan els organismes necessiten menjar o beure, fan conductes

que no s’observen en altres moments i que desapareixen així que la necessitat ha

quedat satisfeta. Per tant, aquest canvi també és transitori.

3. Altres:

- No hi ha instruments que ens permeten observar-lo.

- No es donen les condicions adequades

La maduració al llarg del cicle vital provoca canvis no transitoris de conducta però, no

requereixen d¡experiència, per tant, la maduració no és aprenentatge. Aquests factors

maduratius poden ser o no necessaris per a l’execució d’una acció.

1.4 Tipus d’aprenentatge

Trobem dos tipus:

1. Aprenentatge no associatiu: en el qual intervé un únic estímul que desencadena una

resposta reflexa i la resposta que elícita va variant.

a. Habituació: es tracta de la disminució de la resposta reflexa produïda per la

presentació repetida de l’estímul; dit d’una altra manera, el que fem és

aprendre a ignorar estímuls que no són importants . Amb això ens permet

adaptar-nos en l’ambient.

Page 3: Aprenentatge i Condicionament (Apunts)

3

b. Sensibilització: es tracta del increment de la resposta reflexa produïda per la

presentació repetida de l’estímul. Normalment són estímuls aversius,

perillosos, amenaçant.

Que nosaltres habituem o sensibilitzem la resposta a un estímul depèn de:

Les característiques de l’estímul: si és irrellevant l’habituem, si és rellevant,

perillós, aversiu el sensibilitzem.

L’estat d’activació de la persona.

Normalment es dóna una habituació.

Habituació Sensibilització

(Per exemple amb una descàrrega dèbil) (Per exemple amb descàrrega intensa)

Les aplicacions de l’habituació són les següents:

- Identificació de l’autisme en nens.

- Avaluació de disfuncions funcionals.

- Publicitat.

2. Aprenentatge associatiu: associem dos estímuls, és a dir, s’aprenen relacions de

predicció entre dos o més fets. Trobem:

a. Condicionament clàssic: en aquest condicionament canviem la conducta en

base a la relació apresa. L’aparició de la RC (resposta condicionada) evidencia

l’establiment de l’aprenentatge.

L’aplicació d’aquest condicionament pot ser per a: publicitat, tractaments clínics de fòbia, pel

condicionament de la resposta immunològica (permet l’administració de menors quantitats de

fàrmacs actius), etc.

Page 4: Aprenentatge i Condicionament (Apunts)

4

b. Condicionament instrumental: en aquest condicionament s’aprenen relacions

de predicció entre resposta i conseqüències. Aprenem a controlar certs

aspectes del medi mitjançant la nostra conducta. La conseqüència de la

conducta provoca un canvi en la seva probabilitat de presentació.

L’aplicació d’aquest condicionament por servir per a : l’escola, l’esport, l’entrenament

d’animals per ajudar a persones, el moldejament de conductes senzilles en persones amb

minusvalidesa...

Dins aquest condicionament trobem el condicionament operant (Skinner), que es diferencia

d’aquest en el fet que no hi ha assajos.

CONDICIONAMENT CLÀSSIC

(predicció)

CONDICIONAMENT INSTRUMENTAL

(control)

Associació EC-EI Associació resposta-conseqüències

La RC és resultat de predicció La R determina les conseqüències

*EC= estímul condicionat (la campana a l’experiment del gos de Paulov)

*EI = estímul incondicionat (el menjar en l’experiment del gos de Paulov)

1.5 Aspectes metodològics

Utilització de models animals: els principis i les lleis de l’aprenentatge són comuns a

totes les espècies.

Avantatges d’utilització d’animals:

o Coneixement de les característiques biològiques

o Menys problemes derivats de la interacció subjecte-experimentador

o Menys problemes ètics

1.6 Objecte d’estudi de l’aprenentatge com a disciplina científica

L'aprenentatge com a disciplina científica té com a objectiu conèixer:

a) les condicions de l’aprenentatge quan s’aprèn, en quines situacions es produirà

l'aprenentatge;

Page 5: Aprenentatge i Condicionament (Apunts)

5

b) els mecanismes de I'aprenentatge: com s’aprèn, quin és el sistema o procediment

mitjançant el qual s'adquireixen determinats continguts en determinades situacions;

c) els continguts de l'aprenentatge: què s’aprèn, què és el que els organismes

adquireixen com a resultat d'un aprenentatge;

d) els determinants de I'execució: quins elements fan que I'aprenentatge es manifesti o

no i que ho faci mitjançant una execució o una altra.

Page 6: Aprenentatge i Condicionament (Apunts)

6

Tema 2: Aprenentatge no associatiu. Conducta elicitada/heretada/innata

2.1 Concepte de conducta elicitada

La conducta elicitada no requereix aprenentatge previ. Un estímul, si es presenta, provoca una

resposta de manera involuntària/automàtica (cas de l’acte reflex). Aquesta inclou dos

conductes diferents:

Els reflexos: tenen una estructura neural mínima i són a base de l’aprenentatge no

associatiu.

Els mecanismes d’orientació o tropismes;

o Indirectes (kínesis)

o Directes (tàxies): tropisme direccional; quan apareix un estímul, el subjecte es

dirigeix cap a ell o fuig.

Les pautes d’acció modal (patrons d’acció modal o pautes d’acció fixes): són un

conjunt de respostes encadenades.

Totes aquestes conductes tenen una base heretada, però això no vol dir que no siguin

modificables per l’aprenentatge.

Esquema genèric de les conductes elicitades: E R (diferent de l’aprenentatge)

2.2 Els reflexos

2.2.1 Definició

Pautes uniformes d’acció (moviments característics d’aquell reflex) desencadenades de forma

involuntària en un temps molt breu i degudes a l’aplicació d’un estímul molt definit (alta

especificitat) a un determinat receptor.

Esquema genèric de les conductes reflexes: E elicitador (estímul determinat que provoca una

acció determinada i que s’ha de provocar en un determinat receptor) R específica/elicitada.

L’especificitat en la relació de l’estímul i la resposta reflexa és una conseqüència de

l’organització del sistema nerviós:

Neurona aferents Interneurona Neurona eferent = arc reflex

Page 7: Aprenentatge i Condicionament (Apunts)

7

Sempre que es presenta un estímul elicitador apareix la mateixa resposta reflexa, que podrà

tenir característiques diferents en funció de les característiques del subjecte i de la situació

concreta o del moment en què apareix. Hi ha, per tant, variabilitat interindividual i variabilitat

intraindividual en relació amb les respostes reflexes.

Recordatori - període de latència de resposta: temps des del inici de l’estímul fins el inici de la

resposta.

2.2.2 El reflex d’orientació

No compleix amb les normes dels reflexos anteriors perquè és inespecífic pel que fa l’estímul

ja que són estímuls nous, i pel que fa les respostes, que són variades i no estan ficades.

Conjunt de respostes (preparen l’organisme per a l’acció). Part de les respostes elicitades són:

A. Respostes musculars: augment de la tensió muscular; moviments d’orientació.

B. Respostes vegetatives. Disminució o pausa (apnea) de la freqüència respiratòria;

alteracions de la freqüència cardíaca i de la pressió arterial; increment de la sudoració

(RED); dilatació pupil·lar.

C. Respostes centrals: desincronització de les ones electroencefalografies (EEG)

cerebrals. Ja no hi ha un estat continu en les ones alfa i passaríem a unes ones beta.

Característiques definitòries:

Reflex d’orientació o també anomenat d’ensurt i de defensa. Aquest reflex s’utilitza

com a indicador atencional.

Conjunt de respostes elicitades per un estímul nou o per la modificació d’un estímul

familiar.

És un reflex inespecífic.

És important pels psicòlegs perquè s’habitua (habituar-se = forma d’aprenentatge més

simple) de forma ràpida i total.

2.2.3 Mesures de la resposta reflexa

- Magnitud

Intensitat (potència): el punt màxim de canvi.

Durada: el temps des de l’inici fins al final de la resposta.

Page 8: Aprenentatge i Condicionament (Apunts)

8

- Latència: el temps des de que comença l’estímul fins que s’inicia la resposta. Estímul intens

latència curta.

- Facilitat d’habituació (habituabilitat): si s’habitua en pocs assaigs reflex dèbil.

- Llindar (Umbral): intensitat mínima de l’estímul que desencadena la resposta. El valor del

llindar ens diu si el reflex es més fort o més dèbil, depenent de si es necessita un llindar

d’estímuls més alts o més baixos (estímuls baixos reflex fort). Indicador de la força del reflex.

Page 9: Aprenentatge i Condicionament (Apunts)

9

Tema 3: Aprenentatge no associatiu: Habituació i sensibilització

3.1. Concepte d’habituació

3.1.1 Definició

Consisteix en una disminució de la resposta reflexa, causada per la repetida presentació de

I'estímul elicitador. En alguns casos, com en el reflex d'orientació, la resposta reflexa pot

arribar a desaparèixer si el nombre de presentacions de l'estímul elicitador és suficient.

La disminució de resposta que podem observar quan presentem repetidament un estímul no

és regular, sinó que a mesura que transcorren els assaigs la disminució de la resposta generada

per cada assaig particular, i que se suma a la generada pels assaigs anteriors, és cada cop

menor. Malgrat tot, no és infreqüent que en els primers assaigs aparegui un petit increment de

la resposta (sensibilització) i tot seguit és quan comença el decrement de resposta característic

de I'habituació.

3.1.2 Altres respostes de decrement de la resposta

A més de I'habituació, la fatiga i l'adaptació sensorial són altres fenòmens que poden provocar

el decrement de la resposta reflexa. Tot i la seva similitud quant a la forma de manifestar-se,

les causes que les originen són diferents:

- Adaptació sensorial Disminució de la sensibilitat dels receptors sensorials Procés

perifèric No és aprenentatge. (arc reflex)

- Habituació Canvis en el SNC com a conseqüència de l’experiència repetida amb l’estímul

Procés central És aprenentatge.

- Fatiga muscular Esgotament dels músculs efectors Procés perifèric No és

aprenentatge.

Exercici. Habituació, fatiga i adaptació sensorial: anàlisi de casos:

- Identifica i raona en cada cas de quin d’aquests fenòmens es tracta.

Cas de soroll de projector que deixem de prestar-li atenció conscient. Exemple

d’habituació. No pot ser ni adaptació sensorial ni fatiga muscular perquè és un procés

central (en el SNC). A més, l’estímul es deixa de percebre de manera específica, no

perdem directament l’audició per complert (seguim seguint al professor i escoltant-lo).

Page 10: Aprenentatge i Condicionament (Apunts)

10

Cas de l’enlluernament provocat per la llum del power point que ens fa no veure ve en

els moments posteriors. Exemple d’adaptació sensorial. Adaptació perquè no és

específica la pèrdua de visió, no només no veiem el power point, tampoc podem veure

al company o els apunts.

Totes fan que la resposta vagi disminuint però l’únic que ve de l’aprenentatge és l’habituació.

3.2 Propietats de l’habituació

- Especificitat muscular: quan jo m’habituo, m’habituo a UN estímul. És especifica a l’estímul.

- Generalització: som capaços de generalitzar una cosa que l’hem aprés en un context específic

a un altre context. Ex. mi fa sol la si do re (gradient de generalització).

- Retenció:

Recuperació espontània: tornar a l’estat d’abans; com si faig un assaigs i m’hi he

habituat, deixem passar un temps tornem als assaigs recuperem l’estat inicial, però

normalment no és total sinó moderada.

Tipus: habituació a curt termini (dura un temps de segons o minuts) i habituació a llarg

termini (durada de hores, dies, setmanes, anys). (Leaton)

- Potenciació de l’habituació: Les habituacions repetides a un mateix estímul són cada vegada

més fàcils i duradores, és a dir, que requereixen menys assaigs i s'endarrereix la recuperació

espontània de la resposta.

- Deshabituació: no es deixa passar cap temps perquè sinó seria recuperació espontània; el que

es fa es que en el interval entre estímuls es presenta un estímul nou i diferents (estímul

deshabituador). Així la resposta a l’estímul habituador augmenta.

Exercici.

Volem dur a terme un experiment amb l’objectiu d’estudiar so les persones amb trastorn límit

de la personalitat mostren un reflex d’orientació alterat enfront d’imatges d’alt contingut

emocional negatiu, en comparació amb un grup control de participants sans.

- Indica dues respostes reflexes que es podrien avaluar en aquesta recerca i, per a cadascuna

d’elles, especifica una possible mesura de la seva força.

Sudoració i dilatació pupil·lar.

Page 11: Aprenentatge i Condicionament (Apunts)

11

1. Latència: quan comença a sudorar i magnitud durada des q comença fins q s’acaba.

2. Magnitud

3.3 Variables de l’habituació

- Intensitat de l’estímul: a major intensitat de l’estímul elicitador, més difícil i lenta resultarà

l’habituació. Un cop aconseguida l’habituació, la retenció és més duradora. D'altra banda, a

més intensitat de l’estímul, major és la retenció de I'habituació.

- Freqüència de presentació de l’estímul (IEA: interval entre assaig): a major freqüència de

presentació de l’estímul, més fàcil i ràpida serà l’habituació però, a curt termini. Per tant, quan

la freqüència és més baixa, més durarà l’habituació.

Exercici. Grup A i grup B. En el grup A: 8 assaigs / 60 dB /IEA = 30s. En el grup B: 8 assaigs /

80dB / IEA = 30s. En el grup A els assaigs 7 i 8 tenen un valor de RED de 0. En el grup B quins

valors es podrien presentar? Doncs valors més grans que 0 perquè augmenta la intensitat de

l’estímul i disminueix la freqüència.

3.4 Concepte de sensibilització treballat a Conferència. Mirar llibre de Michael Domjan.

Consisteix en un increment de la resposta reflexa, causat per la repetida presentació de

l'estímul elicitador.

Els estímuls que provoquen sensibilització són els estímuls rellevants per a l'organisme,

intensos, aversius, amenaçadors. En general són estímuls que assenyalen perill i per això és

important per a l'organisme estar aler,ta- Aquests estímuls, com també l'acció de determinats

fàrmacs i altres factors, poden portar l¡organisme a un estat que comporti que pugui mostrar

respostes desproporcionadament intenses a estímuls nous i diferents dels que van provocar la

sensibilització, encara que aquests estímuls nous no siguin estímuls que indiquin perill.

El procés de sensibilització forma part del sistema de defensa dels individus, i com a tal és

normal que la resposta elicitada per un estímul que implica aquest sistema no s’habituï

fàcilment i que incrementi la reacció del subjecte davant la repetida presentació de l'estímul

fins a un límit fisiològicament acceptable.

3.5 Propietats i variable de la sensibilització (Es tracta del increment de la resposta reflexa

produïda per la presentació repetida de l’estímul. Normalment són estímuls aversius,

perillosos, amenaçant)

Page 12: Aprenentatge i Condicionament (Apunts)

12

- Baixa especificitat estimular. Exemple: cine pel·lícula de por en què apareixen sons inesperats

que provoquen respostes d’ensurt. El primer cop t’espantes, i el següent (si la pel·lícula és bona)

encara ens farà més por perquè estem ficats en l’argument.

- Generalització. Un cop habituat un estímul, si es presenta un altre diferent respondrem de

manera semblant. Exemple de la por amb una pel·lícula de terror: si estem ja espantats i ens

toquen per darrera responem de la mateixa manera que si aparegués a escena d’ensurt en la

pel·lícula.

- Intensitat de l’estímul: a major intensitat de l’estímul, major efecte de sensibilització.

- Freqüència de presentació de l’estímul: a major freqüència de presentació de l’estímul,

major efecte de sensibilització.

- Curs temporal:

Curs temporal de la sensibilització: l’increment de la tendència a respondre

normalment té vida curta. Per exemple, una rata exposada a un so durant 25 min,

només va incrementar la reactivitat durant 10 o 15 min. La durada està determinada

per la intensitat de l’estímul. Els estímuls més intensos produeixen major increments

en la tendència a respondre i a una sensibilització més persistent.

Curs temporal de l’habituació: hi tant habituació a llarg termini com a curt termini.

Veiem-ho amb un experiment. La recuperació espontània es característica de la de a

curt termini i mai es completa per la de a llarg termini.

El efectes de l’habituació a curt i llarg termini queden clarament il·lustrats en l’experiment de

Leaton sobre la resposta de sobresurt de les rates.

- L’estímul de prova és un to agut (durant 2 sec.). Primer es permet als animals a que

s’acostumin al recinte experimental sense cap tipus de so; després la rata rep (en un únic

assaig) el to una vegada al dia durant 11 dies. Degut a la longitud d’interval (24 h) qualsevol

disminució de la resposta consistirà en una habituació a llarg termini. En la següent fase rep

300 presentacions seguides (cada 3 sec.) i serà habituació a curt termini. Les rates, finalment,

reben una única presentació de l to cada cadascun dels tres dies següents per mesurar la

recuperació de l’efecte de l’habituació a curt termini. La reacció més intensa s’observa el

primer cop i va disminuint la resposta progressivament.

Page 13: Aprenentatge i Condicionament (Apunts)

13

- Especificitat

Especificitat de l’estímul en la habituació: una resposta a un estímul prèviament

habituada pot manifestar-se plenament alterada alguna característica important de

l’estímul. Per exemple, després que ens hem habituat al so del rellotge de la paret, es

probable que tornem a prestar-li atenció si funciona malament.

Encara que l’habituació es específica a un estímul, pot donar-se certa generalització. Si

ens hem habituat a un determinat soroll y apareix un que si assembla molt a l’original

hi haurà una generalització de l’estímul de l’habituació. Tot i així l’organisme mostrarà

una menor habitació o una supressió de la resposta davant aquest nou estímul.

Especificitat de l’estímul en la sensibilització: no és molt específica; si un animal

s’activa o sensibilitza per alguna raó, la seva activitat augmenta per tota la varietat

d’estímuls.

També podrem parlar de deshabituació quan la resposta habituada pot restablir-se

sensibilitzant amb l’exposició a un estímul extern. Aquest terme fa referència a la recuperació

de la resposta al estímul prèviament habituada.

*Experiment: atenció visual amb bebès (Kaplan, Werner i Rudy).

Els bebès foren exposats a un patró de tauler d’escacs 4x4 i en els 8 primer assaigs van mostrar

ja una habitació. A l’assaig 9 es va fer el mateix y es la introduir un so, mentre un altre grup

continuava com inicialment. La presencia del so va augmentar la resposta notablement i es va

veure que es mantingué elevada durant els següents assaigs, durant els quals ja no hi havia so.

3.6 Teories sobre l’aprenentatge no associatiu

3.6.1. Teoria del doble procés (aprenentatge no associatiu)

Diuen que l’habituació i sensibilització necessiten una certa estructura neural per poder-se

donar. En aquest intervenen:

- Sistema E-R: és la via neural més curta entre l’estímul elicitador i la resposta elicitada

resultant. Està compost per les estructures neurals de l’arc reflex (neurona sensorial,

interneurona, neurona motora) arc reflex.

S’activa sempre que un estímul elicita una resposta. La repetida utilització d’aquest sistema

provoca una disminució en la tendència a respondre.

Page 14: Aprenentatge i Condicionament (Apunts)

14

- Sistema d’Estat: consisteix en tots els processos neuronals que no són part integrant

del sistema E-R però que influeixen en la seva reactivitat. És el responsable de l’estat

d’activació o d’alerta de l’organisme.

Per tant, aquest sistema és el responsable de l¡increment de “responsivitat”.

Únicament participa en circumstàncies especials (events excitadors), provocant un increment

en la tendència a respondre.

Activació repetida del sistema E-R procés d’habituació

Estímul

Possible activació del sistema d’estat procés de sensibilització

La resposta observable dependrà de la força dels processos generats per l’estímul.

3.6.2. Teoria del procés oponent (estudi de les respostes emocionals)

Inicialment hi ha una etapa en la qual hi ha una gran manifestació emocional, aquesta resposta

disminueix però encara es manté quan l’estímul està present. En el moment en que l’estímul

desapareix, desapareix la resposta emocional forta i finalment es cau en el caire contrari i

posteriorment es torna a la normalitat.

També van observar que la resposta emocional era menys intensa si aquest estímul es donava

en més ocasions.

Page 15: Aprenentatge i Condicionament (Apunts)

15

Postulats de la teoria:

Les reaccions emocionals són bifàsiques

La reacció primària s’afebleix amb l’exposició a l’estímul

L’afebliment de la reacció primària va acompanyada d’un enfortiment del postefecte

(procés oponent)

És una teoria homeostàtica.

Gràfic: resposta afectiva/ processos oponents:

El procés A determina el tipus de resposta que hi ha i és invariant. El procés B canvia amb

l’experiència (s’enforteix). De la suma d’aquests processos surt “l’evolució” de l’emoció, la

corba.

- Un estímul que produeix un estat emocional (procés a) produeix també l’efecte oposat

posterior (procés b) l’inici del qual es posterior.

- El procés a és el responsable de l’estat emocional i el procés b genera la reacció

emocional oposada.

- La intensitat i durada de a és fixa i ve determinada per les característiques de l’estímul.

El procés a comença quan l’estímul apareix i acaba quan aquest finalitza.

- El procés b és variable. Les repetides exposicions a l’estímul l’enforteixen (s’activa més

ràpidament, la seva intensitat màxima augmenta i es deteriora més lentament).

Postulats de la teoria:

Els canvis emocionals observats quan es presenta un estímul i després es retira, se

suposa que reflecteixen el resultat net d’aquests dos processos (a i b)

La reacció emocional observable provocada per a primera presentació de l’estímul

disminueix si l’estímul es presenta amb una certa freqüència, com a conseqüència de

l’enfortiment del procés b

El desequilibri, cada cop menor, entre el processos a i b, explicaria l’habituació de la

resposta emocional

Page 16: Aprenentatge i Condicionament (Apunts)

16

Els canvis del procés b, també depenen del temps entre les successives presentacions

de l’estímul. Si són molt espaiades, no ocorreran canvis en el procés b, o seran mínims

i no s’habituarà la resposta emocional.

EXPERIMENTS

Atenció visual en els bebès (Habituació i deshabituació)

2 grups de bebès. Al primer li presenten un estímul visual (com un joc d’escacs) de 4x4, i al

segon un e 12x12. La presentació és repetidament , 8 vegades en intervals de 10 segons. El

resultat va ser que:

- L’atenció visual provocada per l’estímul més senzill (4x4), es redueix a mida que van passant

els assajos.

- L’atenció visual provocada per l’estímul més complex (12x12), incrementa durant els primers

assajos i després es comença a reduir.

IMATGE PÀGINA 37!!!

Deshabituació: en l’assaig 9, un grup de bebès reben un so conjunt amb l’estímul visual,

mentre que l’altre grup només rep l’estímul visual. El to va augmentar la resposta i per tant va

recuperar la resposta de l’estímul prèviament habituat (visual).

IMATGE PÀGINA 48!!!

Salivació i avaluació del sabor en humans (Adaptació sensorial)

El gust del menjar elicita la salivació com a resposta reflexa. El que es va fer era mesurar la

salivació de 8 dones davant el suc de llimona i el suc de llima. En els 10 primers assajos hi havia

un sabor, i a partir de l’11 es canviava per l’altre sabor. A mida que l’estímul es repetia, perdia

eficàcia per elicitar respostes, però quan es canviava el sabor, recuperava la resposta.

IMATGE PÀGINA 38!!!

Resposta de sobresalt en rates (Habituació i sensibilització)

Mitjançant una càmera establimètrica, es controla la resposta de sobresalt en rates. Dos grups

de rates: a un se li aplica un soroll quan escolten una melodia amb un so ambiental semblant al

de l’aigua (60db), i al segon igual però amb el so de l’aigua a 80db. Es repeteixen els sons.

Page 17: Aprenentatge i Condicionament (Apunts)

17

Resultats: per a les rates exposades al so ambiental suau, les repeticions del soroll van

provocar un sobresalt cada vegada més dèbil. En canvi, a les rates amb un so ambiental alt, les

repeticions del soroll provocaren reaccions de sobresalt cada vegada més rigoroses.

Leaton (efectes de l’habituació a curt i llarg termini)

Experiments sobre rates. Primer se les deixa experimentar el lloc sense cap to agut e intens, i

després s’aplica aquest (durant 2 segons):

1. Un cop al dia durant 11 dies (procés d’habituació a llarg termini)

2. Tres-centes presentacions de l’estímul cada 3 segons durant 11 dies (procés

d’habituació a curt termini)

3. Un cop al dia

Conclusions:

1. l’habituació a llarg termini no va provocar una completa pèrdua del reflex d’orientació.

2. l’habituació a curt termini va provocar una disminució de la resposta més ràpida

3. la resposta d’ensurt es va recuperar al nivell del 11è dia de l’experiment; aquesta

recuperació és la recuperació espontània (principal característica de l’habituació a llarg

termini).

Experiment amb l’invertebrat

Estudien la resposta reflexa de la retracció de la brànquia d’un invertebrat.

Aquesta investigació ha demostrat que l’estimulació repetida de la neurona sensorial no

provoca canvis en els potencials d’acció generats per la neurona sensorial, sinó que redueix la

quantitat de transmissor alliberada, donant lloc al fenomen de l’habituació.

La sensibilització, en canvi, involucra la interneurona facilitadora, que produeix un canvi en la

neurona sensorial que li permet alliberar més neurotransmissor. Donat això, les neurones

motores s’activen més i la resposta de retracció de la brànquia és més intensa. Per tant, i en

resum, la sensibilització conductual ocorre degut que descàrrega en la cua potencia

l’alliberació de neurotransmissor per part de la neurona sensorial.

Page 18: Aprenentatge i Condicionament (Apunts)

18

Tema 4: Els fonaments del condicionament clàssic. Aprenentatge associatiu

4.1 Els descobriments inicials de Pavlov – Conferència 2 (ben explicats en el llibre de text de

Domjan)

La investigació sobre el condicionament clàssic va començar amb el treball de Pavlov, que va

estudiar com aprenien els gossos a anticipar l’administració de menjar.

A diferència de l’habituació i sensibilització, que permetien canvis en les respostes que ja es

troben al repertori de respostes de l’organisme, el condicionament clàssic permet també

l’aprenentatge de noves respostes o de respostes a nous estímuls.

Aprenem relacions, establim associacions. En el condicionament clàssic aprenem relació entre

estímuls. És un aprenentatge d’anticipació, de predicció, de tal manera que ens ajuda a ajustar

el nostre comportament a l’ambient.

En resum: el condicionament clàssic és el mecanisme més simple pel qual els organismes

poden aprendre sobre les relacions entre estímuls i canviar la seva conducta en conformitat

amb les relacions.

4.1.1 Aportacions de Paulov a l’estudi del condicionament clàssic

- Observació sistemàtica del fenomen (1903): estudi característiques, variables.

- Procediments: de presentació d’estímuls, de mesura de la RC.

- Estudi de diferents fenòmens: aprenentatge extinció, generalització, discriminació,

condicionament inhibitori, condicionament de 2on ordre...

- Aportació teòrica: teoria de la substitució de l’estímul.

4.1.2 Condicionament salival: preparació experimental

Es mira quant saliven els gossos a través d’una cànula (llibre Domjan).

- Ei (estímul incondicionat): carn en pols

- En (estímul neutre): auditius, visuals, olfactius, tàctils...

- RI (resposta incondicionada): salivació

- RC (resposta condicionada): salivació

Page 19: Aprenentatge i Condicionament (Apunts)

19

La resposta salival es pot extingir i és més ràpida.

4.1.3 Altres autors

Pavlov

- Estudi de les secrecions gàstriques (premi Nobel de fisiologia 1904)

- Estudi de propietats del sistema nerviós: força, equilibri i mobilitat.

- Tipologies animals seguint la classificació clàssica galeno-hipocràyica (colèric, sanguini,

flemàtic, melancòlic).

Vladimir Beixterev

Va introduir:

- El condicionament clàssic de respostes musculars

- la utilització d’EEII aversius.

John B. Watson

Estén el condicionament clàssic a les respostes emocionals.

Vul’fson

Va estudiar la resposta salival de varies substàncies situades a la boca, com el menjar sec,

humit, l’aigua àcida y arena. Després que els gossos haguessin experimentat la sensació

provocada per aquestes substàncies a la boca, la mera visió de les mateixes provocaven la

salivació.

Snarskii

Va expandir allò que havia fet Vul’fson a substàncies artificials com aigua àcida d’un color

negre; l’animal va acabar salivant només amb la visió de l’aigua negra o d’una ampolla amb

líquid negre.

Ambdós (Vul’fson & Snarskii)

Les substàncies també provocaven en la boca sensacions de textura y sabor característics. Això

es denominà estímuls orofaringis, les quals el gos va aprendre a associar-les amb

Page 20: Aprenentatge i Condicionament (Apunts)

20

característiques visibles aprenentatge d’objecte (associar diferents característiques a un

mateix objecte.

4.1.4. Tipus de condicionament clàssic

EI apetitiu EI aversiu

EC + presència EI Excitatori apetitiu Excitatori aversiu

EC- absència EI Inhibitori apetitiu Inhibitori aversiu

- Base de tractaments clínics (tractament de fòbies, etc)

4.2 El paradigma i els termes del condicionament clàssic

- Fase A (situació inicial):

EI (estímul incondicionat: menjar) RI (resposta incondicionada: salivació)

En (estímul neutre: so metrònom) no provoca salivació

- Fase B (adquisició de l’aprenentatge):

En - ->(“seguit de”) EI RI

- Fase C (fase de prova, provo si s’ha arpés):

EC (estímul condicionat: so metrònom) RC (resposta condicionada: salivació)

L’estímul neutre associat al menjar ha adquirit valor informatiu i es converteix en un estímul

condicionat.

Nota: consultar el glossari per a la definició dels termes del condicionament clàssic.

4.3 Fenòmens bàsics del condicionament clàssic

4.3.1 L’adquisició

Procediment: presentació repetida de l’EC i de l’EI associats (EC - -> EI).

Resultat:

o A nivell d’aprenentatge: adquisició força associativa (intensitat de l’associació

o relació existent entre l’EC i l’EI) per part de l’EC;

Page 21: Aprenentatge i Condicionament (Apunts)

21

o A nivell d’execució: enfortiment de la RC (s’adquireix força associativa);

o Curs de l’adquisició.

RC (salivació)

Assaigs

4.3.2 L’extinció (aprenem a inhibir però, no eliminem aprenentatge):

Procediment: presentació repetida de l’EC sol després del condicionament (EC - ->).

Resultat: debilitament gradual de la força de la RC.

- Resistència a l’extinció (Rext): nombre d’assaigs d’extinció necessaris per a la desaparició de

la RC.

- Recuperació espontània: reaparició de la RC i l’EC després d’un temps de descans.

- Interpretació: l’extinció com a aprenentatge d’inhibició de la RC (inhibició extintiva):

Recuperació espontània (reaparició de la RC a l’EC després d’un temps de descans);

Desinhibició: reaparició de la RC per la presentació d’un estímul nou (ED: estímul

desinhibidor) conjuntament amb l’EC durant l’extinció (té els mateixos efectes que la

pausa però el procediment de la desinhibició és diferent) Trenca el procés

d’aprenentatge en curs;

Renovació: reaparició de la RC al presentar l’EC en el context d’adquisició original

(l’extinció la portem a terme en un context diferent a l’original). Aquest efecte sorgeix

perquè la memòria d’extinció és específica de les claus que estaven presents durant la

fase d’extinció. Això succeeix que la RC és més forta o duradora que l’extinció.;

Restabliment: reaparició de la RC i l’EC per la reexposició a l’EI després de l’extinció. Es

presenta l’EI sol (menjar en l’exemple de salivar) i després tornes a presentar l’EC. El

condicionament contextual facilita l’efecte de restabliment.

Tots aquests fenòmens tenen en comú que es fa desaparèixer part de l’aprenentatge però si es

torna a presentar l’estímul, es dóna la resposta condicionada.

Page 22: Aprenentatge i Condicionament (Apunts)

22

- Oblit: debilitament d’una resposta apresa degut al pas del temps. L’extinció és més eficaç

pels aprenentatges inhibitoris que l’oblit. Deixo passar el temps un cop adquirit l’aprenentatge

(no segueixo el procediment d’extinció). En molts casos, l’oblit es confon degut que es

presenten estímuls semblants entre ells que fan que el primer estímul quedi borrós.

- Implicació: tractament de les fòbies. Per eliminar-la podem utilitzar l’extinció però, el

subjecte ho passa malament ja que el presentem a l’EC (un objecte que en un principi no crea

por). No podríem eliminar les fòbies amb l’oblit.

4.3.3 La generalització és la tendència natural a respondre als estímuls que són similars a l’EC.

En aquest cas, el gradient de generalització és invers a la generalització en l’habituació ( )

Gradient de generalització

Ex: petit Albert, el condicionen a tenir por a les rates blanques, i el nen quan li presenten un

conill blanc, generalitza l’estímul i igualment dóna una resposta.

4.3.4 La discriminació: Per extingir la generalització presentem els estímuls semblants a l’EC

sense l’EI i quan presentem l’EC presentem també l’EI.

Procediment: EC - -> EI alternat a l’atzar (sense un ordre concret perquè si no s’aprèn)

amb E’ - ->

Resultat: EC RC ; E’ - ->

o Neurosis experimentals (Shenger-Krestovnikova, 1921): va dissenyar un experiment en

què la discriminació s’anava complicant en gossos. Quan ja era molt complicat

discriminar i es presentava un altre cop els estímuls inicials (EC i E’ que eren

relativament més diferents), els gossos es tornaven agressius i els costava molt

discriminar els estímuls.

Exercici. Anomena els procediment i fenòmens de condicionament clàssic descrits en la taula

següent

1. Nombre d’assaigs de presentació de l’EC sol necessaris er a la desaparició de la RC –

Resistència a l’extinció.

2. Reaparició de la RC prèviament extingida per la presentació de l’EC després d’un temps

de descans – Recuperació espontània.

Page 23: Aprenentatge i Condicionament (Apunts)

23

3. Debilitament d’un aprenentatge degut al pas del temps – Oblit.

4. Reaparició de la RC per la presentació durant l’extinció d’un estímul nou conjuntament

amb l’EC – Desinhibició.

5. Presentació de l’EC sense l’EI després de l’adquisició – Extinció.

4.4 Condicionament clàssic en la nostra vida

Normalment s’estudia en un laboratori, però això no vol dir que només aparegui en situacions

de laboratori. El condicionament clàssic sempre té lloc que un estímul precedeix regularment a

un altre.

Una àrea d’investigació interessant es per a explicar els judicis de causalitat humana, és a dir,

com apareixen les causalitats que establim a la nostra vida quotidiana (el saber que si reguem

una flor creixerà). També Per a les preferències i aversions alimentaries (si alguna cosa ens a

provocat malestar al menjar-la tendirem a tenir aversió d’ella), per a les respostes de por. I

finalment, també les podem veure a part de en la conducta sexual, en les respostes dels nens i

les mares per a que la seva alimentació (bebés) es doni.

Page 24: Aprenentatge i Condicionament (Apunts)

24

Tema 5: Metodologia d’estudi del condicionament clàssic

5.1 La qualificació de la RC

5.1.1 Mesures

Intensitat (amplitud màxima de canvi) Magnitud

Durada (des de l’in. Fins al final de la RC)

Latència (només la tenen les respostes, no els estímuls): Temps des de que començo a

presentar l’estímul condicionat fins el principi de la RC.

Resistència a l’extinció (Rext.)

Percentatge d’assaigs amb RC. Aquesta mesura és vàlida quan hem de realitzar

centenars d’assaigs i no uns pocs. Només és útil en respostes de condicionament lent.

5.1.2 Tècniques de mesura

Per evitar la interferència de la RI tinc dos tipus de tècniques:

- Assaig de prova (un cop donat el condicionament clàssic, faig aquest assaig):

Es presenta l’EC sol;

=> Extinció (inconvenient ja que debilito la RC)

- Anticipació (en els assaigs que vull mesurar la RC, continuo presentant el so el menjar, EC i EI,

però deixo passar un temps entre els estímuls)

S’augmenta la durada del interval entre estímuls (IEE).

=> Inhibició de demora (la RC es donarà cada cop més tard, és a dir, salivarà més tard i,

per tant, augmentarà la seva latència. Finalment es sobreposarien les dues respostes,

la RC i RI).

R RI

EI RC

EC

Tots dos procediments debiliten la RC, no hi ha cap de millor o pitjor.

Page 25: Aprenentatge i Condicionament (Apunts)

25

5.2 Els procediments de presentació temporal dels estímuls

Demora (EC abans de l’EI): és un procediment eficaç per generar condicionament

clàssic. En algun moment del temps han de coincidir els estímuls (mirar imatge).

Traça (huella): interval o període de traça (temps entre les dues presentacions de

l’estímul). Genera condicionament clàssic però, degenera aquest condicionament.

Temporal (presento l’EI cada poc temps però regularment): en aquest cas el temps es

converteix en l’EC i la RC apareixeria just abans l’EI. no hi ha un estímul explícit que

anticipi, sinó un estímul implícit que és l’interval entre la presentació de l’estímul. (ex:

salivació del gos: es presenta cada 5 minuts l’estímul el gos acaba salivant abans

dels 5 minuts). Presentem l’estímul incondicionat en intervals regulars de temps.

Aleatori (presento l’EC i l’EI a l’atzar): en aquest cas, l’EI no té cap relació amb l’EC i la

RC no es donarà (no genera condicionament).

Cap endarrera (retroactiu o retrògrad): primer apareix l’EI (menjar) i després l’EC (so).

Provoca alleujament i es produeix un condicionament inhibitori: l’EC prediu l’absència

de l’EI.

Simultani (presentar al mateix temps l’EI i l’EC): no hi ha unanimitat en aquest

procediment ja que al presentar al mateix temps els estímuls no es produeix

condicionament però, existeixen experiments que han donat resultats de

condicionament inhibitori. Això es pot explicar mirant el final de la presentació de

l’estímul, ja que quan s’acaba l’EC es prediu que l’EI no es continuarà presentant.

5.3 El control experimental

Hem dut a terme un condicionament clàssic: com podem estar segurs que la RC és realment

deguda al condicionament (això és, a l’associació EC-EI), i no fruit de la casualitat o d’un procés

aliè al mateix condicionament?

En els experiments de condicionament clàssic, aquest important problema metodològic

s’afronta comparant els resultats del grup experimental (grup de subjectes als quals

s’administra el condicionament) amb els resultats del grup control (grup de subjectes als quals

es presenten igualment l’EC i l’EI, però sense possibilitat de condicionament).

Page 26: Aprenentatge i Condicionament (Apunts)

26

- El pseudocondicionament

S’utilitza per comparar dos grups per tal de saber si realment hi ha hagut un condicionament.

El que necessitarem serà un grup control. Si en el grup experimental hi ha RC i en l’altre grup

(grup control) també direm que hi ha hagut un pseudocondicionament (aparent

condicionament). Però llavors no podré dir que es una RC sinó que hi ha un

pseudocondicionament.

- Grups de control. S’han proposat diferents estratègies de presentació dels estímuls per al

grup control, les quals es poden utilitzar complementàriament en un mateix experiment:

1. Els procediments de control de l’EC aïllat i de control de l’EI aïllat consisteixen a

presentar al grup de control l’EC sol o bé l’EI sol. Encara que informatius, aquests

tractaments no es poden considerar plenament satisfactoris, ja que els subjectes del

grup control no tenen una experiència amb els dos estímuls comparable a la que reben

els subjectes del grup experimental.

2. Procediment de control vertaderament aleatori del pseudocondicionament: el que

faríem seria un condicionament aleatori, ja que es van posant aleatòriament EC i EI i

no hi ha possibilitat que aparegui condicionament. En principi, això garanteix que els

subjectes del grup control reben un tractament idèntic al dels seubjectes del grup

experimental, excepte per la impossibilitat teòrica d’establir una associació entre EC i

EI. Per això el procediment aleatori no podria ser bo, perquè si el nombre de

presentacions és petit, ja que podem tenir de traça o de demora, que siguin realment

de condicionament (el que volem descartar), per això si hi ha un nombre d’assaigs gran

no hi hauria cap tipus de condicionament i seria un grup de control bo.

3. Procediment control explícitament no aparellat (control desaparellat explícit): es

presenten l’EC i l’EI separats per un període de temps suficient per evitar el

desenvolupament de l’associació.

Control discriminador (inhibició diferencial): es un disseny intrasubjecte; agafo els

subjectes experimentals, tenim dos estímuls EC i EI (so i llum) un associar-lo al menjar i

l’altre no. El primer serà l’experimental i l’altre serà la de control; 30 d’un tipus i 30

d’un altre però en el mateix grup de subjectes. En un assaig presento els dos junts i hi

ha una resposta condicionada per tant, no pot ser-ho i hi haurà un

pseudocondicionament. En un altre participant el que faríem seria contrabalancejar

(canviar els estímuls a l’inversa per tal de descartar o no el condicionament).

Normalment no s’utilitza un aïllat dels procediments sinó més d’una a la vegada.

Page 27: Aprenentatge i Condicionament (Apunts)

27

5.4 Les situacions experimentals de condicionament clàssic

Modernament s’han desenvolupat diferents situacions o tècniques experimentals per a

l’estudi del condicionament clàssic, que han substituït el condicionament salival i altres

preparacions experimentals utilitzades pels pioners en l’estudi del condicionament clàssic.

5.4.1 Condicionament palpebral (tancament de la parpella reflex)/ condicionament de la

membrana nictitant en conills.

Es desenvolupà inicialment als anys seixanta amb subjectes humans, però aviat alguns

avantatges metodològics van fer que es tendís a substituir pel condicionament de la

membrana nictitant en el conill albí, una tècnica desenvolupada principalment per Isidor

Gormezano.

S'associen un EC (so, llum, estímul tàctil) i un EI que provoca de manera reflexa la resposta de

tancament de la membrana nictitant, com ara un buf d'aire o una descàrrega elèctrica lleu.

Tots dos estímuls es presenten durant un temps molt breu amb un procediment de demora

curta. No cal utilitzar cap tècnica de mesura de la RC particular, ja que la latència de la RC és

també molt breu i, consegüentment, no se sobreposa a la posterior RI.

Es tracta d'un condicionament molt lent: generalment cal dur a terme centenars d'assaigs

d'adquisició per assolir un percentatge elevat d'assaigs amb RC.

- EC (que no faci tancar la parpella nictitant, i amb una durada curta)

- EI (un buf a l’ull o descàrrega elèctrica)

Just després de la finalització del so apareix EI. Seria de demora, en un cas extrem. No cal

utilitzar procediments de prova o anticipació. Necessita molts assaigs.

5.4.2 L’automoldejament o seguiment del signe

Observat per P. L. Brown i H. M. Jenkins l'any 1968. Se sol dur a terme amb coloms amb una

motivació de menjar ja que han estats provats de menjar en la caixa d'Skinner.

Els assaigs d'adquisició associen la il·luminació de la tecla amb l'entrega d'una petita quantitat

de menjar (o d'aigua). La RC consisteix que quan la tecla s’il·lumina el colom s'hi aproxima i la

picoteja. Habitualment la força de la RC es mesura per la taxa de resposta (freqüència o

nombre de respostes per minut). La llum on està la tecla ha adquirit un significat informatiu i el

colom segueix aquest signe informatiu i s’apropa a la tecla i la picoteja, però això no vol dir que

Page 28: Aprenentatge i Condicionament (Apunts)

28

quan picoteja aparegui menjar. Ex. En humans mirar les llum pel pis que vas en l’ascensor que

es l’estímul informatiu i el que volem aconseguir es arribar al nostre pis.

S'adquireix amb uns trenta-cinc o quaranta assaigs. Aquesta tècnica mostra com els estímuls

que ens informen de l'aparició de conseqüències rellevants atreuen poderosament la nostra

atenció i n'estimulen el seguiment.

Rep el nom d'automoldejament perquè s'aconsegueix que el colom picotegi la tecla sense

necessitat d'una intervenció elaborada per part de l'experimentador (vegeu el tema 10).

5.4.3 L’aversió condicionada al gust

EC un gust (normalment dolç = aigua amb sacarina i es nou)i l’EI els hi donen una cosa que

provoca malaltia interna; s’agafa als animals i després de haver consumit per primera vegada

la solució amb sacarina i després se’ls els posa la substancia que provoca malestar, amb un

assaig es suficient. Han aprés a relacionar amb aquest gust que els hi provoca malestar, ja no

veuen a penes:

- Es pot aprendre amb un únic assaig.

- S’aprèn amb un interval de temps fins i tot d’hores.

- Es extraordinàriament resistent a la extinció.

5.4.4 El condicionament de la por

Per mesurar la por: tècnica de supressió condicionada o resposta emocional condicionada

(REC) (Estes i Skinner, 1941): les rates quan tenen por es queden “congelades”, sense fer res, i

és aquesta la forma amb la qual es mesura la por. Fan a la rata aprendre a apretar la palanca

quan per tal de tenir menjar (amb condicionament instrumental). Quan l’animal està apretant

la palanca per obtenir menjar es presenta l’EC si l’animal continua apretant la palanca és

que no té por, si deixa d’apretar-la té por.

- EI (descàrrega, xoc elèctric) RI (por).

- EC(so o llum): es presenta durant un temps perllongat (fins 2-3 min).

Normalment s’utilitza un procediment de demora, i la descàrrega és molt curta.

Índex o raó de supressió (A/A+B)

- A: nombre de respostes a la palanca durant l’EC

- B: nombre de respostes a la palanca abans de l’EC.

Page 29: Aprenentatge i Condicionament (Apunts)

29

Interpretació:

0 = màxima por condicionada (supressió total de la resposta a la palanca durant l’EC)

0,5 = absència de por condicionada (no alteració de la resposta a la palanca durant l’EC):

50 vegades

--------------

50 + 50

Entre 3 i 8 assaigs és fàcil adquirir el condicionament a la por.

Totes les situacions en condicionament clàssic són condicionament excitatori perquè l’EC

s’associa amb l’aparició de l’EI.

5.4.5 El condicionament farmacològic

L’EI és un fàrmac o droga, de manera que els seus efectes fisiològics constitueixen la RI.

L’administració de I'EI és precedida sistemàticament per un determinat EC, inicialment sense

cap activitat fisiològica particular. A través del condicionament, I'EC adquireix la capacitat de

provocar una RC relacionada amb els efectes fisiològics del fàrmac.

El condicionament clàssic de les respostes fisiològiques als fàrmacs suposa un de mecanismes

psicològics que podrien explicar l'efecte placebo.

Page 30: Aprenentatge i Condicionament (Apunts)

30

Tema 6: El condicionament clàssic inhibitori

6.1 El concepte de condicionament inhibitori

El condicionament inhibitori apareix sempre que un estímul desconfirma l’expectativa de

conseqüència generada per un altre estímul.

És important poder predir quan no apareixerà un estímul aversiu. La majoria dels estudis sobre

inhibició són sobre condicionament aversiu. Es parla d’aversius perquè la majoria d’estudis

s’han fet amb aquests estímuls.

Perquè hi hagi un condicionament inhibitori cal que la absència de l’EI tingui lloc en un context

excitatori, és a dir, en una situació en la qual el subjecte tingui algun motiu per esperar la

possible aparició de l’EI. L’EC és igualment informatiu i útil per al subjecte tant en el excitatori

com en l’inhibitori. La relació EC-noEI només es informativa si s’espera la presentació d’EI.

6.2 Procediments que generen condicionament inhibitori

6.2.1. Procediment estàndard

Es presenten aleatòriament dos tipus d’assaigs:

A) (excitatori) Si EC no EC + i si EI. B) (inhibitori) Si EC+ Si EC- NO ei

Aquest permet predir el moment precís de l’aparició de l’EI, també permet predir quan no

apareixerà l’EI. Aquest procediment permet la codificació temporal de l’absència de l’EI

Page 31: Aprenentatge i Condicionament (Apunts)

31

6.2.2 Procediment d’inhinició diferencial (o discriminació simple)

Es presenten aleatòriament dos tipus d’assaigs.

A) EC+ i EI en els excitatoris. B) EC- i no EI en els inhibitoris.

El resultat és el mateix que en el procediment anterior.

Tanmateix, tots els procediments difereixen quan a la seva eficiència per generar el

condicionament inhibitori, resultant clarament superior el procediment estàndard. Ja que el

desenvolupament d’un condicionament inhibitori requereix la presència en els assaigs

inhibitoris de claus excitatòries (que generin l’expectativa d’una possible presentació de l’EI),

aquest paper el desenvolupa amb major eficiència l’EC i en el procediment estàndard, que no

pas els estímuls contextuals en el procediment d’inhibició diferencial.

6.2.3 Contingència o correlació negativa entre EC i EI

No hi ha un EC + explícit.

A)situació habitual: no EC+ i si EI. B) si EC- i no EI

Resultat: EC- RC-

Una correlació contingència negativa indica que l’EI és menys probable després de l’EC que en

un altre moment. Per tant, l’EC senyala una reducció de la probabilitat que aparegui l’EI. L’EI

apareix periòdicament aïllat, però l’EC prediu l’absència de l’EI durant un temps.

Page 32: Aprenentatge i Condicionament (Apunts)

32

6.2.4 Procediment de discriminació

En el procediment estàndard i en el procediment d’inhibició diferencial es presenten assaigs

excitatoris i assaigs inhibitoris.

A la discriminació:

- L’EC – s’assembla a l’EC+.

- Els assaigs tenen la finalitat de fer desaparèixer la generalització i en últim terme crear

inhibició.

Als procediments d’inhibició que presenten assaigs excitatoris i inhibitoris:

- No és necessari que l’EC – s’assembli a l’EC+.

- Els assaigs tenen, des del principi, la finalitat de crear inhibició.

6.3 Les tècniques de mesura del condicionament inhibitori

Quan l’EC prediu l’absència de l’EI (EC--->EI). L’EC provocarà alleujament.

EC- RC-

- Quan la RC- origina canvis en l’execució de sentit antagònic o oposat als que origina la

RC+ tècniques directes.

Normalment la resposta condicionada inhibitòria és no fer res, per tant és difícil mesurar-la.

Per això cal utilitzar unes tècniques indirectes:

- Quan la RC- no es manifesta en uns canvis d’execució directament observables i

mesurables tècniques indirectes.

Trobem dos tipus de tècniques indirectes

Page 33: Aprenentatge i Condicionament (Apunts)

33

6.3.1 Prova de sumació (prova de l’estímul compost)

Ex: condicionament salival: so = menjar; llum = absència de menjar. Es fa un assaig en què es

presenta l’EC+ sol, i un segon assaig en què es presenten conjuntament l’EC+ i l’EC-, i es

mesuren en totes dues ocasions la força de la RC.

EC + RC+ (so => salivació de 3ml)

EC+/EC- (simultàniament) RC (< RC+?) (so + llum => menys salivació)

Atribuirem la disminució a la RC inhibitòria degut al condicionament inhibitori previ. Però

podria ser deguda a qualsevol altre factor, com per exemple: la distracció del gos mirant la

llum. És per això que introduïm un altre assaig.

EC+/En RC (=RC+?)

Si en aquest assaig es dóna una resposta reduïda com en l’anterior però amb un estímul

neutre, direm que s’ha produït un pseudocondicionament inhibitori. En canvi, si no es

produeix cap reducció de la RC inhibitòria s’haurà produït el condicionament.

Experiment: Cole, Barnet & Miller (1997)

L’experiment es realitzà utilitzant el procediment de supressió de llepament en rates de

laboratori mitjançant descàrregues. Els resultats afirmen que hi ha una inhibició de la por

condicionada que es limità a l’estímul (X) que havia participat en l’entrenament d’inhibició

condicionada; també els resultats mostren que X fou capaç d’inhibir la por condicionada no

només davant de l’excitador pel que va ser entrenat (A) sinó també davant d’un altre excitador

(B) que mai s’havia presentat junt amb X durant l’entrenament.

6.3.2 Prova de retard en l’adquisició

Es compara el nombre d’assaigs necessaris per condicionar excitatòriament en En nou i

presumpte EC-, tot associant-los en cada cas a l’EI.

En-- > EI: agafo En que no ha participat en el condicionament, fins que esdevingui EC i

provoqui RC (EC+RC+)

En- ->EI EC+ RC+ n assaigs

EC-- > EI EC+ RC+ n assaigs (>En?)

Page 34: Aprenentatge i Condicionament (Apunts)

34

Si l’EC- costa més de condicionar que l’estímul neutre, això vol dir que produïa una resposta

condicionada inhibitòria. Si volem demostrar que ha sigut degut al condicionament inhibitori,

contrabalancegem els estímuls. Hauríem de fer un grup de control.

Si el nombre d’assaigs és similar, no hi ha condicionament inhibitori; si, contràriament, el

nombre d’assaigs és major per l’EC- que per l’En, aquesta diferència s’interpreta com un

indicador indirecte de la força RC-.

En principi, s’aconsella utilitzar simultàniament totes dues proves – sumació i retard- per poder

concloure el caràcter inhibitori d’un estímul condicionat.

Cole i col·laboradors realitzaren un experiment amb aquesta prova.

Page 35: Aprenentatge i Condicionament (Apunts)

35

Tema 7: Variables que afecten l’adquisició del condicionament clàssic

Quines característiques de l’EC i de l’EI fan que es produeixi millor el condicionament.

7.1. La magnitud de l’estímul condicionat

A major magnitud (intensitat i/o durada) de l’EC, major velocitat d’adquisició de la RC; no

afecta pas a l’efecte del condicionament final.

El més important és la discriminabilitat de l’EC: el grau en què sobresurt dels estímuls

contextuals, la perceptibilitat de l’EC en relació als estímuls contextuals.

- Inhibició transmarginal: impediment de l’associació EC - EI amb magnituds de l’EC

excepcionalment elevades. És a dir, amb un estímul molt intens, no es produeix

condicionament.

7.2. La magnitud de l’estímul incondicionat

La magnitud de l’EI afecta tant la velocitat d’adquisició de la RC com el nivell de

condicionament finalment assolit.

A major magnitud (intensitat i/o durada) de l’EI, major velocitat d’adquisició de la RC i també

afecta al resultat final del condicionament clàssic.

El que més afectarà el condicionament clàssic és la magnitud de l’estímul incondicionat.

7.3 La naturalesa de l’estímul incondicionat

Exemple: vídeo del colom picat per a obtenir menjar i aigua.

La naturalesa (“qualitat”) de l’EI pot afectar la topografia o morfologia de la RC. Ex: el colom

posava el bec d’una forma diferent per obtenir menjar que per obtenir aigua.

7.4 La novetat dels estímuls condicionat i incondicionat

L’impacte conductual d’un estímul depèn de la seva novetat. Un estímul familiar no elicita una

resposta tan vigorosa com ho fa un estímul nou (habituació). El coneixement previ dels

estímuls que associarem modifica l’efectivitat del procediment.

La novetat de l’estímul és important pel condicionament clàssic. Si l’EC i/o l’EI són coneguts, el

condicionament clàssic es desenvolupa més lentament que si fossin nous. Observar el paper de

la novetat de l’estímul implica dues fases: la preexposició i el condicionament posterior.

Page 36: Aprenentatge i Condicionament (Apunts)

36

En els experiments de condicionament clàssic, generalment l’EC i l’EI resulten nous per al

subjecte en el moment d’iniciar-se l’experiment. No obstant això, en moltes situacions reals,

quotidianes, de condicionament clàssic, sovint el subjecte ja ha tingut algun tipus d’experiència

amb els estímuls que participen en el condicionament. Com afecta aquesta preexposició dels

estímuls al seu posterior condicionament?

7.4.1 La inhibició latent

Efecte de la inhibició latent (o efecte de preexposició de l’EC): la presentació aïllada de l’EC,

abans del condicionament, dificulta la seva posterior associació amb l’EI.

L’efecte de la inhibició és més fort a major nombre d’assaigs de preexposició i a major

magnitud de l’EC.

La inhibició latent mostra una gran dependència del context: si el context experimental de

preexposició de l’EC no és el mateix en què té lloc el condicionament posterior, l’efect

d’inhibició latent es veu significativament reduït.

La inhibició latent es manifesta tant en el condicionament excitatori com el inhibitori. La seva

interpretació teòrica és: és com si, al presentar-se repetidament sol, l’EC perdés al seva

associabilitat, de forma que la seva adquisició posterior de qualsevol significat senyalitzador

ens resultaria pertorbada (mecanismes d’inferència associativa). Les hipòtesis diverses

d’autors com N.J. Mackintosh, A.R. Wagner o R.E. Lubow van en el sentit anterior. D’altres

autors consideren que en l’explicació dels fenòmens de preexposició també podrien intervenir

mecanismes d’interferència de la memòria, com proposa la hipòtesi del fracàs de recuperació

de R.R. Miller.

Page 37: Aprenentatge i Condicionament (Apunts)

37

Les proves d’inhibició latent s’utilitzen per detectar dèficits d’atenció. Els subjectes amb dèficit

d’atenció no mostren inhibició latent (retard en condicionar-se).

El condicionament aversiu al gust s’assoleix amb un sol assaig. En canvi, si el gust és conegut

(preexposició a l’EC = gust), calen més assaigs.

7.4.2 El bloqueig contextual

El bloqueig contextual o efecte de preexposició a l’EI fa referència a la presentació aïllada de

l’EI, abans del condicionament, dificulta la seva associació posterior amb l’EC. Mostra una gran

dependència del context i la interpretació teòrica que fem és que es considera un cas

particular del fenomen general del bloqueig.

Context A: casa dels avis on sempre tinc caramels al meu abast (EI):

- Ve de visita la senyora A (EC) i em porta caramels (EI). Associació lenta entre senyora

A (EC) i caramel (EI).

Context B: casa dels pares on no tinc caramels al meu abast (EI):

- Ve de visita la senyora A (EC) i em porta caramels (EI. Associació ràpida entre la

senyora A (EC) i el caramel (EI).

7.4.3 La irrellevància apresa

La presentació aleatòria (descorrelacionada) de l’EC i l’Ei abans del condicionament, dificulten

la seva posterior associació.

Page 38: Aprenentatge i Condicionament (Apunts)

38

Com ha demostrat principalment Mackintosh, la irrellevància apresa és més que la suma dels

efectes d’inhibició latent i bloqueig contextual.

La interpretació teòrica que fem és que durant la fase de preexposició el subjecte aprèn que

els dos estímuls són mútuament irrellevants, cosa que dificultaria l’establiment ulterior de

qualsevol tipus de relació predictiva entre ambdós estímuls (excitatòria o inhibitòria).

7.5 L’interval entre estímuls

7.5.1 El concepte de contigüitat temporal

- Interval entre estímuls o interval entre EC-EI. Es pot anomenar de les tres maneres.

7.5.2 Hi ha un interval entre estímuls òptim?

Depèn del tipus de resposta, dels estímuls i de l’especia. NO existeix un punt universal.

L’interval entre estímuls per tant es variable.

Per exemple en el reflex palpebral el nivell òptim entre estímuls seria de 450 milisegons, però

varien el milisegons, i al sortit d’aquí el condicionament es deteriora.

En general, sol ser molt breu (de dècimes de segon a uns pocs segons) entre l’EC i l’EI; sol ser

més breu per condicionament de les respostes musculars que pel condicionament de les

respostes vegetatives. Quan condicionem una resposta muscular l’interval òptim es molt més

curt que en les vegetatives.

7.6 El principi de selectivitat associativa: la rellevància causal o pertinència entre l’EC i l’EI

El principi d’equipotencialitat, defensat per Pavlov, sostenia que qualsevol En tindria la

mateixa facilitat per esdevenir Ec ates a la seva presentació en contigüitat temporal amb un

determinat EI.

Page 39: Aprenentatge i Condicionament (Apunts)

39

Garcia i Koelling van mostrar resultats incompatibles amb els principis d’equipotencialitat. La

<<naturalesa>> de l’EC (el tipus d’EC) pot influir, fins i tot decisivament, en la seva

associabilitat amb un EI concret. Aquests resultats han donat lloc al principi alternatiu de

selectivitat associativa o associació selectiva, segons el qual hi ha parells d’estímuls (EC i EI)

que s’associen amb gran facilitat (fins i tot amb un únic assaig i un IEE prolongat, com la versió

condicionada al gust en rates); d’altres, en canvi, no s’associen o ho fan amb una gran dificultat

(p.ex. estímuls audiovisuals en relació amb malestar intern en rates). En el primer cas, diem

que els EE mostren una elevada rellevància causal o pertinència entre si (mentre que aquestes

serien òbviament baixes en el segon cas). La rellevància causal també depèn, però, de l’espècia

animal amb la qual estem treballant.

Experiment sobre selectivitat associativa (Garcia & Koelling)

Si gust i malaltia van junts, el grup que ha rebut CILi presentarà major aversió a la sacarina que

l’estímul audiovisual TL.

Experiment sobre l’aversió condicionada al gust. Associació selectiva o rellevància causal

(Garcia & Koelling)

Les rates que reben verí CILi disminuirein el consum de sacarina. Les rates que reberen xoc

disminuirien el consum d’aigua brillant i sorollosa. Aquest experiment suggereix que el gust

s’associa més ràpidament amb la malaltia que amb el xoc (dolor perifèric) i que els estímuls

audiovisuals (LS) s’associen més ràpidament amb el dolor/xoc que amb la malatia.

ASSOCIACIÓ SELECTIVA

Page 40: Aprenentatge i Condicionament (Apunts)

40

L’associació selectiva també es dóna en altres espècies. Algunes aus localitzen l’aliment per les

seves característiques visuals, en comptes de per el gust,

En els subjectes que al test podien triar entre aigua blava o normal es provà si manifestaven

aversió al color (propietat visual de l’aliment) i els que reberen aigua amb gust o no normal

l’aversió al gust.

Les rates mostraren una forta aversió al gust agre i poca aversió a les propietats visuals

de l’aliment.

Un patró oposat es pot veure en les aus: forta aversió a l’aigua blava però poca aversió

al gust agre.

L’EC que és condicionat més fàcilment és el que els animals usen per procurar-se

aliment.

Les rates usen gust i olor per procurar-se aliment.

Les aus usen indicis visuals per procurar-se aliment.

Page 41: Aprenentatge i Condicionament (Apunts)

41

7.7 L’interval entre assaig

En general, els intervals entre assaig (IEA) llargs donen lloc a un condicionament més fort. La

durada òptima de l’IEA està en relació a la durada de cada assaig: l’IEA ha de ser notablement

més llarg que l’IEE (efecte de l’aïllament).

Page 42: Aprenentatge i Condicionament (Apunts)

42

Tema 8: Fenòmens especials en el condicionament clàssic

8.1 Contracondicionament

L’En és un EC o un EI (no hi participen En). Els estímuls que poden fer de En són qualsevol

estímul aversiu. S’associa un EC o un EI de valor emocional i/o motivacional contrari.

EI aversiu EI apetitiu. EI apetitiu EI apetitiu

RC apetitiva (apareix una R de signe contrari) RC apetitiu

El contracondicionament és més lent que el condicionament directe amb un En.

Experiment de Konorski i Szwejkowska

Resultats del contracondicionament (Konorski i Szwejkowska, 1956)

Tractament basat en el contracondicionament

Desensibilització sistemàtica: Associació

d’un EC aversiu (ansiogen) amb un

estímul (EI) que provoca una resposta de

tranquil·litat i relaxació.

Page 43: Aprenentatge i Condicionament (Apunts)

43

Aquesta RC apetitiva apareixerà sempre i quan la R esperada pel primer estímul sigui menor a

la R generada pel segon.

Ítems utilitzats en un tractament de desensibilització sistemàtica (cas de persona que li

provoca ansietat volar- Els ítems estan presentats per nivell d’ansietat que creen en el

subjecte):

1. Em diuen que he de fer un viatge

2. Cada vegada falta menys pel viatge

3. Estic preparant les maletes

4. Agafo el cotxe per anar a l’aeroport

5. Sóc a l’aeroport

6. Em criden per embarcar

7. Estic asseguda a la butaca de l’avió

8. Durant el vol

9. S’enlaira l’avió

10. Aterra l’avió

8.2 Condicionament de segon ordre

No cal usar EI, s’utilitza un EC. Presentem un estímul inicialment neutre (EC2) seguit per un EC1

i la conseqüència és que l’EC2 provoca una RC2. L’EC1 prové d’un condicionament previ, és a

dir, tot condicionament de segon ordre prové d’un condicionament previ. S’acaba aprenent

que EC2 està associat amb l’EI de la fase 1.

Page 44: Aprenentatge i Condicionament (Apunts)

44

Molts assaigs en la fase 2 deteriora la RC2 perquè en aquesta fase, es presenta un EC1 que

provoca un RC1 intensa i en la segona fase ja no es present l’EI de la fase 1, per tant, es perd

força. Són possibles condicionaments de tercer i quart ordre (apareixen principalment en

condicionaments aversiu).

A la nostra vida hi ha molts EC poderosos i significatius. És difícil concebre que cada un hagi

desenvolupat la seva força després d’haver-se associat amb un EI. Molts poden haver adquirit

la seva força a través del condicionament de segon ordre, és a dir, associant-se amb un altre EC

fort, no amb un EI.

Aquest condicionament proporciona un mecanisme per establir associacions sense necessitat

de presentar EI.

RC2 similar a RC1 (menys forta).

La màxima RC2 (condicionament de segon ordre) apareix després de pocs assaigs (si

augmentem el nombre d’assaigs, RC2 es debilita): a cada assaig l’EC2 és associat a un

EC1 (...)

Variables d’aquest condicionament:

A. La magnitud de l’EI;

B. L’interval entre estímuls EC1/EI i EC2/EC1;

C. La similitud entre els EC de primer i de segon ordre;

D. La contigüitat espacial entre EC2 i Ec1 afavoreix el condicionament de segon ordre.

Experiment Rizley i Rescorla

Page 45: Aprenentatge i Condicionament (Apunts)

45

8.3 Precondicionament sensorial

L’associació es pot establir entre dos E neutres. Mostra que és possible l’associació entre dos

estímuls qualsevol.

A la fase 1 s’assoleix un aprenentatge latent o un condicionament sense RI manifesta.

S’aprèn que: EC1 EC2 EI

Com a conseqüència: EC1 RC1

FASE 1 FASE 2 PROVA

En1 En2 EC2 EI EC1 RC1

La possibilitat d’associar estímuls neutres amplia el rang d’elements ambientals que poden ser

associats. Igual que el condicionament clàssic.

Variables:

A. A la fase 1 (associació Eneutres) l’interval òptim entre estímuls ha de ser curt (4 segons

aprox.). Millor si coincideixen en part.

B. La força màxima del precondicionament s’assoleix en pocs assaigs, com en el cas de

condicionament de segon ordre (quatre associacions entre Eneutres aprox.)(habituació

amb més?).

C. La motivació (gana, set) durant el precondicionament afavoreix l’associació entre els

En.

Aquest procediment té dos resultats:

1) el primer, completament previsible, és el condicionament del'EC2: EC2 RC2.

Page 46: Aprenentatge i Condicionament (Apunts)

46

2) el segon, potser més inesperat, és que, si ara presentem de nou el primer estímul

(En1), també aquest provocarà la nova resposta condicionada: ECl RC1.

Què ens indica aquest segon resultat? Posa de manifest en l'execució l'aprenentatge que

realment havia tingut lloc durant la primera fase del precondicionament sensorial (un

aprenentatge latent o un condicionament sense RI manifesta).

I què havia aprés el subjecte en aquesta primera fase? Com és habitual en el condicionament

clàssic, l'existència d'una relació predictiva entre els estímuls, és a dir, que el primer estímul

(EC1) prediu l'aparició del segon (EC2). Mentre el segon estímul no provocava cap resposta

biològica potent (fase 1), aquest aprenentatge restava latent; però, quan s'ha condicionat

aquest segon estímul amb un EI potent (fase 2), l'aprenentatge s'ha traduït finalment en

execució: l'EC1 indica la propera presentació de l'EC2, el qual genera l'expectativa de I'E1,

donant així lloc a l'aparició de la RC1.

Entre les variables que afecten el precondicionament sensorial es troben: c) L’interval entre

estímuls, òptim en diferents situacions de condicionament prop d'uns 4 segons durant la fase l;

i b) el nombre d'assaigs, tot assolint el precondicionament sensorial la seva força màxima amb

uns quatre assaigs de condicionament a la fase I (amb més assaigs es donaria una habituació

de les respostes d'orientació als estímuls neutres).

El precondicionament sensorial és també un fenomen important des d'un punt de vista pràctic,

ja que mostra la possibilitat d'associació entre dos estímuls qualssevol, encara que cap

d'aquests no provoqui una resposta biològica intensa (p. ex., imatges o paraules en humans).

Experiment: Control del precondicionament sensorial (Rizley i Rescorla, 1972)

8.4 El condicionament amb estímuls condicionats compostos

El condicionament amb estímuls condicionats compostos fa referència a les situacions de

condicionament clàssic -comunes en la pràctica- en què l'EC no és un únic estímul, sinó un

conglomerat de diversos estímuls que es presenten simultàniament, i que formen el que

s'anomena un estímul condicionat compost.

Page 47: Aprenentatge i Condicionament (Apunts)

47

Suposem que duem a terme un procediment de condicionament d'un EC compost format per

dos elements (EC1/EC2):

EC1/EC2 ---> EI R1

En principi, el resultat teòricament esperable d'aquest procediment seria un condicionament

similar dels diferents elements que configuren el compost, de forma que cadascun d'ells

adquiriria una part proporcional de la força associativa total:

ECl RCl (RC total / 2)

EC2 RC2 (RC total / 2)

EC1/EC2 RC total (RC1 + RC2)

La RC total constitueix un valor invariable, de tal manera que si posteriorment al

condicionament amb l'EC compost s'alteren el valor predictiu i la força de la RC corresponents

a un dels elements del compost (p. ex., associant-lo en solitari amb l'EI, o extingint-lo), l'altre

element veurà automàticament corregida la força de la seva RC en sentit contrari.

8.4.1 L’emmascarament

L'emmascarament constitueix una excepció (d'altra banda, prou freqüent) del resultat general

que tot just acabem d'enunciar: en l'emmascarament únicament es condiciona un dels

elements del compost, el qual, al mateix temps, impedeix el condicionament dels altres

elements. És a dir, que, tot i que si aquests altres elements s'haguessin associat en solitari amb

l'EI s'haurien condicionat amb tota normalitat, la presència simultània en el compost de

l'element <<emmascarador>> n'impedeix el condicionament.

Per tant, podríem representar el resultat de l'emmascarament de la forma següent:

EC1 RC1 (RC total)

EC2 no RC

EC1/EC2 RC total (RC1).

Quan es produeix emmascarament? Quan un dels elements del compost és: a) més intens (o

més discriminable); o b) té major rellevància causal amb I'EI.

Page 48: Aprenentatge i Condicionament (Apunts)

48

8.4.2 El bloqueig

En el bloqueig, el condicionament previ d'un dels elements de l'EC compost impedeix el

condicionament dels altres elements.

Es tracta, per tant, d'un procediment en dues fases:

- En la primera fase s'associa en solitari un element de l'EC compost (EC1) amb l'EI, fins a

assolir el seu condicionament asimptòtic (màxim):

ECI ---> EI RI.

Com a resultat:

EC1 RC1

En la segona fase s'associa l'EC compost complet amb el mateix EI:

EC1/EC2 ---> EI RI

El resultat és que es manté el condicionament del primer element, mentre que el segon no es

condiciona:

EC1 RC1

EC2 no RC.

Anàlisi del bloqueig

- Anàlisi teòrica: segons Kamin, perquè l’EC i l’EI s’associïn, l’EI ha de constituir un

esdeveniment inesperat o “sorpresiu”. Només així estimularà l’<<esforç mental>> (cognitiu)

necessari per a la formació de l’associació EC - EI. Recordar que en la fase II del bloqueig, l’EI ja

no serà tan sorpresiu perquè en la fase I s’haurà produït un condicionament clàssic i, per tant,

l’EC1 prediu l’EI. No s’estimularà llavors l’adquisició del condicionament en l’EC2.

Existeix un fenomen que dóna suport empíric a aquesta concepció (EI sorpresiu) anomenat

desbloqueig. En la segona fase, modifiquem alguna característica de l’EI (més intents, més

dèbil...) i per tant, l’EI tornarà a ser sorpresiu i es donarà el condicionament (EC1 RC1; EC2

RC2)

Recordatori: L’estímul incondicionat ha de ser un fet rellevant. Si un EI no és rellevant, no

podrà produir condicionament.

Page 49: Aprenentatge i Condicionament (Apunts)

49

8.4.3 El condicionament serial

- Definició: presento els elements del compost (EC) de forma seqüencial o successiva.

- Procediment: EC1- - > EC2 - -> EI RI

- Resultat:

L’EC que més es condicionarà serà l’EC1 ja que hi haurà més valor informatiu i predomina el

valor informatiu per sobre de la contigüitat temporal.

L’EC1 es condiciona més que si no s’hagués presentat després l’EC2 (potenciació). Si

no es presentés l’EC2 es donaria un procediment de traça, ja que hi ha un interval de

traça entre l’EC1 i l’EI. Exemple: temps d’espera de notícies importants que generen

patiment l’EC2 ens fa de pont i genera la percepció de que el temps d’espera no és

tan llarg.

L’EC2 es condiciona menys que si no s’hagués presentat abans l’EC1 => contigüitat

temporal vs valor informatiu.

Page 50: Aprenentatge i Condicionament (Apunts)

50

Tema 9: Anàlisi teòrica del condicionament clàssic

9.1 Introducció

9.2 Les condicions de l’aprenentatge. Quan s’aprèn?

- La contigüitat temporal. Per Paulov, l’EC era un “substitut” de l’EI, podrem afirmar que la

seva teoria era bàsicament mecanicista: pel simple fet de posar dos estímuls (l’EC o En amb

l’EI) temporalment junts es produïa un condicionament. Llavors, el nivell de condicionament

adquirit per l’EC depèn de:

1. La durada del interval EC - EI.

2. El nombre d’aparellaments/assaigs EC - EI (quantes vegades l’EC es seguit per l’EI)

o EC - -> EI (Adquisició; condicionament excitatori)

o EC

Limitacions (degut a fenòmens que es van descobrir als anys 60 després de Paulov) a la

contigüitat temporal com a condició:

1. Necessària: en el cas de l’aversió condicionada al gust no és necessari que es doni la

contigüitat temporal ja que es presenta el gust i en 30 minuts es dóna l’EI.

2. Suficient: en el del condicionament serial, el bloqueig i el emmascarament es dóna

contigüitat temporal però no un condicionament. El procediment simultani seria

també un exemple (no hi ha condicionament encara que els dos estímuls es presenten

a l’hora).

Robert A. Rescorla (1968): la presentació no senyalada de l’EI deteriora el

condicionament. Paulov només considerava la presentació de l’EC amb l’EI o només el

EC, en Robert tenia en compte també la presentació de l’EI sol. Lo important no és la

contigüitat temporal sinó el valor predictiu (informatiu) d’aquest.

=> p(EI/noEC), això ens informa, en un condicionament clàssic, que l’EI no està

associat amb l’EC ja que aquest primer es presenta sol, sense l’EC.

=> Valor predictiu de l’EC.

- El principi de la contingència (Rescorla, 1968)

Contingència: Probabilitat de l’EI amb presència de l’EC contrastada amb l’EI amb la no

presència de l’EC. Només hi haurà condicionament si les dues probabilitats difereixen.

1. Contingència positiva: p(EI/EC) > p’(EI/noEC).

P (EI/EC) = 1

Page 51: Aprenentatge i Condicionament (Apunts)

51

Condicionament excitatori: serà màxim quan la p sigui 1 i la p’ sigui 0. Si la p és 0’7 i

la p’ és 0’3, existirà condicionament excitatori però menys que en el primer cas. La

força del condicionament excitatori serà més fort quan més allunyades estiguin les

probabilitats.

2. Contingència negativa: p (EI/EC) < p’(EI/noEC)

Condicionament inhibitori. Sempre que la primera probabilitat sigui menor que la

segon, l’EC predirà una absència de resposta i es produirà una inhibició (un

alleujament en el cas de la descàrrega ja que per exemple, el so pot indicar l’absència

de l’EI).

3. Contingència nul·la (o zero): P(EI/EC) = p’(EI/noEC)

Absència de condicionament (impredictibilitat).

Espai contingencial:

P(EI/noEC) No cond (impredictibilitat)

Cond. Inh Cond. exc

P(EI/EC)

La teoria de la contingència té limitacions: el bloqueig (en l’EC2 es presenta l’EI però no hi ha

RC encara que sí que hi ha una contingència positiva), per solucionar això, afegim a la idea de

Rescorla la de Kamin, que l’EI sigui sorpresiu. (Mirar la resta de limitacions en Domjan).

Podem concloure que per a que hi hagi condicionament clàssic:

- Contigüitat temporal

- Contingència

(- El component sorpresiu en EI)

Page 52: Aprenentatge i Condicionament (Apunts)

52

Exercicis

1.

Variables Hospital 1 Hospital 2 Hospital 3 Hospital 4

TLP (EI) després

abusos sexuals

(EC)

70% 80% 20% 50%

No TLP després

d’abusos sexuals

30% 20% 80% 50%

TLP sense

abusos sexuals

20% 80% 70% 30%

- Quina/es variables són necessàries per determinar la capacitat predictiva dels abusos sexuals

en la incidència de TLP? La 1 (probabilitat de patir TLP després de patir abusos) i la 3

(probabilitat de patir TLP sense abusos sexuals).

- En quin dels 4 hospitals els abusos sexuals prediuen millor la incidència de TLP? En l’hospital

1 ja que la diferència entre les dues probabilitats (presentar TLP en funció dels abusos sexuals)

és major que la resta (0’7-0’2=0’5).

- Quina conclusió podem treure pel que fa a la relació entre els abusos sexuals i la incidència

de TLP a l’hospital 2? I a l’hospital 3? En l’hospital 2, els abusos sexuals no tindrien res a veure i

la contingència seria nul·la. En el cas de l’hospital 3, la contingència seria negativa perquè la

primera probabilitat és més petita que la segona.

9.3 Els mecanismes l’aprenentatge. Com s’aprèn?

El model de Rescorla i Wagner: Parteix de la idea de Kamin de que l’efectivitat d’un EI ve

determinada pel seu grau de “sorpresivitat” .(QUANT podem aprendre: com més sorprenent

sigui la EI, més i millor serà processat pel subjecte, de manera que més força associativa

adquirirà l’EC). El que s’aprèn en un assaig de condicionament clàssic és: El que podem

aprendre (depèn de la sorpresivitat del EC)–el que sabem ja (força associativa que ja adquirit

aquest EC).

Page 53: Aprenentatge i Condicionament (Apunts)

53

Increment ( ) de força associativa (V) de l’EC (A) en un assaig determinat (n). *EI:1+ *Y= el

màxim que s’aprendrà+ Els estímuls que son salients (discriminalitat i rellevància causal)

s’associen amb gran facilitat A la formula ho fa amb constants αA β1.

VAN= αA β1 (Y1 -VA ). Quan tenim tot l’aprenentatge, la diferència serà 0.

Exemple: Seguiment del signe (llum menjar). αA= 0.5 β1= 1 i Y1= 10 (10 respostes

per minut es el màxim de respostes que es pot donar en aquesta situació.

Calcula l’increment de la força associativa del llum en els cinc primers assaig de

condicionament.

AVAN = 0.5* 1 (10-0)=5 Va1=5

AVAN= 0.5*1 (10-5)=2.5 Va2=7.5

AVAN= 0.5*1 (10-7.5)= 1.25 Va3=8.75

AVAN= 0.5*1 (10-8.75)=0.625 Va4=9.375

AVAN=0.5*1 (10-9.375)=0.3125 Va5=9.6875

Aquest model explica molts fenòmens, com per exemple:

El límit asimptòtic de l’aprenentatge (que arribi un moment que no es pot aprendre

més)= Quan Va = Y1.

El bloqueig: l’EI ja resulta predit per l’estímul prèviament condicionat (VA= Y1) de

manera que, (Y1-VA+B)= 0.Com que el primer ja ha adquirit tota la força associativa, B

no es condiciona.

L’extinció: l’EC genera excés d’expectativa de l’EI (Va> Y1= 0), de manera que l’EC perd

valor associatiu fins que aquest arriba a 0. En un primer assaig el resultat serà negatiu,

i la força associativa s’anirà reduint. EN una extinció Y1 serà 0 (mínim aprenentatge).

Però en l’extinció, mai serà 0 (no es perd l’aprenentatge del tot, perquè si el tornem a

condicionar, serà més fàcil).

Aquest model ha permès descobrir fenòmens: Per exemple, la sobreexpectativa: Ex:

Seguiment del signe (llum verd 1 bola de menjar). De forma independent, faig un altre

associació (llum vermell 1 bola de menjar). Segons la lògica, fi faig un assaig amb llum verd i

vermell, el subjecte predirà dues boles de menjar.

Page 54: Aprenentatge i Condicionament (Apunts)

54

El model de Rescorla i Wagner ens prediu que quan faci un assaig amb el compost la resposta

serà 1 bola de menjar, Pero el subjecte predirà 2, i això ens donarà resultat negatiu. La força

associativa s’anirà reduint. *Reducció del valor associatiu de dos EECC, prèviament associats de

forma independent amb un mateix EI, quan aquests se segueixen presentant com a EC

compost associat a aquell mateix EI].

9.4 Els continguts de l’aprenentatge. Què s’aprèn?

Quin és el contingut que s’aprèn del condicionament clàssic? En la visió tradicional de Pavlov,

els continguts de l’aprenentatge s’expliquen d’una forma mecànica: presentem un EC seguit en

contigüitat d’un EI (de forma innata provoca una RI) i el fet de posar-los junts succeeix que les

propietats de l’EI es traslladen a l’EC, és a dir, l’EC provoca una RC.

El condicionament clàssic com a:

Noves connexions entre estímuls i respostes (aprenentatge E-R) Connexionisme.

Noves associacions entre estímuls (aprenentatge E-E) Cognitivisme. L’EC adquireix

la capacitat de generar l’expectativa de que a continuació apareixerà EI. Aquesta

expectativa genera la RC. L’EC genera una representació mental de l’EI.

Els experiments de devaluació de l’EI: Holand i Rescorla (1975) (Domjan pp. 108-109)

Grup Fase 1 Fase 2 Fase Prova

Experimental To (EC) - - > menjar (EI)

To (EC) augment activitat motora (RC)

Els deixem menjar

el que vulguin

To (EC)

disminució

RC?

Control To (EC) - - > menjar (EI)

To (EC) augment activitat motora (RC)

--- To (EC) RC

Com que els so no té una ubicació espacial concreta, la forma de la rata a prestar atenció a l’E

informatiu, és moure’s. Saciant els animals (fase 2 grup experimental) fa que es predi el valor

informatiu de l’EC. Segons la RC en la fase de prova, podrem observar quin tipus d’associació

han après els animals.

Segons el model E-E, la presentació de l’EC activa la imatge de l’EI, la qual desencadena

una resposta que, en produir-se davant la presència de l’EC, esdevé la Rc. El resultat

dels experiments sobre els efectes de la devaluació de l’EI donen suport als postulats

d’aquest model.

Page 55: Aprenentatge i Condicionament (Apunts)

55

Si han après una associació entre estímuls, si la visió cognitiva és certa, el so generarà

l’expectativa de que a continuació apareixerà menjar. Quan el menjar tenia valor, es

movien, però ara que estan saciats, els animals no es mouran.

El RC baixa, per tant: condicionament clàssic = aprenentatge E-E (cognitivisme).

Hi ha excepció: el condicionament de segon ordre. En aquest, associem Ec1 - - > EI; en la fase

22 agafem EC2 - -> Ec1; per tant EC2 RC2- Què passarà amb aquest condicionament de

segon ordre, si llavors presentem l’EC1?

- Si l’EC2 RC2 és perquè hem après que l’EC2 anticipa EC1, i aquest anticipa l’EI. Per tant,

sabem que EC2 anticipa EI. Si extingim la RC de primer ordre, també3 s’hauria d’extingir la de

segon ordre (cognitivista).

9.5 Els determinants de l’execució.

Quins factors expliquen per què apareix una RC i no una altra?

Model de substitució de l’estímul (Pavlov): l’EC es converteix en un substitut de l’EC i provoca

una RC que no és la mateixa que produïa l’EI.

D’acord amb Pavlov, quan es presenta un EI, hi ha un àrea neuronal específica que processa

aquest estímul i de forma innata (conducta reflex – Arc reflex) es processat pel sistema nerviós

i dóna lloc a una RC.

Si presentem un En, aquest serà processat per una altra àrea del cervell però no es presenta la

RI. En el cervell es formen noves connexions degut a la presentació de l’En i l’EI contigus

(recordar la contigüitat estimular) que donen com a resultat un connexió entre l’EC i la

resposta que dóna l’EI, és a dir, EC RC.

Als anys 70, Siegel realitzà experiments amb rates aplicant morfina i produint així un efecte

incondicionat analgèsic. El que fa és, abans d’injectar la morfina, presentar a la rata un so i un

llum i tot seguit la morfina. Una vegada s’associa, fa un assaig de prova i presenta només l’EC.

El resultat és contrari a la teoria de Pavlov, és a dir, les rates presenten hiperalgesia (més dolor

enlloc de analgèsia).

El problema d’aquest experiment és que està mal definit. La psicologia estudia processos

mentals i conductes. Aquests experiments (també el de la glucosa) no es basen en processos

mentals sinó en bases fisiològiques i respostes fisiològiques. Això no és psicologia, perquè no

es basa en processos psicològics. Exemple glucosa corregit:

Page 56: Aprenentatge i Condicionament (Apunts)

56

(glucosa ) Augment de sucre (EI) alliberació insulina i disminució de sucre (RI)

EC (glucosa ) Augment sucre (EI) alliberació insulina i disminució de sucre (RI)

EC alliberació insulina i disminució del sucre (RC)

El condicionament farmacològic va semblar que es contraposava el model de substitució de

l’estímul, però realment, l’efecte que es produeix de forma condicionada és la resposta

fisiològica. Moltes vegades, les drogues i fàrmacs produeixen desviacions de l’equilibri

homeostàtics i el cervell produeix correccions, aquesta correcció homeostàtica seria la

resposta condicionada.

Per exemple, en el cas de les drogues: quan una persona es pren una droga en un determinat

context i ho fa de manera repetida, quan deixa de prendre la droga i es troba en el context

determinat, la resposta no serà la mateixa que el fàrmac sinó la síndrome d’abstinència.

La tolerància a les drogues, a part de tenir una base farmacològica, té base psicològica. Quan

es consumeix la droga en un ambient determinat de manera repetida, l’ambient produeix la

síndrome d’abstinència però l’efecte de la droga canviarà i acabarà sent menor si segueix

prenent la droga en aquest ambient.

Siegel va proposar: una persona consumeix heroïna en els mateixos llocs amb els mateixos

estímuls contextuals sempre, cada cop la droga produeix un efecte menor i la persona ha de

consumir més. Va comprovar que en un ambient diferent de l’habitual, amb la dosi gran, en

consumir la droga moria per sobredosis perquè no tenia els mecanismes compensatoris dels

estímuls contextuals sempre presents.

Malgrat que es coneixen diferents aspectes de l’EC i l’EI que semblen actuar com a

determinants de la forma que adquirirà la RC, cap teoria actual no pot explicar

satisfactòriament com interactuen entre si, ni tampoc no pot explicar el complex conjunt de

resultats de què disposa. Un element que pot ajudar a comprendre una mica millor per què

manifestarà una RC o una altra en un condicionament clàssic és el que s’anomena teoria dels

sistemes de conducta (Timberlake).

Segons aquesta teoria, el procediment de condicionament clàssic activa el sistema de conducta

relacionat amb l’EI que s’utilitza. Aquest enfocament posa l’èmfasi en els aspectes evolutius

(teoria ecològica i adaptatius de l’aprenentatge: un EI alimentari activarà el sistema

d’alimentació, i un EI aversiu activarà el sistema de defensa. Com que aquests sistemes

impliquen diferents conductes integrades, l’EC podrà donar lloc a una (o més) d’aquestes

conductes, en funció d’altres paràmetres com, per exemple, l’interval EC-EI. D’aquesta

Page 57: Aprenentatge i Condicionament (Apunts)

57

manera, un mateix EC i un mateix EI presentats amb un interval entre estímuls diferents,

poden donar lloc a respostes condicionades diferents.

Page 58: Aprenentatge i Condicionament (Apunts)

58

Tema 10: Condicionament instrumental

10.1 Introducció al condicionament instrumental

El condicionament instrumental és el segon tipus d’aprenentatge associatiu. Mentre que en el

condicionament clàssic s’aprèn, bàsicament, una associació predictiva entre l’EC i l’EI, en el

condicionament instrumental l’associació que s’estableix és entre una conducta o resposta i les

seves conseqüències (associació resposta-conseqüències). Així doncs, en el condicionament

instrumental és necessari que aparegui una conducta que faci d’instrument per aconseguir que

es donin una sèrie de fets consegüents. Per tant, el condicionament instrumental permet

aprendre a controlar l’aparició d’unes determinades conseqüències ambientals.

L’estudi del condicionament instrumental ens permetrà conèixer les particularitats d’aquestes

conseqüències i els canvies que provoquen sobre la probabilitat d’aparició de la conducta.

10.2 Antecedents històrics del condicionament instrumental: E. L. Thorndike (1874-1949) i B.

F. Skinner (1904-1990)

Thorndike i la llei de l’efecte

Thorndike va ser pioner en l’estudi experimental del condicionament instrumental amb

animals. Els seus primers estudis tenien com a objectiu demostrar que els animals no utilitzen

el raonament per sortir-se de determinades situacions, sinó que simplement aprenen per

assaig i error.

Tot i que, inicialment, en els seus treballs va utilitzar pollets que havien de resoldre laberints

construïts amb llibres, els experiments més sistemàtic els va dur a terme en les anomenades

caixes problema dissenyades per ell mateix. Eren caixes de fusta on situava un gat privat de

menjar, i aquest havia d’aprendre quina era la resposta més adequada perquè s’obrís la porta

de la caixa i en conseqüència pogués accedir al plat de menjar situat a l’exterior. Thorndike

registrava el temps que trigava l’animal a fer la resposta correcta i, a continuació, el tornava a

tancar dins de la caixa.

Els resultats van mostrar una disminució gradual de les latències de resposta, i aquest procés

gradual d’aprenentatge va se interpretat per Thorndike com un aprenentatge per assaig i error

on una de les respostes realitzades dóna lloc, per atzar, a unes conseqüències satisfactòries. A

més a més, va inferir que aquestes conseqüències satisfactòries servien per enfortir,

gradualment, una hipotètica associació entre l’estímul de l’interior de la caixa i la resposta

correcta.

Page 59: Aprenentatge i Condicionament (Apunts)

59

Aquest aprenentatge associatiu entre l’estímul i la resposta configura la base de la llei de

l’efecte formulada per Thorndike l’any 1891: si una resposta executada en presència d’un

estímul va seguida d’un fet satisfactori, l’associació entre l’estímul i la resposta s’enforteix. Si la

resposta va seguida d’un fet molest, l’associació es debilita.

Skinner i la llei del reforçament

Skinner va formular a partir de la llei de l’efecte, la llei del reforçament, amb el propòsit de

mesurar i objectivar al màxim tant la resposta instrumental com les conseqüències derivades

d’aquesta. Segons aquesta llei, els organismes aprenen a fer determinades conductes en

certes situacions perquè aquestes conductes han estat seguides de conseqüències agradables

per l’organisme (reforçament). Una conducta que ha estat reforçada, augmentarà la seva

probabilitat d’ocurrència en el futur.

Skinner va posar en pràctica la llei del reforçament instaurant el procés de condicionament

operant amb la gàbia dissenyada per ell mateix i anomenada caixa d’Skinner. Aquesta gàbia

possibilitava que animals com la rata o el colom aprenguessin a executar una conducta nova

(pitjar una palanca o picotejar un disc, respectivament) sempre que la conseqüències

d’aquesta conducta fos la presentació de menjar.

Els aspectes més destacats de la caixa d’Skinner són: una palanca amb un mecanisme

incorporat el qual permetrà que, automàticament, cada cop que és accionada la palanca es

dispensi una petita fracció d’aliment que apareixerà dins de la menjadora situada al costat. La

caixa d’Skinner també disposa d’un mòdul addicional que fa el registre gràfic i acumulatiu tant

de la freqüència de resposta de l’animal, com de l’administració del menjar al llarg d’una

sessió.

10.3 Procediment de condicionament operant i la gàbia d’Skinner

La caixa d’Skinner està composada per:

Manipulandum: la tecla o palanca que s’acciona.

Dispensador: “pellet” (mejar-boletes).

Menjadora.

Registre acumulatiu: aparell fora de la gàbia que representa gràficament la taxa de

respostes per minut.

Page 60: Aprenentatge i Condicionament (Apunts)

60

Les respostes es van acumulant. Podem llegir el pendent. Si la taxa de resposta és alta, la

pendent serà pronunciada (i viceversa).

Un procediment típic de condicionament operant amb una rata consta dels passos següents:

1. Privació: l’animal ha d’haver estat privat de menjar fins que es trobi al 80% del seu pes

habitual.

2. Adaptació a la gàbia: se situa l’animal dins de la gàbia d’Skinner per tal d’habituar les

respostes d’orientació, i establir una línia base operant abans de començar el

condicionament.

3. Entrenament al dispensador de menjar: en aquesta fase, l’animal aprèn una associació

clàssica entre el so (EC) que emet entre el mecanisme dispensador del menjar, i la

presència de l’aliment (EI) dins de la menjadora.

4. Moldejament per reforçament diferencial de les aproximacions successives: és el que

s’ha d’aplicar quan volem instaurar un reforçament. Des de conductes inicials (que

l’animal sí que fa), anem reforçant-se fins obtenir la conducta final desitjada.

Fem aproximacions successives (experiment rata):

a. Primer apropar-se al menjador.

b. Ficar el morro.

c. Tocar la palanca amb les potes.

d. Apretar la palanca amb prou força.

Un cop observem taxa de resposta alta en la primera (apropar-se al menjador), passem

a la segona conducta (ficar el morro). És a dir, anem realitzant aproximacions

successives.

10.4 Anàlisi dels elements del condicionament instrumental

10.4.1 La resposta instrumental: R o RC

Podem condicionar instrumentalment molts tipus de conceptes: respostes condicionades,

cognicions (imaginació), respostes fisiològiques,etc.

Page 61: Aprenentatge i Condicionament (Apunts)

61

10.4.1 Les conseqüències de la resposta

Existeixen dos efectes:

- Reforçament: Els estímuls que segueixen a una resposta operant, que l’efecte que tinguin

sigui reforçar (enfortir) la resposta. Existeix, llavors, l’estímul reforçador: qualsevol

esdeveniment que augmenta la freqüència futura d’emissió de la resposta a la qual segueix.

Qualsevol estímul no és un estímul reforçador, serà reforçador quan el presentem i la

conducta posterior augmenti de freqüència.

- Càstig: En aquest cas, la presentació dels estímuls que segueixen una resposta operant

produeixen un efecte contrari al reforçament, és a dir, disminueixen la freqüència de la

resposta. Per tant, la conducta es fa menys probable.

10.4.3 Tipus d’estímuls reforçadors

- Estímuls incondicionats/primaris/innats: Existeixen estímuls que, sense necessitat de cap

aprenentatge previ, actuen com a reforçadors. Per tant, actuen de manera innata.

- Estímuls condicionats/secundaris/apresos: Aquest tipus d’estímuls provenen d’un

aprenentatge previ, és a dir, d’un condicionament clàssic a partir d’estímuls reforçadors

primaris.

- Estímuls generalitzats: són estímuls reforçadors apresos però, a diferencia dels secundaris,

no han estat a un estímuls reforçador primari sinó a més d’un.

10.5 Procediments bàsics de condicionament instrumental

Els quatre procediments bàsics de condicionament instrumental es classifiquen en funció del

tipus d’estímul que es manipuli (apetitiu o aversiu) i del fet que aquest tipus d’estímul es

presenti o es retiri com a conseqüència de la resposta realitzada (contingència positiva o

contingència negativa).

E. APETITIU (conductes

d’apropament)

E. AVERSIU (conductes de

rebuig)

PRESENTACIÓ (contingència

positiva)

Reforçament positiu (augment de la

conducta operant)

Càstig positiu (disminució de la

conducta operant)

RETIRADA/NO PRESENTACIÓ

(contingència negativa)

Entrenament per omissió/Càstig

negatiu (disminució de la conducta

operant)

Reforçament negatiu: Fugida o

Evitació (augment de la conducta

operant)

Page 62: Aprenentatge i Condicionament (Apunts)

62

Recordar: Un estímul pot ser aversiu o apetitiu i es pot presentar o no però, un no-E apetitiu

no vol dir un E aversiu, i un no-E aversiu no és un E apetitiu.

Exercici

- Caminar mirant a terra (conducta operant o instrumental) i trobar un bitllet de 50 €

(conseqüència).

Contingència positiva => Reforçament positiu.

- Agafar un camí alternatiu (conducta operant o instrumental) quan sentim la ràdio que més

endavant ens trobarem un embús (el no embús és la conseqüència).

Contingència negativa => Reforçament negatiu => Evitació.

- Fer tard (conducta operant) a una cita i trobar-nos que l’altra persona ha marxat

(conseqüència).

Contingència negativa => càstig positiu.

- Treure un tema de conversa (conducta operant) i rebre crítiques (conseqüències).

Contingència positiva => Càstig positiu.

- Administrar-se un heroïnòman una dosi per deixar de patir la síndrome d’abstinència.

Contingència negativa => càstig negatiu => Fugida.

Page 63: Aprenentatge i Condicionament (Apunts)

63

Tema 11: El reforçament positiu I: procediments i variables

11.1 Procediments i mesures de la resposta en el reforçament positiu

11.1.1 Procediments d’assaigs discrets

Aquest procediment es caracteritza perquè únicament permet una resposta instrumental a

cada assaig. Thorndike va ser l’autor pioner en utilitzar aquest procediment i actualment

s’aplica en determinats aparells com ara els següents:

Corredor recte: format per un únic passadís amb una caixa de sortida en un extrem, i

una caixa d’arribada a l’extrem oposat. Un assaig s’inicia col·locant ‘animal dins de la

caixa de sortida i acaba quan entra dins de la caixa d’arribada, on, normalment, es

troba amb el reforçador.

Laberints en forma de Y i T: estan formats per un corredor central que es bifurca en

dos braços. Un assaig s’inicia col·locant l’animal dins de la caixa de sortida i acaba

quan entra dins de la caixa d’arribada d’un dels braços del laberint. L’animal realitza

un assaig correcte quan gira cap al braç que conté el reforçador.

Mesures de la resposta:

1. Latència de resposta: temps transcorregut des que es posa l’animal a la caixa de

sortida fins que inicia el recorregut.

2. Temps de carrera.

3. Velocitat de carrera.

4. Percentatge d’assaigs amb resposta correcta (només en els laberints en forma de Y i T).

11.1.2 Procediment d’operant lliure

Procediment dissenyat per Skinner (fa servir la caixa d’Skinner) i es caracteritza perquè permet

l’execució lliure i repetida de la resposta operant. Les mesures més usuals de la gàbia d’Skinner

són:

1. Taxa de resposta: nombre de vegades que l’animal pitja la palanca per fracció de

temps.

2. Latència de resposta: des de que comença la sessió fins que emet la primera resposta.

3. Topografia de la resposta operant: forma en què l’animal pitja la palanca.

4. Intensitat de la resposta: força que aplica l’animal en accionar la palanca.

Page 64: Aprenentatge i Condicionament (Apunts)

64

11.2 Variables que afecten el reforçament positiu

11.2.1 Variable relativa al subjecte: motivació

S’estableix una relació de “U” invertida entre el grau de motivació i l’aprenentatge assolit.

Aquesta motivació es determina amb el nivell de privació, és a dir, les formes més comunes i

objectives que s’utilitzen per mesurar el nivell de motivació són:

A major motivació, menor aprenentatge:

APR.

MOT.

11.2.2 Variables relatives al reforçador

Magnitud: fa referència a la quantitat (a major quantitat de reforçador, millor

execució) i a la qualitat de l’estímul reforçador. Experiment de Hurt: rates amb

diferents quantitats i tipus de reforçadors. Les rates corren més ràpid per aconseguir

reforçadors majors i més gustosos.

Canvis en la magnitud: l’eficàcia d’una determinada magnitud de reforçament,

presentada darrere d’una determinada conducta, està en funció de les experiències

prèvies amb altres magnituds de reforçament diferents. Aquestes experiències prèvies

determinaran que l’efecte de contrast (descrit per Crespi l’any 1942) entre la quantitat

de reforçament anterior i la quantitat actual sigui positiu (donarà lloc a un augment del

rendiment) o negatiu (amb disminució de rendiment). Perquè hi hagi un contrast

positiu, la magnitud de reforçament actual ha de ser més gran que l’anterior. En el cas

contrari, es produirà un contrast negatiu.

Petita Gran

Page 65: Aprenentatge i Condicionament (Apunts)

65

11.2.3 Variables relatives a l’associació resposta-reforçador

a) Contigüitat temporal:

Temps entre l’emissió de la resposta i l’obtenció del reforçador (demora de

reforçador). En principi s’estableix una relació negativa entre demora i nivell

d’aprenentatge.

La introducció d’un temps de demora en la presentació de l’ER perjudica de forma clara

l’execució de la R, específicament quan:

o La magnitud de reforçament és petita;

o El cost de la resposta és alt;

o No existeixen estímuls reforçadors secundaris entre la R i el reforçador.

El paper de les respostes competitives (aquelles que apareixen entre la resposta

operant, la que té relació de contingència amb l’aparició del menjar, i l’estímul

reforçador). Aquestes dificulten establir l’associació entre la resposta-reforçador. És

possible que l’última resposta competitiva es vegi reforçada i augmenti de freqüència.

Les conductes supersticioses (derivades del explicat en el punt anterior de les

respostes competitives): experiment de superstició (Skinner) reforçament accidental o

adventici; creences il·lusòries.

L’autocontrol: aprendre a esperar i preferir la conseqüència demorada sobre la

immediata.

En l’exemple del ludòpata, el que importa realment per a que la persona segueixi fent una

determinada conducta (gastar-se diners en la màquina escurabutxaques) és la immediatesa de

les conseqüències.

b) Contingència resposta operant – estímul reforçador: relació de control entre l’emissió de

resposta i el reforçador. [p(ER/R) vs. P’(ER/no R)]

Si la primera probabilitat és més probable que la segona Reforçament positiu

Si la segona probabilitat és menys probable que la segona Reforçament diferencial

d’altres conductes (RDO) (Tema 16, càstig negatiu)

Page 66: Aprenentatge i Condicionament (Apunts)

66

Si les probabilitats són iguals absència de condicionament (manca de control).

Quan, per exemple, a un nen li regalem sempre alguna cosa quan fa o no una conducta

inapropiada

Exercici

Quatre fàbriques de joguines han contractat temporalment uns grups d'operaris (Grups 1 a 4)

per tal de col·locar el material ja fabricat dins de contenidors. La taula següent especifica el sou

que ha rebut cada grup de treballadors en les dues campanyes de Nadal en què han participat:

1. En la segona campanya de Nadal els temps que aquests grups de treballadors han trigat a

omplir cada contenidor han estat els següents: 180, 210, 240 i 270 minuts. Indica en la darrera

columna de la taula (Rendiment Final) a quin grup de treballadors correspon cadascun

d'aquests valors.

1. 180 (millor rendiment): grup 4

2. 210: grup 3

3. 240: grup 1

4. 270: grup 2

2. Quin o quins grups calen per posar de manifest la relació existent entre la magnitud del

reforçament i el rendiment? El 1 i el 3.

3. Quin o quins grups calen per posar de manifest el fenomen de Contrast Positiu? El grup 4

(com a grup experimental) amb el 3 (grup control).

4. Quin o quins grups calen per posar de manifest el fenomen de Contrast Negatiu? El 2

respecte de l’1.

Page 67: Aprenentatge i Condicionament (Apunts)

67

Tema 12: El reforçament positiu II: programes de presentació del reforçament

12.1 El reforçament intermitent

- Reforçament continu (RFC), allò que s’utilitza quan s’ha d’ensenyar una nova conducta

(procés de moldejament):

La R és seguida per l’ER cada vegada que s’emet;

Adquisició de noves conductes;

Baixa resistència a l’extinció;

Taxa de resposta moderada i relativament constant, amb pauses breus i

impredictibles.

- Reforçament intermitent o parcial (exemple de les màquines escurabutxaques, no sempre

obtinc el “premi”, només a vegades):

La R sols és seguida per l’ER en algunes ocasions;

Manteniment de les conductes ja apreses;

Alta resistència a l’extinció.

Aquest tipus de reforçament funciona de manera que no totes les emissions de la conducta

queden reforçades.

El programa de reforçament es la regla que especifica, en una situació de reforçament

intermitent, en quines ocasions la resposta és reforçada.

12.2 Programes simples de reforçament intermitent

- Programes simples de raó: el reforçament depèn del nombre de respostes:

Programes de raó fixa (RF): el nombre de respostes perquè es presenti l’ER és sempre

el mateix (per exemple: RF 5 cal apretar la palanca 5 vegades per obtenir l’estímul

reforçador). Hi ha una taxa de resposta alta i sostinguda.

Pauses

Page 68: Aprenentatge i Condicionament (Apunts)

68

Programa de raó variable (RV): el nombre de respostes perquè es presenti l’ER és

variable i impredictible. El valor del programa de raó variable (per exemple RV5) indica

el nombre mitjà de respostes al llarg de la sessió. Per exemple, la persona que juga a

les màquines, la persona no sap quan surt el premi; qui programa la màquina diu que

cada 50 vegades de tirar monedes s’ha de donar un premi. El subjecte respondrà de

manera compulsiva i sense pauses si el premi surt abans de les 50 monedes que s’han

de fer servir per arribar al premi.

- Programes d’interval: el reforçament depèn del temps per obtenir l’ER cal emetre la R

després d’un període mínim de temps des de l’anterior R reforçada. Si el subjecte respon en el

període de temps que hem determinat (l’interval), no se li presenta l’estímul; si el subjecte

respon per primera vegada després de l’interval, rebrà l’estímul reforçador.

Programa d’interval fix (IF): el període de tremps és sempre el mateix (per exemple IF

3 min). Quan passin tres minuts i el subjecte faci la resposta operant, se li presenta el

reforçament; si es fa la resposta operant en l’interval, no es presentarà l’estímul

reforçador.

Llarga pausa postreforçament i taxa de resposta progressivament accelerada a mesura que

s’apropa la fi de l’interval (“festó” de l’interval fix).

Programa d’interval variable (IV): el període de temps és variable i imprevisible. El

valor del programa (per exemple IV 3 min) indica el temps mitjà que ha de passar.

Potser hi ha un interval de 30 segons, un altre de 4 minuts, etc. però, en mitjana, és 3.

Taxa de resposta moderada i sense pauses (molt constant i estable).

- Programes de reforçament de taxes de resposta: en aquests programes s’exigeix una

determinada taxa de resposta per obtenir el reforç. El reforç es pot rebre per emetre taxes

elevades de conducta –reforçament diferencial de taxes altes (RDA)- o per emetre taxes

baixes de conducta –reforçament diferencial de taxes baixes (RDB).

12.3 L’extinció de la resposta reforçada positivament

El procediment d’extinció consisteix a suspendre el reforçament després d’una resposta, de

manera que el subjecte no pot obtenir recompensa, sigui quina sigui la seva conducta. Així, en

aquest cas, la probabilitat que es presenti el reforçador darrere de la resposta és igual a 0.

Page 69: Aprenentatge i Condicionament (Apunts)

69

El resultat que produeix l’extinció és una disminució progressiva de la freqüència de la

resposta. Després d’un període de descans es pot produir una recuperació espontània de la

resposta, de forma similar a com s’observa a l’habituació de la resposta reflexa i a l’extinció del

condicionament clàssic. Experiment de Rescorla amb rates: el que va realitzar en el seu

experiment fou introduir un període de descans posterior a l’extinció (R-No descans) que va

produir una recuperació substancial en la resposta, il·lustrant el fenomen de la recuperació

espontània.

- Efectes de l’extinció a nivell conductual:

Efecte paradoxal de l’extinció: La corba de l’extinció no descriu una disminució

progressiva i homogènia de la resposta instrumental, sinó que en els primers assaigs es

produeix un major nombre de respostes, que, a més a més, són més intenses. Exemple

del nen i les rebequeries.

Més períodes de no-resposta: disminueix la taxa de resposta i apareixen pauses.

Les respostes canvien de topografia.

- Efectes de l’extinció a nivell emocional:

L’extinció pot induir frustració i reaccions agressives degut a l’omissió d’un

reforçament esperat. Experiment amb coloms d’Azrim (1956): En primer lloc es reforça

a un colom per picotejar una tecla de resposta, mentre que l’altre animal es troba

subjecte a una cantonada de la cambra experimental. L’ocell que picoteja la tecla

ignora pràcticament l’altre mentre se li proporcionen reforçadors però, quan

s’introdueix l’extinció i s’acaba el reforçament, l’ocell prèviament reforçat és probable

que ataqui al seu innocent company. Es dóna una agressió semblant si es situa un

model de drap en lloc d’un animal real en la gàbia d’Skinner.

12.3.1 Variables relatives a l’estímul reforçador

- Procediment del reforçament previ:

Efecte del reforçament parcial en l’extinció: les respostes que han estat sotmeses a un

programa de reforçament intermitent presenten, posteriorment, més resistència a

l’extinció que les respostes que han estat sotmeses a un reforçament continu.

Els programes de reforçament variable generen més resistència a l’extinció.

Page 70: Aprenentatge i Condicionament (Apunts)

70

- Excepcions d’aquest procediment. En general, un major nombre de reforçaments i uns

reforçaments de major magnitud provoquen més resistència a l’extinció. No obstant, la relació

entre aquestes variables pot dependre d’altres factors, com el programa de reforçament:

Efecte de la magnitud del reforçament en l’extinció: Així, en el reforçament continu

una quantitat de recompensa elevada disminueix la resistència a l’extinció.

Efecte del sobreentrenament en l’extinció: un major nombre d’episodis de

reforçament amb una magnitud de reforçament alta disminueix també la resistència a

l’extinció.

12.3.2 Variables relatives al subjecte (a la seva motivació)

Hi ha una relació positiva entre el nivell de privació (nivell alt => més difícil l’extinció) i la

resistència a l’extinció.

L’experiència prèvia en situacions d’extinció facilita l’extinció.

12.3.3 Variables relatives a la resposta

A major cost (l’esforç que li suposa al subjecte emetre la resposta operant), menor resistència

a l’extinció. Més alt cost de la resposta, més fàcil l’extinció (és a dir, menys resistència a

l’extinció).

12.3.4 Variables relatives al procediment

- si el procediment d’extinció es dóna en un context diferent al del condicionament

instrumental, la resposta es recuperarà quan s’exposi al subjecte de nou al context on ha rebut

el reforçament positiu. Aquest fenomen s’anomena efecte de renovació de la resposta

prèviament extingida.

- A major IEA (en els procediments d’assaigs discrets), major resistència a l’extinció.

- La pràctica massiva (tant en la fase d’aprenentatge com durant l’extinció) afavoreix l’extinció;

en canvi, la pràctica distribuïda la dificulta.

Page 71: Aprenentatge i Condicionament (Apunts)

71

Tema 13: el reforçament positiu III: anàlisi teòrica

13.1 Introducció

Què és un estímul reforçador?

La definició bàsica que respon a aquesta pregunta (explicada ja anteriorment: un reforçador és

una conseqüència que incrementa la probabilitat que aparegui la conducta la qual segueix, i

aquesta increment la seva probabilitat d’aparició perquè ha estat reforçada per la presentació

d’un determinat estímul) és circular, operativa i poc satisfactòria pel que fa l’aspecte teòric. No

ens explica res, ens defineix els fets.

Des d’un punt de vista teòric, s’ha de mirar les causes i característiques de l’estímul per poder

veure i anticipar els seus possibles efectes sobre la conducta.

Existeixen diferents perspectives que donen respostes més teòriques:

- Perspectiva biològica: els reforçadors considerats com a estímuls. No tots els estímuls són

reforçadors.

- Perspectiva conductual: estímuls reforçadors com a conductes. Els estímuls reforçadors en

realitat no són estímuls, el que és reforçant és la conducta consumatòria (conductes

consumatòries: aquelles finalitzen una seqüència instintiva de conductes).

13.2 Els reforçadors considerats com a estímuls

Diferents teories ens diuen que ha de tenir un estímul per a que pugui ser estímul reforçador:

- Llei de l’efecte de Thorndike: Tipus especial d’estímuls que produeixen un “estat satisfactori”

per a l’organisme (llei de l’efecte de Thorndike). Aquesta definició té un caràcter subjectiu ja

que cada persona considera o no una determinada conducta com a satisfactòria.

- Llei de la reducció del impuls de Hull: Tots els reforçadors primaris són estímuls que

redueixen alguna necessitat biològica essencial per a la supervivència de l’organisme, i tots els

estímuls que redueixin una necessitat biològica actuaran com a reforçadors (teoria de la

reducció de l’impuls de Hull). Els estímuls reforçadors són estímuls que la propietat que tenen

és que són necessaris per a la supervivència de l’organisme. En aquesta segona afirmació

també existeixen excepcions, com, per exemple, el cas de la sacarina: segons Hull, hauria de

ser un reforçador primari però, aquest, “no alimenta”, no proporciona nutrients al cos i per

tant, no contribueix a la supervivència de l’organisme.

Page 72: Aprenentatge i Condicionament (Apunts)

72

13.3 Els reforçadors considerats com a conductes

Aquest punt de vista considera que el que pot actuar com a reforçador no és l’accés a un

determinat estímul, sinó la possibilitat de fer determinades conductes. Dins d’aquesta

perspectiva, podem considerar que hi ha quatre aproximacions que donen explicacions

progressivament més complexes, però tampoc no arriben a oferir una explicació amb una

validesa universal.

13.3.1 La teoria de la resposta consumatòria (Fred Sheffield)

- El que actua com a reforçador és la possibilitat de dur a terme les respostes consumatòries

(respostes que culminen una seqüència instintiva de conductes). És a dir, el reforçador no seria

el menjar sinó la conducta de menjar.

13.3.2 El principi de Premarck (principi de la probabilitat diferencial – David Premarck)

Considera que les conductes reforçants no són un determinat tipus de conducta.

Afirma que existeixen conductes de major probabilitat que actuaran com a reforçadors de les

conductes menys probables.

R instrumental (conducta de baixa probabilitat) Reforçador (possibilitat de fer una nova

conducta d’alta probabilitat.

Si, per exemple, un nen prefereix jugar a pilota abans que fer trencaclosques i el fem fer

trencaclosques abans de jugar a pilota, la conducta de jugar a pilota (més probable) reforçarà

la conducta de fer trencaclosques (menys probable).

13.3.3 La hipòtesi de la privació de resposta (Timberlake i Allison)

Aquesta hipòtesi afina una mica més la teoria de Premarck, ja que aquests dos autors estan

d’acord en moltes de les idees de Premarck.

Afirmen que el que converteix una conducta en reforçant no és la seva alta probabilitat, sinó el

fet que es trobi privada.

És a dir, en l’exemple del nen que prefereix jugar a la pilota, quan el nen reforça la conducta de

realitzar trencaclosques es produeix aquest efecte degut que la conducta de jugar a pilota es

troba privada.

Page 73: Aprenentatge i Condicionament (Apunts)

73

D’acord amb aquesta hipòtesi, la conducta de fer trencaclosques també pot arribar a ser

reforçant ja que s’acaba realitzant la conducta amb major probabilitat per tal d’aconseguir

altres conductes.

13.3.4 L’enfocament basat en la regulació conductual

Hi ha diferents punts de vista que podem agrupar sota aquest títol, atès que comparteixen una

idea en comú: L’organisme tendeix a aconseguir una homeostasi conductual, i, quan

s’introdueix una contingència instrumental que altera aquest equilibri, l’organisme

redistribueix el seu repertori conductual tractant d’apropar-se com més millor al punt preferit

d’equilibri conductual o punt òptim. El que farà l’organisme depèn de les diferents estratègies

i conductes substitutives que pugui tenir a l’abast. Si no hi ha alternatives disponibles, com

succeeix en les situacions de laboratori, la contingència instrumental pot actuar de forma molt

poderosa. Si la situació permet diferents alternatives (com succeeix habitualment fora de

laboratori, en situacions naturals), la contingència instrumental no pot regular la conducta

d¡una manera tant potent i pot ocórrer que les conductes finals no siguin, ni de bon tros, les

que les contingències resposta-reforçador volien aconseguir.

13.4 Conclusions

Com ja hem avançat a la introducció, cap dels punts de vista exposats no pot explicar tots els

fenòmens observats. Això és lògic si tenim en compte que cada plantejament parteix de

supòsits molt diferents, la qual cosa els fa arribar a conclusions molt diferents.

Malgrat tot, sembla que el plantejament que ens ofereix una visió més àmplia és el que

considera que la situació de condicionament instrumental provoca una restricció de la

conducta lliure de l’organisme, a la qual aquest respon reorganitzant els seus comportaments

tot cercant una recuperació de l’homeostasi conductual. Aquesta reorganització pot fer que

augmenti la conducta la qual la contingència de condicionament instrumental li ha atribuït el

paper de resposta instrumental. Si això té lloc en un ambient molt controlat (situació de

laboratori), serà més probable que la resposta instrumental augmenti.

Page 74: Aprenentatge i Condicionament (Apunts)

74

Tema 14: El reforçament negatiu i (fugida i evitació): procediments variables

14.1 Reforçament negatiu

Procediment de condicionament instrumental en el qual la resposta augmenta com a

conseqüència de:

1. La retirada d’un estímul aversiu (ER-): FUGIDA.

2. La no presentació d’un estímul aversiu (ER-): EVITACIÓ.

14.2 Procediment de la resposta de fugida

Esquema:

E av. - -> Augmenta la probabilitat de resposta de fugida Retirada E av.

(A mesura que passen presentacions de l’estímul av. la latència d ela resposta de fugida va

disminuint).

- Situacions experimentals en què s’estudia aquesta resposta

Respostes locomotrius:

o Corredor recte, laberints.

o Caixa de dos compartiments: compartiment de perill i compartiment de

seguretat.

o Roda d’activitat

Respostes manipulatives:

o Caixa de Skinner: la resposta de prémer la palanca amb l’estímul aversiu

tindria com a conseqüència la finalització de prémer la palanca.

- Estímuls aversius:

Descàrrega elèctrica d’intensitat moderada.

Immersió en aigua freda.

Visió d’un depredador específic de l’espècie. Amb això busquem més valor ecològic en

l’experiment.

Page 75: Aprenentatge i Condicionament (Apunts)

75

En humans:

o Estimulació sensorial intensa o emocionalment desagradable (international

affective pictures system).

o Exposició CO2: provoca sensació molesta ja que es té la sensació de manca

d’oxigen.

14.3 Mesures de la resposta de fugida

- Percentatges d’assaigs amb resposta de fugida (NO són útils).

- Nombre de respostes de fugida.

- Latència de la resposta de fugida.

- Magnitud de la resposta: velocitat de la resposta (respostes locomotrius) i intensitat de la

resposta (resposta manipulativa).

14.4 Variables que afecten a la fugida

Variables Reforçament positiu Reforçament negatiu (fugida)

Motivació Nivell de privació del l’ER+ Com d’intens és l’estímul aversiu.

Magnitud del

reforçament Quantitat i qualitat del ER+

- El percentatge o grau de disminució en la

magnitud de l’estímul aversiu.

- El temps que triga en aparèixer un altre

cop (interval entre assaigs).

Demora del

reforçament

Demora de la presentació de

l’ER+

Demora en la retirada de l’estímul aversiu.

- Intensitat de l’estímul (variable que determina el grau de motivació del subjecte per fer la

resposta): a major intensitat de l’estímul aversiu, menor latència de la resposta de fugida.

- Reducció de la intensitat de l’estímul rere la resposta: a major percentatge de reducció de

l’estímul aversiu, major força de la resposta de fugida. A major IEA major força de la resposta

de fugida.

Page 76: Aprenentatge i Condicionament (Apunts)

76

- La demora en retirar l’estímul aversiu: a major demora en la retirada de l’estímul aversiu,

adquisició més lenta i nivell final d’execució de la resposta de fugida més baix; la presència

d’estímuls reforçadors secundaris immediats atenuen l’efecte de la demora de la retirada de

l’estímul aversiu.

14.5 Procediments de la resposta d’evitació discriminada

- Procediments d’evitació:

Evitació discriminada (o senyalada): un estímul o senyal d’avís (o d’alarma) indica el

moment en què cal emetre la resposta (procediment amb assaigs discrets). L’estímul

d’avís NO provoca la resposta d’evitació, ja que és una resposta lliure voluntària, sinó

que indica que és un moment apropiat per fer-la. Aquest estímul és un exemple

d’estímul discriminatiu.

L’estímul discriminatiu (ED): indica que, si en la seva presència s’emet la resposta instrumental,

s’obtindrà el reforçament. Per exemple: el to del mòbil.

Esquema:

E d’avís Augment de la probabilitat de la resposta d’evitació No presentació de l’E av.

Aquest tipus de conductes són difícils d’aprendre (entre 40 i 80 assaigs). Alguns subjectes no

arriben a aprendre la conducta (20%).

- Si el subjecte fa la resposta d’evitació quan encara és present l’estímul aversiu, això és una

fugida de la resposta.

Primer aprenem a fugir i després a evitar.

Page 77: Aprenentatge i Condicionament (Apunts)

77

- Quan fa la resposta abans de l’estímul aversiu el que passarà és que no es presentarà

l’estímul. Llavors, ja sí que seria una autèntica resposta d’evitació. A aquest tipus

d’aprenentatge també se’l pot anomenar, llavors, com aprenentatge de fugida-evitació.

Evitació no discriminada i d’operant lliure: no hi ha estímul d’avís, sinó que la resposta

es pot emetre en qualsevol moment (procediment d’entrenament continu).

Esquema:

Aquest aprenentatge es realitza en una gàbia d’Skinner i es basa en dos tipus d’intervals:

Interval D-D: és l’interval entre descàrregues en absència de resposta;

Interval R-D: és l’interval entre la resposta d’evitació i la propera descàrrega

programada. Aquest és el temps de seguretat.

- Situacions experimentals d’evitació discriminada:

Respostes locomotrius:

o Evitació de vaivé (evitació shuttle). La resposta és anar d’un costat a un altre

de la gàbia (enlloc dels dos compartiments, el de seguretat i perill).

o Roda d’activitat.

o Evitació de salt. L’animal ha de saltar en una altra plataforma lleugerament

més alta i si salta a la plataforma no es presenta la descàrrega.

o Evitació d’un sentit: caixa de dos compartiments; el posem en el de perill, es

presenta l’estímul d’avís i es presenta la descàrrega. Si quan se li presenta la

descàrrega, abans ja marxa cap a la caixa de seguretat, ha après resposta

d’evitació.

Respostes manipulatives:

o Evitació de manipulandum.

Page 78: Aprenentatge i Condicionament (Apunts)

78

14.6 Mesures de la resposta d’evitació discriminada

- Latència de la resposta d’evitació: temps transcorregut des que es presenta senyal d’alarma

fins que comença a fer la conducta d’evitació.

- Percentatge d’assaigs amb resposta d’evitació: fa referència a la proporció de respostes

d’evitació que s’han donat en una sessió o en un determinat nombre d’assaigs.

- Nombre d’assaigs consecutius amb resposta d’evitació. Així, per exemple, en la gàbia

shuttle, normalment es fixa el criteri d’aprenentatge en quatre o cinc respostes d’evitació

consecutives.

14.7 Variables que afecten l’evitació discriminada

- Nombre d’assaigs d’aprenentatge: situacions experimentals “fàcils”: evitació amb roda

d’activitat, evitació de salt, evitació d’un sentit (s’aprèn amb menys de 10 assaigs); situacions

experimentals “difícils”: evitació de vaivé, evitació de manipulandum. No tothom aprèn

conductes d’evitació, tot i que de fugida sí.

- Intensitat de l’estímul aversiu: relació directa (+/+) en l’evitació amb roda d’activitat i en

l’evitació d’un sentit; relació inversa (+/-) en l’evitació de vaivé en rates i l’evitació de

manipulandum; relació en forma d’U invertida (fins arribar a un punt que baixa) en l’evitació

de vaivé en gossos.

- Demora en la retirada de l’estímul d’avís: la demora en la retirada de l’estímul d’avís

perjudica de clara l’aprenentatge d’evitació discriminada.

14.8 Controlabilitat i interferència de l’aprenentatge: indefensió apresa

Sempre hi ha una contingència entre la conducta que fem i la conseqüència que té associada.

Què passa quan un subjecte experimenta manca de control? És a dir, unes conseqüències que

no depenen de la resposta operant (contingència entre conducta i conseqüències inexistent)?.

- Incontrolabilitat o manca de control: dificulta l’adquisició de nous aprenentatges

instrumentals. Aquest efecte s’anomena l’efecte d’indefensió apresa.

Aquest efecte fou descobert per Seligman, Overmier i Maier (1967): en gossos, l’exposició a

descàrregues elèctriques inescapables i inevitables dificulta l’adquisició posterior d’un

aprenentatge de fugida-evitació de vaivé (Domjan, pp. 152-153).

Page 79: Aprenentatge i Condicionament (Apunts)

79

Segons Seligman, la indefensió apresa constituiria una síndrome que inclouria dèficits a nivell:

D’aprenentatge

Cognitivo-motivacional

Emocional

Seligman va proposar la hipòtesi d’indefensió apresa: quan un subjecte experimenta una

situació de manca de contingència entre conducta i conseqüència adquirim una cognició (una

expectativa) de manca de control. Aquesta cognició seria la que explicaria que posteriorment

es donés la dificultat de l’aprenentatge instrumental.

Si una persona experimenta situacions de control no es desenvoluparà la indefensió apresa.

Page 80: Aprenentatge i Condicionament (Apunts)

80

Tema 15: El reforçament negatiu II (fugida i evitació): anàlisi teòrica

15.1 Introducció

La qüestió central que ha guiat les principals teories sobre l'aprenentatge d’evitació ha estat

conèixer quines són les conseqüències que segueixen a la conducta d’evitació que

proporcionen algun tipus de reforçament instrumental responsable de l’augment d’aquesta

conducta. És a dir, esbrinar quin a és la font de reforçament o allò que motiva l’individu a fer la

conducta d'evitació. D'altra banda, aquesta qüestió queda sense interès quan es tracta de

valorar l'aprenentatge de fugida. Aquest tema se centrarà en l’anàlisi teòrica de l'evitació

discriminada i en el seu procediment d'extinció.

1. En l’evitació discriminada, quines són les conseqüències que reforcen la conducta

d’evitació? “Com s’aprèn” finalització E avís.

2. Quan s’ha adquirit la conducta d’evitació discriminada, l’estímul aversiu ja no es presenta:

perquè no s’extingeix llavors la resposta d’evitació?

Exemples d’intervenció

Conductes d’evitació en els trastorns fòbics.

Trastorn obsessiu-compulsiu (TOC).

15.2 Teories de l’evitació

15.2.1 Teoria bifactorial de Mowrer

- Teoria bifactorial o teoria dels dos processos.

Mowrer (1947)

Miller (1951)

En l’aprenentatge, un factor que intervé és un condicionament clàssic: Estímul avís associat

amb EI aversiu procés condicionament clàssic. Predirà la presentació de la descàrrega

provocarà resposta condicionada (R+) de por, seguidament, evitar sensació de por.

En l’evitació discriminada intervindrien 2 factors:

1. Condicionament clàssic: l’estímul d’avís (so) s’associa a la presentació de l’estímul aversiu

(EI: xoc elèctric) de manera que esdevindria un EC+ que provocaria un RC+ de por.

Page 81: Aprenentatge i Condicionament (Apunts)

81

Evitar estímul d’avis, no por.

2. Condicionament instrumental: la por proporcionaria la motivació per a la resposta

d’evitació, ja que aquesta seria reforçada negativament per la finalització “de l’estímul avís”

(EC) i la no-presentació de l’EI (xoc). Quan el so desapareix, desapareix també la por

condicionada. La desaparició de la por condicionada és el reforçador que manté la conducta

d’evitació, essent considerada la no-presentació de l’EI com un fenomen secundari. Segons

això, allò que reforça l’execució de la resposta és la retirada d’un EC+ aversiu.

SUPORT EXPERIMENTAL: BROWN I JACOBS (1949) (Domjan pp. 284-288)

El que prediu la teoria bifactorial és un cicle indefinit de fases alternades d’extinció i de

recondicionament de la por i de la resposta d’evitació.

SUPORT EXPERIMENTAL

L’existència d’aquests cicles no sempre s’ha pogut confirmar empíricament. Contràriament, en

moltes ocasions, s’ha pogut observar que, encara que l’estímul aversiu ja no es presenti, la

resposta d’evitació es pot mantenir de manera indefinida. A més, en alguns casos quan la

conducta d’evitació es troba ben establerta, la por a l’estímul d’avís es pot reduir, però no

obstant es manté la resposta d’evitació.

CONCLUSIÓ: La teoria bifactorial explica de forma satisfactòria com s’adquireixen les respostes

d’evitació discriminada, però no com es mantenen una vegada apresses.

15.2.2 La hipòtesi del senyal de seguretat

- Bolles i Grossen (1969)

- Weisman i Litner (1972)

Segons la teoria bifactorial:

La resposta d’evitació seria reforçada negativament per la retirada de l’estímul d’avís (un

senyal de perill: EC+ associat a la presentació de l’EI aversiu) i la consegüent reducció de la RC+

de por.

Page 82: Aprenentatge i Condicionament (Apunts)

82

Segons la hipòtesi del senyal de seguretat:

La resposta d’evitació també podria ser reforçada positivament per la presentació de senyals

de seguretat (EC- que indica l’absència de l’EI aversiu), els quals provocarien respostes

condicionades inhibitòries d’aullejament, seguretat i relaxació.

Quins estímuls podrien actuar com a senyals de seguretat?

La finalització de l’estímul d’avís.

Les claus retroalimentadores o propioceptives que acompanyen l’emissió de la resposta

d’evitació.

CONCLUSIÓ: la hipòtesi del senyal de seguretat complementa la teoria bifactorial explicant de

forma satisfactòria el manteniment de les respostes d’evitació discriminada quan l’estímul

aversiu ja no es presenta.

15.3 Anàlisi de l’extinció de la conducta d’evitació discriminada

Els diferents procediments emprats per extingir una conducta reforçada negativament s’han

de basar, necessàriament, en una postura teòrica sobre quin és l’element o elements que

reforcen negativament la conducta. A partir d’aquí, el procediment d’extinció que s’utilitzi ha

d’anar encaminat a retirar o no presentar l’element reforçador, tal com es fa en l’extinció del

reforçament positiu. Però, a diferència de les conductes reforçades positivament, és ben

complex identificar quin o quins són els elements reforçadors de la conducta d’evitació. Per

aquest motiu s’han dissenyat diferents procediments que presenten característiques pròpies.

15.3.1 L’extinció ordinària

La conseqüència de l’extinció de la resposta d’evitació consisteix en deixar de presentar

l’estímul aversiu. Això produeix el mateix efecte que la mateix conducta d’evitació.

No es dóna un canvi aparent de les conseqüències de la resposta, de manera que la seva

eficàcia és molt reduïda.

Page 83: Aprenentatge i Condicionament (Apunts)

83

15.3.2. Càstig de la resposta d’evitació

·consisteix en presentar l’estímul aversiu quan es fa la resposta d’evitació

·tot i que pot resultar molt eficaç, presenta els inconvenients dels procediments de càstig

positiu (veure tema 16).

15.3.3. La inundació

Es fonamenta en els supòsits de la teoria bifactorial de Mowrer.

Consisteix en mantenir la presentació de l’estímul d’avís, és a dir, fer inoperant la

resposta d’evitació o impossibilitar-la.

Té dues variants:

1. Inundació tipus 1 o extinció verdadera de Katzev: consisteix a fer que la resposta

d’evitació no elimini l’EC i que tampoc no es presenti l’EI.

- La resposta d’evitació es pot emetre, però resulta inoperant de manera que no finalitza la

presentació de l’estímul d’avís.

- És més adequada quan els senyals d’avís són estímuls auditius i/o visuals (p.ex. evitació de

vaivé)

2. Inundació tipus 2 (bloqueig o prevenció de la resposta, comprovació de la realitat):

consisteix a, a més de no eliminar l’EC, impossibilitar la resposta d’evitació.

Evidentment, tampoc no es presenta mai al subjecte l’estímul aversiu.

- S’impossibilita “físicament” l’execució de la resposta d’evitació, presentant-se de forma

continuada l’estímul d’avís.

- És més adequada quan els estímuls d’avís són senyals de lloc o estímuls contextuals (p.ex.

evitació d’un sentit).

Els experiments o tractaments basats en la inundació inclouen 3 fases:

1. Adquisició de la resposta d’evitació (prèvia al tractament en el cas de les intervencions

terapèutiques) (nivell basal)

2. Aplicació de la inundació (intervenció)

3. Observació de l’extinció ordinària (fase de prova)

Page 84: Aprenentatge i Condicionament (Apunts)

84

L’eficàcia de les tècniques d’inundació està directament relacionada amb el temps d’exposició

a l’estímul condicionat aversiu (sigui amb una pràctica massiva o distribuïda).

Els procediments d’inundació demostren una certa independència entre la conducta d’evitació

i la resposta emocional de por. En aquest sentit, s’ha vist que és més fàcil eliminar l’execució

de la resposta d’evitació que la resposta de por condicionada davant l’EC, que, d’altra banda,

s’aconsegueix fer desaparèixer amb sessions addicionals d’inundació.

Page 85: Aprenentatge i Condicionament (Apunts)

85

Tema 16: El càstig: procediments i variables

16.1 Procediments de càstig: càstig positiu i càstig negatiu

Els procediments de càstig donen lloc a disminució de la conducta. Es diferencien dos tipus de

càstig en funció que s’estableixi una contingència positiva o negativa entre la conducta i les

seves conseqüències:

Càstig positiu; s’estableix una relació positiva entre la presentació d’una conducta i

l’aparició d’un estímul aversiu. Aquesta contingència disminuirà la probabilitat

d’aparició de la conducta.

Càstig negatiu: s’estableix una relació negativa entre la presentació d’una conducta i

l’aparició d’un estímul apetitiu. En aquest tipus de càstig, l’aparició de la conducta

provoca la retirada o la no-presentació d’un estímul apetitiu que s’esperava en aquest

moment.

Dos procediments relacionats amb el càstig negatiu són:

1. El reforçament diferencial d’altres conductes (RDO), en què una resposta que fins ara

permetia obtenir un determinat estímul reforçador deixa de tenir aquesta

conseqüència, la qual en canvi es pot continuar obtenint de forma periòdica sempre i

quan s’emetin d’altres conductes diferents. Per exemple: nen amb rebequeries amb

pares que presenten massa atenció, al retirar l’atenció el que segueixen és un

procediment d’extinció i no de càstig negatiu. En el càstig negatiu trec un reforçador

que abans no reforçava res, en l’extinció retiro el reforçador que estava reforçant.

2. El procediment de temps fora: en què la resposta té com a conseqüència un període

de temps durant el qual el subjecte no té disponibles les fonts de reforçament

habituals. Amb aquesta finalitat, a vegades el subjecte és retirat físicament de la

situació en què podia obtenir reforçadors per dur a terme determinades conductes.

16.2 Aparells experimentals i mesures

El primer que fem en un experiment és una fase I d’adquisició de la resposta mitjançant

reforçament positiu o negatiu (nivell basal). Tot seguit, una fase II: càstig de la resposta. Les

mesures per identificar l’eficàcia del càstig fem servir:

Percentatge o grau de disminució de la probabilitat o de la taxa de resposta després

d’aplicar el càstig: és a dir, la quantitat de supressió que obtinc. Aquest percentatge de

disminució pot ser total o parcial.

Page 86: Aprenentatge i Condicionament (Apunts)

86

Temps de durada de la supressió: pot ser permanent o temporal.

En alguns casos la supressió temporal o parcial no és útil, ja que es pot produir un efecte

d’habituació degut que el subjecte s’habitua a la presentació de l’estímul aversiu. Per exemple:

nen de les rebequeries que ja no fa cas dels crits del pare.

L’efecte de facilitació és aquell efecte que es produeix quan un estímul aversiu passa a ser un

estímul reforçador de la conducta operant (en el cas del nen de les rebequeries, conducta

inapropiada).

Esquema:

Resposta operant (rebequeries nen) Estímul reforçador positiu (atenció dels pares)

Resposta operant (rebequeries nen) Estímul aversiu (crits) que inicialment suprimeix la

conducta, finalment es converteix en un estímul reforçador secundari condicionat

- Situacions experimentals de càstig:

D’assaigs discrets:

o Corredors rectes

o Laberints simples

o Caixa de dos compartiments

o Gàbia shuttle

Operant lliure:

o Caixa d’Skinner

16.3 Variables del càstig positiu

16.3.1 Motivació per respondre

Com més gran sigui la motivació per fer la resposta que es vol castigar, menor serà l’efectivitat

del càstig.

16.3.2 Intensitat i durada de l’estímul aversiu

Com més gran és la intensitat de l’estímul aversiu, més gran és la supressió de la conducta

observada.

En general, la durada de l’estímul aversiu no afecta de manera dràstica el grau de supressió

de la resposta.

Page 87: Aprenentatge i Condicionament (Apunts)

87

Ara bé, durades molt llargues de l’estímul aversiu perjudiquen la supressió de la conducta, ja

que poden facilitar aprenentatge de fugida. En el Domjan s’explica que a més durada més

supressió, i no és així. Per exemple: nen que fica els dits a l’endoll (la presentació de l’estímul

aversiu és molt curta) i ja no els torna a ficar mai més.

16.3.3 Forma d’introducció

EL càstig és més eficaç si l’estímul punitiu es presenta en tota la seva intensitat de forma

sobtada que no pas si es presenta de forma gradual.

La forma d’introduir l’estímul aversiu pot donar lloc a dos fenòmens diferents:

La tolerància comportamental al càstig: l’exposició inicial a un càstig suau redueix els

efectes d’un posterior càstig intens. Així doncs, els subjectes als quals se’ls va

incrementant de forma paulatina la intensitat de l’estímul aversiu que reben després

de realitzar la conducta, disminueixen menys l’execució, que els subjectes que han

rebut inicialment, i d’un sol cop, l’estímul aversiu a la seva màxima intensitat.

Sensibilitat comportamental al càstig: l’exposició inicial (de manera sobtada) a una

estimulació aversiva abusiva augmenta els efectes supressors d’un posterior càstig

suau. Per exemple: un professor que crida fort i de manera sobtada al veure que la

gent parla; posteriorment la gent callarà simplement quan el professor els miri o avisi.

El professor que comença amb crits suaus però acaba amb un crit fort no produeix

l’efecte de sensibilització (produeix habituació).

16.3.4 Immediatesa del càstig (efectes de demora)

S’estableix una relació negativa entre la demora en presentar l’estimulació aversiva

contingentment a la resposta i el nivell de supressió de conducta que s’obté. A major demora d

ela presentació de l’estímul punitiu, menor eficàcia del càstig (molt menor eficàcia).

Conlusió de les variables

Per què un càstig sigui eficaç s’han de donar aquestes condicions sobre l’estímul aversiu:

Intens

No prolongat

Inescapable (no hi ha possibilitat

de perdó)

Sobtat

Immediat

Consistent o continu (una

característica nova però que també

afecta a l’eficàcia del càstig).

Page 88: Aprenentatge i Condicionament (Apunts)

88

16.4 Efectes emocionals del càstig negatiu

El càstig pot donar lloc a efectes secundaris emocionals del càstig no desitjats, com per

exemple: por, angoixa, etc. Pot provocar respostes emocionals incondicionades de por o

ansietat, les quals:

Es poden condicionat clàssicament a d’altres estímuls o persones presents la situació, i

posteriorment generalitzar-se a d’altres estímuls o persones similars;

Poden motivar conductes de fugida i/o d’evitació no desitjades..

També pot induir respostes emocionals incondicionades d’ira, hostilitat o agressivitat.

Per tal de minimitzar els efectes perniciosos del càstig, principalment quan s’aplica a les

persones, és recomanable, sempre que la situació ho permeti, començar per un procediment

d’extinció de la conducta. Tanmateix, també és important garantir la possibilitat de realitzar

respostes alternatives a la castigada que permetin rebre reforçament positiu; aquesta operació

provoca una major supressió de resposta castigada i permet utilitzar un estímul aversiu menys

intens i durant un temps més breu sense perdre eficàcia.

Resum d’alternatives al càstig positiu:

Extinció

Càstig negatiu

RDO

Temps fora

Inundació (en l’evitació discriminable)