L’aprenentatge de reforç en un món saturat d’estímuls i recompenses

 

És ben sabut que una de les majors motivacions que ens impulsa a aprendre és la recompensa: l’associada a un aprenentatge determinat. Aquest tipus d’aprenentatge s’anomena “aprenentatge de reforç” i ha estat molt estudiat, fins i tot en laboratori, pels investigadors. No obstant això, les investigacions fetes en aquest camp sempre s’han dut a terme amb tasques simples; és a dir, quan hi ha un nombre reduït de possibles decisions i de recompenses potencials (una decisió ens presenta més benefici que una altra). Però, què passa al nostre cervell quan ens trobem en situacions més complexes en les quals les fonts de recompensa potencial són nombroses? Com identifica el cervell el que és gratificant i com ho pondera segons la recompensa? Dit d’una altra manera, com decideix el cervell el que és important i el que no en el món real actual sobresaturat d’estímuls i recompenses?

 

És important saber com interactuen exactament l’atenció i l’aprenentatge, i com es modelen entre si

 

Aquestes preguntes són les que s’ha fet un equip d’investigadors de la Universitat de Princeton que, ara, acaba de publicar el resultat del seu treball a la revista Neuron. L’estudi publicat es titula Interacció dinàmica entre l’aprenentatge de reforç i l’atenció en entorns multidimensionals  (Dynamic interaction between reinforcement learning and attention in multidimensional environments) i els seus resultats podrien contribuir a millorar l’ensenyament i l’aprenentatge, com també el tractament d’alguns trastorns en què les perspectives de les persones són disfuncionals o estan minvades per alguna raó.

Estudio: cómo el cerebro decide lo que es importante y lo que no en el aprendizaje

Tal com explica l’autor principal de l’estudi, Yael Niv (professor associat de psicologia a l’Institut de Neurociències de Princeton), per entendre com es produeix l’aprenentatge, no podem passar per alt que aquest, habitualment, es produeix en un ambient “desordenat” i “multidimensional”. “Si volem que a l’escola els nens escoltin la mestra, no podem ignorar que a l’aula estan succeint moltes coses per a un nen, tant a l’interior com a l’altra banda de les finestres. Per tant, és important saber com interactuen exactament l’atenció i l’aprenentatge, i com es modelen entre si”, assenyala Niv.

D’altra banda, i fins ara, la majoria de les investigacions realitzades sobre aquest tema s’han centrat en l’atenció que anomenem “exògena” (coses que capten la nostra atenció automàticament, com un fort soroll o una espurna de llum). En canvi, aquest grup d’investigadors s’ha centrat en l’atenció “endògena”; és a dir, en com triem parar atenció al que ens envolta per maximitzar el que aprenem de cada experiència, i quins processos configuren aquestes decisions internes sobre què hem d’atendre.

Abans d’explicar-vos les conclusions de l’estudi, us avancem que la resposta està en la interacció bidireccional entre l’atenció i l’aprenentatge (una petita recompensa per estimular l’aprenentatge sempre va bé, oi?).

 

L’estudi

Atención y aprendizaje

Els resultats suggereixen una “via de doble sentit” entre l’atenció i l’aprenentatge, en què l’atenció enfocada permet l’aprenentatge de les complexitats ambientals, i en la qual l’aprenentatge promou una atenció més centrada o focalitzada.

 

Els investigadors van estudiar com aprenem a què cal parar atenció per aprendre més eficaçment; és a dir, per aprofitar al màxim les experiències de vida, assumint que en les situacions de la vida real la majoria de les coses són irrellevants i que discriminem amb claredat les que són importants i les que no en cada situació. Per exemple, quan demanem alguna cosa nova en un restaurant ‒posem per cas una pizza d’anxoves‒, hauríem d’aprendre si ens agrada o no la pizza d’anxoves, en lloc d’atribuir la suposada experiència plaent al fet d’estar asseguts en una taula en particular. Un altre exemple per il·lustrar això anterior seria: en travessar un carrer, per la nostra pròpia seguretat, hauríem de focalitzar l’atenció en la velocitat i la direcció del trànsit que s’aproxima, i ignorar el color dels cotxes. És a dir, la nostra atenció és, o hauria de ser, selectiva.

Estudio de Princeton sobre la atención y el aprendizaje

Als participants en l’estudi se’ls va donar una sèrie de nou imatges perquè les miressin. Cada imatge tenia un valor de recompensa desconegut per al participant. La tasca va consistir en què identifiquessin quina imatge (o quines imatges) oferia la major recompensa. Els autors van fer servir fMRI (ressonància magnètica funcional) per identificar la imatge en què se centrava cada participant i, per tant, van poder discernir com interactuava l’atenció amb l’aprenentatge. Quan els participants van aprendre quines imatges es recompensaven, el seu enfocament d’atenció es va reduir a les imatges més gratificants. Els resultats suggereixen una “via de doble sentit” entre l’atenció i l’aprenentatge, en què l’atenció enfocada permet l’aprenentatge de les complexitats ambientals, i en la qual l’aprenentatge promou una atenció més centrada o focalitzada.

En conclusió, utilitzem l’atenció selectiva per determinar el valor de diferents opcions, per decidir què aprenem quan passa una cosa inesperada (aprenc que m’agrada la pizza d’anxoves i ignoro si aquesta situació és irrellevant) i, finalment, el que aprenem a través d’aquest procés ens ensenya a què cal parar atenció, amb la qual cosa es crea un cercle que es retroalimenta.

L’estudi Interacció dinàmica entre aprenentatge de reforç i atenció en entorns multidimensionals és un treball en el qual han participat Yuan Chang Leong, Angela Radulescu, Reka Daniel, Vivian DeWoskin i Yael Niv.

 

    Fonts:

How the Human Brain Decides What Is Important and What’s Not

https://npjscilearncommunity.nature.com/users/16553-alan-woodruff/posts/14749-january-2017-research-round-up
http://www.princeton.edu/~nivlab/aboutus.html

http://neurosciencenews.com/importance-neuroscience-decisions-5967/