El aprendizaje de refuerzo en un mundo saturado de estímulos y recompensas

 

Es bien sabido que una de las mayores motivaciones que nos impulsa a aprender es la recompensa: la asociada a un aprendizaje determinado. A este tipo de aprendizaje se lo denomina “aprendizaje de refuerzo” y ha sido muy estudiado, incluso en laboratorio, por los investigadores. Sin embargo, las investigaciones realizadas en este campo siempre se han llevado a cabo con tareas simples; es decir, cuando hay un número reducido de posibles decisiones y de recompensas potenciales (una decisión nos presenta mayor beneficio que otra). Pero, ¿qué ocurre en nuestro cerebro cuando nos encontramos en situaciones más complejas en las que las fuentes de recompensa potencial son numerosas? ¿Cómo identifica el cerebro lo que es gratificante y cómo lo pondera según la recompensa? En otras palabras, ¿cómo decide el cerebro lo que es importante y lo que no en el mundo real actual sobresaturado de estímulos y recompensas?

 

Es importante saber cómo interactúan exactamente la atención y el aprendizaje, y cómo se moldean entre sí

 

Estas preguntas son las que se ha hecho un equipo de investigadores de la Universidad de Princeton que, ahora, acaba de publicar el resultado de su trabajo en la revista Neuron. El estudio publicado lleva por título Interacción dinámica entre el aprendizaje de refuerzo y la atención en entornos multidimensionales (Dynamic interaction between reinforcement learning and attention in multidimensional environments) y sus resultados podrían contribuir a mejorar la enseñanza y el aprendizaje, así como el tratamiento de algunos trastornos en los que las perspectivas de las personas son disfuncionales o se ven mermadas por alguna razón.

Estudio: cómo el cerebro decide lo que es importante y lo que no en el aprendizaje

Tal como explica el autor principal del estudio, Yael Niv (profesor asociado de psicología en el Instituto de Neurociencias de Princeton), para entender cómo se produce el aprendizaje, no podemos pasar por alto que éste, habitualmente, se produce en un ambiente “desordenado” y “multidimensional”. “Si queremos que en la escuela los niños escuchen a la maestra, no podemos ignorar que en el aula están sucediendo muchas cosas para un niño, tanto en el interior como al otro lado de las ventanas. Por lo tanto, es importante saber cómo interactúan exactamente la atención y el aprendizaje, y cómo se moldean entre sí”, señala Niv.

Por otra parte, y hasta ahora, la mayoría de las investigaciones realizadas sobre sobre este tema se han centrado en la atención que llamamos “exógena” (cosas que captan nuestra atención automáticamente, como un fuerte ruido o un destello de luz). En cambio, este grupo de investigadores se ha centrado en la atención “endógena”; es decir, en cómo elegimos prestar atención a lo que nos rodea para maximizar lo que aprendemos de cada experiencia, y qué procesos configuran esas decisiones internas de a qué atender.

Antes de explicaros las conclusiones del estudio, os adelantamos que la respuesta está en la interacción bidireccional entre la atención y el aprendizaje (una pequeña recompensa para estimular el aprendizaje siempre va bien, ¿no?)

 

El estudio

Atención y aprendizaje

Los resultados sugieren una “vía de doble sentido” entre la atención y el aprendizaje, en la que la atención enfocada permite el aprendizaje de las complejidades ambientales, y en la que el aprendizaje promueve una atención más centrada o focalizada.

 

Los investigadores estudiaron cómo aprendemos a qué prestar atención para aprender más eficazmente; es decir, para aprovechar al máximo las experiencias de vida, asumiendo que en las situaciones de la vida real la mayoría de las cosas son irrelevantes y que discriminamos con claridad las que son importantes y las que no en cada situación. Por ejemplo, cuando pedimos algo nuevo en un restaurante – pongamos por caso una pizza de anchoas – deberíamos aprender si nos gusta o no la pizza de anchoas, en lugar de atribuir la supuesta experiencia placentera al hecho de estar sentados en una mesa en particular. Otro ejemplo para ilustrar lo anterior sería: al cruzar una calle, por nuestra propia seguridad, deberíamos focalizar la atención en la velocidad y la dirección del tráfico que se aproxima, e ignorar el color de los coches. Es decir, nuestra atención es, o debería ser, selectiva.

Estudio de Princeton sobre la atención y el aprendizaje

A los participantes en el estudio se les dio una serie de nueve imágenes para que las miraran. Cada imagen tenía un valor de recompensa desconocido para el participante. La tarea consistió en que identificaran qué imagen (o imágenes) ofrecía la mayor recompensa. Los autores utilizaron fMRI (resonancia magnética funcional) para identificar la imagen en la que se centraba cada participante y, por lo tanto, pudieron discernir cómo interactuaba la atención con el aprendizaje. Cuando los participantes aprendieron qué imágenes se recompensaban, su enfoque de atención se redujo a las imágenes más gratificantes. Los resultados sugieren una “vía de doble sentido” entre la atención y el aprendizaje, en la que la atención enfocada permite el aprendizaje de las complejidades ambientales, y en la que el aprendizaje promueve una atención más centrada o focalizada.

En conclusión, utilizamos la atención selectiva para determinar el valor de diferentes opciones, para decidir qué aprendemos cuando sucede algo inesperado (aprendo que me gusta la pizza de anchoas e ignoro lo irrelevante de esa situación) y, finalmente, lo que aprendemos a través de este proceso nos enseña a qué prestar atención, creándose un círculo que se retroalimenta.

El estudio Interacción dinámica entre aprendizaje de refuerzo y atención en entornos multidimensionales es un trabajo en el que han participado Yuan Chang Leong, Angela Radulescu, Reka Daniel, Vivian DeWoskin y Yael Niv.

 

    Fuentes:

How the Human Brain Decides What Is Important and What’s Not

https://npjscilearncommunity.nature.com/users/16553-alan-woodruff/posts/14749-january-2017-research-round-up
http://www.princeton.edu/~nivlab/aboutus.html

http://neurosciencenews.com/importance-neuroscience-decisions-5967/