« Je ne ferai plus ça », disons-nous souvent face à des retours négatifs, des effets indésirables ou des résultats décevants. Ainsi, nous essayons de tirer des leçons de ces expériences négatives. Ce principe est également une pierre angulaire de notre système éducatif : échouer à un examen devrait inciter les élèves à faire mieux la prochaine fois.
Comment le cerveau réalise-t-il ce type d’apprentissage ? Le renforcement positif et négatif apparaît comme les deux faces d’une même médaille dans certaines parties du système d’évaluation du cerveau. Notamment, certains neurones qui libèrent le neuromodulateur « dopamine » présentent des résultats meilleurs ou pires que prévu avec une augmentation ou une diminution de leur activité, respectivement. Dans le même temps, de nombreuses preuves s’accumulent suggèrent que d’autres parties du cerveau gèrent le « négatif » et le « positif » de manière fondamentalement différente.
Les expériences négatives, lorsqu’elles sont rencontrées, ont souvent un effet excitant : elles ne nous laissent ni indifférents ni insouciants. Au-delà de cet éveil général, des parties spécifiques du néocortex sont activées, ce qui nous permet de prêter attention aux caractéristiques pertinentes et, éventuellement, d'en tirer des conséquences et d'apprendre – un concept parfois appelé « attention pour l'apprentissage ». En nous concentrant sur le côté négatif des choses, nous pouvons inventer cette « attention à l’apprentissage aversif ».
Une équipe de neuroscientifiques de l'Institut HUN-REN de médecine expérimentale de Budapest, en Hongrie, dirigée par le chercheur principal Balazs Hangya MD PhD, a demandé quelles régions du cerveau et quels types de neurones pourraient être responsables de « l'attention liée à l'apprentissage aversif ». Dans une nouvelle étude publiée aujourd'hui dans Communications naturellesl'équipe rapporte que les neurones inhibiteurs projetant à longue portée qui expriment la parvalbumine (PV), une protéine liant le calcium, connue pour ses capacités d'activité très rapide, située dans un noyau cérébral profond appelé « le membre horizontal de la bande diagonale de Broca » ou HDB joue un rôle clé dans ce processus.
Il a déjà été démontré que ces neurones HDB-PV transmettent des effets excitants au néocortex à des échelles de temps courtes et longues, et contrôlent des ondes cérébrales corticales rapides appelées oscillations gamma, importantes pour les processus cognitifs. Par conséquent, ils sont apparus comme de bons candidats pour médier « l’attention à l’apprentissage aversif ». L'équipe de Hangya a montré que ces neurones sont en effet recrutés par des événements aversifs chez des souris expérimentales, comme une bouffée d'air inattendue sur le visage que les souris s'efforcent d'éviter, ou l'odeur d'un prédateur craintif.
De tels événements aversifs concernent évidemment aussi bien les humains que les animaux et activent ainsi un certain nombre de voies provoquant une série de conséquences dans le cerveau. Avant tout, ces événements peuvent représenter une chance d’impact négatif durable, voire un danger immédiat, dont la probabilité devrait être atténuée par des comportements d’évitement. En effet, de nombreuses voies neuronales recrutées par les entrées aversives se sont avérées conduire à un évitement actif. Deuxièmement, des événements aversifs inattendus devraient accroître l’éveil et l’attention en activant les parties concernées du néocortex, recrutant ainsi des ressources permettant de faire face à la situation. Troisièmement, et c’est crucial pour la survie à long terme, les événements aversifs devraient induire un apprentissage permettant d’éviter ou de réduire l’impact de scénarios similaires à l’avenir.
Apprendre des expériences négatives est une stratégie de survie ancienne et profondément enracinée. C'est si fort que nous pouvons parfois en faire l'expérience nous-mêmes, qu'il peut même annuler l'effet du renforcement positif.
Panna Hegedüs, premier auteur de l'étude
L'équipe de Hangya a utilisé une technologie appelée optogénétique, qui peut rendre des types de cellules spécifiques, en l'occurrence les neurones HDB-PV, sensibles à la lumière. Ces techniques permettent une activation ou une suppression précise de l'activité des neurones par l'envoi programmé de lumière dans le tissu cérébral via de petites fibres optiques. Ils ont découvert que l’activation des neurones HDB-PV ne provoquait pas de comportement d’évitement chez la souris, ce qui suggère que cette voie n’est pas impliquée dans l’évitement actif comme la recherche d’un abri, mais qu’elle médiatise plus probablement l’attention et/ou les aspects d’apprentissage induits par des stimuli aversifs. En effet, lorsqu’elles bloquaient optogénétiquement les réponses des neurones aux bouffées d’air du visage, les souris ne parvenaient pas à apprendre des stimuli auditifs prédictifs discriminants prévoyant des bouffées d’air probables ou improbables. Cette expérience a démontré que les neurones HDB-PV sont nécessaires pour apprendre des stimuli aversifs.
Quel circuit cérébral assure cet effet d’apprentissage ? Les neurones n’agissent pas de manière isolée mais font partie de circuits complexes comportant diverses voies d’entrée et de sortie. L'équipe de Hangya, avec Gabor Nyiri et ses collègues du même institut, a cartographié les entrées et sorties des neurones HDB-PV. Ils ont découvert que ces cellules intègrent de multiples sources d’informations aversives, notamment des voies importantes provenant de l’hypothalamus et des noyaux du raphé du tronc cérébral. À leur tour, ils transmettent des informations intégrées au système dit limbique, largement responsable des réponses comportementales et émotionnelles, y compris le système septo-hippocampique important pour le stockage et le rappel des souvenirs épisodiques. De plus, les cellules HDB-PV inhibitrices ciblent principalement d’autres neurones inhibiteurs dans ces régions, soulageant ainsi probablement les cellules excitatrices de l’inhibition, leur permettant d’être plus actives – un mécanisme cérébral omniprésent appelé désinhibition.
En résumé, l'étude suggère que les neurones HDB-PV inhibiteurs à longue portée sont recrutés par des stimuli aversifs pour remplir des fonctions d'apprentissage associatives cruciales en augmentant l'excitabilité corticale au niveau de zones cibles spécifiques, probablement par désinhibition. Ainsi, au moins pour les stimuli aversifs, les neurones HDB-PV pourraient être le substrat physique du concept « d'attention pour l'apprentissage ».
«La dérégulation du traitement des valences positives et négatives peut être observée dans différents troubles psychiatriques, notamment l'anxiété et la dépression.» Il est donc crucial de comprendre comment la valence négative est codée dans le cerveau et comment elle contribue à l'apprentissage», conclut Panna Hegedüs.