Avec une nouvelle subvention de l’armée américaine, une équipe de scientifiques cherchera à améliorer l’intelligence artificielle en intégrant des cellules cérébrales appelées astrocytes.
En codant une caractéristique de l’intelligence biologique appelée apprentissage par renforcement, dans laquelle nous apprenons de manière itérative des succès et des échecs, les «réseaux de neurones profonds» (DNN) ont révolutionné l’intelligence artificielle avec des démonstrations spectaculaires de maîtrise des échecs et du go.
Mais ils ont du mal à faire face aux problèmes du monde réel rencontrés quotidiennement par les humains et les autres animaux. Une nouvelle collaboration basée au MIT postule qu’une lacune fondamentale des réseaux de neurones profonds est qu’ils ne sont que neuraux.
L’équipe vise à prouver que les DNN pourraient devenir beaucoup plus puissants en intégrant un autre type de cellule cérébrale: les astrocytes.
«Trop d’accent mis sur les neurones a supprimé toute analyse du rôle de ces cellules qui constituent 50% des cellules cérébrales», a déclaré Mriganka Sur, professeur Newton de neurosciences au Picower Institute for Learning and Memory au MIT et chef du projet financé par l’armée américaine avec jusqu’à 6,5 millions de dollars sur cinq ans via une subvention de l’Initiative de recherche universitaire multidisciplinaire. L’équipe comprend quatre membres du corps professoral des départements des sciences du cerveau et des sciences cognitives (BCS) et du génie électrique et informatique (EECS) du MIT, ainsi que des professeurs du California Institute of Technology et de l’Université du Minnesota.
Étant donné les jeux où les règles et le contexte ne varient jamais, le temps n’a pas d’importance et toutes les informations sur l’état du jeu sont toujours apparentes sur le plateau, les DNN actuels à la pointe de la technologie peuvent rester terriblement inefficaces ou carrément inconscients de toutes sortes. des facteurs que les humains et les animaux doivent systématiquement prendre en compte, a déclaré Sur.
Il s’agit notamment de trouver un équilibre entre l’exploration d’une situation incertaine et son exploitation pour avancer vers l’objectif; comment faire le suivi des heures supplémentaires dont les étapes s’avèrent finalement cruciales pour le succès; et comment extraire et transférer les connaissances de ces étapes clés pour une application dans des contextes inattendus mais liés.
Il y a de plus en plus de preuves, a déclaré Sur, que les astrocytes dotent les cerveaux biologiques de ces capacités en agissant comme un réseau parallèle recouvrant celui des neurones.
Les raffinements de calcul que cela apporte incluent l’intégration d’informations sur de longues échelles de temps, la modulation sélective des connexions clés entre les neurones appelés synapses et la fourniture d’une infrastructure dans laquelle les actions clés les plus étroitement associées à la récompense – même si cela prend plusieurs étapes supplémentaires pour atteindre – peuvent être reconnues et réutilisé.
Les astrocytes sont des liens clés dans la coordination d’un processus par lequel des produits chimiques appelés neuromodulateurs guident les neurones dans le cortex préfrontal du cerveau pour mener à bien l’exploration et guident les cellules du striatum cérébral pour exécuter l’exploitation.
La collaboration étudiera l’hypothèse selon laquelle l’intégration des astrocytes dans les DNN peut radicalement améliorer leur efficacité et leurs performances. Les collaborateurs Pulkit Agrawal, professeur assistant en EECS, et Alexander Rakhlin, professeur agrégé en BCS, dirigeront les efforts pour intégrer les astrocytes dans la théorie de l’apprentissage par renforcement.
John O’Doherty, professeur de psychologie à Caltech, mènera des expériences pour tester les prédictions théoriques en surveillant l’imagerie cérébrale chez les humains alors qu’ils traversent des tâches qui confondent les DNN actuels. Ann Graybiel, professeur à l’institut BCS, le fera chez la souris, où elle étudie l’apprentissage par renforcement et ses racines dans le striatum.
Pendant ce temps, Sur et Alfonoso Araque du Minnesota mesureront le fonctionnement des astrocytes dans les circuits cérébraux des souris au fur et à mesure de leur apprentissage, et manipuleront même les cellules pour voir comment cela change les performances d’apprentissage par renforcement. Les résultats expérimentaux aideront ensuite à affiner la théorie du groupe.
Par exemple, les humains joueront à un jeu vidéo dans lequel ils doivent collecter des pièces, mais ne peuvent pas le faire sans avoir d’abord trouvé un seau. Le seau se remplira fréquemment, ce qui les obligera à déposer les pièces collectées dans une banque avant de pouvoir collecter plus de pièces.
Les gens ne prendront pas longtemps pour comprendre comment reconnaître et naviguer dans ces contextes changeants, mais un DNN devrait lutter puissamment. Grâce à de telles tâches et à des tâches simplifiées chez la souris, l’équipe s’attend à voir comment les régions du cerveau et les astrocytes et neuromodulateurs à l’intérieur font des différences clés.
« Notre hypothèse centrale est que l’interaction des astrocytes avec les neurones et les neuromodulateurs est la source de prouesses informatiques qui permettent au cerveau d’effectuer naturellement un apprentissage de récompense et de surmonter de nombreux problèmes associés aux systèmes d’apprentissage par renforcement (RL) de pointe », le l’équipe a écrit dans leur subvention.
Les astrocytes peuvent intégrer et moduler les signaux neuronaux à travers diverses échelles de temps allant de l’activité synaptique aux changements d’état comportemental et d’apprentissage. Notre projet est un effort combiné pour faire avancer la théorie des systèmes RL et faire progresser la neurobiologie de la fonction astrocytaire, grâce à une conception synergique de la théorie et des expériences. «
Des chercheurs