La capacité de prédire avec précision les mouvements est essentiel non seulement pour les humains et les animaux, mais aussi pour de nombreuses applications d'IA – de la conduite autonome vers la robotique. Des chercheurs de l'Université technique de Munich (TUM) ont maintenant découvert que les réseaux de neurones artificiels peuvent mieux accomplir cette tâche lorsqu'elles sont formées avec des données biologiques du développement des premiers systèmes visuels.
Que ce soit chez la souris, les chats ou les humains: même avant que les vertébrés ouvrent les yeux, un programme de formation intégré commence dans la rétine – entièrement indépendante des stimuli externes. Les modèles d'activité spontanée se propagent dans des mouvements en forme d'onde à travers le tissu neural de l'œil. Cette activité neuronale, connue sous le nom de «ondes rétiniennes», coordonne le câblage précoce entre la rétine et le système visuel du cerveau. D'une certaine manière, l'œil commence à pratiquer la vision avant de rencontrer le monde réel.
Les chercheurs de TUM ont maintenant montré que les réseaux de neurones artificiels – qui imitent la fonction du cerveau – peuvent également bénéficier de ce type de pré-formation.
Les réseaux de neurones artificiels sont généralement formés à l'aide de données qui ressemblent étroitement à la tâche qu'ils sont destinés à effectuer. Une fois considérée par analogie avec la façon dont le système visuel se développe dans les organismes vivants, leur processus d'apprentissage ne commence que lorsque les yeux s'ouvrent. Nous nous sommes inspirés de la nature et avons incorporé une étape de pré-formation, analogue à celle du système visuel biologique, dans la formation des réseaux de neurones. «
Julijana Gjorgjieva, professeur de neurosciences informatiques chez TUM
La pré-formation mène à des prédictions plus rapides et plus précises
Dans la première étape, l'équipe a étudié si la formation avec des vagues de rétine a un impact sur les performances d'un réseau neuronal. Pour ce faire, ils ont formé différents réseaux de différentes manières: un groupe de réseaux a subi une pré-formation en utilisant des données d'ondes rétiniennes d'une souris. Ensuite, ces réseaux ont été formés à l'aide d'un film d'animation simulant la perspective d'une souris qui traverse un couloir étroit bordé de divers motifs géométriques. Un autre groupe de réseaux a été formé en utilisant uniquement le film d'animation – sans aucune pré-formation.
La tâche était la même pour tous les réseaux: ils devaient prédire avec précision comment les motifs visuels sur la paroi du couloir simulé allaient évoluer. Les réseaux pré-formés avec des ondes rétiniennes ont effectué la tâche plus rapidement et plus précisément que celles sans pré-formation. Pour exclure la possibilité que la meilleure performance soit simplement due à une période de formation plus longue, les chercheurs ont mené une autre série d'expériences dans lesquelles ils ont raccourci le temps passé à former les réseaux pré-formés sur l'animation. Cela a assuré que tous les réseaux avaient la même durée globale de formation. Même alors, les réseaux pré-formés ont surpassé les autres à la fois en vitesse et en précision.
Meilleure performance même avec des images réelles
Dans une dernière étape, l'équipe a augmenté le niveau de difficulté. Ils ont formé les réseaux en utilisant des images réelles capturées du point de vue d'un chat itinérant avec une caméra d'action, montrant ce que le chat voit. La qualité vidéo était plus faible que dans l'animation, et les mouvements étaient plus complexes. Encore une fois, les réseaux qui avaient été pré-formés par des vagues rétiniens ont surpassé tous les autres.
















