Ma Clinique : L'information médicale par des professionnels de la santé
  • À la une
  • Actualités
  • Médecines douces
  • Chirurgie esthétique
  • Enfants
  • COVID-19NEW
Pas de résultat
View All Result
Ma Clinique : L'information médicale par des professionnels de la santé
Pas de résultat
View All Result

Accueil » Actualités médicales » Les scientifiques du MIT produisent un nouveau modèle de vision

Les scientifiques du MIT produisent un nouveau modèle de vision

par Ma Clinique
5 mars 2020
dans Actualités médicales
Temps de lecture : 5 min

picture20192f52ffuturistic_techno_design_on_background_of_supercomputer_data_center_-_image_-_timofeev_vladimir_m1_402c068791b640469e416c4f55d84afe-620x480-4286741

Lorsque nous ouvrons les yeux, nous voyons immédiatement notre environnement dans les moindres détails. Comment le cerveau est capable de former si rapidement ces représentations du monde riches en détails est l'un des plus grands casse-tête non résolus de l'étude de la vision.

Les scientifiques qui étudient le cerveau ont essayé de reproduire ce phénomène en utilisant des modèles informatiques de vision, mais jusqu'à présent, les modèles de pointe n'effectuent que des tâches beaucoup plus simples telles que sélectionner un objet ou un visage sur un fond encombré.

Maintenant, une équipe dirigée par des scientifiques cognitifs du MIT a produit un modèle informatique qui capture la capacité du système visuel humain à générer rapidement une description détaillée de la scène à partir d'une image, et offre un aperçu de la façon dont le cerveau y parvient.

Ce que nous essayions de faire dans ce travail est d'expliquer comment la perception peut être tellement plus riche que de simplement attacher des étiquettes sémantiques sur des parties d'une image, et d'explorer la question de savoir comment voyons-nous tout le monde physique. « 

Josh Tenenbaum, professeur de sciences cognitives computationnelles

Tenenbaum c'est aussi membre du laboratoire d'informatique et d'intelligence artificielle du MIT (CSAIL) et du Center for Brains, Minds and Machines (CBMM).

Le nouveau modèle postule que lorsque le cerveau reçoit une entrée visuelle, il effectue rapidement une série de calculs qui inversent les étapes qu'un programme d'infographie utiliserait pour générer une représentation 2D d'un visage ou d'un autre objet.

Ce type de modèle, connu sous le nom de graphiques inverses efficaces (EIG), est également en bonne corrélation avec les enregistrements électriques provenant de régions sélectives pour le visage dans le cerveau de primates non humains, ce qui suggère que le système visuel des primates peut être organisé de la même manière que le modèle informatique. , disent les chercheurs.

Ilker Yildirim, un ancien post-doctorant du MIT qui est maintenant professeur adjoint de psychologie à l'Université de Yale, est l'auteur principal de l'article, qui paraît aujourd'hui dans Avancées scientifiques. Tenenbaum et Winrich Freiwald, professeur de neurosciences et de comportement à l'Université Rockefeller, sont les principaux auteurs de l'étude. Mario Belledonne, étudiant diplômé à Yale, est également auteur.

Graphiques inversés

Des décennies de recherche sur le système visuel du cerveau ont étudié en détail comment l'apport de lumière sur la rétine est transformé en scènes cohérentes.

Cette compréhension a aidé les chercheurs en intelligence artificielle à développer des modèles informatiques qui peuvent reproduire des aspects de ce système, tels que la reconnaissance de visages ou d'autres objets.

« La vision est l'aspect fonctionnel du cerveau que nous comprenons le mieux, chez l'homme et les autres animaux », explique Tenenbaum. « Et la vision par ordinateur est l'un des domaines les plus réussis de l'IA à ce stade. Nous tenons pour acquis que les machines peuvent désormais regarder les images et reconnaître très bien les visages, et détecter d'autres types d'objets. »

Cependant, même ces systèmes sophistiqués d'intelligence artificielle ne se rapprochent pas de ce que le système visuel humain peut faire, dit Yildirim.

« Notre cerveau ne détecte pas simplement qu'il y a un objet là-bas, ni ne reconnaît et met une étiquette sur quelque chose », dit-il. « Nous voyons toutes les formes, la géométrie, les surfaces, les textures. Nous voyons un monde très riche. »

Il y a plus d'un siècle, le médecin, physicien et philosophe Hermann von Helmholtz a émis l'hypothèse que le cerveau crée ces riches représentations en inversant le processus de formation de l'image.

Il a émis l'hypothèse que le système visuel comprend un générateur d'images qui serait utilisé, par exemple, pour produire les visages que nous voyons pendant les rêves.

Faire fonctionner ce générateur à l'envers permettrait au cerveau de travailler en arrière à partir de l'image et de déduire quel type de visage ou d'autre objet produirait cette image, disent les chercheurs.

Cependant, la question restait: comment le cerveau pouvait-il exécuter ce processus, connu sous le nom de graphiques inverses, si rapidement?

Les informaticiens ont essayé de créer des algorithmes qui pourraient réaliser cet exploit, mais les meilleurs systèmes précédents nécessitent de nombreux cycles de traitement itératif, prenant beaucoup plus de temps que les 100 à 200 millisecondes dont le cerveau a besoin pour créer une représentation visuelle détaillée de ce que vous voyez.

Les neuroscientifiques croient que la perception dans le cerveau peut se dérouler si rapidement car elle est mise en œuvre dans un passage principalement à action directe à travers plusieurs couches de traitement neuronal organisées hiérarchiquement.

L'équipe dirigée par le MIT a entrepris de créer un type spécial de modèle de réseau de neurones profond pour montrer comment une hiérarchie neuronale peut rapidement déduire les caractéristiques sous-jacentes d'une scène – dans ce cas, un visage spécifique.

Contrairement aux réseaux de neurones profonds standard utilisés en vision par ordinateur, qui sont formés à partir de données étiquetées indiquant la classe d'un objet dans l'image, le réseau des chercheurs est formé à partir d'un modèle qui reflète les représentations internes du cerveau de ce que les scènes avec des visages peuvent ressembler.

Leur modèle apprend ainsi à inverser les étapes d'un programme d'infographie pour générer des visages.

Ces programmes graphiques commencent par une représentation tridimensionnelle d'un visage individuel, puis la convertissent en une image bidimensionnelle, vue d'un point de vue particulier. Ces images peuvent être placées sur une image d'arrière-plan arbitraire.

Les chercheurs théorisent que le système visuel du cerveau peut faire quelque chose de similaire lorsque vous rêvez ou évoquez une image mentale du visage de quelqu'un.

Les chercheurs ont formé leur réseau neuronal profond pour effectuer ces étapes à l'envers – c'est-à-dire qu'il commence par l'image 2D et ajoute ensuite des fonctionnalités telles que la texture, la courbure et l'éclairage, pour créer ce que les chercheurs appellent une représentation « 2.5D ».

Ces images 2.5D spécifient la forme et la couleur du visage d'un point de vue particulier. Celles-ci sont ensuite converties en représentations 3D, qui ne dépendent pas du point de vue.

« Le modèle rend compte au niveau des systèmes du traitement des visages dans le cerveau, lui permettant de voir une image et finalement d'arriver à un objet 3D, qui comprend des représentations de forme et de texture, à travers cette étape intermédiaire importante d'une image 2.5D « , Dit Yildirim.

Performances du modèle

Les chercheurs ont découvert que leur modèle est cohérent avec les données obtenues en étudiant certaines régions du cerveau de singes macaques. Dans une étude publiée en 2010, Freiwald et Doris Tsao de Caltech ont enregistré l'activité des neurones dans ces régions et analysé comment ils ont répondu à 25 visages différents, vus de sept points de vue différents.

Cette étude a révélé trois étapes de traitement de visage de niveau supérieur, qui, selon l'équipe du MIT, correspondent désormais à trois étapes de leur modèle graphique inverse: en gros, une étape dépendante du point de vue 2,5D; une scène qui fait le pont entre 2,5 et la 3D; et une étape 3D, invariante du point de vue, de la représentation du visage.

« Ce que nous montrons, c'est que les propriétés de réponse à la fois quantitatives et qualitatives de ces trois niveaux du cerveau semblent s'accorder remarquablement bien avec les trois premiers niveaux du réseau que nous avons construit », a déclaré Tenenbaum.

Les chercheurs ont également comparé les performances du modèle à celles des humains dans une tâche qui implique de reconnaître les visages de différents points de vue.

Cette tâche devient plus difficile lorsque les chercheurs modifient les visages en supprimant la texture du visage tout en préservant sa forme ou en déformant la forme tout en préservant la texture relative.

Les performances du nouveau modèle étaient beaucoup plus similaires à celles des humains que les modèles informatiques utilisés dans les logiciels de reconnaissance faciale de pointe, preuve supplémentaire que ce modèle pourrait être plus proche de l'imitation de ce qui se passe dans le système visuel humain.

Les chercheurs prévoient maintenant de continuer à tester l'approche de modélisation sur des images supplémentaires, y compris des objets qui ne sont pas des visages, pour déterminer si des graphiques inverses pourraient également expliquer comment le cerveau perçoit d'autres types de scènes.

De plus, ils pensent que l'adaptation de cette approche à la vision par ordinateur pourrait conduire à des systèmes d'IA plus performants.

« Si nous pouvons montrer que ces modèles peuvent correspondre à la façon dont le cerveau fonctionne, ce travail pourrait amener les chercheurs en vision par ordinateur à prendre plus au sérieux et à investir plus de ressources d'ingénierie dans cette approche graphique inverse de la perception », a déclaré Tenenbaum. « Le cerveau est toujours la référence pour tout type de machine qui voit le monde rapidement et richement. »

La source:

Massachusetts Institute of Technology

★★★★★

Précédent

Manger un œuf par jour est OK

Suivant

Une nouvelle technique permet d'étudier les interactions peptide-récepteur à la surface cellulaire

Ma Clinique

Ma Clinique

L'équipe Ma Clinique : professionnels de la santé et spécialistes en médecine générale. Notre objectif est de vous fournir les informations dont vous avez besoin pour prendre des décisions éclairées sur vos soins de santé.

En rapport avec cet article

L'imagerie optique révèle comment les cellules cancéreuses détournent l'activité métabolique pour alimenter la croissance des tumeurs pancréatiques
Actualités médicales

Un modèle de tumeur de lymphome synthétique à base d’hydrogel ouvre la voie à des thérapies personnalisées contre le cancer

29 mars 2023
La recherche de l'OSU met en lumière la façon dont les cellules cancéreuses malignes changent de forme
Actualités médicales

Jefferson Lab annonce la création d’un nouveau centre de recherche et d’innovation biomédicales

28 mars 2023
Combinaison de Covid-19 et de grippe liée à un risque accru de maladie grave, de décès
L'actualité du COVID-19

Un nouveau capteur à base de nanomatériaux détecte la grippe et le COVID-19 en seulement 10 secondes

28 mars 2023
L'assouplissement des restrictions COVID-19 a conduit à la réémergence de virus respiratoires saisonniers à Houston
Actualités médicales

Des scientifiques du NIH découvrent une maladie auto-inflammatoire causée par des mutations du gène LYN

28 mars 2023
Une étude révèle un risque accru de décès prématuré pour les survivants d'une crise cardiaque et d'un arrêt cardiaque
Actualités médicales

Un nouveau symposium se concentre sur les raisons pour lesquelles le cœur de certaines personnes s’arrête sans avertissement

28 mars 2023
Novel AI system can unobtrusively monitor elderly people in their living spaces
Actualités médicales

Un nouveau système d’IA peut surveiller discrètement les personnes âgées dans leurs espaces de vie

28 mars 2023

Articles populaires

Opération de l'hallux valgus : tout savoir sur cette intervention orthopédique

Opération de l’hallux valgus : tout savoir sur cette intervention orthopédique

29 mars 2023
Les compléments alimentaires pour la ménopause

Les compléments alimentaires pour la ménopause

27 mars 2023
Les brûle-graisse efficaces

Les brûle-graisse efficaces

27 mars 2023
Les dangers de la sédentarité sur votre santé : comment les éviter ?

Les risques de la sédentarité sur la santé et comment y remédier ?

22 mars 2023
La Hijama : les bienfaits de la cupping therapy

La Hijama : les bienfaits de la cupping therapy

22 mars 2023

Articles recommandés

La sieste pour préparer un examen

La sieste pour préparer un examen

3 janvier 2022
Que peut soigner un ostéopathe ?

Que peut soigner un ostéopathe ?

4 novembre 2022
Kinésithérapie pour les opérés d’une prothèse de hanche

Kinésithérapie pour les opérés d’une prothèse de hanche

5 février 2022
C’est quoi la téléassistance pour personnes âgées ?

C’est quoi la téléassistance pour personnes âgées ?

23 septembre 2022
Herbe à Pic ou zèb a pik

Herbe à Pic ou zèb a pik

17 janvier 2022
La réalité virtuelle contre la douleur de l’enfant

La réalité virtuelle contre la douleur de l’enfant

5 avril 2022
Les effets secondaires des injections d'acide hyaluronique

Les effets secondaires des injections d’acide hyaluronique

18 juillet 2021
Cynothérapie pour la dépression de personnes souffrant de démence

Cynothérapie pour la dépression de personnes souffrant de démence

5 janvier 2022

Quels sont les avantages de porter des lunettes anti lumiere bleue ?

23 septembre 2022
Le tai-chi pour ne pas chuter

Le tai-chi pour ne pas chuter

14 janvier 2022
Les étuis péniens pour l’incontinence masculine

Les étuis péniens pour l’incontinence masculine

23 septembre 2022
La douleur nociceptive : on vous en parle !

La douleur nociceptive : on vous en parle !

5 juillet 2022

Qui sommes-nous ?

Ma Clinique

Ma Clinique : L'information médicale par des professionnels de la santé.

Ma Clinique est géré par des professionnels de la santé qui ont à cœur de fournir des informations médicales précises et actualisées. Nous sommes une équipe de médecins et d'autres professionnels de la santé, et avons des années d'expérience dans le domaine de la médecine.

Nous trouver

Ma Clinique
11 rue Jules Ferry
01500 Ambérieu-en-Bugey
France

Articles récents

L'imagerie optique révèle comment les cellules cancéreuses détournent l'activité métabolique pour alimenter la croissance des tumeurs pancréatiques

Un modèle de tumeur de lymphome synthétique à base d’hydrogel ouvre la voie à des thérapies personnalisées contre le cancer

29 mars 2023
Le gouvernement britannique ouvre un nouveau centre de test COVID à Renfrew

Une étude montre les avantages de l’expansion de l’utilisation des services de télésanté pour les personnes atteintes d’un trouble lié à l’utilisation d’opioïdes

29 mars 2023
Les jeunes hommes adultes atteints de drépanocytose ne sont pas conscients des problèmes de fertilité associés à la drépanocytose, révèle une étude

Hemex Health reçoit une subvention de 3 millions de dollars pour faire avancer la commercialisation du test Gazelle Hb Variant pour le marché américain

29 mars 2023
Perte de poids avec chirurgie bariatrique associée à un risque moindre de cancer et de mortalité liée au cancer

Un médicament anti-obésité expérimental peut contrôler l’appétit sans chirurgie ni nausée

29 mars 2023

Notre équipe

  • Florence Bretille
  • Jules Gilbault
  • Ma Clinique
  • Stéphane Cohen
  • Mentions légales
  • Contactez-nous

© 2022 Copyright - L'information médicale par des professionnels de la santé.

Pas de résultat
View All Result
  • À la une
  • Actualités
  • Médecines douces
  • Chirurgie esthétique
  • Enfants
  • COVID-19

© 2022 Copyright - L'information médicale par des professionnels de la santé.

Ce site utilise les cookies. En continuant votre navigation sur ce site, vous acceptez l'utilisation des cookies afin d'assurer le bon déroulement de votre visite et de réaliser des statistiques d'audience. Visitez nos mentions légales .