La télésanté est devenue un moyen essentiel pour les médecins de continuer à fournir des soins de santé tout en minimisant les contacts en personne pendant le COVID-19. Mais avec les rendez-vous téléphoniques ou Zoom, il est plus difficile pour les médecins d’obtenir des signes vitaux importants d’un patient, tels que son pouls ou sa fréquence respiratoire, en temps réel.
Une équipe dirigée par l’Université de Washington a développé une méthode qui utilise la caméra sur le smartphone ou l’ordinateur d’une personne pour prendre son pouls et son signal de respiration à partir d’une vidéo en temps réel de son visage. Les chercheurs ont présenté ce système de pointe en décembre lors de la conférence Neural Information Processing Systems.
Maintenant, l’équipe propose un meilleur système pour mesurer ces signaux physiologiques. Ce système est moins susceptible d’être déclenché par différentes caméras, conditions d’éclairage ou caractéristiques du visage, telles que la couleur de la peau. Les chercheurs présenteront ces résultats le 8 avril lors de la conférence ACM sur la santé, les interférences et l’apprentissage.
L’apprentissage automatique est assez bon pour classer les images. Si vous lui donnez une série de photos de chats et que vous lui dites de trouver des chats dans d’autres images, il peut le faire. Mais pour que l’apprentissage automatique soit utile dans la télédétection de la santé, nous avons besoin d’un système capable d’identifier la région d’intérêt dans une vidéo qui contient la source la plus puissante d’informations physiologiques – le pouls, par exemple – puis de la mesurer au fil du temps. «
Xin Liu, auteur principal, doctorant à l’UW, Paul G. Allen School of Computer Science & Engineering
« Chaque personne est différente », a déclaré Liu. « Donc, ce système doit être capable de s’adapter rapidement à la signature physiologique unique de chaque personne, et de la séparer des autres variations, telles que ce à quoi elles ressemblent et dans quel environnement elles se trouvent. »
Le système de l’équipe préserve la confidentialité – il fonctionne sur l’appareil plutôt que dans le cloud – et utilise l’apprentissage automatique pour capturer les changements subtils dans la façon dont la lumière se reflète sur le visage d’une personne, ce qui est corrélé à la modification du flux sanguin. Ensuite, il convertit ces changements en pouls et en fréquence respiratoire.
La première version de ce système a été formée avec un ensemble de données qui contenait à la fois des vidéos des visages des gens et des informations de «vérité terrain»: le pouls et la fréquence respiratoire de chaque personne mesurés par des instruments standard sur le terrain. Le système a ensuite utilisé les informations spatiales et temporelles des vidéos pour calculer les deux signes vitaux. Il a surpassé les systèmes d’apprentissage automatique similaires sur des vidéos où les sujets bougeaient et parlaient.
Mais si le système fonctionnait bien sur certains ensembles de données, il se débattait toujours avec d’autres contenant des personnes, des arrière-plans et un éclairage différents. Il s’agit d’un problème commun connu sous le nom de « surajustement », a déclaré l’équipe.
Les chercheurs ont amélioré le système en lui faisant produire un modèle d’apprentissage automatique personnalisé pour chaque individu. Plus précisément, il permet de rechercher des zones importantes dans une image vidéo qui contiennent probablement des caractéristiques physiologiques corrélées à la modification du flux sanguin d’un visage dans différents contextes, tels que différents tons de peau, conditions d’éclairage et environnements. À partir de là, il peut se concentrer sur cette zone et mesurer le pouls et la fréquence respiratoire.
Bien que ce nouveau système surpasse son prédécesseur lorsqu’il est doté d’ensembles de données plus complexes, en particulier pour les personnes à la peau plus foncée, il reste encore du travail à faire, a déclaré l’équipe.
« Nous reconnaissons qu’il existe toujours une tendance à des performances inférieures lorsque le type de peau du sujet est plus sombre », a déclaré Liu. « C’est en partie parce que la lumière se reflète différemment sur une peau plus foncée, ce qui entraîne un signal plus faible pour la caméra à capter. Notre équipe développe activement de nouvelles méthodes pour résoudre cette limitation. »
Les chercheurs travaillent également sur diverses collaborations avec des médecins pour voir comment ce système fonctionne dans la clinique.
«Toute capacité à détecter le pouls ou la fréquence respiratoire à distance offre de nouvelles possibilités de soins à distance aux patients et de télémédecine. Cela peut inclure les soins personnels, les soins de suivi ou le triage, en particulier lorsqu’une personne n’a pas facilement accès à une clinique», a déclaré un senior l’auteur Shwetak Patel, professeur à la fois à l’école Allen et au département de génie électrique et informatique. «C’est passionnant de voir les communautés universitaires travailler sur de nouvelles approches algorithmiques pour résoudre ce problème avec des appareils que les gens ont à la maison.»
La source:
Référence du journal:
Liu, X., et coll. (2021) MetaPhys: adaptation en quelques coups pour la mesure physiologique sans contact. CHIL ’21: Actes de la Conférence sur la santé, l’inférence et l’apprentissage. doi.org/10.1145/3450439.3451870.