Dans une étude récente publiée dans la revue npj Médecine Numérique, les chercheurs ont évalué un nouvel outil d’intelligence artificielle (IA) visant à évaluer les performances motrices de patients potentiels atteints de la maladie de Parkinson (MP). Leurs résultats mettent en évidence que le modèle d’apprentissage automatique (ML) a surpassé les évaluateurs certifiés par l’échelle unifiée d’évaluation de la maladie de Parkinson de la Movement Disorder Society (MDS-UPDRS) et les experts neurologiques étroitement appariés dans les mesures de performance diagnostique des tests standardisés de tapotement du doigt. Ces résultats expliquent la possibilité de n’avoir besoin que d’une webcam, d’un téléphone ou d’un appareil photo numérique pour diagnostiquer à distance la MP et d’autres troubles neurologiques dans des zones traditionnellement privées de soins neurologiques.
Étude : Utilisation de l’IA pour mesurer la gravité de la maladie de Parkinson à domicile. Crédit d’image : meeboonstudio/Shutterstock
Sommaire
Comment l’IA peut-elle aider les patients parkinsoniens ?
La maladie de Parkinson (MP) est un trouble neurologique caractérisé par des mouvements involontaires ou incontrôlables, tels que des tremblements, une raideur et des difficultés d’équilibre et de coordination. Les symptômes commencent généralement progressivement et s’aggravent avec le temps. À mesure que la maladie progresse, les gens peuvent avoir du mal à marcher et à parler. Jusqu’à présent, il n’existe aucun remède contre cette maladie, mais des ajustements réguliers des médicaments et des évaluations cliniques peuvent aider à gérer les symptômes et à améliorer la qualité de vie du patient.
La maladie de Parkinson est la deuxième maladie neurodégénérative la plus courante après la maladie d’Alzheimer. Il s’agit également de la maladie neurologique qui connaît la croissance la plus rapide, avec plus de 10 000 000 de patients dans le monde. Malheureusement, étant donné le manque d’experts en neurologie, en particulier dans les régions éloignées et sous-développées, de nombreux patients parkinsoniens reçoivent des soins neurologiques inadéquats et, par conséquent, un diagnostic et un traitement inappropriés. Des rapports estiment que 40 % des patients parkinsoniens aux États-Unis, un pays développé, ne reçoivent pas de soins spécialisés. Cette tendance est encore plus alarmante dans les régions en développement ou sous-développées, qui ne comptent qu’un seul neurologue pour un million d’individus.
La plupart des patients parkinsoniens sont des adultes de plus de 65 ans. Même dans les zones disposant d’un soutien neurologique suffisant, il est difficile d’organiser des visites cliniques régulières pour les personnes âgées dont la fonction motrice est altérée. Des modèles d’intelligence artificielle (IA) et d’apprentissage automatique (ML) ont récemment été proposés pour résoudre ce défi via un diagnostic automatisé de la maladie de Parkinson et une évaluation clinique. Des vidéos de tâches motrices, le plus souvent des exercices de tapotements avec les doigts, ont été utilisées pour entraîner des modèles afin d’évaluer la bradykinésie, le ralentissement des mouvements accompagnant fréquemment les troubles neurodégénératifs, notamment la MP.
« Imaginez que n’importe qui, n’importe où dans le monde, puisse effectuer une tâche motrice (c’est-à-dire taper du doigt) à l’aide d’une webcam d’ordinateur et obtenir une évaluation automatisée de la gravité de ses performances motrices. »
Bien que la déclaration mentionnée ci-dessus résume la vision des auteurs, elle présente trois complications fondamentales : premièrement, collecter avec précision suffisamment de données sur l’environnement domestique, qui est traditionnellement bruyant et hétérogène dans son environnement. Deuxièmement, identifier et développer des « biomarqueurs numériques » pour évaluer la présence et la gravité de la maladie de Parkinson. Troisièmement, créer une plateforme en ligne où les personnes âgées potentiellement déficientes motrices peuvent effectuer en toute sécurité et en privé les tâches d’évaluation requises sans supervision professionnelle.
Les travaux antérieurs dans le domaine ne portaient que sur des cohortes de formation de 20 personnes ou moins. Les études se sont concentrées uniquement sur les classifications binaires (PD ou pas de PD) mais n’ont pas réussi à évaluer la gravité de la maladie chez les patients atteints de cette maladie. Les modèles utilisés dans les analyses vidéo ont calculé des variables qui ne sont pas interprétables cliniquement. Plus important encore, les vidéos utilisées dans la formation prospective sur les modèles ML ont été enregistrées dans des environnements cliniques contrôlés et sans bruit, avec des conseils professionnels qualifiés. Compte tenu de la sensibilité des modèles ML, les modèles formés sur des données propres et sans bruit sont susceptibles d’être sous-performants dans des environnements domestiques bruyants, ce qui nécessite le développement d’un outil d’IA capable d’évaluer avec précision la présence et la gravité de la MP à partir de données potentiellement bruyantes dérivées d’enregistrements domestiques.
À propos de l’étude
La présente étude visait à développer, former et tester les performances de modèles ML capables d’utiliser des vidéos sur la fonction motrice capturées par webcam pour diagnostiquer avec précision la gravité de la MP à distance et automatiquement. Les données ont été collectées auprès de 250 participants du monde entier à l’aide de l’outil ParkTest en ligne accessible au public. Parmi eux, 202 participants se sont enregistrés en train d’effectuer la tâche de tapotage du doigt à la maison, tandis que 48 participants ont été filmés en utilisant une méthodologie identique dans une clinique. ParkTest a également collecté des informations sociodémographiques et cliniques sur les patients inscrits.
Trois neurologues spécialisés et deux non-spécialistes ont administré des évaluations cliniques pour les enregistrements vidéo de tâches réalisées en tapant du doigt. Les neurologues spécialisés comprenaient des professeurs associés ou titulaires d’instituts neurologiques américains réputés. Les non-spécialistes étaient un médecin (MBBS) ayant une expérience dans les études cliniques sur la MP et un résident en neurologie en début de carrière possédant une vaste expérience (10 ans) dans la recherche sur les troubles du mouvement. Les évaluations impliquaient de regarder une vidéo et d’attribuer un score compris entre zéro (normal) et quatre (sévère) conformément aux directives MDS-UPDRS. La directive stipule que chaque main est traitée comme un échantillon distinct, la taille de l’échantillon était donc de 500.
Les scores de gravité de la vérité terrain ont été calculés à l’aide d’évaluations provenant exclusivement de neurologues spécialisés, en utilisant le consensus entre au moins deux experts comme « vérité terrain ». Dans les cas où aucun des scores des spécialistes ne se chevauchait, la moyenne de leurs scores était considérée comme une vérité terrain. Les notes des spécialistes et des non-spécialistes ont été utilisées comme références pour comparer les performances finales du modèle ML.
Les caractéristiques des biomarqueurs numériques ont été sélectionnées en évaluant les mouvements de nombreuses parties vitales de la main. Les chercheurs ont identifié 21 points critiques par main à l’aide de MediaPipe, « un projet open source développé par GoogleAI qui fournit une API publique d’un modèle de pointe très précis pour l’estimation de la pose des mains ». Ces points ont donné 47 caractéristiques de frappe du doigt, dont la vitesse, l’amplitude, le ralentissement, l’hésitation et le rythme. Dix-huit fonctionnalités supplémentaires quantifient le mouvement du poignet. Les coefficients de corrélation (r) ont été mesurés pour chaque caractéristique, en comparant la caractéristique à la vérité terrain.
« Le processus d’extraction des caractéristiques comprend cinq étapes : (i) distinguer les tapotements du doigt gauche et droit de la vidéo enregistrée, (ii) localiser la main cible pour un suivi continu, (iii) quantifier les mouvements du doigt en extrayant la clé points en main, (iv) la réduction du bruit et (v) des fonctionnalités informatiques conformes aux directives cliniques établies, telles que MDS-UPDRS.
Cette étude a utilisé le modèle de régresseur Light Gradient Boosting Machine (LightGBM) comme outil d’IA. L’évaluation du modèle a été réalisée en utilisant l’approche de validation croisée « laisser un patient dehors ». Comme son nom l’indique, cette approche utilise un patient comme cohorte de test, tandis que tous les patients restants sont utilisés pour la formation du modèle. L’estimation des performances du modèle a été réalisée à l’aide de l’erreur quadratique moyenne (MSE), de l’erreur absolue moyenne (MAE), de l’erreur absolue moyenne en pourcentage (MAPE), du coefficient de corrélation de rang de Kendall (τ de Kendall), du coefficient de corrélation de rang de Spearman (ρ de Spearman) et du coefficient de corrélation de Pearson. (PCC).
La correction des biais a été effectuée à l’aide d’informations sociodémographiques et cliniques, en particulier le sexe, l’âge, l’origine ethnique et le statut diagnostique de la maladie de Parkinson. Enfin, pour tenir compte de l’hétérogénéité des conditions d’éclairage dans les différents foyers, il a été demandé aux classeurs d’évaluer la qualité de l’éclairage de chaque vidéo, après quoi les impacts d’un éclairage de mauvaise qualité sur les performances du classement et du modèle ont été estimés.
Résultats de l’étude
La présente étude a apporté trois contributions significatives, dont la première est que l’évaluation des tâches par tapotement du doigt peut être réalisée avec succès, précision et fiabilité par des neurologues spécialisés à distance via une vidéo diffusée ou enregistrée. Les neurologues spécialistes étaient tout à fait d’accord sur leur diagnostic de vidéos. Ils ont représenté les scores alpha et du coefficient de corrélation intra-classe (ICC) de Krippendorff de 0,69 et 0,88, respectivement.
« Les trois évaluateurs ont montré une différence d’au plus 1 point par rapport à la vérité terrain dans 99,2 %, 99,5 % et 98,2 % des cas, respectivement. Ces mesures suggèrent que les experts peuvent évaluer de manière fiable nos vidéos enregistrées à partir d’environnements domestiques. »
Deuxièmement, les outils d’IA peuvent surpasser les non-spécialistes et égaler presque les neurologues spécialisés dans leur diagnostic et leur évaluation de la gravité des vidéos de patients parkinsoniens. Les scores MAE absolus pour les spécialistes, les non-spécialistes et le modèle LightGBM formé étaient de 0,53, 0,83 et 0,58 (où le plus bas est le meilleur).
Enfin, les biais ou les confusions dus à des variables socio-économiques ou cliniques n’affectent pas l’exactitude ou la sensibilité du modèle, ce qui permet au modèle proposé d’aider potentiellement plus que les 250 patients inclus dans cette étude.
Conclusions
Dans la présente étude, les chercheurs ont évalué un outil d’IA de validation de principe pour évaluer automatiquement et à distance l’apparition et la gravité de la maladie de Parkinson chez les patients éprouvant des difficultés bénéficiant de soins neurologiques conventionnels. Leurs résultats indiquent qu’à la fois avec le modèle ML et avec une précision légèrement supérieure, les neurologues spécialisés peuvent diagnostiquer de manière fiable la MP et des troubles similaires de la fonction motrice en évaluant des vidéos de tests de patients réalisés par tapotement des doigts à distance.
« …notre outil n’est pas destiné à remplacer les visites cliniques pour les personnes qui y ont accès. Au lieu de cela, l’outil peut être utilisé fréquemment entre les visites cliniques pour suivre la progression de la MP, augmenter la capacité des neurologues à analyser les vidéos enregistrées avec des biomarqueurs numériques. et affiner les médicaments. Dans les milieux de soins où il y a une pénurie extrême de neurologues, l’outil peut jouer un rôle plus actif en évaluant automatiquement les symptômes fréquemment et en orientant le patient vers un neurologue si nécessaire.
Les modèles d’apprentissage automatique s’améliorent continuellement avec l’augmentation des ensembles de données d’échantillons. Alors que les auteurs se préparent à publier leur outil d’IA dans le domaine public, chaque patient supplémentaire deviendra un point d’échantillonnage supplémentaire pour affiner davantage la précision du modèle. À l’avenir, d’autres biomarqueurs neurologiques pourraient être découverts et améliorer davantage la fonctionnalité de l’outil.