Parmi toutes les maladies neurologiques, l’incidence de la maladie de Parkinson (MP) a considérablement augmenté. La MP est généralement diagnostiquée sur la base des symptômes du nerf moteur, tels que les tremblements au repos, la rigidité et la bradykinésie. Cependant, la détection de symptômes non moteurs, tels que la constipation, l’apathie, la perte d’odorat et les troubles du sommeil, pourrait aider au diagnostic précoce de la MP de plusieurs années à plusieurs décennies.
Dans un récent Sciences centrales de l’AEC étude, Des scientifiques de l’Université de Nouvelle-Galles du Sud (UNSW) discutent d’un outil basé sur l’apprentissage automatique (ML) qui peut détecter la MP des années avant l’apparition des premiers symptômes.
Étude: L’apprentissage automatique interprétable sur les données métabolomiques révèle des biomarqueurs de la maladie de Parkinson. Crédit d’image : SomYuZu / Shutterstock.com
Arrière-plan
À l’heure actuelle, la précision diagnostique globale de la MP basée sur les symptômes moteurs est de 80 %. Cette précision pourrait être accrue si la MP était diagnostiquée sur la base de biomarqueurs plutôt qu’en fonction principalement des symptômes physiques.
Plusieurs maladies sont détectées sur la base de biomarqueurs associés aux processus métaboliques. Les biométabolites des échantillons de plasma sanguin ou de sérum sont évalués à l’aide d’outils analytiques tels que la spectrométrie de masse (MS).
Les méthodes de diagnostic non invasives utilisant le sébum cutané et l’haleine ont récemment gagné en popularité. Des études antérieures ont montré que la SEP peut projeter des profils de métabolites différentiels entre les candidats pré-PD et les individus en bonne santé.
Cette différence dans les profils de métabolites a été observée jusqu’à 15 ans avant un diagnostic clinique de MP. Ainsi, les biomarqueurs de métabolites pourraient être utilisés pour détecter la MP beaucoup plus tôt que les approches récemment utilisées.
Les approches ML sont largement utilisées pour développer des modèles de prédiction précis pour le diagnostic des maladies à l’aide de grandes données métabolomiques. Cependant, le développement de modèles de prédiction basés sur des ensembles de données métabolomiques complets est associé à de nombreux inconvénients, notamment un surentraînement qui pourrait réduire les performances diagnostiques. La majorité des modèles sont développés à l’aide d’un plus petit sous-ensemble de caractéristiques, qui sont prédéterminées par des méthodes statistiques traditionnelles.
Certaines approches ML, telles qu’une machine à vecteurs de support linéaire (SVM) et une analyse discriminante partielle des moindres carrés (PLSDA) peuvent ne pas tenir compte des caractéristiques clés des ensembles de données métabolomiques. Cependant, cette limitation a été résolue par des méthodes ML avancées, telles que les réseaux de neurones (NN), qui ont été particulièrement conçus pour le traitement de données volumineuses.
NN est utilisé pour développer des modèles qui ont un effet non linéaire. Un inconvénient majeur des modèles prédictifs basés sur NN est le manque d’informations mécanistes et de modèles ininterprétables.
Les explications additives de Shapley (SHAP) ont récemment été développées pour interpréter les modèles ML. Cependant, cette technique n’a pas encore été utilisée pour analyser des ensembles de données métabolomiques.
À propos de l’étude
Dans l’étude actuelle, les chercheurs ont évalué des échantillons de sang obtenus à partir de l’étude prospective européenne espagnole sur la nutrition et le cancer (EPIC) à l’aide de différents outils analytiques tels que la chromatographie en phase gazeuse-MS (GC-MS), l’électrophorèse capillaire-MS (CE-MS) et le liquide chromatographie-MS (LC-MS).
L’étude EPIC a fourni des données métabolomiques à partir d’échantillons de plasma sanguin obtenus à la fois de candidats sains, ainsi que de ceux qui ont développé plus tard la MP jusqu’à 15 ans plus tard après le prélèvement initial de leur échantillon.
Diane Zhang, chercheuse à l’UNSW, a développé un outil d’apprentissage automatique appelé Analyse de classification et de classement à l’aide de réseaux de neurones générant des connaissances à partir de la SEP (CRANK-MS). Cet outil a été conçu pour interpréter le cadre basé sur NN afin d’analyser l’ensemble de données métabolomiques généré par les outils analytiques.
CRANK-MS comprend plusieurs fonctionnalités, y compris des paramètres de modèle intégrés qui offrent une haute dimensionnalité des ensembles de données métabolomiques à analyser sans nécessiter de caractéristiques chimiques de présélection.
CRANK-MS inclut également SHAP pour explorer et identifier rétrospectivement les caractéristiques chimiques clés qui aident à la prédiction précise du modèle. De plus, SHAP permet des tests de référence avec cinq méthodes ML bien connues pour comparer les performances de diagnostic et valider les caractéristiques chimiques.
Les données métabolomiques obtenues auprès de 39 patients qui ont développé la MP jusqu’à 15 ans plus tard ont été étudiées à l’aide du nouvel outil basé sur le ML. Le profil métabolite de 39 patients pré-PD a été comparé à celui de 39 patients témoins appariés, ce qui a fourni une combinaison unique de métabolites pouvant être utilisée comme signe d’alerte précoce de l’incidence de la MP. Notamment, cette approche ML a montré une plus grande précision pour prédire la MP avant le diagnostic clinique.
Cinq métabolites ont obtenu des scores constamment élevés dans les six modèles de ML, indiquant ainsi leur utilité potentielle pour prédire le développement futur de la MP. Ces classes de métabolites comprenaient la substance alkyl polyfluorée (PFAS), les triterpénoïdes, le diacylglycérol, les stéroïdes et les stéroïdes cholestane.
Les isomères 1,2-diacylglycérol (34:2) du métabolite diacylglycérol détectés sont certaines huiles végétales comme l’huile d’olive, qui est fréquemment consommée dans le régime méditerranéen. Le PFAS est une neurotoxine environnementale qui peut altérer le traitement, la signalisation et la fonction des cellules neuronales. Ainsi, des facteurs alimentaires et environnementaux peuvent contribuer au développement de la MP.
conclusion
CRANK-MS est accessible au public pour tous les chercheurs intéressés par le diagnostic des maladies à l’aide de l’approche ML basée sur des données métabolomiques.
L’application de CRANK-MS pour détecter la maladie de Parkinson n’est qu’un exemple de la façon dont l’IA peut améliorer la façon dont nous diagnostiquons et surveillons les maladies. Ce qui est excitant, c’est que CRANK-MS peut être facilement appliqué à d’autres maladies pour identifier de nouveaux biomarqueurs d’intérêt. Elle a en outre affirmé que cet outil est convivial et peut générer des résultats « en moins de 10 minutes sur un ordinateur portable conventionnel ».