Des scientifiques des données de la Icahn School of Medicine du Mount Sinai à New York et leurs collègues ont créé un modèle d’intelligence artificielle qui peut prédire avec plus de précision quels médicaments existants, non actuellement classés comme nocifs, peuvent en fait entraîner des handicaps congénitaux.
Le modèle, ou « graphe de connaissances », décrit dans le numéro du 17 juillet du Nature journal Médecine des communications [DOI: 10.1038/s43856-023-00329-2], a également le potentiel de prédire l’implication de composés précliniques susceptibles de nuire au fœtus en développement. L’étude est la première du genre connue à utiliser des graphes de connaissances pour intégrer divers types de données afin d’enquêter sur les causes des handicaps congénitaux.
Les malformations congénitales sont des anomalies qui affectent environ 1 naissance sur 33 aux États-Unis. Ils peuvent être fonctionnels ou structurels et on pense qu’ils résultent de divers facteurs, dont la génétique. Cependant, les causes de la plupart de ces handicaps restent inconnues. Certaines substances présentes dans les médicaments, les cosmétiques, les aliments et les polluants environnementaux peuvent potentiellement entraîner des malformations congénitales si elles sont exposées pendant la grossesse.
« Nous voulions améliorer notre compréhension de la santé reproductive et du développement fœtal et, surtout, mettre en garde contre le potentiel de nouveaux médicaments à provoquer des malformations congénitales avant que ces médicaments ne soient largement commercialisés et distribués », déclare Avi Ma’ayan, PhD, professeur en sciences pharmacologiques. , et directeur du Mount Sinai Center for Bioinformatics à Icahn Mount Sinai, et auteur principal de l’article. « Bien que l’identification des causes sous-jacentes soit une tâche compliquée, nous espérons que grâce à une analyse de données complexe comme celle-ci qui intègre des preuves provenant de plusieurs sources, nous serons en mesure, dans certains cas, de mieux prédire, réglementer et protéger contre les dommages importants qui des handicaps congénitaux pourraient causer. »
Les chercheurs ont rassemblé des connaissances sur plusieurs ensembles de données sur les associations d’anomalies congénitales notées dans les travaux publiés, y compris ceux produits par les programmes du Fonds commun des NIH, pour démontrer comment l’intégration des données de ces ressources peut conduire à des découvertes synergiques. En particulier, les données combinées proviennent de la génétique connue de la santé reproductive, de la classification des médicaments en fonction de leur risque pendant la grossesse et de la manière dont les médicaments et les composés précliniques affectent les mécanismes biologiques à l’intérieur des cellules humaines.
Plus précisément, les données comprenaient des études sur les associations génétiques, les modifications de l’expression génique induites par les médicaments et les composés précliniques dans les lignées cellulaires, les cibles médicamenteuses connues, les scores de charge génétique pour les gènes humains et les scores de croisement placentaire pour les médicaments à petites molécules.
Surtout, en utilisant ReproTox-KG, avec apprentissage semi-supervisé (SSL), l’équipe de recherche a priorisé 30 000 médicaments précliniques à petites molécules pour leur potentiel à traverser le placenta et à induire des malformations congénitales. SSL est une branche de l’apprentissage automatique qui utilise une petite quantité de données étiquetées pour guider les prédictions de données non étiquetées beaucoup plus volumineuses. De plus, en analysant la topologie du ReproTox-KG, plus de 500 cliques d’anomalies congénitales/gènes/médicaments ont été identifiées qui pourraient expliquer les mécanismes moléculaires qui sous-tendent les anomalies congénitales induites par les médicaments. En termes de théorie des graphes, les cliques sont des sous-ensembles d’un graphe où tous les nœuds de la clique sont directement connectés à tous les autres nœuds de la clique.
Les enquêteurs avertissent que les résultats de l’étude sont préliminaires et que d’autres expériences sont nécessaires pour la validation.
Ensuite, les chercheurs prévoient d’utiliser une approche similaire basée sur des graphiques pour d’autres projets axés sur la relation entre les gènes, les médicaments et les maladies. Ils visent également à utiliser l’ensemble de données traité comme matériel de formation pour des cours et des ateliers sur l’analyse bioinformatique. En outre, ils prévoient d’étendre l’étude pour prendre en compte des données plus complexes, telles que l’expression génique à partir de tissus spécifiques et de types de cellules collectées à plusieurs stades de développement.
« Nous espérons que notre travail collaboratif débouchera sur un nouveau cadre mondial pour évaluer la toxicité potentielle des nouveaux médicaments et expliquer les mécanismes biologiques par lesquels certains médicaments, connus pour provoquer des malformations congénitales, peuvent fonctionner. Il est possible qu’à un moment donné dans le futur, les organismes de réglementation tels que la Food and Drug Administration des États-Unis et l’Environmental Protection Agency des États-Unis peuvent utiliser cette approche pour évaluer le risque de nouveaux médicaments ou d’autres applications chimiques », explique le Dr Ma’ayan.