Les chercheurs ont développé TxGNN, un modèle basé sur l'IA qui surpasse les méthodes existantes en prédisant les traitements des maladies pour lesquelles il n'existe pas de thérapies approuvées, en utilisant des explications à plusieurs sauts pour offrir une plus grande transparence et une plus grande confiance.
Recherche : Un modèle de base pour la réutilisation des médicaments centrée sur le clinicien. Crédit d'image : unoL/Shutterstock
Une étude récente publiée dans la revue Médecine naturelle a développé TxGNN, un modèle de base basé sur des graphiques pour la réutilisation de médicaments sans injection. Seulement 5 à 7 % des maladies rares disposent de médicaments approuvés. L’élargissement de l’utilisation des médicaments existants pour de nouvelles indications peut contribuer à atténuer le fardeau mondial de la maladie. La réutilisation des médicaments exploite les données existantes en matière de sécurité et d’efficacité, permettant une traduction clinique plus rapide et une réduction des coûts de développement.
Prédire l’efficacité des médicaments contre toutes les maladies peut permettre de sélectionner des médicaments ayant moins d’effets secondaires, de concevoir des traitements plus efficaces pour plusieurs cibles d’une maladie et de réutiliser les médicaments disponibles pour de nouvelles utilisations thérapeutiques.
Les effets des médicaments peuvent être adaptés à de nouvelles indications en analysant les graphiques de connaissances médicales (KG). Bien que les méthodes informatiques aient identifié des candidats à la réutilisation, deux défis importants se posent. Premièrement, ces approches supposent que des prédictions thérapeutiques sont nécessaires pour les maladies pour lesquelles il existe déjà des médicaments.
Deuxièmement, la plupart des modèles ont tendance à identifier les médicaments sur la base de similitudes avec les traitements existants, ce qui ne parvient pas à traiter les maladies pour lesquelles aucun traitement n'est disponible. Pour une utilisation clinique, les modèles d'apprentissage automatique doivent faire des prédictions sans impact, c'est-à-dire prédire les médicaments pour des maladies avec une compréhension moléculaire limitée et aucun médicament approuvé. Toutefois, cette capacité est nettement inférieure pour les modèles existants.
TxGNN comble cette lacune en mettant en œuvre une approche de réutilisation de médicaments sans injection, en utilisant un GNN et un module d'apprentissage métrique spécialisé basé sur la similarité des maladies pour transférer les connaissances des maladies traitables à celles sans traitement.
L'étude et les résultats
Dans la présente étude, les chercheurs ont développé TxGNN, un modèle de base graphique pour la réutilisation de médicaments sans injection, qui prédit la réutilisation des candidats, y compris ceux qui manquent actuellement de traitements. TxGNN était composé de 1) un encodeur basé sur un réseau neuronal graphique (GNN), 2) un décodeur d'apprentissage métrique basé sur la similarité des maladies, 3) un pré-entraînement stochastique toutes relations suivi d'un réglage fin, et 4) un graphe multi-sauts. module explicatif.
TxGNN a été formé sur un KG médical, rassemblant des décennies de recherche sur 17 080 maladies. En outre, un explicateur TxGNN multi-sauts a été développé pour faciliter l’interprétation des candidats médicaments en reliant les paires médicament-maladie via des chemins de connaissances médicales interprétables. Cet explicateur fournit aux experts humains des explications transparentes à plusieurs sauts qui favorisent la confiance dans les prédictions générées par l’IA.
Les performances du modèle ont été évaluées sur divers ensembles de données d'exclusion. Un ensemble de données d'exclusion a été généré en échantillonnant des maladies du KG, qui ont été omises lors de la formation pour être utilisées ultérieurement comme cas de test. Ces maladies retenues étaient aléatoires ou spécifiquement choisies pour évaluer la prédiction du tir zéro.
TxGNN a été comparé à huit méthodes de pointe, dont un modèle de traitement du langage naturel, BioBERT, des méthodes GNN comme HGT et HAN et des techniques statistiques de médecine de réseau. Dans le cadre de la stratégie d'analyse comparative standard, où les maladies de l'ensemble de tests présentaient déjà certaines indications ou contre-indications pendant la formation, TxGNN a surpassé la méthode la plus puissante, HAN, d'une marge de 4,3 % dans l'AUPRC (Area Under Precision-Recall Curve) pour les indications.
Ensuite, l’équipe a évalué des modèles dans le cadre d’une réutilisation sans injection, dans lesquels des modèles étaient nécessaires pour prédire les candidats thérapeutiques pour les maladies dépourvues de traitements. Dans ce cas, TxGNN a montré une augmentation de 49,2 % de l’AUPRC pour les indications médicamenteuses et de 35,1 % pour les contre-indications par rapport au modèle suivant.
Ces gains sont particulièrement importants car les modèles conventionnels peinent dans des environnements de type zéro-shot, où aucune relation médicament-maladie préalable n'est disponible pour la formation. TxGNN a également été évalué dans des contextes rigoureux dans neuf domaines pathologiques, obtenant des gains AUPRC allant de 0,5 % à 59,3 % pour les indications médicamenteuses et de 11,8 % à 35,6 % pour les contre-indications.
Dans ce scénario, TxGNN a présenté des améliorations constantes de ses performances par rapport aux modèles existants, avec des gains AUPRC allant de 0,5 % à 59,3 % pour les indications médicamenteuses et de 11,8 % à 35,6 % pour les contre-indications. De plus, une étude pilote a été menée auprès de scientifiques et de cliniciens. Les participants comprenaient deux pharmaciens, cinq cliniciens et cinq chercheurs cliniciens. Il leur a été demandé d’évaluer 16 prédictions TxGNN, dont 12 étaient exactes.
Le temps d'exploration des participants, la précision de l'évaluation et les scores de confiance pour chaque prédiction ont été enregistrés. Ils ont considérablement amélioré leur confiance et leur précision lorsque les prédictions étaient accompagnées d’explications. De plus, lors des entretiens et des questionnaires administrés après la tâche, les participants ont signalé une plus grande satisfaction à l'égard de l'explicatif TxGNN, 91,6 % des participants étant d'accord sur le fait que les prédictions et les explications de TxGNN étaient précieuses.
En revanche, 75 % n’étaient pas d’accord, s’appuyant sur les prédictions de TxGNN sans explications. Ensuite, l'équipe a évalué si les médicaments prédits et leurs explications s'alignaient avec le raisonnement médical pour les maladies rares suivantes : le syndrome de Kleefstra, le syndrome d'Ehlers-Danlos et le syndrome néphrogénique d'antidiurèse inappropriée (NSIAD).
Ce protocole d'évaluation comprenait trois étapes. Tout d’abord, un expert humain a interrogé TxGNN pour identifier des médicaments potentiellement réutilisables. Ensuite, TxGNN Explainer a été interrogé pour illustrer pourquoi le médicament a été envisagé. Dans la troisième étape, des preuves médicales indépendantes ont été analysées pour vérifier les prédictions et les explications de TxGNN.
Le modèle a identifié le zolpidem, la trétinoïne et le nitrite d'amyle pour le syndrome de Kleefstra, le syndrome d'Ehlers-Danlos et le NSIAD, respectivement. Dans tous les cas, les explications de TxGNN étaient cohérentes avec les preuves médicales.
Validation dans le monde réel via les DME
Les chercheurs ont organisé une cohorte de plus de 1,2 million d'adultes ayant reçu au moins une prescription de médicament et une maladie à l'aide de dossiers médicaux électroniques (DME) provenant d'un système de santé et ont mesuré l'enrichissement de la cooccurrence médicament-maladie. Cette validation aligne les prédictions de TxGNN avec une utilisation clinique réelle.
L'enrichissement a été estimé comme le rapport entre les chances d'utiliser un médicament pour une maladie et celles de l'utiliser pour d'autres maladies. Au total, 619 200 valeurs de log (rapport de cotes) (log (OR)) ont été dérivées. TxGNN a généré une liste classée de candidats thérapeutiques pour chaque maladie phénotypée par DME.
Les médicaments liés à la maladie ont été omis et les nouveaux médicaments candidats ont été classés parmi les premiers, les cinq premiers, les 5 % les plus performants et les 50 % les moins performants. Les médicaments prédits les mieux classés avaient en moyenne des valeurs de log (OR) environ 107 % plus élevées que le log (OR) moyen des 50 % de prédictions inférieures, ce qui indique que les prédictions de TxGNN s'alignent bien avec les prescriptions hors AMM faites par les cliniciens.
Conclusions
Ensemble, l’étude a développé TxGNN pour la réutilisation de médicaments sans injection qui cible spécifiquement les maladies pour lesquelles les données et les options thérapeutiques sont limitées. TxGNN surpasse systématiquement les méthodes existantes en offrant des explications interprétables multi-sauts pour ses prédictions, ce qui améliore la confiance et la convivialité dans les flux de travail cliniques. En outre, les médicaments prévus correspondent au consensus médical des experts humains et s'alignent sur les taux de prescription hors AMM dans les DME.
Les explications interprétables multi-sauts de TxGNN offrent un nouveau niveau de transparence, favorisant la confiance et améliorant l'intégration du modèle dans les flux de travail cliniques.