Dans un article récent publié dans Rapports scientifiques, les chercheurs ont souligné l’importance des outils utilisés pour interpréter les résultats des modèles prédictifs dans la gestion du diabète de type 1 (DT1).
Étude: L’importance de l’interprétation des modèles d’apprentissage automatique pour la prédiction de la glycémie dans le diabète : une analyse à l’aide de SHAP. Crédit d’image : Buravleva stock/Shutterstock.com
Sommaire
Introduction
À cette fin, ils ont d’abord sélectionné un ad hoc étude de cas axée sur une patiente de l’ensemble de données OhioT1DM.
Ensuite, ils ont « rejoué » rétrospectivement les données des patients pour trouver un algorithme de prédiction approprié qui pourrait être intégré dans un système d’aide à la décision (DSS) pour aider à faire des suggestions de bolus d’insuline correctifs (CIB).
Ils ont réalisé leurs expériences sur deux modèles ad hoc de réseaux neuronaux de mémoire à long terme (LSTM), non physiologiques (np)-LSTM et physiologiques (p)-LSTM, avec une précision de prédiction similaire mais la capacité de donner des décisions cliniques différentes.
Étant donné que les LSTM peuvent apprendre et maintenir des dépendances à long et à court terme à partir des données, ils sont adaptés à la prédiction de séries chronologiques.
Alors que np-LSTM et p-LSTM reposaient sur les mêmes caractéristiques et structures d’entrée, ce dernier avait une couche de prétraitement non apprenable entre l’entrée et la couche LSTM cachée, comprenant deux filtres qui se rapprochaient des courbes de décroissance physiologique de l’insuline. et les glucides (CHO), mesurés en grammes/minute.
Arrière-plan
Dans le DT1, l’homéostasie du glucose est altérée ; ainsi, les patients s’auto-administrent généralement de l’insuline et suivent un régime alimentaire restreint et des routines d’exercice. Maintenir les niveaux de glycémie (BG) dans la plage requise de 70 à 180 mg/dl réduit le risque de mortalité et les autres complications liées à l’hyperglycémie.
Les progrès technologiques ont facilité la surveillance des niveaux de glucose à l’aide de capteurs de surveillance continue du glucose (CGM). Ils fournissent une mesure de glycémie toutes les cinq minutes et lorsque la glycémie dépasse les seuils, ils génèrent des alertes visuelles et acoustiques. Ainsi, les patients peuvent prendre des mesures correctives en temps opportun (par exemple, un CIB) pour améliorer leur taux glycémique.
Bien que la technologie permette d’éviter les événements indésirables, la prévision du niveau de glycémie en temps réel nécessite également des systèmes avancés de DSS et de pancréas artificiel (APS). Le premier aide les patients dans le processus de prise de décision clinique, sur la base duquel le second permet l’administration automatisée d’insuline.
Les modèles d’apprentissage automatique avec DSS sont devenus des outils populaires pour la gestion du DT1. Ils aident à prévoir les niveaux de glycémie et fournissent des suggestions thérapeutiques préventives, comme le CIB.
La sécurité des patients étant primordiale, les modèles utilisés dans la pratique clinique doivent être physiologiquement solides, avoir une précision de prédiction élevée et produire des résultats interprétables.
Même si les modèles d’apprentissage automatique garantissent des performances précises, les scientifiques ont exprimé des inquiétudes quant à l’interprétabilité de leurs résultats. De plus, il n’y a aucune transparence dans leur logique inhérente.
De plus, il existe des biais cachés dans les ensembles de données disponibles sur le DT1. Par conséquent, les modèles de boîte noire actuellement utilisés pourraient parfois mal interpréter l’effet de ces entrées sur les niveaux de glycémie.
Un tel scénario pourrait être potentiellement dangereux lorsque des modèles sont activement utilisés pour suggérer des actions thérapeutiques dans la pratique clinique. Cela met en évidence la nécessité d’outils pour interpréter les résultats du modèle, par exemple SHapley Additive ExPlanation (SHAP).
Ils comprennent chaque prédiction d’un algorithme individuellement et dans quelle mesure chaque entrée contribue à la sortie des modèles.
À propos de l’étude
Dans la présente étude, les chercheurs ont sélectionné une patiente qui a soigneusement rapporté ses repas et ses données CIB pendant 10 semaines, c’est-à-dire tout au long de la période de suivi de l’étude.
Ses données CGM ne manquaient que 3 % des mesures, ce qui permettait une évaluation équitable des algorithmes prédictifs et des performances du DSS. Elle avait un temps au-dessus de la plage (TAR) et un temps dans la plage (TIR) élevés (~ 46 % et 54 %) sur l’ensemble des données de test.
L’équipe a utilisé les 10 derniers jours de ses données pour calculer la précision des prévisions des modèles et les six semaines de données restantes pour entraîner les deux LSTM.
De plus, ils ont utilisé un sous-ensemble de l’ensemble de tests (une fenêtre postprandiale de huit heures) pour évaluer les actions correctives à l’insuline suggérées par le DSS.
Le ReplayBG développé en interne est un roman in silico méthodologie qui a aidé les chercheurs à évaluer rétrospectivement l’efficacité des actions correctives suggérées par le DSS des modèles LSTM.
Résultats
Le graphique récapitulatif SHAP décrit la valeur de chaque fonctionnalité dans chaque échantillon de l’ensemble de données de l’étude.
Chaque ligne du graphique récapitulatif représente une caractéristique, la CGM et l’insuline étant les deux caractéristiques les plus importantes. L’impact de insuline sur les résultats du modèle semblait faible, comme l’indique la faible ampleur des valeurs SHAP associées à cette fonctionnalité.
Quelques valeurs de CHO ont eu un impact positif sur les prédictions de glycémie, tandis que d’autres ont eu un impact négatif. C’était surprenant car on sait que la consommation de CHO augmente les niveaux de glycémie chez les patients atteints de DT1. Ces résultats suggèrent que le modèle s’appuie principalement sur les lectures CGM passées pour prédire les futurs niveaux de glycémie.
Les valeurs SHAP observées ont montré que la colinéarité entre insuline et CHO dans l’ensemble de données de test, il était difficile pour l’algorithme d’apprentissage de distinguer l’effet individuel sur le résultat.
Insuline a contribué positivement au résultat du modèle dans np-LSTM pour PH = 30 et 60 minutes, ce qui implique que np-LSTM prédirait un pic de glycémie après tout bolus d’insuline, même lorsque le patient ne consommait pas de CHO.
Conclusions
En conclusion, SHAP a élucidé les résultats des modèles de boîte noire et a montré que seul le p-LSTM apprenait la relation physiologique entre les apports et la prédiction du glucose.
Seul le p-LSTM pourrait améliorer le contrôle glycémique des patients lorsqu’il est intégré au DSS. Ainsi, le p-LSTM est le modèle le plus adapté à toute application décisionnelle.