Étude : Des modèles de glycémie aux résultats sur la santé : un modèle généralisable pour l'analyse des données de surveillance continue de la glycémie. Crédit photo : Orawan Pattarawimonchai / Shutterstock
*Avis important : arXiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et qui, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique/le comportement lié à la santé, ou traités comme des informations établies.
Sommaire
GluFormer, un modèle génératif basé sur un transformateur formé sur des données CGM, surpasse les outils d'analyse traditionnels en prédisant les résultats généraux en matière de santé et les risques futurs dans diverses populations et conditions.
Dans une étude récente publiée sur le arXiv* Des scientifiques israéliens ont présenté un modèle génératif basé sur une architecture de transformateur pour analyser les données de surveillance continue de la glycémie et prédire les schémas glycémiques. Ce modèle a des applications dans la stratification des risques, les soins du diabète et l'optimisation des stratégies de traitement.
Arrière-plan
Le diabète est devenu une crise sanitaire mondiale, touchant plus de 500 millions de personnes dans le monde et coûtant plus de 900 milliards de dollars chaque année. Bien que le diabète de type 2 comporte de nombreux facteurs de risque modifiables, notamment l’alimentation et le niveau d’activité physique, il augmente également le risque d’autres comorbidités telles que les problèmes de santé mentale, les maladies rénales et les maladies cardiovasculaires.
Les dispositifs de surveillance continue du glucose (SGC) ont contribué à améliorer la gestion du diabète en réduisant la fréquence des événements glycémiques, en améliorant le contrôle glycémique et en améliorant la qualité de vie globale. La surveillance continue du glucose est également utilisée pour détecter précocement la dysrégulation du glucose et personnaliser les choix alimentaires.
Parallèlement, le domaine de l’intelligence artificielle médicale (IA) évolue vers un apprentissage auto-supervisé capable d’analyser de grandes quantités de données non étiquetées, telles que celles collectées par les appareils CGM. Les modèles d’apprentissage auto-supervisé entraînés sont utilisés efficacement pour analyser les données des appareils portables et des images histopathologiques et rétiniennes afin de détecter des maladies.
À propos de l'étude
Dans la présente étude, les chercheurs ont décrit le développement d’un modèle génératif basé sur l’architecture du transformateur appelé GluFormer qui peut analyser de grandes quantités de données CGM provenant de diverses populations.
Le modèle a été initialement formé sur des données CGM provenant de participants non diabétiques inscrits au Human Phenotype Project. Cet ensemble de données comprenait plus de 10 millions de mesures de glucose provenant de 10 000 participants. Chaque mesure a été traitée comme un jeton discret, qui a été utilisé pour former le modèle en utilisant efficacement la méthode de prédiction du jeton suivant. Cette méthode de formation a permis à GluFormer de générer et d'étendre la série chronologique CGM.
De plus, l’utilisation de l’apprentissage auto-supervisé pour pré-entraîner le modèle lui a permis d’apprendre à partir de données non étiquetées, améliorant ainsi la capacité de GluFormer à capturer les modèles complexes dans les données CGM.
La capacité du modèle à créer des signaux CGM réalistes a ensuite été testée et validée à l'aide de comparaisons quantitatives et d'inspections visuelles utilisant des mesures glycémiques majeures, telles que les indicateurs de gestion de la glycémie et les niveaux moyens de glucose.
Les chercheurs ont ensuite appliqué la généralisabilité du modèle à des cohortes de validation présentant des caractéristiques glycémiques variées et provenant de différentes zones géographiques. Ces cohortes comprenaient des personnes atteintes de diabète gestationnel et de diabète de type 2.
GluFormer a également été appliqué aux données de différents types d'appareils CGM et à une variété de troubles sous-jacents pour tester sa robustesse dans différents scénarios. L'étude a également comparé les performances du modèle en matière de prédiction des résultats cliniques à celles d'autres modèles basés sur l'IA, tels que les perceptrons multicouches et les réseaux neuronaux convolutés.
De plus, les chercheurs ont intégré des données sur l’apport alimentaire aux données CGM pour créer une version multimodale de GluFormer qui pourrait améliorer la précision de la prédiction en mettant l’accent sur les réponses du glucose à des aliments spécifiques. Les chercheurs ont également intégré des informations temporelles telles que l’heure, le jour et le mois dans le modèle GluFormer pour capturer les fluctuations temporelles des niveaux de glucose.
Résultats
Les résultats ont démontré la capacité de GluFormer à analyser et à prédire les données CGM et à comprendre la dynamique des données de surveillance de la glycémie de différentes populations. L'approximation et la projection uniformes, ou UMAP, ont été utilisées pour tester la capacité de GluFormer à capturer des données pertinentes, et l'étude a révélé que les modèles d'intégration présentaient des informations cliniquement significatives sur la tolérance au glucose et le contrôle glycémique.
Le modèle a également été en mesure d'identifier avec précision les modèles spécifiques à chaque individu dans les données CGM. Performance de GluFormer dans la prédiction de l'hémoglobine A1C les niveaux ont dépassé ceux des perceptrons multicouches et des réseaux neuronaux convolutés, et le modèle a fourni des prédictions plus précises que les mesures cliniques standard.
De plus, des signaux CGM réalistes avec des mesures glycémiques corrélées ont été générés lorsque le modèle a été testé sur des cohortes comprenant des personnes atteintes de diabète gestationnel et de diabète de type 2, ce qui a soutenu les fortes capacités prédictives du modèle.
De plus, la version multimodale de GluFormer, intégrant des données alimentaires, a prédit les données CGM avec une corrélation plus élevée avec les données CGM observées, en particulier autour des heures de repas, et a amélioré la précision de prédiction du modèle. L'ajout d'informations temporelles a encore amélioré la capacité du modèle à générer des données CGM qui pourraient refléter avec précision les variations temporelles des niveaux de glucose tout au long de la journée.
Conclusions
Dans l’ensemble, l’étude a révélé que le modèle basé sur l’architecture du transformateur, GluFormer, formé à l’aide de l’apprentissage auto-supervisé, a démontré des niveaux élevés de précision dans la prédiction des données CGM et des résultats glycémiques dans des populations présentant des caractéristiques métaboliques et une géographie diverses. Il a surpassé les autres modèles basés sur l’IA, et l’intégration de données alimentaires dans la version multimodale du modèle a amélioré ses capacités prédictives et sa précision. Ces résultats soulignent l’utilité de GluFormer dans la gestion des maladies chroniques.
Notre nouvel article arXiv : Nous avons construit un modèle d'IA génératif des niveaux de glucose sanguin à partir de 10 millions de mesures de surveillance continue de la glycémie de 11 000 personnes du Human Phenotype Project
Nous montrons que notre modèle peut prédire des paramètres cliniques tels que les paramètres liés au foie, au sang… pic.twitter.com/h96Z6JrvZ2
— Eran Segal (@segal_eran) 23 août 2024
*Avis important : arXiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et qui, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique/le comportement lié à la santé, ou traités comme des informations établies.