Dans une étude récente publiée dans la revue npj Médecine Numériqueles chercheurs ont effectué une étude exploratoire pour analyser les modèles basés sur l’intelligence artificielle (IA) pour la prédiction du diabète sucré de type 2 (DT2).
Revue : Une revue de la portée des méthodes basées sur l’intelligence artificielle pour la prédiction du risque de diabète. Crédit image : Créé avec l’aide de DALL·E 3
Sommaire
L’importance croissante de l’IA dans les soins de santé
L’IA contribue au développement de modèles de prédiction du diabète, une maladie dont la prévalence augmente à travers le monde. Basée sur les profils de risque, cette technique tente d’évaluer le risque d’un individu de développer un DT2 et des complications associées. L’IA permet l’identification des patients à haut risque et le développement de méthodes préventives individualisées et de thérapies ciblées.
Étapes clés du développement de modèles d’IA
Les modèles d’IA doivent être développés par étapes, y compris la création, l’évaluation et la traduction du modèle en aide à la décision clinique. Une validation interne ou externe peut être utilisée, une validation externe étant recommandée pour un examen plus complet de la généralisabilité du modèle. Les modèles basés sur l’IA sont apparus comme une approche viable pour générer des modèles de prédiction du DT2, permettant des stratégies individualisées de prévention des maladies.
Méthodologie d’étude
Dans la présente revue complète, les chercheurs ont exploré les applications des approches prédictives basées sur l’intelligence artificielle pour prédire le risque de diabète.
Les données ont été recherchées systématiquement dans les bases de données Scopus, PubMed, Google Scholar et IEEE-Xplore pour trouver des études longitudinales pertinentes utilisant des modèles basés sur l’intelligence artificielle pour des sujets humains et publiées entre le 1er janvier 2000 et le 19 septembre 2022. De plus, les références aux études incluses ont été examinés pour identifier des enregistrements supplémentaires.
Seules les études évaluées par des pairs, les recherches originales et les actes de conférences utilisant des informations médicales, notamment les dossiers de santé électroniques (DSE), l’imagerie et la multiomique, ont été inclus. L’équipe a exclu les revues, commentaires, éditoriaux, lettres, prépublications, études transversales, celles sans utilisation d’IA, celles menées sur des sujets non humains, celles incluant le diabète de type 1 et gestationnel, et celles incluant les personnes souffrant de complications associées au diabète.
Les données extraites comprenaient les titres, l’année de publication, le nom du premier auteur, le type de publication, le pays, l’objectif de l’étude, l’échantillon de population, la conception de l’étude, les données démographiques des participants, les méthodes utilisées pour vérifier les diagnostics de DT2, la période de suivi et le type de source de données. De plus, l’équipe a enregistré le nombre et le type de modalités utilisées, le type d’IA, les algorithmes spécifiques et l’approche de validation. Un évaluateur a effectué une recherche de données, et deux études sélectionnées de manière indépendante et extrait les données, et les divergences ont été résolues en discutant ou en consultant un troisième évaluateur. Une approche de synthèse narrative a été utilisée pour l’analyse.
Ce que révèlent les données
Initialement, 1 105 documents ont été identifiés, dont 853 ont fait l’objet d’une vérification des titres et des résumés, 64 ont subi une vérification du texte intégral et 40 ont été pris en compte pour l’analyse finale. La plupart des études ont été publiées au cours des quatre années précédentes. La taille des échantillons variait de 244 à 1 893 901 individus, avec des populations diverses, notamment celles de Chine, de Finlande, de Californie et du Koweït.
Types de données et algorithmes les plus courants
La plupart des études étaient de type cohorte rétrospective, analysant les données provenant de grands ensembles de données privées et de bases de données accessibles au public telles que le Réseau canadien de surveillance sentinelle en soins primaires (CPCSSN), la San Antonio Heart Study (SAHS) et la Tehran Lipid and Glucose Study (TLGS). ). Une glycémie à jeun de 126 mg/dL ou plus et une hémoglobine glyquée (HbA1c) de 6,5 % et plus étaient les critères les plus couramment utilisés pour établir un diagnostic de DT2.
La plupart des études ont utilisé des modèles d’intelligence artificielle unimodaux (n = 30), dont 10 seulement ont utilisé des approches multimodales. Alors que les modèles unimodaux montraient une aire sous la courbe (AUC) de 0,8, les modèles multimodaux étaient supérieurs (AUC, 0,9). Les modèles classiques d’apprentissage automatique (ML) ont été utilisés dans la plupart (n = 10) des études, avec les DSE (y compris les données sociodémographiques, les antécédents familiaux de diabète, les facteurs liés au mode de vie, les mesures anthropométriques, les traits glycémiques, les taux de lipides sériques, de cholestérol et de TG) comme modalité de données la plus couramment utilisée.
De plus, les données multi-omiques (telles que les polymorphismes mononucléotidiques (SNP), les mesures métabolomiques et les données sur le microbiote) étaient prédominantes, alors que l’imagerie médicale était la moins utilisée. Les modèles classiques d’apprentissage automatique utilisaient des arbres de décision (DT) avec leurs variantes, telles que des arbres statistiques rapides, impartiaux et efficaces (QUEST) et des arbres de classification et de régression (CART). La modélisation de régression linéaire, les classificateurs de forêt aléatoire (RF), les machines à vecteurs de support (SVM), les classificateurs Naïve Bays (NB), l’amplification de gradient extrême (XGBoost) et KNN ont été utilisés dans 10 études, neuf études, huit études, cinq études, quatre. études et quatre études, respectivement.
Les limitations rencontrées à différentes étapes de la construction d’un modèle prédictif d’IA pour le DT2 : celles associées aux données sous-jacentes, à la construction et à l’évaluation du modèle, ainsi qu’à la traduction clinique.
Validation et interprétabilité : un aspect critique
Trente-neuf études ont effectué une validation interne, tandis que cinq seulement ont effectué une validation externe. La plupart des études ont utilisé les valeurs de l’aire sous la courbe (AUC) pour les mesures de discrimination. Il convient de noter que seules cinq études ont fourni des calibrages de modèles. Cinquante pour cent des études ont utilisé des méthodes d’interprétabilité pour identifier les prédicteurs de risque, et la plupart des modèles ont rapporté des prédicteurs communément connus. La glycémie à jeun, l’indice de masse corporelle (IMC), l’âge et les triglycérides sériques (TG) étaient les prédicteurs du risque de DT2 les plus fréquemment documentés. Les marqueurs métabolomiques comprenaient l’α-tocophérol, le mannose, le glucose, le mestranol, l’iboflavine, l’hydroxysphingomyéline C14:1 et la phosphatidylcholine acyl-alkyle C40:5. Les biomarqueurs basés sur l’imagerie pour les maladies rétiniennes liées au diabète comprenaient la tortuosité vasculaire, l’hémorragie rétinienne, les taches de coton et la dilatation veineuse.
Orientations et défis futurs
Sur la base de ces résultats, les modèles d’IA se sont révélés prometteurs dans la prévision du développement du DT2, mais des obstacles doivent être surmontés avant que leur plein potentiel puisse être réalisé. Pour évaluer les avantages potentiels des modèles d’IA, une validation et une évaluation approfondies via des essais cliniques et des recherches prospectives sont nécessaires. La fonction de l’IA en médecine n’est pas autonome mais plutôt un effort de collaboration entre les modèles d’IA et la connaissance humaine.
Prochaines étapes
Malgré les limites et les obstacles, les chercheurs doivent utiliser les technologies de l’IA pour accélérer la découverte des progrès et leur application dans la pratique clinique pour les patients et les professionnels de la santé.