Dans une étude récente publiée dans eClinicalMedicine, les chercheurs ont développé des modèles basés sur des questionnaires pour prédire l’incidence et la prévalence du diabète sucré de type 2 (DT2) dans différentes ethnies.
Étude: Modèles de prédiction efficaces basés sur des questionnaires pour le diabète de type 2 dans plusieurs ethnies : une étude de développement et de validation de modèles. Crédit d’image : NicoElNino/Shutterstock.com
Arrière-plan
Les technologies de dépistage et de prédiction sont essentielles à la détection et à la gestion précoce du DT2, en particulier chez les personnes non blanches. Ces personnes sont soumises à un concours complexe de circonstances, qui entraîne un départ précoce et les conséquences qui en découlent.
La technologie basée sur l’apprentissage automatique (ML) peut fournir un dépistage non invasif, permettant des évaluations préliminaires et des références, favorisant ainsi la santé de la population et réduisant les dépenses de santé.
À propos de l’étude
Dans la présente étude, les chercheurs ont développé des modèles de prédiction de l’incidence et de la prévalence du DT2 basés sur des questionnaires utilisant les données de la United Kingdom Biobank (UKBB) (à des fins de formation). Ils les ont appliqués aux données de l’étude Lifelines (pour validation) pour une utilisation auprès des individus blancs et non blancs.
Des algorithmes basés sur des questionnaires ont été formés à l’aide des données sur la population blanche de l’UKBB. La valeur clinique potentielle des algorithmes a été comparée à l’aide de deux autres modèles (avec des variables supplémentaires telles que des mesures physiques et des marqueurs biologiques) et des modèles de référence pour l’évaluation des risques cliniques afin de prédire l’apparition du DT2. Une modélisation de régression logistique a été réalisée pour prédire l’incidence et la prévalence du DT2.
L’ensemble de données de formation comprenait des individus blancs ayant participé à l’étude UKBB (472 696 individus, âgés de 37 à 73 ans, informations obtenues de 2006 à 2010) et a été validé pour cinq ethnies non blanches (29 811 individus) avec une validation externe utilisant les données Lifelines (168 205 individus âgés de 0 à 93 ans, données obtenues de 2006 à 2013).
La sélection des fonctionnalités a été effectuée pour le développement du modèle. L’aire sous la courbe des caractéristiques de fonctionnement du récepteur (ROC) (AUC) a été utilisée pour mesurer la précision prédictive et des analyses de sensibilité ont été effectuées pour évaluer la valeur clinique possible.
En outre, une analyse de reclassement a été réalisée après avoir comparé les modèles de prédiction basés uniquement sur un questionnaire à ceux incluant des biomarqueurs et des outils de risque physique et clinique de DT2.
Le DT2 a été diagnostiqué parmi les participants à la cohorte de formation à l’aide de données autodéclarées, notamment un diagnostic de DT2 basé sur un clinicien ou des dossiers hospitaliers avec les codes de diagnostic de la Classification internationale des maladies, neuvième révision (ICD-9).
Les participants à la cohorte de validation ont été classés comme ceux présentant un diabète de type 2 incident ou prévalent, sur la base de leur auto-évaluation.
Selon les recommandations du National Institute for Health and Care Excellence (NICE), les seuils de DT2 « potentiellement non diagnostiqués » dans les ensembles de données de formation et de validation comprenaient des taux de glycémie supérieurs à 7,0 mmol/L ou des taux d’hémoglobine glyquée (HbA1c) supérieurs à 48 mmol/L. mol. Les personnes atteintes de DT2 « potentiellement non diagnostiquées » ont été exclues de l’analyse afin de minimiser les biais dans les études de prévalence.
De plus, les chercheurs ont exclu tous les patients incidents de DT2 avec plus de huit ans avant le diagnostic et les individus qui n’ont pas contracté le DT2 mais ne sont pas revenus au centre d’évaluation après huit ans.
En outre, les chercheurs ont validé le score de risque de diabète finlandais cliniquement concis (FINDRISC) et l’outil clinique australien d’évaluation du risque de DT2 (AUSDRISK), qui utilisent respectivement neuf et 13 fonctionnalités pour prédire l’incident de DT2, couvrant les antécédents médicaux, la démographie, le mode de vie. , et l’anthropométrie.
Résultats
67 083 et 631 748 personnes ont été incluses pour évaluer respectivement l’incidence et la prévalence du DT2. Il convient de noter que les taux d’incidence et de prévalence du DT2 différaient considérablement entre les individus non blancs et blancs, les non-blancs présentant une prévalence 4,0 fois plus élevée (entre 12 % et 23 %) et une incidence 0,5 à 3,0 fois plus élevée (entre 1,4 % et 8,2 %) par rapport à la population blanche UKBB (6,00 % et 2,80 %, respectivement).
D’autre part, Lifelines a présenté une prévalence (deux pour cent) et une incidence (deux pour cent) inférieures du DT2 par rapport à la population blanche UKBB, ce qui pourrait s’expliquer en partie par les disparités d’âge entre les deux populations.
Dans l’échantillon White UKBB, les algorithmes ont correctement prédit la prévalence du DT2 (AUC de 0,9) et l’incidence sur huit ans (AUC de 0,9).
Les deux modèles se sont bien reproduits lors de la validation externe Lifelines, avec des valeurs d’ASC de 0,8 et 0,9 pour l’incidence et la prévalence, respectivement.
Les deux modèles basés sur ML ont toujours donné de bons résultats dans toutes les ethnies, avec des valeurs d’ASC comprises entre 0,86 et 0,89 pour la prévalence et entre 0,82 et 0,88 pour l’incidence du DT2.
Les modèles ont généralement surpassé les méthodes non laboratoires cliniquement vérifiées, reclassant de manière appropriée près de 3 000 cas supplémentaires. L’ajout de marqueurs biologiques, mais pas de données physiques, a augmenté les performances du modèle.
Les modèles de prévalence et d’incidence accordent une grande valeur à l’IMC et au nombre de médicaments utilisés, les plaçant parmi les trois principales caractéristiques des deux modèles. De plus, l’incidence contient un élément de sédentarité [time spent watching television (TV)].
En prévoyant la prévalence et l’incidence dans diverses données démographiques, les modèles ML basés sur des questionnaires de Lifelines ont surpassé FINDRISC et AUSDRISK.
Les modèles constitués uniquement de questionnaires ont obtenu un bon équilibre sensibilité-spécificité, VPP et VPN pour toutes les populations. L’équilibre sensibilité-spécificité s’est amélioré dans les modèles incluant des biomarqueurs, ce qui a entraîné une plus grande VPP entre les groupes.
Avec une signification statistique pour les populations blanches, caribéennes, autres et sud-asiatiques, les modèles ont catégorisé avec précision plus de cas que les techniques de prédiction cliniquement prouvées. Par rapport aux modèles de questionnaire, l’ajout de données physiques a permis de classer avec précision davantage d’incidents dans Lifelines. Dans presque tous les cas, les modèles basés sur des biomarqueurs surpassent les méthodes cliniques.
Dans l’ensemble, les résultats de l’étude ont montré que la prévalence et l’incidence du DT2 ont été prédites avec succès par les modèles ML de la biobanque britannique pour toutes les ethnies, y compris les individus non blancs.
Ces modèles ont surpassé les méthodes existantes, ce qui a donné lieu à une stratégie précise, évolutive et rentable pour identifier les instances positives et prévoir les risques.