Modèles pronostiques d’apprentissage profond et d’apprentissage automatique pour la maladie pulmonaire obstructive chronique

Dans une étude récente publiée dans The Lancet Digital Health, des chercheurs ont réalisé une méta-analyse pour évaluer la qualité et les performances des modèles d’apprentissage profond et d’apprentissage automatique pour le pronostic à long terme de la maladie pulmonaire obstructive chronique (MPOC). Ils ont également comparé les modèles avec les modèles de régression prédictifs précédents.

Étude: Modèles prédictifs d’apprentissage automatique et d’apprentissage profond pour le pronostic à long terme chez les patients atteints de maladie pulmonaire obstructive chronique : une revue systématique et une méta-analyse. Crédit d’image : LALAKA/Shutterstock.com

Arrière-plan

La BPCO est une cause importante de mortalité dans le monde et les dépenses liées à son traitement vont probablement augmenter. Les modèles d’apprentissage profond et d’apprentissage automatique sont de plus en plus utilisés pour prédire la progression à long terme des patients atteints de BPCO afin de réduire les coûts et d’améliorer l’efficacité de la prestation des soins de santé.

L’apprentissage profond utilise des structures hiérarchiques pour apprendre des structures et des relations complexes, tandis que l’apprentissage automatique utilise des algorithmes pour apprendre des règles et des corrélations à partir de données. L’apprentissage profond gagne en popularité comme moyen d’identifier les patients atteints de BPCO risquant de connaître de mauvais résultats.

À propos de l’étude

Dans la présente méta-analyse, les chercheurs ont comparé les performances pronostiques des modèles d’apprentissage profond et d’apprentissage automatique pour la BPCO.

L’équipe a recherché dans les bases de données Cochrane Library, PubMed, ProQuest, Embase, Web of Science et Scopus depuis le début de l’étude jusqu’au 6 avril 2023 des études pertinentes publiées en anglais qui utilisaient l’apprentissage profond ou l’apprentissage automatique pour estimer les résultats pour les patients ≥ 6,0 mois après la première étude. Diagnostic de BPCO. Des recherches manuelles dans les références des études incluses et des revues systématiques ont été effectuées pour identifier les études manquées.

L’équipe a inclus des études portant sur des participants humains âgés de 18 à 90 ans ayant des antécédents de BPCO depuis ≥ 6,0 mois, permettant des modalités de saisie.

Les études ont documenté l’aire sous les valeurs de la courbe caractéristique du récepteur-opérateur (ROC) (AUC) pour estimer les décès, les exacerbations et la réduction forcée du volume expiratoire en une seconde (VEMS). Des études de cohortes rétrospectives et prospectives, des études transversales, des études cas-témoins et des essais cliniques randomisés ont été inclus.

Les études pronostiques sur le développement de la BPCO chez des individus qui n’étaient pas initialement atteints de BPCO ont été exclues, tout comme les études pronostiques qui n’incluaient pas au moins six mois de suivi. Deux chercheurs ont examiné les données de manière indépendante et les désaccords ont été résolus par discussion ou en consultant un autre chercheur.

Les chercheurs ont évalué l’hétérogénéité à l’aide de la statistique Q de Cochran (une valeur I² supérieure à 50 % indiquait une hétérogénéité significative). Ils ont évalué les risques de biais et la qualité des rapports à l’aide respectivement des listes de contrôle PROBAST et TRIPOD.

L’apprentissage automatique a été décrit comme des algorithmes plus complexes que les modèles de régression, comprenant des machines à vecteurs de support et une analyse aléatoire de forêts, qui pourraient apprendre à porter des jugements basés sur des modèles de données.

L’apprentissage profond a été décrit comme l’utilisation de réseaux de neurones avec ≥2,0 couches cachées. L’hospitalisation a été utilisée comme indicateur d’aggravation. Les changements dans la performance du test de marche de six minutes, la dyspnée ou la charge de BPCO, tels que déterminés par des questionnaires ou des mesures psychophysiques, ont été utilisés comme indicateurs de substitution pour la réduction du VEMS.

Résultats

L’équipe a initialement identifié 3 620 études, dont 18 répondaient aux critères d’éligibilité, et parmi elles, six et 12 utilisaient respectivement des modèles d’apprentissage profond et d’apprentissage automatique.

Sept modèles ont évalué les risques d’exacerbation ; cependant, seulement six ont rapporté des valeurs d’ASC (AUC combinée, 0,8). La valeur I² de 97 % indiquait une hétérogénéité significative dans les études incluses.

Onze modèles ont estimé les risques de décès ; cependant, seulement six ont rapporté des valeurs d’ASC (AUC combinée, 0,8) avec une hétérogénéité significative (I² de 60 %). Deux études ont évalué les réductions de la fonction pulmonaire, mais n’ont pas pu être regroupées.

Une réduction de la fonction pulmonaire > 30 mL sur cinq ans a été prédite avec une ASC de 0,8 sur une cohorte de 42 individus utilisant une validation croisée multipliée par cinq, et la diminution globale du volume pulmonaire a été prédite avec une ASC de 0,7 chez 4 496 patients utilisant une validation croisée multipliée par 10. validation croisée imbriquée.

Les modèles basés sur l’apprentissage profond et l’apprentissage automatique n’ont montré aucune amélioration significative dans l’estimation des exacerbations par rapport aux scores préexistants pour la gravité de la maladie. Trois études ont évalué de manière comparative les modèles basés sur l’apprentissage automatique et les évaluations de la gravité de la maladie pour l’estimation de la mortalité, et cinq études de validation externes ont montré des performances inférieures à celles de la modélisation de régression.

Les risques de biais étaient principalement attribués à une mauvaise gestion des informations manquantes, à l’utilisation d’ensembles de données trop petits et à la non-documentation de l’incertitude du modèle.

La méta-analyse n’a indiqué aucune différence significative dans l’ASC regroupée entre les modèles d’apprentissage automatique et les modèles de régression conventionnels (valeurs d’ASC regroupées, 0,77 contre 0,75).

L’étude a révélé que 50 % des 12 études sur l’apprentissage automatique présentaient un ratio événement par variable inférieur à 10, avec un nombre médian d’événements positifs de 82 et 154 variables prédictives. Les six études restantes avaient une EPV supérieure à 20, avec un événement positif médian de 1 645 et une variable prédictive de 11,5.

Sur la base des résultats de l’étude, il existe peu de preuves que les modèles d’apprentissage profond et d’apprentissage automatique surpassent les scores de gravité préexistants de la BPCO pour le pronostic à long terme de la BPCO. Les chercheurs doivent suivre les critères PROBAST et TRIPOD pour augmenter la reproductibilité des résultats de l’étude.

En raison de la quantité de variables nécessaires, les modèles conventionnels ont une applicabilité clinique limitée. Cependant, il existe plus de chances dans la pratique clinique d’évaluer par apprentissage profond les données de tomodensitométrie (TDM).