Au 9 mars 2022, le coronavirus 2 du syndrome respiratoire aigu sévère (SRAS-CoV-2), l’agent causal de la pandémie de maladie à coronavirus 2019 (COVID-19), avait infecté plus de 446 millions de personnes et causé plus de 6 millions de décès dans le monde. , avec un taux de mortalité estimé à 1,5 %.
Étude: Un modèle prédictif d’hospitalisation et de survie au COVID-19 dans une étude rétrospective basée sur la population. Crédit d’image : Cryptographe / Shutterstock.com
Sommaire
Contexte
Les vaccins COVID-19 se sont avérés efficaces pour réduire les taux d’hospitalisation et de mortalité. Les périodes de transmission étendue du SRAS-CoV-2 pendant la pandémie en cours, également appelées «vagues», ont mis à rude épreuve les ressources hospitalières. Cette tension est en grande partie due au nombre sans précédent de cas de COVID-19 nécessitant des soins intensifs, qui a dépassé la capacité de l’unité de soins intensifs (USI).
Au cours de ces pics de transmission du SRAS-CoV-2, les taux de mortalité ont été particulièrement élevés en raison de la surcharge des systèmes de santé. Ainsi, à l’avenir, une stratification rapide des risques, une gestion clinique planifiée et une utilisation optimisée des ressources sont essentielles dans la gestion de la pandémie de COVID-19.
Les dossiers médicaux électroniques (DSE) servent de guides complets pour le triage précis et la gestion cohérente des patients COVID-19. L’intelligence artificielle a été utilisée pour prédire le pronostic des patients infectés par le SRAS-CoV-2 en utilisant des données sanitaires et démographiques collectées auprès des systèmes de santé.
Cependant, dans la plupart des cas, ces données sont biaisées, car la proportion de patients présentant des épisodes graves de la maladie reste faible. Par conséquent, l’apprentissage automatique supervisé n’est peut-être pas un modèle équilibré pour prédire les résultats de la COVID-19.
À propos de l’étude
Une étude récente publiée sur le medRxiv* Le serveur de préimpression présente une nouvelle technique pour résoudre les problèmes déséquilibrés pour la gestion efficace des patients infectés par le SRAS-CoV-2 en fonction des comorbidités, de l’âge et du sexe sur la base des données disponibles auprès du système de santé régional en Espagne.
De plus, cette technique impliquait l’utilisation de l’apprentissage automatique pour développer des modèles afin de déterminer si un patient COVID-19 nouvellement diagnostiqué nécessiterait une hospitalisation et prédire son pronostic.
Comme les données étaient très déséquilibrées en raison du nombre inférieur de patients expirés et hospitalisés par rapport aux patients sortis et ambulatoires, une nouvelle méthode d’apprentissage automatique basée sur l’ensemble et sensible au déséquilibre appelée partitions identiques pour les problèmes de déséquilibre (IPIP) a été proposée. Pour chaque question d’intérêt, deux modèles IPIP ont été créés et évalués avec une validation croisée quintuple.
Classification des sous-types de patients COVID-19
La présente étude a été menée entre le 4 janvier 2020 et le 4 février 2021 et a inclus des patients diagnostiqués avec COVID-19, comme confirmé par un test d’antigène positif ou un test de réaction en chaîne par polymérase de transcriptase inverse (RT-PCR) de pharynx ou nasal échantillons d’écouvillonnage.
Une analyse exploratoire de 86 867 patients positifs pour le SRAS-CoV-2 a montré que 93,7 % étaient des patients ambulatoires, dont 5,4 % hospitalisés en dehors des soins intensifs, tandis que 0,85 % étaient des patients en soins intensifs. Les symptômes les plus courants étaient la toux dans 49,9 % des cas, les maux de tête dans 38,3 % et les myalgies dans 36 %.
Les participants ont été classés en trois types. Le prototype ambulatoire était une femme âgée de 38 ans avec deux systèmes affectés et deux pathologies chroniques, avec des comorbidités courantes telles que l’hypertension artérielle, l’obésité, l’asthme et la dépression. Comparativement, le patient type hospitalisé non-USI était un homme âgé de 62 ans avec quatre systèmes affectés et cinq pathologies chroniques, avec des comorbidités plus fréquentes.
Le patient prototype de l’USI était un homme de 62 ans avec trois systèmes affectés et cinq pathologies chroniques, avec les comorbidités les plus fréquentes, notamment l’hypertension artérielle, le diabète sucré, l’obésité et l’arthrose. Les patients en soins intensifs avaient un taux de mortalité deux fois plus élevé que les patients hospitalisés non en soins intensifs.
D’autres enquêtes ont été menées pour différencier les survivants des défunts. Le prototype survivant était une femme âgée de 39 ans avec deux systèmes affectés et deux pathologies chroniques et comorbidités similaires aux patients ambulatoires.
Comparativement, le prototype décédé était un homme âgé de 83 ans avec cinq systèmes atteints et huit pathologies chroniques, dont la pathologie la plus fréquente était l’hypertension artérielle (75,64%). Les comorbidités supplémentaires de ce type de patient comprenaient le diabète sucré, la dépression, l’arthrose et l’obésité.
Trois variables, dont l’âge, la comorbidité et les systèmes affectés, étaient pertinentes pour l’état final d’un patient. L’augmentation de l’âge, le nombre de comorbidités et les systèmes d’organes affectés augmentaient la probabilité de décès. Une relation similaire pourrait être déduite entre les patients ambulatoires, les patients en soins intensifs et les patients hospitalisés non en soins intensifs.
Les mâles ont un taux de mortalité plus élevé que les femelles. Les comorbidités à risque plus élevé comprenaient l’insuffisance rénale, l’insuffisance cardiaque, les accidents vasculaires cérébraux, la démence et la cardiomyopathie ischémique. Les décès liés au COVID-19 n’ont pas pu être corrélés à la présence d’asthme, d’ostéoporose ou d’arthrose.
La précision des modèles d’apprentissage automatique
Plusieurs modèles d’apprentissage automatique ont été générés pour prédire le besoin d’hospitalisation des patients et leur état final. Pour gérer les données déséquilibrées, deux algorithmes d’apprentissage automatique, y compris la régression logistique et la forêt aléatoire, ont été évalués avec ou sans tenir compte de l’IPIP.
Le modèle utilisant la régression logistique avec IPIP (LR-IPIP) a fourni le meilleur résultat pour prédire l’état final d’un patient avec une précision équilibrée. Le résultat a montré que le ROC-AUC pour l’ensemble de données déséquilibré prédit par ce modèle était de 0,937.
Les déterminants les plus importants de l’état final des patients utilisant le modèle RL-IPIP comprenaient l’âge, l’obésité sexuelle, l’arthrose et le nombre de systèmes affectés.
Un ensemble de données de formation a été utilisé pour développer un modèle d’évaluation du besoin d’hospitalisation et un ensemble de données de test a été utilisé pour son évaluation. Le modèle LR-IPIP a donné les meilleurs résultats.
À l’aide du modèle RL-IPIP, le besoin d’hospitalisation a été prédit avec une précision équilibrée de 0,72 pour l’ensemble de données équilibré et entre 0,71 et 0,73 pour les ensembles de données déséquilibrés. Le ROC-AUC pour l’ensemble de données non équilibré prédit par ce modèle était de 0,746. L’âge, le sexe, l’insuffisance rénale, la dépression et le nombre de maladies chroniques étaient des caractéristiques pertinentes obtenues par le modèle RL-IPIP.
Importance des caractéristiques pour les modèles finaux. NSA est le nombre de systèmes affectés et NCD est le nombre de maladies chroniques.
conclusion
L’étude actuelle a développé et analysé des modèles basés sur l’apprentissage automatique qui pourraient prédire l’état final des patients infectés par le SRAS-CoV-2 avec une grande précision, ainsi qu’évaluer le besoin d’hospitalisation des patients avec une précision raisonnable. De plus, le déséquilibre des classes a été résolu en développant un nouvel algorithme appelé IPIP.
Le modèle LR-IPIP proposé pourrait être utilisé pour gérer efficacement les patients COVID-19 qui ont un accès limité aux ressources de santé. Les modèles prédictifs, ainsi que les applications Web correspondantes, sont accessibles sur GitHub pour une utilisation future dans les futures vagues de COVID-19 ou d’autres maladies respiratoires virales.
*Avis important
medRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique/les comportements liés à la santé, ou traités comme des informations établies.

















