Le coronavirus 2 du syndrome respiratoire aigu sévère (SRAS-CoV-2) continue de se propager rapidement, avec de nouvelles variantes apparaissant mois après mois qui résistent à la neutralisation par les anticorps contre les souches antérieures. Suite à l’infection, le nombre élevé de patients qui tombent gravement malades et gravement malades met à rude épreuve les services de santé.
Étude : Un modèle de prévision d’ensemble pour le risque de mortalité COVID-19. Crédit d’image : Adao/Shutterstock
Prédire laquelle du flot de personnes testées positives pour le virus serait inestimable pour diriger de manière optimale les services médicaux et de soutien nécessaires. De nombreux modèles ont été explorés pour fournir cette capacité, mais avec un succès limité.
Une nouvelle préimpression rapporte un nouveau modèle d’apprentissage automatique qui prédit prétendument le risque de mortalité de la maladie à coronavirus 2019 (COVID-19) chez les patients avec précision et à un stade précoce de l’infection.
Une version préimprimée de l’étude est disponible sur le medRxiv* serveur pendant que l’article est soumis à un examen par les pairs.
Comment fonctionnait le modèle ?
Dans cette étude, les scientifiques ont mis en place un nouveau système dans lequel les données ont été soumises à un prétraitement pour traiter des détails cliniques complexes avant d’être implémentées dans un ensemble de modèles d’ensemble (EM) pour produire une prédiction des risques pour les patients COVID-19. Un tel modèle dépend de l’exploitation des points forts de plusieurs modèles de base tels que Gradient Boosted Decision Tree (GBDT), Extreme Gradient Boosting (XGBoost), Random Forest (RF), Logistic Regression (LR) et Support Vector Machine (SVM),
Par la suite, ces modèles ont été entraînés sur une large cohorte. Le test de ces modèles dans une autre grande cohorte a conduit à une validation réussie des modèles prédictifs. C’est la première fois qu’un modèle prédisant les résultats à haut risque pour COVID-19 s’est avéré fiable dans un grand groupe indépendant et encourage l’espoir qu’ils pourraient être utiles dans des situations cliniques.
Les chercheurs ont utilisé 14 éléments cliniques sur 20 comme l’imputation des caractéristiques cliniques manquantes, ainsi que l’EM, pour augmenter la précision de la prédiction de la mortalité, comme le montre la comparaison des résultats de ce modèle avec ceux des systèmes de notation conventionnels utilisés pour évaluer COVID- 19 gravité.
De plus, ils ont utilisé un algorithme génétique (GA) pour sélectionner l’ensemble de caractéristiques des caractéristiques les plus appropriées à partir des caractéristiques cliniques, car l’inclusion de caractéristiques redondantes réduit la précision de la prédiction. Ils ont pu démontrer l’amélioration significative de la valeur prédictive après la suppression de ces fonctionnalités.
Lors de l’analyse de l’importance dans la prédiction du risque de décès, le plus important a été déterminé comme étant la pression artérielle moyenne (MAP), l’interleukine-6 (IL-6), la procalcitonine, les D-dimères (Ddimères), l’âge et les niveaux de glucose. L’algorithme GA a craché le coefficient de combinaison optimal d’utilisation complète en utilisant les cinq modèles de base utilisés pour l’EM.
Suite à cela, il y a eu une centaine de cycles de validation utilisant une technique de validation croisée moitié-moitié, dans tous lesquels l’EM s’est montré le meilleur pour prédire le résultat en utilisant une gamme d’indicateurs. Ainsi, à condition que certains paramètres physiologiques clés tels que les marqueurs inflammatoires, les tests de la fonction hépatique et rénale et les indicateurs de la fonction cardiovasculaire soient disponibles, une prédiction précoce du risque élevé de mortalité suite à une présentation avec COVID-19 peut être faite.
Ce serait un moyen simple de rediriger les ressources là où elles sont le plus nécessaires.
En plus des caractéristiques les plus précieuses, telles que l’âge, la MAP et les marqueurs physiologiques, d’autres tels que les marqueurs de la coagulation comme les D-dimères, les niveaux de glucose (qui sont liés à la fonction hépatique et rénale) et la fonction cardiaque comme indiqué par la troponine niveaux, sont également étroitement liés à la mortalité.
Pour rendre le modèle plus utile, les chercheurs ont défini les plages de référence pour chacune des caractéristiques cliniques utilisées ici afin de permettre une stratification rapide des risques pour les patients.
Les résultats des tests montrent la pertinence de la sélection des caractéristiques et la valeur de ce modèle, qui s’est avéré fournir des résultats robustes dans différentes populations, avec une gamme d’âges et d’ethnies, et avec des différences dans le type de caractéristiques incluses. Cela prouve qu’en dépit de ces variations, le rôle de l’âge, de la PAM et des marqueurs de l’inflammation, de la coagulation, de l’insuffisance hépatique et rénale et de la mauvaise fonction cardiovasculaire sont des caractéristiques prédictives utiles chez les patients COVID-19 pour la stratification du risque de mortalité.
Les résultats corroborent des études antérieures qui ont contribué à une prise de conscience de l’importance prédictive de ces marqueurs tout en soulignant l’efficacité de la sélection des caractéristiques telle qu’elle est utilisée dans ce modèle. L’approche EM a utilisé plusieurs modèles qui se sont avérés avoir de bonnes performances prédictives et d’autres modèles comme le modèle de régression logistique et la machine à vecteurs de support.
Lorsque les performances de différents modèles ont été comparées, une excellente discrimination a été montrée par ce modèle.
En général, notre modèle prédictif (EM) est efficace pour prédire le risque de mortalité lié au COVID-19.”
*Avis important
medRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique/les comportements liés à la santé, ou traités comme des informations établies.