L’épidémie actuelle de COVID-19 est l’une des pires pandémies de l’histoire et a fait des millions de vies à travers le monde, submergé les systèmes de santé et créé des ramifications socio-économiques sans précédent.
Le nouveau coronavirus 2 du syndrome respiratoire aigu sévère (SRAS-CoV-2) est apparu à Wuhan, en Chine, à la fin de 2019 et s’est rapidement propagé à travers le monde par transmission interhumaine. Les personnes infectées sont soit asymptomatiques, soit présentent un large éventail de symptômes allant d’une maladie de type grippal bénigne à une progression rapide vers une pneumonie et parfois la mort due à une insuffisance respiratoire. Alors que les patients présentant des symptômes légers se rétablissent rapidement, ceux atteints de COVID-19 sévère nécessitent une intervention médicale, une hospitalisation et même une ventilation dans les unités de soins intensifs.
Cette hétérogénéité de la pathogenèse du COVID-19 pose des défis pour l’élaboration de protocoles de traitement. Des études montrent que les symptômes graves de maladies infectieuses telles que le COVID-19 sont généralement associés à des variations du génome de l’hôte. De nombreuses études récentes, telles que les études d’association pangénomique (GWAS) du COVID-19 sévère, ont révélé les mécanismes biologiques à l’origine du COVID-19 sévère nécessitant une hospitalisation. En plus des facteurs génomiques, les données démographiques, les modes de vie, les facteurs socio-économiques et les comorbidités peuvent également influer sur l’exposition, la transmission, la gravité de la maladie et la charge virale. Une analyse rigoureuse des ensembles de données cliniques et génomiques est essentielle pour trouver les biomarqueurs associés au COVID-19 sévère.
Composants de RubricOE, en tant que pipeline ML d’ensemble extrayant des fonctionnalités stables à partir de données multi-omiques.
Analyse des données cliniques et génomiques à partir d’un vaste ensemble de données de DSE pour trouver les facteurs de risque courants de la gravité du COVID-19
Jusqu’à présent, la plupart des études visaient à trouver les facteurs de risque courants de COVID-19 sévère se concentrant soit sur les facteurs cliniques, soit sur les facteurs génomiques, mais pas sur les deux. Pour combler cette lacune, un groupe de chercheurs américains a récemment analysé divers facteurs à partir de données cliniques et génomiques à partir d’un vaste ensemble de données de DSE pour trouver les facteurs de risque courants de la gravité du COVID-19. L’étude est publiée sur le serveur de pré-impression, medRxiv*.
Les chercheurs ont appliqué des méthodes d’IA pour mieux interpréter les facteurs qui déterminent la gravité du COVID-19. Ils ont utilisé l’ensemble de données UK BioBank et analysé les données cliniques et génomiques des patients COVID-19, et étudié une grande cohorte prospective de patients britanniques dans le référentiel UKBB10. L’ensemble de données contenait une variété d’informations sur environ un demi-million de patients liées au diagnostic, à la démographie, aux tests de laboratoire, aux médicaments et aux informations génomiques d’environ un demi-million de patients. Les données utilisées étaient du 16 mars 2020 au 21 janvier 2021.
Ils ont exploité des algorithmes d’apprentissage automatique positifs et non étiquetés et ont utilisé un cadre d’analyse génomique de pointe appelé RubricOE pour l’extraction de caractéristiques génomiques. Les résultats ont proposé des algorithmes de prédiction de la gravité avec un score F1 élevé et ont fourni des informations sur les facteurs cliniques et génomiques affectant la gravité de la maladie.
Bien que d’autres études aient révélé que des facteurs tels que le tabagisme, le sexe (masculin), l’âge (plus de 65 ans) et l’hypertension préexistante, les maladies cardiovasculaires, le diabète, les maladies respiratoires, l’obésité, les maladies rénales, l’immunosuppression et le cancer étaient des facteurs de risque maladie, cette étude n’a pas révélé que le tabagisme et la présence de maladies respiratoires étaient des facteurs de risque importants pour l’augmentation des complications dues au COVID-19.
Les facteurs de risque associés à la mortalité liée au COVID-19 sont cruciaux dans les recherches futures
L’étude visait à identifier les facteurs cliniques et génomiques significatifs associés à une réponse sévère au virus SRAS-CoV-2 et a utilisé les données d’un ensemble de données de DSE britannique à grande échelle. L’équipe a utilisé un type particulier d’apprentissage automatique – apprentissage positif-non étiqueté – pour relever le défi de l’étiquette de classe bruyante du résultat de gravité du COVID-19.
Selon les auteurs, la modélisation clinico-génomique holistique utilisée dans cette étude peut potentiellement révéler l’effet de ces facteurs d’une manière robuste qui peut être utilisée comme biomarqueurs pour une meilleure prise de décision clinique. Ils prévoient d’étudier plus avant l’effet des protocoles de vaccination et de traitement sur la gravité du COVID-19 en exploitant les données des patients hospitalisés à l’avenir. L’étude des facteurs de risque associés à la mortalité liée au COVID-19 sera également un sujet crucial pour les recherches futures. Les auteurs ont également rendu compte de l’évolution de ces facteurs de risque au cours de la dernière année de la pandémie par rapport à des événements significatifs tels que l’émergence de nouvelles variantes, dont le B.1.1.7 du virus SRAS-CoV2.
«À l’avenir, nous prévoyons d’étudier plus en détail l’effet des protocoles de traitement et de la vaccination sur la gravité du COVID-19 en tirant parti des données des patients hospitalisés.»
*Avis important
medRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, orienter la pratique clinique / les comportements liés à la santé ou être traités comme des informations établies.
Référence du journal:
- Impact des facteurs cliniques et génomiques sur la gravité de la maladie du SRAS-CoV2 Sanjoy Dey, Aritra Bose, Prithwish Chakraborty, Mohamed Ghalwash, Aldo Guzman Saenz, Filippo Utro, Kenney Ng, Jianying Hu, Laxmi Parida, Daby Sow medRxiv 2021.03.15.21253549; doi: https://doi.org/10.1101/2021.03.15.21253549, https://www.medrxiv.org/content/10.1101/2021.03.15.21253549v1