Dans une récente étude publiée sur medRxiv* serveur de pré-impression, les chercheurs ont démontré que deux gènes, la GTPase, le membre de la famille IMAP 7 (GIMAP7) et le récepteur 2 de la sphingosine-1-phosphate (S1PR2), ont le potentiel de prédire la maladie grave à coronavirus 2019 (COVID-19) avec ~ 90% de précision.
Étude : La méta-analyse transcriptomique prédit deux biomarqueurs humains robustes pour une infection grave par le SRAS-CoV-2. Crédit d’image : Marcin Janiec/Shutterstock
Sommaire
Arrière plan
La réponse de l’hôte à l’infection par le coronavirus 2 du syndrome respiratoire aigu sévère (SRAS-CoV-2) a été variée ; en conséquence, la demande de biomarqueurs associés à la gravité de la maladie COVID-19 n’a cessé de croître. Plusieurs études ont montré que divers facteurs contribuent aux différences observées dans la gravité du COVID-19 en évaluant les associations entre la gravité de la maladie et différents aspects du système immunitaire adaptatif. Cependant, il y a un manque d’études explorant les biomarqueurs transcriptionnels associés au COVID-19 léger par rapport au COVID-19 sévère.
À propos de l’étude
Dans la présente étude, les chercheurs ont effectué une méta-analyse des données de transcriptomique humaine disponibles pour identifier les marqueurs pronostiques transcriptionnels afin d’éclairer les décisions concernant les soins des patients infectés par le SRAS-CoV-2 sous traitement dans les hôpitaux. L’équipe a recherché des ensembles de données pertinents en fonction de trois critères prédéfinis, comme suit :
i) l’hôte était un être humain ;
ii) les données ont été générées par des expériences de séquençage d’acide ribonucléique (ARN-seq) ;
iii) les échantillons de sang ou les cellules mononucléaires du sang périphérique humain (PBMC) ont été prélevés sur des patients pendant la phase aiguë de l’infection par le SRAS-CoV-2 et avaient des métadonnées de gravité COVID-19 associées.
Ils ont obtenu 358 échantillons publics de transcriptome humain à partir de trois études indépendantes d’ARN-seq de la base de données omnibus d’expression génique (GEO). En outre, les chercheurs ont soumis ces échantillons à un flux de travail de traitement de données spécialisé appelé flux de travail modulaire reproductible automatisé pour le prétraitement et l’analyse différentielle des données ARN-seq (ARMOR) afin de quantifier l’expression génique chez chaque patient. Ce processus a utilisé Salmon pour mapper les lectures au transcriptome du consortium de référence du génome humain human build 38 (GRCh38).
De même, ils ont utilisé edgeR pour calculer l’expression différentielle des gènes (DGE) à partir des comptes de lecture ; enfin, ils ont utilisé Camera pour calculer les termes d’ontologie des gènes (GO) à partir de la liste des identifiants de gènes produite par edgeR. Une transformation de score z a normalisé le nombre de saumons pour chaque gène dans chaque échantillon GEO.
Enfin, l’équipe a formé un algorithme d’apprentissage automatique aux données de comptage de lecture pour identifier les gènes qui pourraient le mieux séparer les échantillons de patients en fonction de la gravité du COVID-19 et produire une liste de gènes en fonction de leurs valeurs d’impureté Gini qui mesurent l’entropie. Les transcriptions des gènes avec de plus grandes valeurs d’impureté de Gini ont représenté les gènes qui pourraient prévoir le plus exactement le phénotype COVID-19.
Résultats de l’étude
Les échantillons de l’étude se sont vu attribuer une gravité élevée ou faible et ont été traités pour obtenir des lectures ajustées de qualité mappées au transcriptome humain pour calculer les niveaux de DEG. Dans l’ensemble, les auteurs ont identifié 8 176 DEG significatifs, dont les plus significatifs étaient l’aspartate bêta-hydroxylase (ASPH), le cadre de lecture ouvert 30 du chromosome 5 (C5orf30), la diacylglycérol kinase eta (DGKH) et la famille des transporteurs de solutés 26 (SLC26A6).
L’enrichissement GO a donné 90 termes GO significatifs, y compris l’apoptose, la réponse immunitaire et la signalisation I-kappaB kinase/NF-kappaB. En outre, les auteurs ont évalué les voies de signalisation intracellulaires les mieux représentées par ces DEG à l’aide de l’algorithme d’analyse d’impact des voies de signalisation. L’analyse a montré neuf voies de signalisation significativement affectées par le COVID-19 sévère. Parmi ces neuf voies, cinq étaient directement associées à la signalisation du récepteur des lymphocytes T (TCR), tandis qu’une sixième décrivait une synapse immunologique de la protéine kinase 70 (Zap70) associée à la chaîne zêta ; notamment, les six voies sont restées inhibées pendant le COVID-19 sévère.
L’équipe a construit un tableau avec tous les transcrits de chaque gène et les données de cartographie lues ont été représentées sous forme de tableaux et de lignes, respectivement, pour générer une courbe caractéristique récepteur-opérateur (ROC). Les auteurs ont noté une aire sous la courbe (AUC) de 96,6 % sur tous les transcrits, indiquant que la réponse transcriptionnelle de l’hôte a contribué à la gravité du COVID-19.
L’AUC pour six gènes avec les valeurs d’impureté Gini les plus élevées était de 94,3 %. L’analyse a quantifié l’ASC combinée de 89,8 % pour les deux principaux DEG, GIMAP7 et S1PR2. De plus, les comptes de lecture moyens et médians pour ces deux gènes étaient environ trois fois plus élevés dans les échantillons à faible gravité du COVID-19.
conclusion
Une étude antérieure sur les biomarqueurs transcriptionnels du SRAS-CoV-2 a identifié le gène GIMAP7 ; cependant, il ne l’a pas classé parmi les meilleurs biomarqueurs. L’approche actuelle de l’étude a permis aux chercheurs de détecter la directionnalité des gènes GIMAP7 et S1PR2. De plus, les résultats de l’étude ont illustré la régulation génique ascendante et descendante qui différenciait le mieux chaque patient COVID-19 dans une population plus diversifiée.
Les futures études devraient déterminer si ces biomarqueurs sont toujours des prédicteurs cohérents de la gravité de l’infection chez les patients infectés par des variants plus récents du SRAS-CoV-2, tels qu’Omicron. En outre, des expériences supplémentaires sont nécessaires pour confirmer s’il est possible de reproduire les résultats de l’étude dans des échantillons de patients d’âges et de groupes à risque différents. Néanmoins, l’étude a conçu un test pronostique qui pourrait contribuer aux efforts de triage des patients à risque plus élevé de développer un COVID-19 sévère et aider à réduire la charge sur les ressources hospitalières dans le monde.
*Avis important
medRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique/les comportements liés à la santé, ou traités comme des informations établies.