Le coronavirus 2 du syndrome respiratoire aigu sévère (SARS-CoV-2) et le coronavirus du syndrome respiratoire aigu sévère (SARS-CoV) appartiennent au sous-genre Sarbecovirus, dont la longueur génomique est d’environ 30 000 paires de bases. Ces virus codent pour quatre protéines structurelles, à savoir la pointe (S), l’enveloppe (E), la membrane (M) et la nucléocapside (N).
Sommaire
Arrière plan
La protéine S contient un domaine de liaison au récepteur (RBD) qui se lie au récepteur de l’hôte, c’est-à-dire l’enzyme de conversion de l’angiotensine 2 (ACE2). RBD est la partie la plus variable des coronavirus qui détermine la gamme d’hôtes de chaque membre de ce groupe.
À ce jour, l’origine évolutive du SRAS-CoV-2 n’a pas été élucidée. Étant donné que l’analyse de la séquence génomique a indiqué que le parent le plus proche de ce virus est le Sarbecovirus de la chauve-souris, il y a une forte possibilité que la souche SARS-CoV-2 infectant l’homme ait émergé après un débordement des chauves-souris directement ou via un hôte intermédiaire.
Semblables aux coronavirus, les Sarbecovirus sont hautement recombinants et l’analyse de la séquence RBD du SRAS-CoV-2 a indiqué que son origine implique une recombinaison génétique. Sur quatre hypothèses clés sur l’origine du SRAS-CoV-2, trois incluent la recombinaison.
La détection des événements de recombinaison est impérative pour analyser l’histoire évolutive du gène S, en particulier dans le SRAS-CoV-2. Bien que plusieurs outils, tels que SimPlot, RDP4 et GARD, aient été utilisés pour identifier la présence de recombinaison parmi les Sarbecovirus, ils n’ont pas réussi à estimer les graphiques de recombinaison ancestrale (ARG) qui caractérisent l’évolution réticulée déclenchée par la recombinaison génétique. Ainsi, il existe des incertitudes phylogénétiques dans l’estimation des événements de recombinaison.
Bien que la reconstruction d’ARG basée sur des données de séquence soit extrêmement difficile, plusieurs progiciels, tels que le progiciel BEAST2 Bacter, ont été développés pour surmonter le défi. Le modèle ClonalOrigin de Bacter a été utilisé pour estimer un nouveau type d’ARC, connu sous le nom de graphes de conversion ancestrale (ACG). Cette méthode peut également être utilisée pour estimer les événements de recombinaison au sein d’une phylogénie.
À propos de l’étude
Une étude actuellement publiée sur le Place de la recherche* serveur de prépublication en cours d’examen pour publication dans Rapports scientifiques a utilisé Bacter pour identifier les événements de recombinaison avec les régions RBD du génome du Sarbecovirus. L’objectif principal de cette étude est de déterminer l’origine des acides aminés situés dans la boucle variable du RBD, qui est responsable de la haute affinité du SRAS-CoV-2 pour les récepteurs ACE2 des cellules humaines.
Au total, quatre-vingt-sept génomes ont été obtenus à partir des bases de données GenBank et GISAID. Les séquences ont été alignées en utilisant les paramètres par défaut de MAFFT 7.475. Le programme Gblocks a permis la détection de positions d’acides aminés mal alignées. Dans cette étude, les régions définies par SARS-CoV-2 RBD ont été extraites de l’alignement complet du génome et analysées à l’aide du modèle coalescent horizon bayésien.
Résultats de l’étude
Une analyse phylogénétique consciente de la recombinaison de la région RBD a été réalisée dans trente-neuf Sarbecovirus. Fait intéressant, plusieurs événements de recombinaison ont été détectés avec un support de probabilité a posteriori supérieur à 0,5 lié à différents Rhinolophus espèces, indiquant une interaction étroite entre la population de chauves-souris.
Trois Rhinolophus les espèces présentaient des aires géographiques qui se chevauchaient, à savoir R. pusillus, R, sinicus et R. affinis. Cependant, R. affinis et R.pusillus ont été proposés pour être les hôtes possibles des progéniteurs du SRAS-CoV-2.
Un événement de recombinaison au sein du RBD impliquant RaTG13 a soutenu l’hypothèse d’ancêtre commun. Cette hypothèse stipule que le virus de la chauve-souris a perdu tous les résidus d’acides aminés sauf un, qui était présent chez les ancêtres communs du SRAS-CoV-2, du RaTg13, du BANAL-103 et du GD410721. Le virus ancestral aurait pu être un agent pathogène capable d’infecter différents hôtes mammifères. Cette observation a été validée par des expériences en laboratoire qui ont révélé que le SRAS-CoV-2 pouvait se lier aux récepteurs ACE2 des chats, des bovins et des chiens.
Les résultats de l’étude soutiennent fortement l’émergence naturelle de l’hypothèse du SRAS-CoV-2. Ce virus a subi une évolution verticale, combinée à plusieurs événements de recombinaison, pour devenir extrêmement efficace dans les transmissions humaines.
Notamment, l’événement de recombinaison aurait pu se produire au-delà de la région RBD, c’est-à-dire que l’événement de recombinaison aurait pu se produire à n’importe quel point du génome du Sarbecovirus. L’étude actuelle a détecté des événements de recombinaison associés à la lignée SARS-CoV-2 sur les extrémités 5′ et 3′ du gène S.
conclusion
Une analyse phylogénétique consciente de la recombinaison des Sarbecovirus a aidé à élucider l’origine évolutive du SRAS-CoV-2. Néanmoins, l’approche informatique utilisée dans cette étude a limité l’analyse de l’ensemble de données complet. La méthodologie utilisée dans cette étude a permis l’analyse d’un fragment seulement des génomes des Sarbecovirus. Par conséquent, à l’avenir, davantage de recherches associées à l’analyse de la séquence génomique entière sont nécessaires pour mieux comprendre l’histoire de la recombinaison du RBD.