La recombinaison virale est un aspect typique de l’évolution des sarbécovirus, dans laquelle le matériel génétique de deux lignées parentales génétiquement diverses estest fusionné dans un génome viral descendant viable. Au cours de l’histoire évolutive du coronavirus 2 du syndrome respiratoire aigu sévère (SRAS-CoV-2), des enquêtes génomiques révèlent des événements de recombinaison parmi les coronavirus circulant dans des espèces non humaines. Au cours de la pandémie de la maladie à coronavirus 2019 (COVID-19), il y avait des signes de recombinaison en cours parmi les génomes du SRAS-CoV-2 évalués à l’aide d’un cadre statistique.
Étude : Emergence et circulation généralisée d’une lignée recombinante du SRAS-CoV-2 en Amérique du Nord. Crédit d’image : Lightspring/Shutterstock
Sommaire
Fond
Des génomes du SRAS-CoV-2 qui sont recombinants ont été trouvés au Royaume-Uni à basse fréquence, certains montrant des preuves de transmission directe. L’un de ces recombinants britanniques a été désigné comme la lignée XA, la première lignée recombinante du système de nomenclature Pango.
À mesure que le SRAS-CoV-2 se propage dans le monde, de nouvelles lignées émergent et sont suivies à l’aide du système de nomenclature hiérarchique dynamique Pango. Une succession de lignées descendantes de B.1 a été trouvée pour la première fois en Amérique du Nord et centrale à la fin de 2020 et au début de 2021.
Les programmes nationaux de surveillance génomique aux États-Unis d’Amérique, au Mexique et dans d’autres pays des Amériques ont identifié les lignées B.1.627, B.1.628, B.1.631 et B.1.634. Leurs génomes ont été publiés publiquement sur la base de données GISAID. La présence de similitudes génomiques entre ces lignées et d’autres circulant dans la région et ailleurs a conduit à l’hypothèse que la recombinaison s’est produite au cours de leur émergence et de leur propagation.
Une équipe de chercheurs d’institutions multinationales examine la diffusion et l’évolution de ces quatre lignées dans cet article, ainsi que le potentiel qu’un ou plusieurs événements de recombinaison aient joué un rôle dans leur évolution.
Ces résultats corroborent l’origine recombinante de la lignée B.1.628 et sa classification en tant que lignée recombinante distincte avec transmission directe circulant dans divers pays.
Une version pré-imprimée de cette étude, qui doit encore faire l’objet d’un examen par les pairs, est disponible sur le site médRxiv* serveur.
L’étude
Un total de 1950 séquences des lignées B.1.627 (n = 252), B.1.628 (n = 1391), B.1.631 (n = 181) et B.1.634 (n = 126) ont été analysées pour leur distribution spatio-temporelle. Les séquences des quatre lignées ont été recueillies entre le 8 juillet 2020 et le 18 août 2021, la plupart des échantillons ayant été prélevés en 2021.
Les quatre lignées ont été principalement échantillonnées en Amérique du Nord (89,5 %), soit aux États-Unis d’Amérique (USA) soit au Mexique. B.1.627 et B.1.631 étaient généralement trouvés aux États-Unis, tandis que B.1.634 était plus fréquent au Mexique. Selon les résultats, une recombinaison s’est probablement produite dans l’ensemble de données de cette étude.
Les résultats peuvent s’expliquer par un seul point de rupture dans l’alignement, selon l’analyse de détection de recombinaison par algorithme générique (GARD), qui montre qu’un modèle intégrant cet événement de recombinaison a beaucoup de support. GARD en déduit que le point de rupture s’est produit autour de la position 21308 (un codon TTT), qui correspond à la région du peptide signal à l’extrémité N-terminale de la protéine de pointe (18 nucléotides en aval de la séquence régulatrice de la transcription du sarbécovirus canonique AACGAAC).
Cependant, lorsque différentes approches de sous-échantillonnage sont utilisées, une certaine variation dans les résultats a été observée; une analyse qui exclut la lignée B.1.634 indique qu’un point de rupture de recombinaison est déduit à la position 22775-22778 (à un codon GAT) dans le cadre de lecture de la protéine Spike, qui est proche de la feuille bêta 3 et correspond à l’acide aminé 390D dans le noyau zone du domaine de liaison au récepteur (RBD). Les suppressions NSP6 sont placées d’un côté du point d’arrêt et les suppressions Orf3a sont placées du côté opposé du point d’arrêt en raison de l’analyse de recombinaison.
Les auteurs ont calculé par paires les distances génétiques à travers les génomes de séquences représentatives (de base aux clades principaux) en référence au génome de référence Hu-1 pour étudier plus avant la divergence génétique de ces lignées et les séquences proches de la racine des arbres phylogénétiques (en particulier, B.1.631 mineur et B.1.628 mineur).
Alors que les mutations se sont accumulées dans toutes les lignées, la zone Orf1ab du mineur B.1.631 présente la plus faible divergence par rapport à Hu-1 ; tous les clades présentent un pic de divergence génétique entre les emplacements 21000 et 23000, à l’exception de B.1.628 major, qui diverge de Hu-1 uniformément dans son génome.
Implications
Les auteurs ont découvert que B.1.628 major est né d’un événement de recombinaison entre le clade majeur B.1.631 et la lignée B.1.634, ce qui a incité sa classification en tant que lignée recombinante selon la convention de nomenclature Pango. Il est également proposé que les séquences classées comme B.1.628 mineures soient examinées et classées dans la lignée B.1.
La dominance de la lignée B.1.617.2 (VOC Delta) à l’échelle mondiale semble incontestée au moment de la rédaction, mais l’expansion remarquable de B.1.628 au début et à la mi-2021 met en évidence la viabilité d’un SARS-CoV-2 recombinant lignée et délimite encore une autre fonction importante des programmes de surveillance génomique active.
Ces résultats mettent en évidence la nécessité de futures recherches sur le taux et le potentiel de recombinaison du virus et les moteurs de ces processus évolutifs.
*Avis important
medRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, orienter la pratique clinique/le comportement lié à la santé, ou traités comme des informations établies.