Depuis le début de la pandémie de COVID-19, plusieurs variantes préoccupantes du coronavirus 2 du syndrome respiratoire aigu sévère (SRAS‑CoV‑2) sont apparues, entraînant une augmentation répétée des cas, des décès et des hospitalisations dans le monde. La classification de ces variantes par la nomenclature d’affectation phylogénétique des lignées d’épidémie mondiales nommées (PANGO) montre que bien qu’elles descendent d’un ancêtre commun, elles ne sont pas des descendants directs les unes des autres.
Les lignées PANGO qui ont été mises en correspondance avec les COV comprennent la variante Alpha (lignées B.1.1.7 et Q), la variante Beta (B.1.351 et lignées descendantes), la variante Gamma (P.1, qui est un descendant de B.1.1 .28 et lignées descendantes), variante Delta (lignées B.1.617.2 et AY) et variante Omicron (lignées B.1.1.529 et BA).
Toutes les variantes auraient évolué à partir de la lignée B.1, tandis qu’Alpha, Gamma et Omicron ont également B.1.1 comme lignée parentale supplémentaire. Cependant, ces classifications ne décrivent pas le degré de distinction entre les variantes ou ne donnent pas un aperçu des propriétés génétiques des variantes.
L’évolution du SARS-CoV-2, comme tous les autres virus, se produit via la mutation de son génome ; ces mutations altèrent les séquences d’acides aminés des protéines virales. Les mutations peuvent être sélectionnées positivement ou négativement en fonction de leur impact sur la fitness virale. Des mutations dans plusieurs régions, telles que le domaine N-terminal (NTD) de la glycoprotéine Spike et le domaine de liaison au récepteur (RBD), ont amélioré la capacité virale. Bien qu’une grande attention ait été accordée aux mutations individuelles au niveau des acides aminés, une attention limitée a été accordée au niveau de la séquence nucléotidique.
Une nouvelle étude publiée dans le serveur de pré-impression medRxiv* a émis l’hypothèse que l’émergence de variantes plus immunitaires invasives ou transmissibles du SRAS-CoV-2 était associée à une distinction génétique accrue par rapport aux souches originales ou précédentes.
Étude : La diversification génomique de longs fragments de polynucléotides est une signature des variantes émergentes du SARS-CoV-2 préoccupantes. Crédit d’image: NIAID
Pour tester l’hypothèse, l’étude a introduit une nouvelle méthodologie qui quantifie le nombre de n-mères de nucléotides distincts (de différentes tailles) dans les COV pour estimer le degré d’évolution virale.
Sommaire
À propos de l’étude
L’étude impliquait de calculer et de quantifier le nombre de n-mers distinctifs pour les séquences du SRAS-CoV-2 à partir de la souche de référence d’origine (lignée PANGO A) et de cinq COV, Alpha, Beta, Gamma, Delta et Omicron, qui ont été obtenus à partir du Base de données GISAID. De plus, le nombre de mutations d’acides aminés pour les séquences obtenues à partir de GISAID a été déterminé et comparé à la souche originale Wuhan-Hu-1 du SRAS-CoV-2.
Un alignement de séquences multiples (MSA) a été effectué pour les génomes du SRAS-CoV-2 sous-échantillonnés afin de calculer la distance phylogénétique. Enfin, le caractère distinctif des n-mers pour une lignée spécifique du SARSCoV-2 a été calculé à l’aide d’une métrique alternative, A*(1-B).
Distribution du caractère distinctif des polynucléotides pour les variantes préoccupantes du SRAS-CoV-2 (COV). (A) Illustration schématique de l’analyse des séquences polynucléotidiques. Les séquences du SRAS-CoV-2 sont analysées pour générer un ensemble de séquences polynucléotidiques n-mères distinctes (taille n-mère max = 240). (B) Diagramme de Venn montrant la moyenne des distributions pour les 9-mères de nucléotides partagés et uniques entre toutes les combinaisons de variantes sur 100 000 comparaisons répétées. La variante bêta a été exclue de cette visualisation pour réduire l’encombrement. (C) Graphiques de densité montrant le caractère distinctif des séquences 9-mères pour les COV, tel que mesuré par le nombre de séquences polynucléotidiques 9-mères distinctes. (DE) Cartes thermiques montrant les valeurs de divergence D et Jensen-Shannon de Cohen à partir de comparaisons par paires des distributions indiquées en (C). (F) Cohen D des distributions n-mer distinctives des variantes Alpha, Beta, Gamma, Delta et Omicron par rapport à la souche d’origine pour diverses longueurs n-mer (n = 3, 6, 9, 12, 15, 18, 21 , 24, 30, 45, 60, 75, 120 et 240). (G) Graphiques de densité montrant un exemple supplémentaire de la spécificité génomique des COV, telle que mesurée par le nombre de séquences polynucléotidiques 15-mères distinctes. Les données présentées dans les panneaux BG ont été générées à l’aide de 287 739 séquences SARS-CoV-2 uniques au total, réparties entre les variantes, comme indiqué dans la légende de C. Abréviations : – moyenne ; IQR – intervalle interquartile ; COV – variante préoccupante.
Résultats de l’étude
Les résultats ont indiqué qu’à partir de chaque génome, un nucléotide distinctif 9-mères (DN9) a été dérivé qui était présent dans une lignée donnée mais absent de tous les autres. Le nombre de DN9 correspondait au moment de l’émergence et s’est avéré être le plus élevé pour Omicron, suivi des variantes Delta, Alpha, Gamma et enfin Beta. La séquence Omicron s’est également avérée avoir plus de DN9 que tous les autres COV.
Carte de la prévalence des COV du SARS-CoV-2 par région géographique. Répartition géographique des variantes Alpha (B.1.1.7), Beta (B.1.351) et Gamma (P.1) basée sur les séquences déposées dans GISAID jusqu’au 14 décembre 2021. Chaque camembert montre la proportion d’Alpha, Beta ou Gamma séquences déposées dans le pays. Notez que le dénominateur est le nombre de séquences étiquetées comme l’une de ces trois variantes, plutôt que le nombre total de séquences déposées dans ce pays. Ainsi, chaque camembert répond à la question suivante : « De tous les génomes déposés dans un pays donné qui ont été assignés comme Alpha, Beta ou Gamma, quelle proportion de génomes a été assignée à chacune de ces trois lignées ? La prévalence de Delta et d’Omicron n’est pas montrée pour mieux mettre en évidence la distribution géographique d’Alpha, Beta et Gamma ; cependant, Delta et Omicron sont actuellement ou ont été très répandus dans les régions indiquées. Seuls les pays où au moins 1000 séquences sont déposées sont affichés. Les variantes représentées, qui ont circulé approximativement à la même époque, sont généralement devenues prédominantes dans des régions géographiquement distinctes.
Omicron s’est avéré être le COV le plus fortement muté, tandis que la distance phylogénétique entre Gamma d’Alpha et Beta était la plus notable. Les résultats suggèrent également que les nouvelles variantes émergentes du SRAS-CoV-2 étaient génétiquement distinctes de la souche d’origine et qu’elles comprenaient des séquences nucléotidiques uniques qui en ont résulté. Le caractère distinctif s’est également avéré augmenter au sein d’une lignée avec le temps évolutif.
La présente étude fournit ainsi une nouvelle méthodologie qui aidera les chercheurs à identifier et à évaluer le caractère distinctif de toute nouvelle variante du SARS-CoV-2 par rapport aux précédentes. Cependant, des recherches supplémentaires sont nécessaires pour déterminer si cette méthode sera en mesure de classer les lignées en tant que COV plus tôt que le temps pris actuellement, comment la vaccination aurait un impact sur la diversité génomique du SRAS-CoV-2, et également déterminer si l’infection SAR-CoV-2 serait progression vers la saisonnalité ou l’endémicité.
Limites
L’étude comportait certaines limites. Premièrement, étant donné que le nombre de séquences Omicron disponibles dans la base de données GISAID est actuellement faible, cela peut conduire à un suréchantillonnage. Deuxièmement, à part le nucléotide 9-mères, les n-mères de nucléotides codant pour une protéine ou les n-mères d’acides aminés doivent également être pris en compte dans la détermination de la diversité génomique. Troisièmement, l’étude peut être sensible à la composition de la lignée dans le groupe complément. Enfin, des recherches supplémentaires sont nécessaires concernant la relation entre les métriques de distinction génomique avec la profondeur phylogénétique et le temps évolutif.
*Avis important
medRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, orienter la pratique clinique/le comportement lié à la santé, ou traités comme des informations établies.