Dans une récente étude publiée sur bioRxiv* serveur de prétirage, les chercheurs ont évalué l’impact de la mutagenèse sur le génome du coronavirus 2 du syndrome respiratoire aigu sévère (SRAS-CoV-2) et les effets des mutations dans les régions neutres et les régions non neutres du génome.
L’évolution est fonction de facteurs tels que la sélection et la mutagenèse, dont la déconvolution peut améliorer la compréhension du taux de substitutions de nucléotides (nt) (spectre mutationnel). Les évaluations des spectres mutationnels peuvent permettre la caractérisation des signatures mutationnelles et des changements évolutifs viraux. Les virus à acide ribonucléique (ARN) évoluent rapidement et, par conséquent, il est important de découvrir l’impact des mutations sur les compositions de codons, d’acides aminés (aa) et de nt.
À propos de l’étude
Dans la présente étude, les chercheurs ont élucidé le spectre mutationnel du génome du SRAS-CoV-2.
Au total, 4 339 984 séquences génomiques du SRAS-CoV-2 ont été obtenues le 14 octobre 2021 à partir de la base de données GISAID (initiative mondiale sur le partage de toute la grippe). Les séquences de faible qualité (comprenant un nt incertain ou <29001 nt) et les doublons ont été filtrés et les 1 139 387 séquences restantes ont été alignées avec le génome de référence (souche Wuhan-Hu-1).
Le génome du SRAS-CoV-2 a été catégorisé comme suit (i) génome précoce obtenu entre décembre 2019 et mars 2020, (ii) génome intermédiaire obtenu en octobre 2020 et (iii) génome tardif obtenu entre septembre 2021 et octobre 2021. Un arbre phylogénétique a été construit sur la base des séquences génomiques SARS-CoV-2 alignées (n = 203 045), élaguées à 54 521 nœuds et les génomes ancestraux des nœuds de l’arbre phylogénétique élagué ont été reconstruits.
Toutes les variantes possibles de substitutions nt simples ont été comptées et ajustées aux nombres attendus de substitutions nt obtenues collectées à partir de la séquence de référence Wuhan-Hu-1. Trois spectres mutationnels du génome du SRAS-CoV-2 ont été reconstruits, à savoir ALL (représentant toutes les mutations), SYN (mutations synonymes) et SYN4F (mutations synonymes dans des régions quadruples dégénérées). Pour évaluer la stabilité du spectre mutationnel, les spectres mutationnels ont été reconstruits à neuf moments différents au cours de la pandémie de maladie à coronavirus 2019 (COVID-19).
Le contexte à trois nt qui a abouti au spectre mutationnel de 192 composants a été analysé et la composition de nt neutre à 12 composants attendue a été obtenue. Les altérations de la composition nt ont été analysées pour l’ensemble du génome du SRAS-CoV-2 et des évaluations comparatives pour Coronaviridés et autres ARN positifs simple brin [(+)ssRNA] Les virus ont été analysés sur la base de l’utilisation des codons et des compositions d’aa spécifiques à l’ARN polymérase dépendante de l’ARN (RdRP) par analyse en composantes principales (ACP).
Des simulations informatiques ont été effectuées pour une estimation quantitative de la composition nt attendue sur les sites neutres. Sur la base des trajectoires de substitution attendues des aa, les aa ont été classés comme perdants [alanine (Ala), proline (Pro), glycine (Gly), arginine (Arg), serine (Ser, AGX), threonine (Thr), glutamine (Gln), glutamic acid (Glu), histidine (His) and aspartic acid (Asp)]intermédiaire [cysteine (Cys), leucine (Leu, CUX), Ser, valine (Val) and tryptophan (Trp)]gagnants [Leu (UUX), phenylalanine (Phe), methionine (Met), tyrosine (Tyr) and isoleucine (Ile)]et neutre [lysine (Lys), aspargine (Asn)]. Les changements de aa dans le variant Omicron de la souche de référence ont été analysés.
Résultats
Les spectres mutationnels reconstruits du SARS-CoV-2 étaient fortement biaisés par G>U et C>U, indiquant que le génome du SARS-CoV-2 est enrichi en U dans des sites faiblement contraints. Les sites nt neutres étaient saturés en U, ce qui indique une exposition virale ancestrale à une pression mutationnelle comparable dans le passé et que des changements significatifs ne sont pas attendus à l’avenir puisque le système génomique a atteint l’équilibre.
Cependant, les mutations non synonymes ont évolué progressivement vers l’équilibre en remplaçant les aa riches en CG (perdants) par des aa riches en U (gainers) avec un déficit résultant en aa perdant et un excès de gain en aa, une découverte parmi tous les virus Coronaviridae (à l’exception d’Omicron). À l’opposé, l’hépacivirus C, le virus Zika et le Bastrovirus BAS-1 ont montré un excès de perdant par un excès de perdants. Les mutations synonymes étaient proches de l’équilibre génomique compositionnel.
L’équipe a proposé un thème papillon, c’est-à-dire que des altérations mineures des spectres mutationnels dans une perspective à long terme conduiraient à des altérations remarquables de la composition. Ils ont émis l’hypothèse que le thème du papillon serait le plus important parmi les espèces présentant des spectres de mutation asymétriques, une sélection détendue et des taux de mutation élevés.
Les mutations nt de haute qualité (n = 542 768) comprenaient 314 538 mutations non synonymes (n = 314 538) synonymes (n = 206 319) et synonymes sur des sites quadruples (n = 92 734). Les spectres mutationnels du SRAS-CoV-2 comprenaient des brins asymétriques dirigés par U et des mutations C>U excessives contribuant à 37 %, 25 % et 35 % des mutations ALL, SYN et SYN4F, respectivement.
Plus de codons NNU ont démontré une asymétrie des spectres mutationnels que les codons NNC et NNG et plus de codons NNA que de codons NNG. Les spectres ALL ont augmenté en asymétrie et en directionnalité pendant la pandémie. Il n’y avait aucune tendance significative dans les changements d’utilisation des codons entre les génomes précoces et les génomes tardifs pendant le COVID-19.
La composition nt des sites neutres et mutés et neutres (en particulier les sites SYN4F) était proche de l’équilibre nt attendu à base de 12 composants, et les changements de composition du génome entier ont suivi le biais de mutation, indiquant la mutagenèse comme un puissant déterminant du SRAS- Évolution du CoV-2. Les mutations du SRAS-CoV-2 étaient spécifiques au virus et non spécifiques à l’hôte.
Dans l’ensemble, les résultats de l’étude ont montré un effet papillon, c’est-à-dire un réglage des espaces protéiques via des trajectoires aa permissives par un biais de mutation qui peut être commun à toutes les espèces avec une mutagenèse biaisée, et que les spectres mutationnels spécifiques à l’espèce et les compositions aa spécifiques à l’espèce sont liés.
*Avis important
bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique/les comportements liés à la santé, ou traités comme des informations établies.