Dans une récente étude publiée sur medRxiv* serveur de préimpression, les chercheurs ont identifié des mutations récurrentes dans le coronavirus-2 du syndrome respiratoire aigu sévère (SARS-CoV-2).
Sommaire
Contexte
La maladie à coronavirus 2019 (COVID-19) causée par le SRAS-CoV-2 disparaît généralement en quelques semaines, mais dans certains cas, le virus peut rester pendant une période prolongée et la condition est appelée COVID-19 à long terme. Les patients immunodéficients atteints de COVID-19 à long terme pourraient être une source de nouvelles variations (génomiques) du SRAS-CoV-2 essentielles à son évolution. Des études antérieures ont émis l’hypothèse que les variantes SARS-CoV-2 Alpha et Omicron pourraient avoir émergé d’infections à long terme.
L’étude
La présente étude a analysé les mutations récurrentes du SRAS-CoV-2 et la fréquence des récidives. Les chercheurs ont construit un ensemble de données comprenant 168 séquences génomiques du SRAS-CoV-2 d’environ 28 patients (immunodéficients) pour l’analyse. Des séries génomiques associées à des patients ont été incluses dans l’étude suite à une recherche documentaire d’études de cas. En outre, l’ensemble de données COVID-19 Genomics UK (COG-UK) a été utilisé pour obtenir d’autres séries de génomes.
Des critères de sélection du génome ont été établis, ce qui a permis l’inclusion de séries de génomes si 1) il y avait deux génomes présents dans les bases de données publiques, 2) COVID-19 persistant à long terme pendant 28 jours ou plus, et 3) des preuves cliniques suffisantes indiquant l’état d’immunodéficience dans les sujets d’étude. Un rapport de civet a été généré pour la série génomique afin de confirmer que les génomes résultaient d’un COVID-19 à long terme. Toutes les séquences génomiques d’une série ont été stockées dans un seul fichier multi-fasta avec un en-tête pour l’identification du patient avec des identifiants et les jours depuis la disponibilité du génome dans cette série (particulière).
L’appel de mutation des génomes a été automatisé et les génomes ont été alignés sur une séquence de référence annotée du SRAS-CoV-2. Les mutations de novo (DNM) observées, mais absentes au « jour 0 » de la série génomique, ont été étudiées en traitant les appels de mutation.
Résultats
Les auteurs ont trouvé le gène SARS-CoV-2 spike (S) avec les mutations récurrentes les plus élevées avec les dix substitutions d’acides aminés (aa) suivantes. Les domaines avec les occurrences les plus élevées de DNM étaient le domaine de liaison au récepteur (RBD) du gène S (sept événements), le domaine N-terminal (NTD) [five occurrences]et le peptide signal (SP) [one occurrence]. RBD avait les locus aa les plus élevés (sept) avec les DNM, suivis de cinq dans le NTD et d’un dans le SP. La mutation S:E484K était la DNM la plus fréquente avec huit occurrences. Le regroupement de tous les DNM de ce locus (S:484) a augmenté le nombre d’occurrences de DNM à 12, indiquant son enrichissement pour les DNM.
Des délétions récurrentes ont été observées uniquement dans la région NTD – S:Δ67 du gène S (région de délétion récurrente 1 ou RDR1), la région S:Δ138 (RDR2) et la région S:Δ243 (RDR4). Le gène S qui ne représente que 1/8 du génome du SRAS-CoV-2 a montré environ 34 % de toutes les occurrences de DNM et 59 % de DNM récurrents.
D’autres gènes non-S, non-ORF1ab avaient une fréquence plus faible d’occurrences de DNM. E:T30I était le seul DNM récurrent dans le gène d’enveloppe (E) avec six occurrences, et M:H125Y dans le gène de matrice (M) était le seul DNM récurrent (quatre occurrences). Les mutations récurrentes dans l’ORF1ab étaient plus nombreuses mais relativement moins nombreuses que dans le gène S. 86 DNM sur 195 ont été trouvés dans ORF1ab, mais il n’y avait que six des 21 DNM récurrents.
La comparaison des DNM récurrents avec les fichiers de définition de la variante préoccupante (VOC) ou de la variante sous enquête (VUI) de l’Agence britannique de sécurité sanitaire (UKHSA) a révélé que la substitution S:E484K était la DNM la plus fréquente avec 11 apparitions. Sur les 21 DNM récurrents observés dans l’étude, neuf ont défini des mutations pour un VOC ou un VUI.
conclusion
L’observation la plus significative était la fréquence DNM du RBD. Le RBD, qui ne représente que 2% de la longueur du génome entier, constituait environ 17% de tous les DNM observés indiquant une forte sélection mutationnelle chez les individus immunodéprimés. De plus, 12 DNM ont été observés pour le locus S:484 mettant en évidence une forte pression sélective à ce site, la substitution S:E484K étant la DNM la plus fréquente.
Toutes les délétions récurrentes du génome du SRAS-CoV-2 n’étaient présentes que dans le NTD du gène S. Le S:Δ138/RDR2, constituant en partie le supersite antigénique NTD ciblé par la plupart des anticorps neutralisants, a eu quatre occurrences de novo.
Pour résumer, les chercheurs ont identifié des mutations récurrentes associées au COVID-19 à long terme chez des sujets immunodéprimés. La plupart des DNM récurrents observés sont liés à l’évasion immunitaire, à l’amélioration de l’affinité de liaison au récepteur de l’hôte ou à l’amélioration de l’emballage du virus. Pourtant, ceux-ci sont, en général, moins répandus dans une population de SRAS-CoV-2 plus étendue.
Sur cette base, les auteurs postulent qu’une infection à long terme pourrait conduire à la sélection de mutations, ce qui peut en partie faciliter la réplication et la persistance intra-hôte plutôt que la population générale de SRAS-CoV-2 dans laquelle les mutations sont fortement sélectionnées pour inter-hôte transmission.
*Avis important
medRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique/les comportements liés à la santé, ou traités comme des informations établies