Dans une récente étude publiée sur bioRxiv* serveur de préimpression, les chercheurs ont développé une nouvelle méthode pour filtrer les données brutes de séquençage du génome entier (WGS) accessibles au public du coronavirus 2 du syndrome respiratoire aigu sévère (SRAS-CoV-2) et identifier plus rapidement les mutations d’intérêt.
Sommaire
Arrière plan
L’examen actuel a utilisé une méthode d’identification intra-hôte SARS-CoV-2 k-mer (iSKIM), qui avait des «k-mers» pour les variantes préoccupantes (VOC) et les variantes d’intérêt (VOI) du SARS-CoV-2. Le SRAS-CoV-2 présente souvent des variations au sein d’un hôte et vit et se transmet sous la forme d’une population de variantes, appelées variantes mineures intra-hôte.
L’évaluation de la dynamique intra-hôte sur plusieurs millions d’échantillons de génome brut reste un défi de calcul. Dans ce contexte, le comptage de séquences génomiques relativement courtes de longueur k, ou «k-mers», s’est avéré être une approche bioinformatique efficace pour plusieurs ensembles de données de séquençage à haut débit. Il permet d’éviter les étapes fastidieuses d’alignement et de post-traitement impliquées dans les méthodes d’assemblage du génome basées sur des références plus traditionnelles.
À propos de l’étude
Dans la présente étude, les chercheurs ont récupéré les ensembles de données d’archives de lecture de séquence (SRA) du National Center for Biotechnology Information (NCBI) contenant les COV/VOI du SRAS-CoV-2 définissant les mutations présentées comme des variantes mineures intra-hôte pour effectuer une analyse intra-hôte à une échelle beaucoup plus grande.
La méthode iSKIM a rapidement scanné les lectures brutes de séquençage du SARS-CoV-2 dans la base de données SRA contenant les mutations SARS-CoV-2 VOC/VOI entre février 2020 et avril 2021, c’est-à-dire la période allant du début de la pandémie à l’émergence de la Variante delta. Au total, les chercheurs ont examiné 108 mutations spécifiques à la lignée SARS-CoV-2.
L’ensemble de données SRA manque de métadonnées et de détails suffisants sur les ensembles d’amorces spécifiques utilisés pour chaque exécution. Ainsi, les auteurs ont utilisé les protocoles ARTIC lors des analyses de l’étude. Les ensembles d’amorces ARTIC populaires sont régulièrement mis à jour et excluent les séquences d’amorces de la soumission de séquençage. L’équipe a également effectué une comparaison d’iSKIM avec LoFreq et ngs_mapper, deux méthodes basées sur l’assemblage du génome de référence, pour confirmer l’exactitude de ses résultats.
Résultats de l’étude
Les auteurs ont observé que 15 des 108 mutations montraient une augmentation marquée en tant que variantes mineures intra-hôte dans les échantillons prélevés un à cinq mois avant la fixation. Sur la base des résultats de l’étude, des mutations spécifiques sont apparues dans la population sous forme de variantes mineures quelques mois avant que ces mutations n’apparaissent sous forme de mutations fixes dans la plupart des échantillons de l’étude.
Sur les 15 mutations identifiées avec ce modèle, 10 celles statistiquement significatives se sont imbriquées à l’intérieur de la protéine de pointe (S). Cependant, 17 mutations n’ont montré aucune augmentation substantielle de la présence de variants mineurs malgré une augmentation des échantillons possédant ces mutations en tant que variants fixes.
En outre, les auteurs ont observé que 11 des autres mutations statistiquement significatives étaient nichées dans les protéines non structurelles du SRAS-CoV-2. Peut-être que bon nombre de ces mutations n’ont pas fourni d’avantage de forme physique au SRAS-CoV-2 et étaient des mutations neutres qui ont émergé aux côtés de mutations bénéfiques qui se sont ensuite fixées.
L’iSKIM a systématiquement appelé la mutation S L452R à une fréquence légèrement plus élevée dans les 68 échantillons de septembre 2020, tandis que LoFreq n’a pas identifié cette mutation intra-hôte mineure des variantes du SRAS-CoV-2. De plus, les résultats intra-hôte de la variante mineure de la mutation Spike N501Y dans les 834 échantillons d’octobre 2020 étaient comparables dans les trois méthodes. De plus, la plupart de ces échantillons appartenaient à la lignée Alpha (B.1.177), tandis que d’autres appartenaient aux lignées B.1.36.28, B.1.36.17 et B.1.221.1/B.1.221.2.
Chacune de ces lignées a été impliquée dans de multiples événements de recombinaison qui se sont produits lors de l’émergence de l’Alpha VoC; cependant, aucun des recombinants ne contenait un complément complet des mutations Alpha.
conclusion
L’iSKIM a rapidement examiné des échantillons nouvellement séquencés contenant des COV du SRAS-CoV-2 ou d’autres mutations VOI d’intérêt. Ainsi, il a permis aux chercheurs de donner la priorité à un ensemble spécifique d’échantillons de génome pour l’assemblage du génome basé sur des références et l’analyse en aval, permettant ainsi des rapports en temps opportun lorsque le délai d’exécution était critique. De plus, les résultats de l’iSKIM ont fourni une vue complémentaire des données génomiques du SRAS-CoV-2 aux côtés des résultats typiques du génome consensuel.
Des études ont identifié des mutations rares du SRAS-CoV-2 dans des séquences génomiques prélevées à partir de la surveillance des eaux usées ou de réservoirs animaux, ces dernières étant une source de variants du SRAS-CoV-2 qui pourraient se répercuter sur l’homme. L’approche iSKIM pourrait aider à la détection précoce et à la guérison de ces mutations rares et de la liste croissante de mutations du SRAS-CoV-2 qui n’ont été observées dans aucun des précédents COV du SRAS-CoV-2 (par exemple, les mutations émergentes chez les patients atteints de diverses formes de immunosuppression). En effet, cette nouvelle méthode s’est révélée prometteuse par rapport au paradigme actuel pour la détection précoce des variantes mineures intra-hôte du SRAS-CoV-2.
*Avis important
bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique/les comportements liés à la santé, ou traités comme des informations établies.