Les progrès récents dans le séquençage de nouvelle génération (NGS) tels que le séquençage ciblé ou non ciblé du génome entier (WGS) et les analyses informatiques capables de traiter efficacement de grandes quantités de données ont permis des analyses complètes des génomes viraux dans des contextes cliniques et de recherche. Par exemple, ces techniques ont été appliquées pour identifier les agents responsables et les origines des épidémies, surveiller les transmissions ou étudier la dynamique d’épidémies telles que Ebola, Zika et la pandémie actuelle de coronavirus 2 du syndrome respiratoire aigu sévère (SRAS-CoV-2).
« Le séquençage du génome entier (WGS) est de plus en plus appliqué en médecine clinique car il a le potentiel d’identifier des variantes génétiques cliniquement exploitables informant une intervention médicale précoce. »
Les premiers génomes du SRAS-CoV-2 récupérés début 2020 chez 8 patients à Wuhan ont montré une identité de 99,98 % et ce niveau élevé de similitude génomique partagée dans les génomes viraux a montré qu’il s’agit d’un nouveau virus qui n’a pas circulé depuis longtemps chez l’homme et était peut-être un débordement des animaux aux humains.
Des études récentes ont montré que la diversité génétique intra-patient du SRAS-CoV-2 augmentait après le traitement au plasma de patients ayant des charges virales élevées. De plus, un taux élevé de mutation du génome du SRAS-CoV-2 a été détecté chez les patients immunodéficients infectés par le virus.
Le séquençage non ciblé du génome entier est un outil puissant qui permet des identifications complètes des constituants des microbes dans un échantillon. Puisqu’il n’est pas nécessaire de diriger l’analyse vers un quelconque type d’identification avant le séquençage du génome, cette technique peut réduire les biais et les résultats faussement négatifs. Il permet également la détermination d’aberrations génétiques telles que des variants nucléotidiques uniques, des insertions, des délétions et des variants du nombre de copies, même dans les régions protéiques non codantes du génome.
Comparaison des performances de 4 différentes méthodes d’amplification d’amorçage aléatoire pour récupérer l’ARN du SRAS-CoV-2
Des chercheurs du Royaume-Uni ont récemment comparé les performances de 4 différentes méthodes d’amplification d’amorçage aléatoire pour récupérer l’ARN du SRAS-CoV-2. Dans la méthode 1 (HP), l’étape de transcriptase inverse (RT) comprenait des hexamères aléatoires, tandis que, dans les méthodes 2 à 4, la RT incorporait une amorce octamère avec une étiquette connue. Cette étude est publiée sur le bioRxiv* serveur de préimpression.
Dans les méthodes 1 et 2, le séquençage (KP) a été réalisé sur du matériel dérivé de l’étape RT-PCR, tandis que dans les méthodes 3 (SISPA) et 4 (SP), une amplification supplémentaire a été réalisée avant le séquençage. Ils ont également présenté la technique SP qui pourrait être applicable pour le séquençage en temps réel d’Oxford Nanopore, car un protocole basé sur une amorce non ciblé n’est pas encore disponible.
« Présenté dans cette étude, le protocole SISPA a permis l’assemblage du génome entier des deux virus en utilisant une seule amorce dans une réaction indépendante de la séquence. »
La méthode SISPA est la méthode la plus efficace des 4 méthodes pour le séquençage du génome entier du SARS-CoV-2
Les résultats ont montré que la méthode SISPA décrite par les auteurs dans cette étude était la méthode la plus efficace pour le séquençage non ciblé/aléatoire du génome entier du SARS-CoV`-2. Cette méthode a permis l’assemblage du génome entier du SRAS-CoV-2 et de la grippe A(H1N1) pdm09 dans des échantillons mixtes. Ils ont déterminé la limite de détection – 103 pfu/ml (Ct, 22,4) pour l’assemblage du génome entier – et la limite de caractérisation du SARS-CoV-2 – 101 pfu/ml (Ct, 30) pour la détection métagénomique. Les séquences du génome entier obtenues à l’aide de la méthode SISPA (ou SP) dans cette étude étaient exemptes de biais d’amorce et ont permis l’analyse du polymorphisme.
Schéma des méthodes d’amplification aléatoire pour l’assemblage du génome entier du génome du virus SARS613 Cov-2. La méthode 1 (HP) est basée sur l’étape de RT-PCR avec une amorce d’hexamères aléatoires (6Ns) suivie d’une amplification isotherme de la polymérase phi29 en présence d’une amorce 6Ns puis d’une préparation de bibliothèque pour le séquençage d’Illumina. Méthode 2 (KP), octamère aléatoire étiqueté avec une séquence d’étiquette connue de 20 nucléotides (5′- GACCATCTAGCGACCTCCACNNNNNNNN-3′) (K-8N) a été utilisé pour l’étape de RT-PCR, suivi d’une amplification isotherme de la polymérase phi29 en présence de l’amorce K marquée -8N puis préparation de la librairie et séquençage Illumina. Méthode 3, technique d’amplification d’amorce Single620 indépendante de la séquence (SISPA), suivie de la préparation de la bibliothèque et du séquençage Illumina. Méthode 4 (SP), suite à l’amplification SISPA (Méthode 3), l’amplification isotherme de la polymérase phi29 en présence d’hexamères aléatoires (6Ns) a été appliquée puis utilisée pour le séquençage d’Illumina
La méthode SISPA est principalement utilisée pour obtenir des séquences génomiques de virus à ARN ou pour étudier des échantillons cliniques complexes avec des infections mixtes en une seule réaction, car aucune information de séquence n’est requise.
Selon les auteurs, cette méthode peut être utilisée pour surveiller les changements génomiques et l’évolution du virus, pour une détection métagénomique rapide et simple, et pour évaluer le profil pathogène de l’échantillon qui pourrait aider à identifier d’autres facteurs qui pourraient être impliqués dans la maladie à coronavirus (Infection par covid19.
« Des études antérieures ont montré des événements de recombinaison génétique active dans les génomes du SRAS-CoV-2 qui peuvent réduire la précision de la détection qRT-PCR conventionnelle, et donc les amorces doivent être choisies avec précision pour relever ces défis. »
*Avis important
bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, orienter la pratique clinique/le comportement lié à la santé, ou traités comme des informations établies.