Les scientifiques ont découvert que plusieurs virus appartenant à la famille des Coronaviridae peuvent infecter un large éventail d’hôtes, y compris les oiseaux, les humains et d’autres mammifères. Ces virus sont des virus à ARN simple brin de sens positif dont la taille varie entre 27 et 32 kb. Ils sont divisés en quatre catégories, à savoir, alpha, bêta, delta et gamma.
Le coronavirus 2 du syndrome respiratoire aigu sévère (SRAS-CoV-2), l’agent causal de la pandémie de coronavirus en cours 2019 (COVID-19), a été identifié pour la première fois dans la province de Wuhan en Chine en décembre 2019. En raison de sa forte infectivité et taux de mortalité, l’Organisation mondiale de la santé a annoncé que le COVID-19 était une pandémie le 11 mars 2020.
Comme les virus subissent une mutation génomique, il est avant tout important d’identifier le site de mutation pour le développement du vaccin. Plusieurs analyses phylogénétiques basées sur des arbres ont été menées pour comprendre la relation évolutive du SRAS-CoV-2 avec d’autres coronavirus bêta. Une étude précédente a construit un arbre phylogénétique et a révélé que la séquence génomique du SRAS-CoV-2 est identique à 88% à celle du BAT-CoV. Dans une autre étude, les scientifiques ont isolé environ 70 séquences génomiques du SRAS-CoV-2 de patients COVID-19 et étudié le gène de la glycoprotéine de pointe. Cette étude a également rapporté que le virus BetaCoV-bat-Yunnan-RaTG13-2013 est presque identique au SARS-CoV-2.
Même si une étude comparative sur les séquences génomiques du SRAS-CoV, du MERS-CoV et du SARS-CoV-2 est disponible, il y a une lacune dans la recherche en ce qui concerne la comparaison entre quatre types de coronavirus, à savoir, le SRAS-CoV , MERS-CoV, BAT-CoV et SARS-CoV-2. Une nouvelle étude, qui traite de la comparaison génomique entre la séquence des quatre types de coronavirus susmentionnés, a été publiée dans le Journal de virologie médicale. Cette étude a utilisé plusieurs marqueurs génétiques, y compris les polymorphismes nucléotidiques simples (SNP), la phylogénie de la séquence du génome entier, les mutations dans les protéines et les microsatellites. Celles-ci ont été comparées à la séquence génomique de référence SARS-CoV-2 connue sous le nom de souche de Wuhan (Wuhan-Wu-I). Toutes les séquences ont été obtenues auprès de la NCBI Genbank.
Les séquences SARS-CoV, MERS-CoV et SARS-CoV-2 ont été obtenues à partir de Homo sapiens (hôte), tandis que les séquences BAT-CoV ont été collectées à partir de huit types différents de chauves-souris. Les résultats de cette étude sont décrits ci-dessous.
Analyse phylogénétique
Pour l’analyse phylogénétique de la séquence des différents coronavirus, une approche du maximum de vraisemblance avec 1000 valeurs bootstrap a été utilisée. L’analyse phylogénétique a révélé différentes lignées de coronavirus. L’analyse phylogénétique basée sur le génome dans son ensemble a montré que le MERS-CoV appartenait à des espèces externes, tandis que les trois autres étaient classés comme espèces endogroupe. Au sein de l’endogroupe, deux lignées ont été trouvées, à savoir une lignée constituée de SARS-CoV-2 et une autre constituée de SARS-CoV et BAT-CoV. Les branches de l’arbre phylogénétique indiquaient que le SRAS-CoV avait divergé très tôt du BAT-CoV. L’arbre a également révélé une divergence indépendante du SARS-CoV-2 par rapport au BAT-CoV. La phylogénie a également montré que le SARS-CoV-2 était plus étroitement lié au BAT-CoV et au SARS-CoV que le MERS-CoV. Le logiciel Simplot a été utilisé pour visualiser le graphique de similarité entre les quatre espèces sélectionnées. Elle a révélé une homologie d’environ 98% du BAT-CoV avec la séquence de référence, c’est-à-dire la coloration de Wuhan du SARS-CoV-2. Cependant, une similitude de 92% a été obtenue entre le SARS-CoV et la séquence de référence, et une similitude de 58% entre le MERS-CoV et la souche de Wuhan.
Analyse des variantes génétiques
Une analyse basée sur des variantes a montré que le génome du MERS-CoV différait de la souche de référence de Wuhan sur 134,21 sites, le génome du BAT-CoV différé sur 136,72 sites, le génome du SRAS-CoV différé sur 26,64 sites et le génome du SRAS-CoV-2 différait sur 0,66 sites. En outre, la présente étude a également révélé que la probabilité de mutations aux sites faux-sens du MERS-CoV et du SARS-CoV-2 est plus élevée que celle du SARS-CoV et du BAT-CoV. Cela est dû au nombre réduit de variations de faux-sens dans le SRAS-CoV et le BAT-CoV, qui se sont produits en raison de la pression de sélection sur les sites de faux-sens.
Le nombre de mutations au niveau de la protéine Spike (S), de la protéine d’enveloppe (E), de la protéine membranaire (M), de la protéine nucléocapside (N) et des protéines structurelles a été calculé. Les SNP ont été filtrés à partir des régions des gènes S, M, E et N par un script python. Les gènes S, M, E et N ont révélé la présence d’un nombre varié de SNP. L’outil en ligne Multialin a été utilisé pour détecter les similitudes entre quatre coronavirus sélectionnés pour l’étude en cours.
Analyse des microsatellites
L’analyse microsatellitaire est utilisée pour déterminer les séquences répétitives dans le génome. Ces séquences ont un impact significatif sur l’apparition des maladies et leur évolution. Dans cette étude, l’analyse des microsatellites a été réalisée à l’aide des outils en ligne IMEX (Imperfect Microsatellite Extractor) et FMSD (Fast Microsatellite Discovery). Aucune présence significative de microsatellite n’a été trouvée en utilisant IMEX. Cependant, le FMSD a révélé la présence de plus de microsatellite dans le MERS-CoV. Le génome du SRAS-CoV-2 a montré la présence de la plus grande incidence de microsatellites composés.
En résumé, l’analyse de l’arbre phylogénétique a montré que le SRAS-CoV-2 est étroitement lié au BAT-CoV et que son deuxième parent le plus proche est le SRAS-CoV. Toutes les souches de MERS-CoV ont montré une relation distale avec le SRAS-CoV-2. Dans l’analyse des variantes génétiques, plus de mutations ont été trouvées dans le MERS-CoV par rapport au SARS-CoV et au BAT-CoV. L’analyse phylogénétique, l’étude de la variation génétique, la multisequence et l’analyse microsatellite, ont montré que la chauve-souris est l’hôte natif du SRAS-CoV-2. En outre, il a également conclu que le BAT-CoV est étroitement lié au SRAS-CoV-2. Il existe une possibilité de la présence d’un hôte intermédiaire pour initier la transmission du COVID-19 des BAT aux humains. Cependant, des recherches supplémentaires sont nécessaires pour valider cette hypothèse. L’outil FMSD a révélé que le SARS-CoV est plus étroitement associé au SARS-CoV-2 qu’au BAT-CoV.
Référence du journal:
- Rehman, AH et coll. (2021). Analyse comparative complète de la génomique et des microsatellites des coronavirus SRAS, MERS, BAT-SARS et COVID-19. Journal de virologie médicale, https://doi.org/10.1002/jmv.26974, https://onlinelibrary.wiley.com/doi/10.1002/jmv.26974