La pandémie de la maladie à coronavirus 2019 (COVID-19), causée par le nouvel agent pathogène du coronavirus 2 (SRAS-CoV-2) du syndrome respiratoire aigu sévère, continue de faire des ravages dans le monde entier. Près d’un an après la première détection du virus à Wuhan, en Chine, fin 2019, plus de 61,1 millions de personnes ont été infectées dans 191 pays et 1,43 million ont perdu la vie.
Alors même que les chercheurs se rapprochent d’un vaccin COVID-19, le virus SRAS-CoV-2 a subi de nombreux changements dans ses séquences génétiques. Cela a été observé en particulier dans la protéine de pointe du virus (ou protéine S), qu’il utilise pour se verrouiller sur le récepteur de l’enzyme de conversion de l’angiotensine 2 (ACE2) de la cellule hôte humaine pour déclencher une infection.
Protéine de pointe du nouveau coronavirus SARS-CoV-2. Impression 3D d’une protéine de pointe de SARS-CoV-2 – également connue sous le nom de 2019-nCoV, le virus responsable du COVID-19 – devant une impression 3D d’une particule virale du SRAS-CoV-2. La protéine de pointe (premier plan) permet au virus d’entrer et d’infecter les cellules humaines. Sur le modèle du virus, la surface du virus (en bleu) est recouverte de protéines de pointe (en rouge) qui permettent au virus d’entrer et d’infecter les cellules humaines. Crédit d’image: NIAID / Flickr
La protéine de pointe a donc été la principale cible antigénique pour la plupart des antiviraux et des vaccins. Un nouveau preprint publié sur le bioRxiv * serveur en novembre 2020 décrit les sept clades différents dans lesquels le virus s’est diversifié. Les haplotypes importants (l’ensemble des déterminants génétiques d’un chromosome) sont également explorés. Ceci est pertinent en termes d’évaluation de l’efficacité des vaccins et de la réponse aux antiviraux prophylactiques et thérapeutiques, ainsi que de la possibilité de réinfection par d’autres clades.
Les clades qui circulaient le plus au début de la pandémie étaient L, O, S et V; ceux-ci ont été appelés les clades fondateurs. Cependant, au cours de la pandémie, la mutation D614G est apparue dans le clade G, dans la protéine de pointe, et a rapidement atteint une prévalence élevée. Cela a été suivi par l’émergence du clade GR, qui est rapidement devenu dominant dans toutes les régions où il a été introduit. Le GH a atteint sa fréquence la plus élevée à 30% en mai 2020, mais a par la suite diminué.
Les chercheurs soulignent que ces trois clades ont été suggérés pour avoir une transmissibilité plus élevée, bien qu’ils n’aient pas provoqué une maladie plus grave.
Une seule étude a montré le taux d’évolution des nucléotides dans la région du pic du génome au cours des quatre premiers mois de la pandémie, mais cela n’a pas tenu compte des différences entre les sept clades. D’autres ont rapporté ce taux pour l’ensemble du génome, mais c’est plus lent que la capacité de mutation de la seule région du pic.
Les chercheurs ont examiné 2100 séquences qui représentaient les sept clades du virus, pour identifier les modèles dans lesquels leurs gènes avaient changé et le taux de changement des nucléotides dans la région génomique du pic.
Les scientifiques ont découvert que les différents modèles de variantes génétiques héritées ensemble, appelés haplotypes, se présentaient sous la forme d’une étoile. En d’autres termes, tous les réseaux d’haplotypes avaient un ancêtre commun, à partir duquel de nombreux haplotypes divergeaient avec une différence de seulement quelques nucléotides entre eux.
Ils ont trouvé près de 480 haplotypes dans ces clades. Le clade V en avait 53, et les clades GH et GR avaient 89 clades chacun. Dans tous les cas, la région RBD était plus hautement conservée par rapport au pic, et était la plus faible pour les clades S et V. Le virus peut conserver la RBD car elle est essentielle pour cibler l’infection cellulaire.
Parmi eux, le plus important était Hap-1, trouvé présent dans 54% des souches des clades G et GH, et à 56% dans GR. Cependant, un autre, appelé Hap-252, était l’haplotype prédominant dans les clades V, L, S et O, à des fréquences de 70%, 63%, 52% et 40%, respectivement. Le plus petit nombre d’haplotypes était dans le clade V, tout comme la diversité nucléotidique.
Certains changements sont liés à des attributs fonctionnels, comme celui du clade L et le D936Y du clade GH, qui sont associés à la stabilité des monomères. Un autre, A829T, dans le clade S, est lié au peptide de fusion. De tels changements se retrouvent dans 1% à 3,4% des séquences.
Le taux d’évolution de la protéine de pointe a été estimé à 1,08 x 10-3 substitutions nucléotidiques / site / an, et n’a pas changé entre les clades. Cependant, les taux étaient quelque peu inférieurs pour les clades fondateurs par rapport aux clades plus récents G, GH et GR. Le taux global d’évolution des nucléotides S est plus élevé que celui des analyses de l’ensemble du génome.
Réseaux d’haplotypes à jonction médiane. Les sept clades de SARS-CoV 2 décrits à ce jour sont comparés à la fois à l’ensemble de la région codante Spike et RBD. Les diamètres des sphères sont proportionnels à la fréquence des haplotypes. Les principaux haplogroupes sont indiqués.
La raison principale de ce taux d’évolution plus élevé est que le génome contient de nombreuses régions hautement conservées, mais la région S, en revanche, fait partie des séquences qui changent le plus rapidement. Cependant, il n’y a pas de différence marquée entre cela et le résultat de l’analyse effectuée au cours des quatre premiers mois de la pandémie.
L’étude rapporte le processus par lequel la protéine de pointe a subi des changements dans différents clades, alors que le virus circulait dans une population mondiale naïve sans immunité préexistante. Les résultats ont montré que la région du pic est restée assez stable au cours de cette période. Au fur et à mesure que les vaccins commencent à être déployés et qu’une part importante du monde est infectée et se rétablit, cette situation pourrait changer et nécessiter une réévaluation de ce paramètre.
Les auteurs soulignent: «La présente analyse évolutive est pertinente puisque la protéine de pointe du SRAS-CoV-2 est la cible de la plupart des candidats thérapeutiques; de plus, des modifications de cette protéine pourraient avoir des conséquences sur la transmission virale, la réponse aux antiviraux et l’efficacité des vaccins.
Cela pourrait également être important pour comprendre les caractéristiques de la réinfection par d’autres clades du virus, comme cela a déjà été rapporté.