La glycosylation des protéines est une fixation covalente post-traductionnelle/co-traductionnelle des glycanes aux chaînes latérales d’acides aminés des protéines. Le coronavirus 2 du syndrome respiratoire aigu sévère (SARS-CoV-2), l’agent causal de la maladie à coronavirus 2019 (COVID-19), montre une glycosylation étendue. Dans une revue publiée dans Transduction du signal et thérapie ciblée, des chercheurs de l’Université du Sichuan ont passé en revue la littérature disponible.
Étude : La glycosylation dans le SARS-CoV-2 et son récepteur ACE2. Crédit d’image : Kateryna Kon/Shutterstock
L’article
La N-glycoprotéomique basée sur la spectrométrie de masse (MS) est l’approche la plus courante pour la caractérisation spécifique au site et à la structure de la glycosylation. Au cours de la première étape de ce processus, le glycane est caractérisé et le glycopeptide intact, le peptide contenant un glycosite et la glycoprotéine intacte. Les glycanes doivent normalement être enrichis par du carbone graphitisé poreux (PGC) ou d’autres matériaux hydrophiles, tandis que les glycopeptides intacts peuvent être analysés avec ou sans enrichissement. Les glycopeptides à faible stoechiométrie bénéficient le plus de l’enrichissement. La chromatographie liquide d’interaction hydrophile, la chromatographie d’affinité de lectine et la chromatographie sur carbone graphitisé sont normalement utilisées pour enrichir les glycopeptides.
Avant l’analyse MS en tandem, la séparation chromatographique peut également être utile pour simplifier la composition de l’analyte. Les colonnes PGC peuvent être utilisées pour séparer les glycanes natifs hydrophiles non dérivés, tandis que les glycanes perméthylés sont plus souvent séparés par chromatographie C18 en phase inverse. Les peptides contenant du glycosite et les glycopeptides intacts peuvent être séparés en utilisant plusieurs des techniques susmentionnées. Après la séparation, le tandem MS/MS avec diverses méthodes de dissociation peut analyser les glycanes/glycoprotéines.
Les deux problèmes les plus importants dans l’analyse MS/MS de la N- et de la O-glycosylation sont la localisation des glycosites et l’identification de la structure des glycanes. Les N-glycosites peuvent être localisés à partir des ions fragments des spectres MS2, et les isomères structuraux peuvent être distingués des ions fragments des fragments N-glycane.
Le génome du SRAS-CoV-2 code pour quatre protéines structurelles, 16 protéines non structurelles et neuf facteurs accessoires. La majorité des protéines codées sont des glycoprotéines, mais seulement quatre d’entre elles ont un glycosite connu. La protéine de pointe est une protéine transmembranaire trimérique formée des sous-unités S1 et S2 qui doit être clivée par une protéase hôte pour être activée. La sous-unité S1 contient un domaine de liaison au récepteur (RBD) qui se lie à l’enzyme de conversion de l’angiotensine 2 (ACE2) pour permettre l’entrée des cellules virales, tandis que la sous-unité S2 est responsable de la fusion membranaire.
Les glycanes modifiés protègent environ 40 % de la surface protéique de la protéine de pointe, agissant comme un camouflage contre le système immunitaire. La protéine de pointe est plus exposée dans le SRAS-CoV-2 que ses plus proches parents – le coronavirus du syndrome respiratoire aigu sévère (SRAS-CoV) et le syndrome respiratoire du Moyen-Orient (MERS). 23 glycosites N-liés avec une forte occupation ont été identifiés, alors que seulement 2 glycosites O-liés sont fortement occupés.
La protéine E est une protéine membranaire qui peut former des structures pentamériques avec une activité de canal sélectif pour les cations et une conductivité Ca2+ dans le compartiment intermédiaire ER-Golgi. Il est essentiel pour la pathogénicité, l’assemblage viral et la libération. Deux glycosites N-liés putatifs peuvent exister dans le segment transmembranaire, mais il s’agit d’une prédiction de séquence.
La protéine M est la protéine d’enveloppe la plus courante du SRAS-CoV-2. Il possède trois domaines transmembranaires N-terminaux et interagit avec les trois autres protéines structurelles. Elle est indispensable à l’assemblage de nouvelles particules virales. On sait peu de choses sur la glycosylation, mais les prédictions informatiques suggèrent huit N-glycosites, avec des fonctions inconnues.
ORF3a est une protéine non structurelle localisée à la surface, avec de larges fonctions, notamment l’amélioration de l’entrée virale, la régulation de la production de cytokines pro-inflammatoires et de chimiokines, et la participation à la formation de canaux ioniques. Il est également impliqué dans la libération de particules virales de la cellule. Il existe probablement quatre glycosites à liaison O, dont deux présentent une occupation significativement plus élevée. La fonction de ceux-ci est inconnue, car il n’y a pas de glycosites N-liés.
hACE2 – le récepteur auquel la sous-unité S1 se lie pour entrer dans la cellule, est exprimé dans une grande variété de tissus et d’organes. 7 N-glycosites ont été identifiés, et 2 O-glycosites liés. Les glycanes liés à N sont complexes, avec une occupation supérieure à 75 % et une liaison à l’acide sialique – qui est le facteur d’attachement de plusieurs coronavirus. La fonction des glycosites liés par O est incertaine.
La glycosylation des protéines peut altérer considérablement leur fonction, et une bonne compréhension de la glycosylation dans le SRAS-CoV-2 pourrait aider à identifier les cibles médicamenteuses et à informer les chercheurs. De nombreuses variantes préoccupantes montrent une glycosylation altérée, et alors que le nombre de cas recommence à augmenter, cette revue aide à éclairer l’état actuel de nos connaissances concernant cette caractéristique importante.