La pandémie de COVID-19 s'est propagée rapidement et largement, nécessitant des recherches urgentes et intensives pour développer un vaccin ainsi que pour concevoir un antiviral préventif ou thérapeutique. Ces efforts nécessitent une compréhension complète de la structure virale.
Maintenant, une nouvelle étude réalisée par une équipe internationale de chercheurs et publiée sur le serveur de pré-impression bioRxiv * en juillet 2020 montre comment cela peut être avancé plus rapidement en combinant des résultats expérimentaux avec des modèles d'homologie obtenus par des pipelines à haut débit. Cela aidera à produire de nouvelles hypothèses qui montreront de nouvelles cibles médicamenteuses pour le développement efficace de médicaments.
L'étude actuelle présente plus de 870 modèles de la structure de diverses protéines constituant le coronavirus 2 du syndrome respiratoire aigu sévère (SARS-CoV-2). Le séquençage et les données 3D proviennent des dernières entrées de la base de données de protéines, qui ressemblent à l'une des protéines virales par séquence. Les chercheurs ont aligné les séquences de protéines virales sur celles de toutes les structures 3D disponibles dans la PDB. Ils ont découvert que presque toutes les structures étaient celles de protéines virales, mais qu'il s'agissait parfois de complexes de protéines virales et hôtes. Dans un petit nombre, il s'agissait de protéines hôtes, ce qui indique que le virus les imitait.
Ces structures ont ensuite été ajoutées à l'utilisation d'un logiciel de prédiction pour modéliser la structure de plus de 32 700 protéines, et l'ensemble a ensuite été méthodiquement exploré pour comprendre les caractéristiques de ces structures. Ils n'ont trouvé que six protéines qui montraient des signes de liaison à d'autres protéines, structurellement. Celles-ci comprennent deux équipes de trois protéines chacune.

Résumé de toutes les connaissances structurelles moléculaires 3D disponibles pour le protéome viral, ainsi que le mimétisme dérivé, le détournement et les interactions protéiques.
Sommaire
Polyprotéine 1a
Cela comprend la protéine non structurale (nsps) 1 à 10, avec des degrés variables d'identité aux structures identifiées, de aucune, comme nsp6, à nsp5, ou 3CL-Pro, qui était hautement conservée et correspondait à 2 familles CATH, avec 256 correspondants structures. Une autre région avec plusieurs correspondances était la région de macrodomaine à côté de nsp2, et une partie de nsp3, avec 144 correspondances.
Certains étaient hautement conservés, mais d'autres ont montré une mauvaise conservation.
Polyprotéine 1b
Les cinq protéines de cette région ont toutes été prédites comme étant hautement ordonnées et dépourvues d'hélices transmembranaires. Ils incluent nsp 12 à nsp 16, avec aussi peu que quatre correspondances pour nsp 14 et jusqu'à 64 pour nsp 13.
Protéines accessoires et capsid
Le reste du génome vers l'extrémité 3 'code pour 12 protéines, qui sont assemblées dans la cellule pour former la nucléocapside. Aucun de ceux-ci ne s'est lié à une structure 3D associée. Les structures avec peu de correspondances comprennent la protéine ORF3a, la protéine d'enveloppe, l'ORF6 à ORF10 et l'ORF14.
La protéine d'enveloppe
Cette protéine correspondait à deux structures du SRAS-CoV, une un monomère et une une protéine pentamérique assemblée de cinq unités identiques formant un canal ionique transmembranaire.
Protéine Spike
Les chercheurs ont trouvé 136 correspondances pour cette protéine dans 2 régions, une avec 15 structures et correspondant à l'hélice transmembranaire C-terminale, quatre des correspondances étant des complexes d'anticorps formés contre le MERS-CoV. L'autre a eu 121 matchs, 34 presque en longueur. Ces 34 formaient un homodimère.
Sur les 121, 68 ont été appariés à des complexes d'anticorps et deux autres à des complexes avec des peptides inhibiteurs. D'autres ont été complexés avec des protéines humaines, y compris le récepteur ACE2, avec à la fois ACE2 et d'autres protéines humaines, et avec d'autres anticorps anti-coronavirus.
Parmi toutes les protéines de capside, c'était la seule qui avait des structures correspondantes mais qui était liée aux protéines humaines. L'importance de ceci est que la capside est principalement assemblée dans des compartiments à l'intérieur de la cellule et n'entre pas en contact avec les protéines de l'hôte ou l'acide nucléique. Il y avait encore quatre régions inégalées dans la région de la protéine de pointe.
La protéine de nucléocapside
Cette protéine N avait 35 correspondances avec des structures 3D connues, dans deux régions. Une région à l'extrémité N-terminale contenait des structures principalement constituées d'un seul monomère de protéine N, mais certaines constituant un dimère et une un tétramère. L'autre, près de l'extrémité C-terminale, avait 13 correspondances, toutes des structures dimères.
La valeur de l'étude
L'étude montre que très peu d'exemples de mimétisme moléculaire par le virus des protéines hôtes ont été trouvés. Le détournement ou l'auto-assemblage a également été rarement trouvé. En fait, un graphique était suffisant pour représenter tous ces cas, indiquant le manque de compréhension des protéines structurales du virus.
Les protéines virales s'associent ou s'affrontent
Les chercheurs suggèrent des interactions entre les trois protéines de chaque équipe.
L'équipe 1 se compose de nsp7, nsp8 et nsp12, qui s'assemblent tous pour produire le complexe de protéines virales en charge de la synthèse de l'ARN. Parmi ceux-ci, nsp7 a été trouvé comme monomère dans 2/15 des structures correspondantes disponibles à l'heure actuelle. Nsp8 était toujours complexé avec nsp12 seul, nsp7 seul ou avec les deux. Cependant, nsp12 a été trouvé seul dans 38 structures correspondantes.
Cette découverte est en accord avec des études plus anciennes sur les virus du SRAS, montrant que nsp12 par lui-même agit comme une ARN polymérase ARN-dépendante, mais montre une immense amélioration lorsqu'elle interagit avec nsp7 et nsp8. En bref, l'équipe 1 est caractérisée par des interactions coopératives.
L'équipe 2 comprend nsp10, nsp14 et nsp16. Parmi les 30 structures qui correspondaient à l'une ou l'autre des deux dernières, elles avaient toutes une structure dimère avec une autre protéine virale, chacune correspondant à nsp10. Des recherches antérieures montrent que nsp10 est nécessaire pour l'activité ARN-cap (nucléoside-2′-O -) – méthyltransférase de nsp14, et pour une activité accrue de la 2′-O-méthyltransférase et de l'exoribonucléase N-terminale de nsp16. Ils concluent que la région commune de nsp 10 se lie à elle-même, pour former un homo-oligomère, ou à nsp14 ou à nsp16, dans des interactions compétitives. Cela pourrait indiquer que la quantité de nsp10 détermine la gravité de l'infection.
Piratage des fonctions de cellule hôte
Seules deux protéines virales se sont avérées offrir des preuves de détournement de protéines humaines. Le nsp3 PL-Pro peut reprendre les précurseurs de l'ubiquitine ainsi que le ISG15 de type ubiquitine. Cette preuve est basée sur les structures expérimentales de la nsp3 du SRAS-CoV, qui est connue pour éliminer l'ubiquitine et ainsi supprimer l'immunité innée.
Une autre découverte plus subtile est une correspondance beaucoup moins proche du MERS-CoV, ce qui soulève la possibilité que ce domaine puisse également prendre le relais de la fonction de la sous-unité ribosomale L40 de l'ubiquitine-60S. De cette manière, les fonctions ribosomales de l'hôte peuvent être détournées par le SARS-CoV-2 – un mécanisme jusqu'ici inconnu.
La protéine de pointe détourne ACE2 comme cela est déjà établi sans aucun doute, et cela a été reflété par 16 états structurels montrant ce complexe. Encore une fois, une découverte plus cachée était qu'elle pourrait également prendre le relais du récepteur de glycoprotéine de surface cellulaire DPP4, favorisant l'activation des cellules T. Cela pourrait être un moyen par lequel le virus échappe à l'immunité de l'hôte. L'étude a également révélé 68 correspondances montrant le complexe pic-anticorps, qui pourrait être utile dans le développement de médicaments ou de vaccins qui interagissent avec ce domaine.
Imiter les protéines des cellules hôtes
Les chercheurs ont découvert que deux protéines humaines étaient imitées par les protéines virales, à savoir nsp3 et nsp13. Le premier est très similaire aux macrodomaines de neuf protéines humaines, dont chacune joue un rôle dans l'ADP-ribosylation des protéines comme moyen d'une modification post-traductionnelle. Si tel est le cas, cela peut entraîner une modification épigénomique, ce qui pourrait expliquer pourquoi les patients présentent des réponses aussi différentes à l'infection. Certaines de ces protéines, comme PARP9 ou PARP14, modulent également l'activation des macrophages, facteur connu dans l'étiologie des maladies vasculaires. De telles interactions pourraient expliquer comment une maladie pneumonique comme le COVID-19 évolue vers des lésions mortelles des vaisseaux sanguins dans de nombreux cas.
Quant à la nsp13, une hélicase virale, elle peut imiter n'importe laquelle des quatre protéines humaines, qui ont une activité de ligature d'exon, peut-être pour créer des protéines chimères. En se liant à d'autres protéines spécifiques, il pourrait également inciter à éviter la réponse immunitaire cellulaire.
Suspects
Le dernier groupe de 17 protéines peut être important dans l'infection virale, mais les preuves structurelles font défaut. Certains avaient au moins une correspondance dans des structures connues, et quelques-uns ont des rôles très connus tels que le nsp5, qui est la protéase clivant les polyprotéines virales. Le problème majeur est l'absence totale d'observations dans lesquelles la nsp5 ou toute protéine similaire a interagi avec tout autre hôte ou protéine virale.
L'autre groupe n'avait pas du tout de structures correspondantes et sont appelés protéines structurellement sombres.
Implications et conclusion
Les chercheurs commentent: «À partir de notre analyse, nous pouvons conclure que les séquences de ces protéines ne sont pas similaires de manière détectable à aucune protéine qui a été observée à ce jour par des méthodes expérimentales de détermination de la structure – du moins, sur la base des méthodes de modélisation d'homologie basées sur les séquences utilisées. dans cette analyse. »
Ils suggèrent l'utilisation de modélisations structurelles plus avancées, telles que celles qui utilisent des contacts résidus-résidus avec un apprentissage automatique en profondeur, pour comprendre les interactions de ces protéines en relation avec leur fonction dans l'infection.
L'étude conclut: «Notre ressource fournit aux chercheurs une mine d'informations sur les mécanismes moléculaires du COVID-19; les informations sont facilement accessibles et, à notre connaissance, ne sont actuellement pas disponibles dans d'autres ressources. La ressource fournit un aperçu visuel immédiat de ce qui est connu – et non connu – de la structure 3D du protéome viral, aidant ainsi à orienter les recherches futures.
*Avis important
bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, orienter la pratique clinique / les comportements liés à la santé ou être traités comme des informations établies.