Une équipe de scientifiques de l'Université de Chicago et de l'Université de Californie à San Diego a développé un modèle à grains grossiers (CG) du virion du coronavirus 2 du syndrome respiratoire aigu sévère (SARS-CoV-2). Le modèle peut être utilisé comme une ressource précieuse pour effectuer des simulations multi-échelles du virion SARS-CoV-2. L'étude est actuellement disponible sur le bioRxiv* serveur de pré-impression.
Le SRAS-CoV-2, l'agent pathogène causal de la pandémie de maladie à coronavirus 2019 (COVID-19), est un virus à ARN simple brin de sens positif avec une taille de génome de 30 kb. Pour obtenir un aperçu détaillé des protéines virales du SRAS-CoV-2 et de leurs fonctions, de nombreuses études de biologie structurale ont été réalisées à l'aide de techniques de cryo-microscopie électronique et de cristallographie aux rayons X. Simultanément, de nombreuses études de biologie computationnelle ont également été menées pour prédire les régions du génome non résolues en utilisant plusieurs algorithmes de repliement des protéines. Cependant, étant donné la difficulté de simuler des biomolécules à des résolutions atomiques, la simulation dynamique moléculaire de tous les atomes de divers processus viraux, tels que l'assemblage des virions, le bourgeonnement, l'entrée et la fusion, est fondamentalement une tâche difficile.
Pour surmonter ces défis, la présente étude visait à construire un modèle CG ascendant du virion SARS-CoV-2 en utilisant des données structurelles expérimentales et des données de simulation atomique accessibles au public sur les principales protéines structurales virales, y compris le pic, la membrane, la nucléocapside et enveloppent les protéines. Dans le modèle CG actuel du virion SARS-CoV-2, les scientifiques ont dérivé des interactions moléculaires entre les particules CG en utilisant des approches de simulation phénoménologiques, expérimentales et atomistiques.
Protéines virales du SRAS-CoV-2. Le génome du SRAS-CoV-2 est indiqué dans le panneau supérieur. Les protéines non structurales (NSP) codées dans le cadre de lecture ouvert (ORF) 1ab sont colorées en orange et le génome complet est en bleu sarcelle. (A) Modèles tous atomes des protéines structurales de SARSCoV-2 constitués des protéines S, E, M et N. Les astérisques indiquent des structures protéiques modélisées par homologie pour E et M (34). (B) Schéma de la surface du virion à partir d'images cryo-EM du virion, adapté de Ref. (19).
Sommaire
Conception de l'étude actuelle
Au départ, les scientifiques ont développé des modèles tous atomes de protéines structurales du SRAS-CoV-2 en utilisant une combinaison de cryo-microscopie électronique, de cristallographie aux rayons X et de simulations informatiques. Par la suite, les modèles CG ont été développés en simulant et en grainant grossièrement les modèles de protéines tous atomes.
Avantages des simulations CG
Les systèmes biologiques complexes, tels que les virions, sont difficiles à capturer par des simulations de tous les atomes ainsi que par des méthodes expérimentales en raison d'un large éventail de transitions physiques et chimiques impliquées. Il en va de même pour les processus biologiques complexes qui impliquent de multiples changements conformationnels. Par exemple, le clivage protéolytique de la protéine de pointe du SRAS-CoV-2 entraîne un changement de conformation important, qui est essentiel pour l'interaction entre la protéine de pointe virale et l'enzyme de conversion de l'angiotensine 2 de la cellule hôte (ACE2), ainsi que l'insertion du peptide de fusion dans la membrane de la cellule hôte. Cependant, il est difficile de capturer de tels événements biologiques à grande échelle par des simulations tous atomes, peut-être en raison d'échelles de temps plus longues ou de barrières d'énergie libre.
Modèles CG des protéines structurales du SARS-CoV-2. (A) Le modèle CG du trimère de la protéine S à l'état ouvert. Les monomères protéiques sont représentés respectivement par des billes roses, vertes et cyan; le monomère en rose a un domaine de liaison au récepteur exposé. Chacun des 22 (x3) glycanes liés à N est représenté sous forme de billes grises. (B) Le modèle CG de la protéine pentamérique E est représenté sous forme de perles orange. (C) Le modèle de dimère CG M est représenté comme des sphères jaunes et bleues, superposées au-dessus du modèle AA du dimère M. Chaque monomère a 36 sites CG, et les lignes rouges indiquent les positions approximatives de la région transmembranaire. (D) Le modèle CG de l'hélice CTD de la protéine N en complexe avec l'ARN viral. L'hélice de la protéine N et les liaisons dérivées du hENM sont représentées en cyan, tandis que l'ARN est représenté sous forme de billes orange.
Contrairement aux simulations tous atomes, les méthodes CG permettent de simuler des processus biologiques complexes à différents niveaux de granularité. Les modèles CG peuvent être développés à partir de modèles tous atomes (de bas en haut) en réduisant la dimensionnalité des modèles tous atomes en un nombre réduit de pseudo-atomes et en faisant la moyenne des mouvements locaux rapides.
Observations importantes
Dans le modèle CG actuel du virion SARS-CoV-2, une simulation phénoménologique basée sur les particules a été utilisée pour décrire l'enveloppe lipidique, et les protéines de membrane et d'enveloppe ont été modélisées comme des corps rigides. De plus, des méthodes de minimisation de l'entropie relative basées sur des simulations de protéines de pic de tous les atomes en microseconde ont été utilisées pour décrire les interactions intra-pic.
Une simulation de tous les atomes du complexe hélicoïdal oligomère-ARN a été utilisée pour développer le modèle de protéine de nucléocapside. Des potentiels gaussiens attractifs entre les queues lipidiques et les domaines protéiques transmembranaires ont été utilisés pour simuler l'interaction entre les lipides et les protéines structurales.
Le modèle CG développé dans la présente étude est une forme préliminaire du virion, qui peut être avancée au fil du temps grâce à la disponibilité de nouvelles données de simulation de tous les atomes et de données structurelles expérimentales de diverses protéines du SRAS-CoV-2.
Un modèle multi-échelle du virion SARS-CoV-2. (A) Vue extérieure du virion SRAS-CoV-2. (B) Vue intérieure du virion SRAS-CoV-2. Les trimères de la protéine Spike (S) sont représentés en sarcelle avec les sites de glycosylation représentés par des sphères noires. Les dimères de la protéine membranaire (M) sont en bleu, avec les canaux ioniques de l'enveloppe pentamérique (E) en orange. La densité des protéines S, M et E a été choisie pour être des expériences cohérentes (38–40). Les protéines N ne sont pas représentées. Le diamètre de l'enveloppe membranaire est d'environ 100 nm et 120 nm y compris les protéines S à la surface du virion.
Importance de l'étude
Les modèles CG de diverses protéines virales peuvent fournir des informations essentielles sur une grande variété de mécanismes viraux, déchiffrés expérimentalement pour développer des interventions thérapeutiques. Par exemple, des modèles CG du virus de l'immunodéficience humaine (VIH) ont été utilisés précédemment pour comprendre l'auto-assemblage de la capside et pour identifier les inhibiteurs de l'activité virale.
*Avis important
bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, orienter la pratique clinique / les comportements liés à la santé ou être traités comme des informations établies.