Dans une récente étude publiée sur bioRxiv* serveur de préimpression, les chercheurs ont utilisé un modèle de régression de réseau neuronal convolutif (CNN) (CNN_seq) pour étudier l’effet des mutations sur l’affinité de liaison du domaine de liaison au récepteur (RBD) du syndrome respiratoire aigu sévère coronavirus 2 (SARS-CoV-2) -Complexe de l’enzyme de conversion de l’angiotensine 2 (ACE2).
Sommaire
Contexte
La première étape cruciale pour l’entrée du SRAS-CoV-2 et l’infectivité ultérieure implique la liaison RBD-ACE2 ; un modèle prédisant de manière fiable l’affinité de liaison de cette association pourrait faciliter la surveillance continue de l’évolution du SRAS-CoV-2 dans les réservoirs animaux. Ceci est crucial car la menace de propagation potentielle du SRAS-CoV-2 aux espèces non humaines et de retour aux humains pourrait compliquer les futures stratégies d’atténuation contre le SRAS-CoV-2.
À propos de l’étude
Dans la présente étude, les chercheurs ont formé le modèle CNN_seq sur un ensemble de données organisé de 8 440 variants RBD pour les humains afin d’analyser les combinaisons de mutations d’acides aminés simples et multiples (jusqu’à quatre) et d’identifier les candidats avec l’affinité de liaison RBD-ACE2 la plus élevée pour la surveillance.
Un autre ensemble de données d’étude de plus de 220 000 variantes RBD appartenait à quatre hôtes animaux du SRAS-CoV-2, y compris le cerf de Virginie (Odocoileus virginianus), bovins (Bos indicus × Bos taureau), les cochons (Sus scrofa), et des poulets (Gallus gallus).
Pour les humains, ils ont obtenu la structure tridimensionnelle (3D) du complexe SARS-CoV-2 spike (S) RBD-hACE2 et ses séquences à partir de la banque de données sur les protéines. De même, ils ont obtenu des séquences de la protéine ACE2 d’UniProt pour quatre hôtes animaux du SARS-CoV-2. L’équipe a généré des structures 3D pour les complexes RBD-ACE2 pour les animaux à l’aide du modèle SWISS car leurs structures déterminées expérimentalement n’étaient pas disponibles.
Étant donné que la structure RBD-ACE2 est complexe, les chercheurs ont utilisé l’outil PISA pour identifier les interactions clés entre les résidus dans ACE2 et RBD, telles que les liaisons hydrogène, les ponts salins et les liaisons disulfure entre les paires d’acides aminés. Ils ont également utilisé les cartes de contact protéique pour enregistrer les distances entre toutes les paires de résidus d’acides aminés dans le complexe RBD-ACE2.
Ils ont également testé le modèle d’étude par rapport à un ensemble de tests en aveugle de 1667 variantes RBD lors de sa formation pour un test de validation croisée quintuple. L’équipe a également comparé la capacité prédictive du modèle CNN_seq aux valeurs expérimentales de la constante de dissociation apparente KD, application ratios. AKré,application ratio quantifie le changement d’affinité de liaison RBD pour hACE2, et Kré,application un rapport supérieur à un indique une liaison RBD-hACE2 plus forte, tandis qu’une valeur inférieure à un indique une liaison plus faible.
Enfin, les chercheurs ont calculé l’énergie libre de liaison (ΔG) du complexe RBD-hACE2 à l’aide du champ de force empirique basé sur la mécanique moléculaire appelé champ de force Rosetta.
Résultats de l’étude
Le pourcentage de récupération de la classification correcte des variants (%VC) atteint par le modèle CNN_seq dans les tests de validation croisée à cinq volets était de 83,28 %, avec un coefficient de corrélation de Pearson (r) de 0,85. Il a également bien fonctionné dans le test à l’aveugle, récupérant un %VC de 83,47 % et un r de 0,84, reconfirmant la robustesse des prédictions du modèle CNN_seq.
Le %VC calcule la précision de la classification en fonction du changement de l’affinité de liaison par rapport à la souche SARS-CoV-2 de type sauvage (WT) (en pourcentage) ; alors que r mesure la force de la corrélation linéaire entre le K prédit et expérimentalD, application valeurs de rapport.
Fait intéressant, les mutations n’ont pas considérablement modifié la structure, la carte de contact et les informations sur les résidus interfaciaux de chaque complexe RBD-ACE2 examiné par le modèle d’étude.
En outre, le modèle CNN_seq a prédit une affinité de liaison améliorée pour la plupart des variantes en circulation (21 au total, dont 13 avaient des étiquettes de l’Organisation mondiale de la santé (OMS) et les huit autres n’avaient que la classification PANGO) par rapport au WT, similaire aux résultats expérimentaux. Il a atteint un %VC de 92,9 % et un r de 0,60 sur l’ensemble de données en aveugle de 15 variantes contenant plusieurs modifications d’acides aminés. En revanche, le modèle de surface de Born généralisé à la mécanique moléculaire du réseau neuronal (NN_MM-GBSA) a donné des résultats relativement médiocres, produisant un %VC de 75,7 % et un r de 0,28 pour le même ensemble de données.
Pour Omicron, le modèle CNN_seq a prédit une meilleure affinité de liaison avec le KD, application valeurs de rapport de 1,23 ± 0,58. Le ΔG moyen résultant des complexes Omicron- et WT-RBD-hACE2 était de -36,2 ± 2,4 et -44,3 ± 1,0 kcal/mol, respectivement.
Les incohérences observées dans les résultats obtenus à partir de différentes méthodes pour Omicron étaient très probablement attribuables à plus de 15 mutations dans son RBD, entraînant la formation ou la rupture de plusieurs paires d’acides aminés et un réarrangement structurel conséquent.
L’affinité de liaison des variants RBD aux ACE2 animaux a suivi le même schéma que pour l’ACE2 humain. En conséquence, l’ACE2 des cerfs s’est lié au SARS-CoV-2 RBD presque aussi fortement que l’ACE2 humain, tandis que les ACE2 des bovins, des porcs et des poulets se sont liés faiblement.
conclusion
En utilisant un ensemble de données agrandi d’environ 80 fois, le nouveau modèle CNN_seq s’est formé efficacement et a surmonté les barrières de calcul associées à la procédure NN_MD-MMGBSA ; ainsi, présentant une opportunité d’évaluer de manière exhaustive les changements d’affinité de liaison dans l’ensemble du RBD ainsi que les récepteurs ACE2 des humains ainsi que des animaux.
Il est difficile d’évaluer expérimentalement les changements d’affinité de liaison en réponse à deux changements d’acides aminés ou plus. Cependant, le modèle CNN_seq a évalué jusqu’à quatre mutations et l’épistasie associée et les effets synergiques. Plus important encore, pour Omicron, ce modèle a défini le rôle des mutations en tant qu’évasion immunitaire et amélioration de la liaison.
*Avis important
bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique/les comportements liés à la santé, ou traités comme des informations établies.