À la fin de 2021, les variantes du coronavirus 2 du syndrome respiratoire aigu sévère (SRAS-CoV-2) associées à une transmissibilité accrue et/ou à une évasion immunitaire (échappement d’anticorps) avaient presque complètement supplanté la souche fondatrice d’origine (Wu-Hu-1). Les variants émergents ont fréquemment au moins une mutation dans le domaine de liaison au récepteur (RBD), qui peut affecter la liaison à l’enzyme de conversion de l’angiotensine 2 (ACE2). Par exemple, les variants alpha (B.1.1.7), bêta et gamma ont la mutation N501Y, qui est associée à une affinité plus élevée de liaison à l’ACE2, ce qui implique qu’il pourrait s’agir d’une pression sélective pour l’émergence de variants.
Étude : Profilage prédictif des variantes du SRAS-CoV-2 par apprentissage mutationnel profond. Crédit d’image : Lightspring/Shutterstock
Des recherches antérieures ont utilisé l’affichage de la surface de la levure et le balayage mutationnel profond (DMS) pour examiner l’impact des mutations à position unique sur la liaison à l’ACE2 et aux anticorps monoclonaux ou sériques sur le RBD complet de 201 acides aminés du SRAS-CoV-2. Plusieurs variantes largement circulantes (par exemple, bêta, gamma et delta) ainsi que de nouvelles variantes en développement (par exemple, mu (B.1621) et lambda (C.37) ont de nombreuses mutations dans le RBD, qui sont associées à une meilleure liaison ACE2 et/ou échappement d’anticorps multi-classes.
L’émergence récente du variant omicron avec 15 mutations RBD, qui représente un danger important d’évasion immunitaire, met en évidence le besoin urgent de comprendre l’impact des mutations combinatoires. Cependant, à mesure que le nombre de mutations et la diversité des acides aminés augmentent, l’espace des séquences combinatoires augmente de façon exponentielle, dépassant rapidement les capacités des procédures de criblage expérimentales. Par exemple, l’espace de séquence théorique dépasse largement ce qui peut être criblé par les bibliothèques d’affichage de levure tout en se concentrant uniquement sur un sous-ensemble de vingt résidus RBD directement impliqués dans la liaison ACE2.
L’apprentissage mutationnel profond (DML) est une technique développée par des chercheurs de plusieurs institutions qui combine le criblage expérimental d’affichage de levure de bibliothèques de mutagenèse RBD avec le séquençage en profondeur et l’apprentissage automatique. Le DML permet une analyse complète des mutations combinatoires RBD et de leur impact sur la liaison ACE2 et l’échappement des anticorps, permettant le profilage prédictif de la variante SARS-CoV-2.
Une version préimprimée de l’étude est disponible sur le site bioRxiv* serveur pendant que l’article est soumis à une évaluation par les pairs.
L’étude
Les auteurs ont examiné leurs performances de classification sur des variantes définies, suivies d’une validation expérimentale et d’une modélisation structurelle, après avoir établi que les modèles d’apprentissage automatique de liaison ACE2 et d’échappement d’anticorps peuvent produire des prédictions très précises sur les données de test. Pour reproduire des voies évolutives réalistes, des lignées synthétiques ont été créées in silico, les variantes dépourvues d’intermédiaires de liaison ACE2 anticipés à chaque stade de mutation étant rejetées. Les lignées ont été créées pour contenir des mutations de la séquence originale Wu-Hu-1 RBD à la distance d’édition 3 (ED3), ED5 et ED7 (nucléotide et acide aminé). Les séquences ont également été choisies pour établir des lignées avec des mutations trouvées dans les variations circulantes.
Un modèle consensus a été utilisé pour prédire la liaison à l’ACE2, dans lequel une séquence RBD donnée devrait se lier à l’ACE2 si les modèles RF et RNN fournissent P > 0,5 ; sinon, ils sont censés être non liants. Les 46 variantes de lignées synthétiques ont été choisies pour leur variété de prédiction de liaison ACE2 (36 liants prédits, dix non-liants prédits). De plus, les prédictions d’échappement de chacun des quatre anticorps thérapeutiques ont été établies en utilisant une technique de modèle de consensus similaire pour les variations synthétiques (la séquence RBD s’échappe d’un anticorps lorsque les sorties RF et RNN sont à P 0,5).
Chaque variation RBD synthétique a été produite indépendamment à la surface des cellules de levure et testée pour la liaison à l’ACE2 et l’échappement des anticorps une fois toutes les prédictions d’apprentissage automatique terminées. Le modèle de consensus a prédit avec précision la liaison ACE2 pour 91,67 % des variations synthétiques, avec une précision de prédiction non contraignante de 100 %, ce qui donne une précision de prédiction de 93,48 % dans l’ensemble. La précision cumulée des prédictions d’échappement d’anticorps pour les quatre anticorps thérapeutiques était de 93,94 % pour les 33 variantes de liaison à l’ACE2 correctement prédites.
De plus, les modèles de consensus ont prédit la liaison et l’échappement de l’ACE2 des quatre anticorps thérapeutiques dans trois variations qui n’étaient que ED3 (nucléotide et acide aminé) du RBD Wu-Hu-1. Des mutations ont été trouvées dans l’une de ces variations aux emplacements 493, 498 et 501, qui sont tous mutés dans la variante omicron. À la suite d’études sur la présentation de levures, les prédictions d’apprentissage automatique de l’échappement d’anticorps des quatre anticorps thérapeutiques, y compris le REGN10987, souvent résistant aux mutations, ont été confirmées. AlphaFold2 a été utilisé pour effectuer une modélisation structurelle sur huit variantes RBD synthétiques. Selon les prédictions structurelles, plusieurs variantes ACE2 non contraignantes ne différaient pas significativement du Wu-Hu-1 RBD original. Les variations de liaison à l’ACE2, d’autre part, présentaient un large éventail de conformations structurelles potentielles.
Implications
Selon les preuves, d’autres domaines endémiques de liaison aux récepteurs de coronavirus pourraient subir une évolution adaptative pour éviter les réactions d’anticorps humains. En conséquence, la combinaison de DML avec des modèles phylogénétiques d’évolution virale pour prédire l’échappement du SRAS-CoV-2 à partir d’anticorps polyclonaux présents dans le sérum d’individus vaccinés ou convalescents peut permettre l’identification de futures variantes avec la plus grande probabilité d’émergence et ainsi soutenir le développement de vaccins pour la maladie à coronavirus 2019 (COVID-19).
*Avis important
bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, orienter la pratique clinique/le comportement lié à la santé, ou traités comme des informations établies.