En exploitant les agents d’IA et l’expertise humaine, les chercheurs accélèrent la conception de nanocorps innovants pour lutter contre les variantes évolutives du SRAS-CoV-2.
Étude : Le laboratoire virtuel : les agents d'IA conçoivent de nouveaux nanobodies SARS-CoV-2 avec validation expérimentale. Crédit d’image : Shutterstock IA
*Avis important : bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique/le comportement lié à la santé, ni être traités comme des informations établies.
Dans une prépublication récente publiée sur le bioRxiv serveur de prépublication*, des chercheurs de l'Université de Stanford et du Chan Zuckerberg Biohub ont créé un « laboratoire virtuel », une collaboration de recherche entre l'intelligence artificielle et les humains, pour concevoir des liants de nanocorps ciblant les variantes du coronavirus 2 du syndrome respiratoire aigu sévère (SRAS-CoV-2) en utilisant un pipeline informatique.
Ils ont découvert que Virtual Lab pouvait concevoir avec succès 92 nouveaux nanocorps, dont deux montrant une liaison améliorée aux variantes récentes du SRAS-CoV-2, en particulier les variantes JN.1 et KP.3, servant de candidats prometteurs pour des recherches plus approfondies.
Sommaire
Arrière-plan
La recherche scientifique interdisciplinaire nécessite une collaboration entre experts de divers domaines, mais la coordination de grandes équipes peut s'avérer difficile, en particulier pour les groupes disposant de ressources insuffisantes.
Les grands modèles de langage (LLM) comme ChatGPT et Claude ont gagné en popularité pour aider les chercheurs dans diverses tâches, telles que répondre à des questions scientifiques, résumer des articles et écrire du code.
Bien que les LLM présentent un grand potentiel pour des tâches spécifiques, ils n’ont pas été largement testés dans le cadre de recherches complexes et ouvertes couvrant plusieurs disciplines.
Les cadres existants comme ChemCrow et Coscientist se concentrent sur des domaines spécifiques tels que la chimie et la planification de la synthèse, tandis que AI Scientist tente de couvrir l'ensemble du processus de recherche mais reste limité à des applications étroites d'apprentissage automatique.
Ces efforts manquent souvent de validation dans le monde réel et ne répondent pas aux défis de la recherche interdisciplinaire qui nécessite un raisonnement en plusieurs étapes dans tous les domaines, ce qui rend difficile pour les groupes sous-financés de s'engager dans des découvertes scientifiques avancées.
Dans la présente étude, les chercheurs ont présenté un nouveau cadre, « Virtual Lab », une collaboration IA-humain développée pour résoudre des problèmes interdisciplinaires complexes et l'a utilisé pour concevoir de nouveaux nanocorps ciblant les dernières variantes du SRAS-CoV-2.
À propos de l'étude
Le laboratoire virtuel consiste en une combinaison de réunions d'équipe et individuelles, au cours desquelles le chercheur humain fixe l'ordre du jour et les agents LLM (par exemple, des biologistes, des spécialistes de l'apprentissage automatique) apportent des connaissances spécialisées pour atteindre les objectifs de recherche.
La recherche est guidée par un agent chercheur principal (PI), qui sélectionne les agents scientifiques appropriés, définit leurs rôles et dirige le processus global.
Lors des réunions d'équipe, tous les agents discutent de vastes sujets de recherche et leurs contributions sont synthétisées par le chercheur principal pour guider la prise de décision. Pour des tâches plus spécifiques, des réunions individuelles sont organisées avec un seul agent, souvent assisté d'un agent critique scientifique pour fournir un retour d'information.
Les agents, chacun défini par un titre, une expertise, un objectif et un rôle, collaborent pour aborder des questions de recherche complexes de manière structurée, avec plusieurs cycles de discussion si nécessaire.
Un exemple du laboratoire virtuel en action est son application à la conception de nanocorps pour lutter contre le virus SARS-CoV-2.
L'agent PI rassemble une équipe (par exemple, immunologiste, spécialiste de l'apprentissage automatique) pour spécifier l'orientation du projet, sélectionner des outils informatiques (par exemple, ESM, AlphaFold-Multimer, Rosetta) et mettre en œuvre ces outils pour concevoir des nanobodies.
Ces outils aident à optimiser les séquences de nanocorps grâce à divers processus, tels que l'analyse de vraisemblance, la prédiction structurelle et les calculs d'énergie de liaison.
Chaque étape est mise en œuvre via des réunions individuelles avec les agents concernés, suivies d'une réunion de fusion pour garantir des résultats de haute qualité.
Résultats et discussion
Le laboratoire virtuel a mené un flux de travail informatique détaillé pour concevoir des candidats nanocorps améliorés ciblant la variante KP.3 du SRAS-CoV-2.
Le flux de travail impliquait plusieurs cycles de mutation et d’analyse pour quatre nanocorps de départ : Ty1, H11-D4, Nb21 et VHH-72. Chaque cycle a affiné les nanocorps en introduisant des mutations guidées par des mesures de notation spécifiques telles que le rapport de vraisemblance (LLR) ESM, la confiance de l'interface AlphaFold (ipLDDT) et l'énergie de liaison Rosetta (dG).
Ces mesures ont permis d'identifier les principales séquences mutantes, qui ont ensuite été validées expérimentalement.
Le processus a commencé par évaluer le nanocorps de type sauvage, puis a introduit de manière itérative des mutations ponctuelles, en appliquant des outils informatiques pour prédire une liaison structurelle améliorée.
Après quatre tours, les meilleures séquences, basées sur le score pondéré combiné (WS), ont été sélectionnées pour validation expérimentale.
Les résultats ont montré que le processus de mutation améliorait systématiquement la qualité des nanocorps en termes d’affinité de liaison et de stabilité structurelle.
La validation expérimentale des 92 nanocorps mutants sélectionnés a montré que 38 % présentaient des niveaux d'expression élevés dans E. coli, dont 85 % présentaient une liaison améliorée à la protéine du domaine de liaison au récepteur (RBD) de Wuhan.
Notamment, deux nouveaux mutants ont démontré une liaison à des variantes supplémentaires, telles que JN.1 et KP.3 RBD, attribuées à des mutations spécifiques comme R37Q et L59E, qui ont probablement amélioré les interactions électrostatiques et les liaisons hydrogène.
Le flux de travail du laboratoire virtuel impliquait une intervention humaine minimale, la majorité du travail étant générée par les agents LLM. Les agents ont collaboré au sein d'équipes interdisciplinaires, l'agent PI guidant l'ensemble du processus.
Des réunions parallèles et la contribution d'un critique scientifique ont amélioré la qualité des résultats, démontrant la puissance de cette approche collaborative pour une découverte scientifique rapide et robuste, accélérant des projets complexes comme la conception de nanocorps.
Conclusion
En conclusion, bien que limité par des données de formation LLM obsolètes, des outils imparfaits et des défis d'ingénierie rapides, le laboratoire virtuel présente une approche révolutionnaire de la recherche interdisciplinaire en intégrant de manière transparente les agents d'IA à l'expertise humaine, permettant une découverte scientifique plus rapide et plus efficace.
Les chercheurs ont déclaré qu'à mesure que les LLM évoluent, l'efficacité du cadre dans la recherche interdisciplinaire devrait s'améliorer encore, et potentiellement s'étendre à des applications au-delà de la recherche biologique.
C'est sauvage et futuriste. Un laboratoire virtuel composé de plusieurs (5) #IA agents conçus de puissants nanocorps vs #SRAS-CoV-2 avec une surveillance humaine minimale.https://t.co/eO5hTRTyEp @james_y_zou @KyleWSwanson @czbiohub @Stanford pic.twitter.com/RswSWbKUxj
– Éric Topol (@EricTopol) 13 novembre 2024
*Avis important : bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique/le comportement lié à la santé, ni être traités comme des informations établies.