L'IA Breakthrough offre une nouvelle façon de prédire et de visualiser les processus pathologiques

Pour résoudre un problème, nous devons le voir clairement.

Qu'il s'agisse d'une infection par un nouveau virus ou des plaques de vol à la mémoire se formant dans le cerveau des patients d'Alzheimer, la visualisation des processus pathologiques dans le corps est la première étape vers la soulagement des souffrances humaines. C'est aussi souvent le plus difficile et le plus coûteux.

Mais une percée d'intelligence artificielle (IA) par les informaticiens de Virginia Tech publiée le 16 septembre dans les systèmes cellulaires – une revue à fort impact dédié à la recherche biologique – met l'accent sur ces processus de brouillard.

Le nouvel outil Prorna3d-Single développé par Debswapna Bhattacharya, professeur agrégé d'informatique, et son équipe de recherche offre un nouveau moyen plus précis de prédire et visualiser ce qui se passe en nous lorsque de nouveaux virus et des maladies neurologiques dévastatrices attaquent – offrant une nouvelle voie pour les traiter ou les prévenir complètement.

L'objectif ultime est d'accélérer le processus de découverte de médicaments pour empêcher les virus de l'ARN d'interagir avec les protéines hôtes, d'arrêter potentiellement les infections avant de se développer en pandémies ou d'inhiber la fonction altérée des protéines de liaison à l'ARN dans la maladie d'Alzheimer. «

Debswapna Bhattacharya, professeur agrégé d'informatique

Un chatpt bilingue pour la biologie

Pendant des décennies, les scientifiques ont eu du mal à comprendre comment l'acide ribonucléique viral (ARN) se lie aux protéines humaines pour former des structures moléculaires 3D complexes. C'est important parce que ces formes contrôlent si les agents pathogènes tels que le SARS-COV-2 peuvent se propager ou si des maladies telles que l'Alzheimer s'installent.

Les systèmes d'IA aident en créant un « alphabet » pour représenter l'ADN, l'ARN et les protéines, que les chercheurs peuvent ensuite utiliser pour former de grands modèles de langage (LLM) pour les séquences biologiques pour analyser et simuler comment ces molécules interagissent dans le corps.

Mais Prorna3d-Single va plus loin que les alphabets. Il utilise l'IA pour générer des images finement détaillées de ces molécules en 3D.

« Les Bio LLM sont essentiellement comme Chatgpt, mais pour les séquences biologiques. Et tout comme Chatgpt, nous pouvons poser des questions à nos modèles et obtenir des réponses », a déclaré Bhattacharya.

L'équipe de Virginia Tech a pris deux LLM biologiques existantes – une pour les protéines et une autre pour les séquences d'ARN – et a créé un troisième modèle qui permet à ces LLM de « se parler. Parmi ces «conversations», Prorna3d-Single peut générer des modèles structurels 3D d'ARN viral interagissant avec les protéines dans le corps. C'est une grande percée.

« Il s'agit essentiellement d'un appariement neuronal de deux modèles différents en grande langue, conduisant à un raisonnement bilingue », a déclaré Bhattacharya. « Du point de vue de l'informatique, c'est une contribution en soi. »

Même les récents modèles d'IA révocateurs développés par Google DeepMind et d'autres ont été loin de prédire et de modéliser avec précision les structures 3D complexes de protéines d'ARN, ce qui laisse les chercheurs s'appuyer principalement sur des expériences coûteuses d'essais et d'erreurs.

Mais la nouvelle méthode Prorna3d-Single a considérablement accru la précision et a ouvert une nouvelle route prometteuse à la découverte scientifique assistée par l'IA.

Mettre au point la maladie

On sait peu de choses sur la façon dont de nouveaux virus tels que les SRAS-CoV-2 évoluent ou comment les conditions telles que la démence se développent au niveau moléculaire, mais Prorna3d-Single aide à combler ces lacunes et à générer des cartes plus précises du paysage intérieur. Maintenant, au lieu de deviner, les développeurs de médicaments peuvent analyser où les virus s'attachent aux protéines humaines et aux traitements de conception pour les bloquer. Cela pourrait réduire considérablement le temps et le coût des interventions et accélérer les réponses aux épidémies.

« Si vous vous souvenez de la pandémie Covid-19 et du vaccin basé sur l'ARNm qui a en fait aidé beaucoup – ce vaccin a fonctionné parce que c'était un thérapeutique basé sur l'ARN », a déclaré Sumit Tarafder, un doctorat de quatrième année. étudiant sur le projet. « La modélisation des interactions protéine-ARN dans la 3D est cruciale, de sorte que nous savons où le médicament peut réellement cibler les molécules qui provoquent une maladie. »

Non seulement cela, mais en générant de nouvelles données sur les interactions d'ARN-protéine, le modèle Prorna3d-Single crée des informations qui pourraient conduire à des traitements révolutionnaires pour une gamme de maladies.

Alors que l'équipe de Virginia Tech a utilisé des virus comme étude de cas, « la méthode est entièrement générique. Il n'est pas spécifique à un seul type de virus ou d'une famille de virus », a déclaré Bhattacharya. « Cette méthode peut être appliquée à n'importe quel cas d'utilisation. »

Science ouverte, impact mondial

Des méthodes innovantes comme Prorna3d-Single ne viennent pas facilement. Deux années de travail ont été lancées dans ce projet.

L'ancien Rahmatullah Roche, 2000, a fait une grande partie du codage, publiant plus d'une douzaine d'articles sur le sujet pendant son travail de doctorat. Il a depuis rejoint la Columbus State University en tant que professeur adjoint d'altitude.

« Les étudiants du doctorat principal ont fait un énorme travail », a déclaré Bhattacharya. « Ils ont fait la majeure partie du gros du travail. »

Des découvertes comme celles-ci peuvent améliorer la vie à l'échelle nationale et même mondiale, et en tant que science dans l'intérêt public, ce projet a reçu un financement de la National Institutes of Health and National Science Foundation. Non seulement le document de recherche est en libre accès, mais Bhattacharya rend le nouvel outil lui-même librement disponible pour les scientifiques pour essayer par eux-mêmes.

« Nous ne pouvons pas surestimer l'importance d'investir dans la science au profit de la société. Nous pensons que l'ouverture est la clé pour rendre la science accessible à tous », a déclaré Bhattacharya. « Les contribuables nous financent, nous avons donc l'obligation de redonner, c'est pourquoi nous rendons notre travail open source et accessible au public. »

L'équipe espère poursuivre le développement de l'outil pour améliorer sa précision et obtenir des modèles encore plus détaillés de divers processus biologiques.

« Nous devons constamment nous rappeler que le problème est loin d'être résolu », a déclaré Bhattacharya. « Nous avons fait des progrès, oui, mais nous sommes conscients du fait que ces modèles ont un long chemin à parcourir. »