Un nouveau modèle d'intelligence artificielle développé par des chercheurs de l'USC et publié dans Méthodes de la nature peut prédire avec précision comment différentes protéines peuvent se lier à l’ADN pour différents types de protéines, une avancée technologique qui promet de réduire le temps nécessaire au développement de nouveaux médicaments et d’autres traitements médicaux.
L'outil, appelé Deep Predictor of Binding Specificity (DeepPBS), est un modèle d'apprentissage profond géométrique conçu pour prédire la spécificité de liaison protéine-ADN à partir de structures complexes protéine-ADN. DeepPBS permet aux scientifiques et aux chercheurs de saisir la structure de données d'un complexe protéine-ADN dans un outil de calcul en ligne.
Les structures des complexes protéine-ADN contiennent des protéines qui sont généralement liées à une seule séquence d'ADN. Pour comprendre la régulation des gènes, il est important d'avoir accès à la spécificité de liaison d'une protéine à n'importe quelle séquence d'ADN ou région du génome. DeepPBS est un outil d'IA qui remplace le besoin de séquençage à haut débit ou d'expériences de biologie structurale pour révéler la spécificité de liaison protéine-ADN.
Remo Rohs, professeur et président fondateur du département de biologie quantitative et computationnelle, USC Dornsife College of Letters, Arts and Sciences
L'IA analyse et prédit les structures protéines-ADN
DeepPBS utilise un modèle d'apprentissage profond géométrique, un type d'approche d'apprentissage automatique qui analyse les données à l'aide de structures géométriques. L'outil d'IA a été conçu pour capturer les propriétés chimiques et les contextes géométriques de la protéine-ADN afin de prédire la spécificité de liaison.
À l’aide de ces données, DeepPBS produit des graphiques spatiaux qui illustrent la structure des protéines et la relation entre les représentations des protéines et de l’ADN. DeepPBS peut également prédire la spécificité de liaison entre différentes familles de protéines, contrairement à de nombreuses méthodes existantes qui se limitent à une seule famille de protéines.
« Il est important pour les chercheurs de disposer d'une méthode qui fonctionne universellement pour toutes les protéines et qui ne se limite pas à une famille de protéines bien étudiée. Cette approche nous permet également de concevoir de nouvelles protéines », a déclaré Rohs.
Une avancée majeure dans la prédiction de la structure des protéines
Le domaine de la prédiction de la structure des protéines a connu des progrès rapides depuis l'avènement d'AlphaFold de DeepMind, qui permet de prédire la structure des protéines à partir de la séquence. Ces outils ont permis d'accroître les données structurelles disponibles pour les scientifiques et les chercheurs à des fins d'analyse. DeepPBS fonctionne en conjonction avec des méthodes de prédiction de structure pour prédire la spécificité des protéines sans structures expérimentales disponibles.
Rohs a déclaré que les applications de DeepPBS sont nombreuses. Cette nouvelle méthode de recherche pourrait accélérer la conception de nouveaux médicaments et traitements pour des mutations spécifiques dans les cellules cancéreuses, ainsi que conduire à de nouvelles découvertes en biologie synthétique et à des applications dans la recherche sur l'ARN.
À propos de l'étude : Outre Rohs, les autres auteurs de l'étude incluent Raktim Mitra de l'USC ; Jinsen Li de l'USC ; Jared Sagendorf de l'Université de Californie à San Francisco ; Yibei Jiang de l'USC ; Ari Cohen de l'USC ; et Tsu-Pei Chiu de l'USC ; ainsi que Cameron Glasscock de l'Université de Washington.
Cette recherche a été principalement financée par la subvention NIH R35GM130376.