Les biologistes quantitatifs David McCandlish et Juannan Zhou du Cold Spring Harbor Laboratory ont développé un algorithme avec un pouvoir prédictif, donnant aux scientifiques la possibilité de voir comment des mutations génétiques spécifiques peuvent se combiner pour faire changer les protéines critiques au cours de l'évolution d'une espèce.
L'algorithme appelé «interpolation d'épistase minimale» permet de visualiser comment une protéine pourrait évoluer pour devenir hautement efficace ou pas du tout efficace. Ils ont comparé la fonctionnalité de milliers de versions de la protéine, trouvant des modèles dans la façon dont les mutations font évoluer la protéine d'une forme fonctionnelle à une autre. Crédit d'image: laboratoire McCandlish / CSHL, 2020
Décrit dans Nature Communications, l'algorithme appelé « interpolation d'épistase minimale » permet de visualiser comment une protéine pourrait évoluer pour devenir hautement efficace ou pas du tout efficace. Ils ont comparé la fonctionnalité de milliers de versions de la protéine, trouvant des modèles dans la façon dont les mutations font évoluer la protéine d'une forme fonctionnelle à une autre.
« Epistasis » décrit toute interaction entre des mutations génétiques dans laquelle l'effet d'un gène dépend de la présence d'un autre. Dans de nombreux cas, les scientifiques supposent que lorsque la réalité ne correspond pas à leurs modèles prédictifs, ces interactions entre les gènes sont en jeu. Dans cet esprit, McCandlish a créé ce nouvel algorithme en supposant que chaque mutation est importante. Le terme «interpolation» décrit l'acte de prédire le chemin évolutif des mutations qu'une espèce pourrait subir pour atteindre une fonction protéique optimale.
Les chercheurs ont créé l'algorithme en testant les effets de mutations spécifiques se produisant dans les gènes qui fabriquent la protéine GB1 streptococcique. Ils ont choisi la protéine GB1 en raison de sa structure complexe, qui générerait un nombre énorme de mutations possibles qui pourraient être combinées d'un nombre énorme de façons possibles.
En raison de cette complexité, la visualisation de cet ensemble de données est devenue si importante. Nous voulions transformer les chiffres en images afin de mieux comprendre ce que (les données) nous disent. «
David McCandlish, laboratoire de Cold Spring Harbor
La visualisation est comme une carte topologique. La hauteur et la couleur sont en corrélation avec le niveau d'activité des protéines et la distance entre les points sur la carte représente le temps qu'il faut aux mutations pour évoluer vers ce niveau d'activité.
La protéine GB1 commence dans la nature avec un niveau modeste d'activité protéique, mais peut évoluer vers un niveau d'activité protéique plus élevée grâce à une série de mutations qui se produisent à plusieurs endroits différents.
McCandlish compare le chemin évolutif de la protéine à la randonnée, où la protéine est un randonneur essayant d'atteindre plus efficacement les plus hauts ou les meilleurs sommets des montagnes. Les gènes évoluent de la même manière: avec une mutation recherchant le chemin de moindre résistance et d'efficacité accrue.
Pour se rendre au prochain meilleur sommet de la chaîne de montagnes, le randonneur est plus susceptible de voyager le long de la ligne de crête que de descendre tout le long de la vallée. Le long de la ligne de crête évite efficacement une autre ascension potentiellement difficile. Dans la visualisation, la vallée est la zone bleue, où les combinaisons de mutations entraînent les niveaux les plus bas d'activité protéique.
L'algorithme montre à quel point chaque séquence mutante possible est optimale et combien de temps il faudra pour qu'une séquence génétique mute en l'une des nombreuses autres séquences possibles. Le pouvoir prédictif de l'outil pourrait s'avérer particulièrement précieux dans des situations comme la pandémie de COVID-19. Les chercheurs doivent savoir comment évolue un virus afin de savoir où et quand l'intercepter avant qu'il n'atteigne sa forme la plus dangereuse.
McCandlish explique que l'algorithme peut également aider à «comprendre les voies génétiques qu'un virus pourrait emprunter au fur et à mesure qu'il évolue pour échapper au système immunitaire ou gagner une résistance aux médicaments. Si nous pouvons comprendre les voies probables, alors nous pourrons peut-être concevoir des thérapies qui peuvent empêcher l'évolution de résistance ou d'évasion immunitaire. «
Il existe d'autres applications potentielles pour un tel algorithme génétique prédictif, notamment le développement de médicaments et l'agriculture.
« Vous savez, au tout début de la génétique … il y avait toutes ces spéculations intéressantes sur ce à quoi ces espaces génétiques ressembleraient si vous pouviez les regarder. Maintenant, nous le faisons vraiment! C'est vraiment cool. »
David McCandlish, Laboratoire de Cold Spring Harbor