C'est un dogme enseigné dans tous les cours d'introduction à la biologie : les protéines sont composées de combinaisons de 20 acides aminés différents, disposés en séquences diverses comme des mots. Mais les chercheurs qui tentent de concevoir des molécules biologiques avec de nouvelles fonctions se sont longtemps sentis limités par ces 20 éléments de base et se sont efforcés de développer des moyens d'intégrer de nouveaux éléments de base, appelés acides aminés non canoniques, dans leurs protéines.
Désormais, des scientifiques de Scripps Research ont conçu un nouveau paradigme permettant d'ajouter facilement des acides aminés non canoniques aux protéines. Leur approche, décrite dans Biotechnologie de la nature le 11 septembre 2024, s'articule autour de l'utilisation de quatre nucléotides d'ARN – plutôt que les trois habituels – pour coder chaque nouvel acide aminé.
Notre objectif est de développer des protéines aux fonctions adaptées pour des applications dans des domaines allant de la bio-ingénierie à la découverte de médicaments. Le fait de pouvoir incorporer des acides aminés non canoniques dans les protéines grâce à cette nouvelle méthode nous rapproche de cet objectif.
Ahmed Badran, Ph. D., auteur principal, professeur adjoint de chimie à Scripps Research
Pour qu'une cellule puisse produire une protéine donnée, elle doit traduire un brin d'ARN en une chaîne d'acides aminés. Chaque groupe de trois nucléotides d'ARN, appelé codon, correspond à un acide aminé. Mais de nombreux acides aminés ont plus d'un codon possible ; par exemple, les séquences d'ARN UAU et UAC correspondent toutes deux à l'acide aminé tyrosine. C'est le travail de petites molécules appelées ARN de transfert (ARNt) de lier chaque acide aminé à ses codons correspondants.
Récemment, des chercheurs souhaitant ajouter des acides aminés entièrement nouveaux à une protéine ont créé des stratégies pour réassigner un codon. Par exemple, le codon UAU pourrait être lié à un nouvel acide aminé en remplaçant l'ARNt par UAU ; cela permettrait à la cellule de lire UAU comme correspondant à un élément constitutif autre que la tyrosine. Mais en même temps, chaque instance d'UAU dans le génome de la cellule devrait devenir UAC, afin d'empêcher le nouvel acide aminé d'être intégré dans des milliers d'autres protéines auxquelles il n'appartient pas.
« La création de codons libres par recodage du génome entier peut être une stratégie efficace, mais elle peut aussi s'avérer difficile car elle nécessite des ressources considérables pour construire de nouveaux génomes », explique Badran. « Pour l'organisme lui-même, il peut être difficile de prédire comment de tels changements de codons influencent la stabilité du génome et la production de protéines de l'hôte. »
Badran et ses collègues voulaient créer une stratégie plug-and-play efficace qui incorporerait uniquement les acides aminés non canoniques choisis dans des sites spécifiques d'une protéine cible, sans perturber la biologie normale de la cellule ni nécessiter la modification de l'intégralité du génome. Cela impliquait d'utiliser un ARNt qui n'était pas déjà attribué à un acide aminé. Leur solution : un codon à quatre nucléotides.
L'équipe savait que dans certaines situations, comme lorsque les bactéries s'adaptent rapidement pour résister aux médicaments, les codons à quatre nucléotides avaient évolué naturellement. Ainsi, dans leur nouveau travail, les chercheurs ont étudié ce qui poussait les cellules à utiliser un codon à quatre nucléotides plutôt qu'à trois. Ils ont découvert que l'identité des séquences proches du codon à quatre bases était essentielle : les codons fréquemment utilisés amélioraient la façon dont la cellule pouvait lire un codon à quatre nucléotides pour incorporer un acide aminé non canonique.
L'équipe de Badran a ensuite testé s'il était possible de modifier la séquence d'un seul gène de manière à ce qu'il possède un nouveau codon de quatre nucléotides qui serait correctement utilisé par la cellule. La méthode a fonctionné : lorsque les chercheurs ont entouré un site cible de codons de trois lettres fréquemment utilisés et ont maintenu des niveaux suffisants d'ARNt de quatre nucléotides, la cellule a incorporé tout nouvel acide aminé attaché à l'ARNt de quatre lettres correspondant. L'équipe de recherche a répété l'expérience avec 12 codons de quatre nucléotides différents, puis a utilisé la technique pour concevoir plus de 100 nouveaux peptides cycliques, appelés macrocycles, contenant jusqu'à trois acides aminés non canoniques chacun.
« Ces peptides cycliques rappellent les petites molécules bioactives que l’on peut trouver dans la nature », explique Badran. « En capitalisant sur la programmabilité de la synthèse des protéines et sur la diversité des éléments constitutifs accessibles par cette approche, nous pouvons créer des petites molécules inédites dans la nature qui auront des applications passionnantes dans la découverte de médicaments. »
Il ajoute que, par rapport aux approches précédentes d'incorporation d'acides aminés non canoniques, cette nouvelle méthode est facile à utiliser car elle implique de modifier un seul gène plutôt que le génome entier d'une cellule. De plus, davantage d'acides aminés non canoniques pourraient être utilisés dans une seule protéine car il existe davantage de codons à quatre nucléotides possibles que de codons à trois nucléotides.
« Nos résultats suggèrent qu'il est désormais possible d'incorporer facilement et efficacement des acides aminés non canoniques à divers endroits dans une large gamme de protéines », explique Badran. « Nous sommes ravis de ces possibilités pour nos travaux en cours et de pouvoir offrir cette capacité à la communauté au sens large. »
Il note que la technique pourrait être utilisée pour réorganiser les protéines existantes – ou en créer de toutes nouvelles – qui auraient une utilité dans de nombreux secteurs, notamment la médecine, la fabrication et la détection chimique.