La thérapie génique pourrait potentiellement guérir des maladies génétiques, mais il reste difficile de conditionner et de délivrer de nouveaux gènes à des cellules spécifiques de manière sûre et efficace. Les méthodes existantes de conception de l'un des vecteurs de délivrance de gènes les plus couramment utilisés, les virus adéno-associés (VAA), sont souvent lentes et inefficaces.
Des chercheurs du Broad Institute du MIT et de Harvard ont développé une approche d’apprentissage automatique qui promet d’accélérer l’ingénierie des AAV pour la thérapie génique. L’outil aide les chercheurs à concevoir les enveloppes protéiques des AAV, appelées capsides, pour qu’elles présentent plusieurs caractéristiques souhaitables, comme la capacité de livrer une cargaison à un organe spécifique mais pas à d’autres ou de fonctionner chez plusieurs espèces. D’autres méthodes ne recherchent que les capsides qui présentent une seule caractéristique à la fois.
L’équipe a utilisé cette approche pour concevoir des capsides pour un type d’AAV couramment utilisé, appelé AAV9, qui ciblait plus efficacement le foie et pouvait être facilement fabriqué. Ils ont découvert qu’environ 90 % des capsides prédites par leurs modèles d’apprentissage automatique ont livré avec succès leur cargaison aux cellules hépatiques humaines et ont rempli cinq autres critères clés. Ils ont également découvert que leur modèle d’apprentissage automatique prédisait correctement le comportement des protéines chez les macaques, même s’il n’était formé qu’à partir de données de souris et de cellules humaines. Cette découverte suggère que la nouvelle méthode pourrait aider les scientifiques à concevoir plus rapidement des AAV qui fonctionnent sur plusieurs espèces, ce qui est essentiel pour traduire les thérapies géniques chez l’homme.
Les résultats, qui ont été publiés récemment dans Nature Communicationsproviennent du laboratoire de Ben Deverman, scientifique de l'institut et directeur de l'ingénierie vectorielle au Stanley Center for Psychiatric Research à Broad. Fatma-Elzahraa Eid, scientifique senior en apprentissage automatique au sein du groupe de Deverman, a été la première auteure de l'étude.
« Il s’agit d’une approche vraiment unique. Elle souligne l’importance pour les biologistes de laboratoire de travailler en collaboration avec les scientifiques de l’apprentissage automatique dès le début pour concevoir des expériences qui génèrent des données permettant l’apprentissage automatique plutôt qu’après coup. »
Ben Deverman, scientifique de l'Institut et directeur, Vector Engineering, Stanley Center for Psychiatric Research, Broad Institute
Le chef de groupe Ken Chan, l'étudiant diplômé Albert Chen, l'associée de recherche Isabelle Tobey et la conseillère scientifique Alina Chan, tous deux du laboratoire de Deverman, ont également contribué de manière significative à l'étude.
Place aux machines
Les approches traditionnelles de conception d'AAV impliquent la création de grandes bibliothèques contenant des millions de variantes de protéines de capside, puis leur test sur des cellules et des animaux au cours de plusieurs cycles de sélection. Ce processus peut être coûteux et long, et conduit généralement les chercheurs à n'identifier qu'une poignée de capsides présentant une caractéristique spécifique. Il est donc difficile de trouver des capsides répondant à plusieurs critères.
D’autres groupes ont utilisé l’apprentissage automatique pour accélérer l’analyse à grande échelle, mais la plupart des méthodes optimisaient les protéines pour une fonction au détriment d’une autre.
Deverman et Eid ont réalisé que les ensembles de données basés sur de grandes bibliothèques AAV existantes n'étaient pas bien adaptés à l'entraînement de modèles d'apprentissage automatique. « Au lieu de simplement prendre des données et de les transmettre aux scientifiques de l'apprentissage automatique, nous nous sommes demandé : « De quoi avons-nous besoin pour mieux entraîner les modèles d'apprentissage automatique ? » », a déclaré Eid. « Comprendre cela a été vraiment essentiel. »
Ils ont d'abord utilisé une première série de modélisations par apprentissage automatique pour générer une nouvelle bibliothèque de taille moyenne, appelée Fit4Function, qui contenait des capsides censées bien emballer la charge génétique. L'équipe a examiné la bibliothèque dans des cellules humaines et des souris pour trouver des capsides ayant des fonctions spécifiques importantes pour la thérapie génique dans chaque espèce. Ils ont ensuite utilisé ces données pour créer plusieurs modèles d'apprentissage automatique qui pouvaient chacun prédire une certaine fonction à partir de la séquence d'acides aminés d'une capside. Enfin, ils ont utilisé les modèles en combinaison pour créer des bibliothèques « multifonctions » d'AAV optimisées pour plusieurs caractéristiques à la fois.
L'avenir de la conception des protéines
Pour prouver le concept, Eid et d'autres chercheurs du laboratoire de Deverman ont combiné six modèles pour concevoir une bibliothèque de capsides dotées de multiples fonctions souhaitées, notamment la fabricabilité et la capacité de cibler le foie dans les cellules humaines et les souris. Près de 90 % de ces protéines présentaient simultanément toutes les fonctions souhaitées.
Les chercheurs ont également découvert que le modèle, formé uniquement à partir de données provenant de souris et de cellules humaines, prédisait correctement la manière dont les AAV se distribuaient dans les différents organes des macaques, ce qui suggère que ces AAV le font grâce à un mécanisme transposable à toutes les espèces. Cela pourrait signifier qu'à l'avenir, les chercheurs en thérapie génique pourraient identifier plus rapidement des capsides présentant de multiples propriétés souhaitables pour l'utilisation humaine.
Eid et Deverman estiment que leurs modèles pourraient aider d’autres groupes à créer des thérapies géniques ciblant ou évitant spécifiquement le foie. Ils espèrent également que d’autres laboratoires utiliseront leur approche pour générer leurs propres modèles et bibliothèques qui, ensemble, pourraient former un atlas d’apprentissage automatique : une ressource capable de prédire les performances des capsides AAV sur des dizaines de caractéristiques pour accélérer le développement de thérapies géniques.