Au cours des deux dernières décennies, les nouvelles technologies ont aidé les scientifiques à générer une grande quantité de données biologiques. Les expériences à grande échelle en génomique, transcriptomique, protéomique et cytométrie peuvent produire d’énormes quantités de données sur un système cellulaire ou multicellulaire donné.
Cependant, il n’est pas toujours facile de donner un sens à ces informations. Cela est particulièrement vrai lorsqu’on tente d’analyser des systèmes complexes tels que la cascade d’interactions qui se produisent lorsque le système immunitaire rencontre un agent pathogène étranger.
Les ingénieurs biologistes du MIT ont développé une nouvelle méthode informatique pour extraire des informations utiles de ces ensembles de données. Grâce à leur nouvelle technique, ils ont montré qu’ils pouvaient découvrir une série d’interactions qui déterminent la façon dont le système immunitaire réagit à la vaccination contre la tuberculose et à l’infection ultérieure.
Cette stratégie pourrait être utile aux développeurs de vaccins et aux chercheurs qui étudient tout type de système biologique complexe, explique Douglas Lauffenburger, professeur d'ingénierie Ford dans les départements de génie biologique, de biologie et de génie chimique.
Nous avons atterri sur un cadre de modélisation informatique qui permet de prédire les effets des perturbations dans un système très complexe, comprenant plusieurs échelles et de nombreux types de composants différents. »
Douglas Lauffenburger, professeur d'ingénierie Ford, départements de génie biologique, de biologie et de génie chimique, Massachusetts Institute of Technology
Shu Wang, ancien postdoctorant du MIT et maintenant professeur adjoint à l'Université de Toronto, et Amy Myers, directrice de recherche au laboratoire de la professeure JoAnne Flynn de la faculté de médecine de l'Université de Pittsburgh, sont les principaux auteurs d'un nouvel article sur le ouvrage, qui paraît aujourd'hui dans la revue Systèmes cellulaires.
Modélisation de systèmes complexes
Lorsqu’ils étudient des systèmes biologiques complexes tels que le système immunitaire, les scientifiques peuvent extraire de nombreux types de données différents. Le séquençage des génomes cellulaires leur indique quelles variantes génétiques portent une cellule, tandis que l'analyse des transcriptions d'ARN messager leur indique quels gènes sont exprimés dans une cellule donnée. Grâce à la protéomique, les chercheurs peuvent mesurer les protéines présentes dans une cellule ou un système biologique, et la cytométrie leur permet de quantifier une myriade de types de cellules présents.
En utilisant des approches informatiques telles que l'apprentissage automatique, les scientifiques peuvent utiliser ces données pour entraîner des modèles afin de prédire un résultat spécifique basé sur un ensemble donné d'entrées – ; par exemple, si un vaccin générera une réponse immunitaire robuste. Cependant, ce type de modélisation ne révèle rien sur les étapes qui se déroulent entre l'entrée et la sortie.
« Cette approche de l'IA peut être très utile à des fins médicales cliniques, mais elle n'est pas très utile pour comprendre la biologie, car on s'intéresse généralement à tout ce qui se passe entre les entrées et les sorties », explique Lauffenburger. « Quels sont les mécanismes qui génèrent réellement des extrants à partir d'intrants ? »
Pour créer des modèles capables d'identifier le fonctionnement interne de systèmes biologiques complexes, les chercheurs se sont tournés vers un type de modèle connu sous le nom de réseau graphique probabiliste. Ces modèles représentent chaque variable mesurée comme un nœud, générant des cartes de la manière dont chaque nœud est connecté aux autres.
Les réseaux graphiques probabilistes sont souvent utilisés pour des applications telles que la reconnaissance vocale et la vision par ordinateur, mais ils n'ont pas été largement utilisés en biologie.
Le laboratoire de Lauffenburger a déjà utilisé ce type de modèle pour analyser les voies de signalisation intracellulaires, ce qui nécessitait l'analyse d'un seul type de données. Pour adapter cette approche afin d'analyser plusieurs ensembles de données à la fois, les chercheurs ont appliqué une technique mathématique capable de filtrer toutes les corrélations entre des variables qui ne s'influencent pas directement. Cette technique, connue sous le nom de lasso graphique, est une adaptation de la méthode souvent utilisée dans les modèles d'apprentissage automatique pour supprimer les résultats probablement dus au bruit.
« En général, avec les modèles de réseau basés sur la corrélation, l'un des problèmes qui peuvent survenir est que tout semble être influencé par tout le reste. Il faut donc trouver comment se limiter aux interactions les plus essentielles », explique Lauffenburger. « En utilisant des cadres de réseaux graphiques probabilistes, on peut vraiment se résumer aux éléments les plus susceptibles d'être directs et éliminer les éléments les plus susceptibles d'être indirects. »
Mécanisme de vaccination
Pour tester leur approche de modélisation, les chercheurs ont utilisé les données d’études sur un vaccin contre la tuberculose. Ce vaccin, appelé BCG, est une forme atténuée de Mycobactérie bovis. Il est utilisé dans de nombreux pays où la tuberculose est courante, mais il n'est pas toujours efficace et sa protection peut s'affaiblir avec le temps.
Dans l'espoir de développer une protection plus efficace contre la tuberculose, les chercheurs ont testé si l'administration du vaccin BCG par voie intraveineuse ou par inhalation pouvait provoquer une meilleure réponse immunitaire que son injection. Ces études, réalisées sur des animaux, ont révélé que le vaccin était bien plus efficace lorsqu’il était administré par voie intraveineuse. Dans l'étude du MIT, Lauffenburger et ses collègues ont tenté de découvrir le mécanisme à l'origine de ce succès.
Les données examinées par les chercheurs dans cette étude comprenaient des mesures d'environ 200 variables, notamment les niveaux de cytokines, d'anticorps et de différents types de cellules immunitaires, provenant d'environ 30 animaux.
Les mesures ont été prises avant la vaccination, après la vaccination et après l’infection tuberculeuse. En analysant les données à l’aide de leur nouvelle approche de modélisation, l’équipe du MIT a pu déterminer les étapes nécessaires pour générer une forte réponse immunitaire. Ils ont montré que le vaccin stimule un sous-ensemble de lymphocytes T, qui produisent une cytokine qui active un ensemble de lymphocytes B qui génèrent des anticorps ciblant la bactérie.
« Presque comme une feuille de route ou un plan de métro, vous pouviez trouver quels étaient réellement les chemins les plus importants. Même si beaucoup d'autres choses dans le système immunitaire changeaient d'une manière ou d'une autre, elles étaient vraiment hors du chemin critique et n'ont pas changé. » compte tellement », dit Lauffenburger.
Les chercheurs ont ensuite utilisé le modèle pour prédire comment une perturbation spécifique, telle que la suppression d’un sous-ensemble de cellules immunitaires, affecterait le système. Le modèle prévoyait que si les cellules B étaient presque éliminées, il y aurait peu d’impact sur la réponse vaccinale, et les expériences ont montré que la prédiction était correcte.
Cette approche de modélisation pourrait être utilisée par les développeurs de vaccins pour prédire l’effet que leurs vaccins pourraient avoir et pour apporter des modifications susceptibles de les améliorer avant de les tester sur des humains. Le laboratoire de Lauffenburger utilise désormais ce modèle pour étudier le mécanisme d'un vaccin contre le paludisme administré aux enfants du Kenya, du Ghana et du Malawi au cours des dernières années.
Son laboratoire utilise également ce type de modélisation pour étudier le microenvironnement tumoral, qui contient de nombreux types de cellules immunitaires et de cellules cancéreuses, dans l'espoir de prédire comment les tumeurs pourraient répondre à différents types de traitements.
La recherche a été financée par l'Institut national des allergies et des maladies infectieuses.