Les biologistes du Cold Spring Harbor Laboratory (CSHL) utilisent une approche mathématique développée dans le laboratoire du professeur adjoint du CSHL David McCandlish pour trouver des solutions à un ensemble diversifié de problèmes biologiques. Créé à l’origine pour comprendre les interactions entre différentes mutations dans les protéines, l’outil est maintenant utilisé par McCandlish et ses collaborateurs pour en savoir plus sur les complexités de l’expression des gènes et les mutations chromosomiques associées au cancer.
C’est l’une des choses qui sont vraiment fascinantes dans la recherche mathématique, c’est que parfois vous pouvez voir des liens entre des sujets, qui en surface semblent si différents, mais à un niveau mathématique, ils pourraient utiliser certaines des mêmes idées techniques. »
David McCandlish, professeur adjoint CSHL
Toutes ces questions impliquent de cartographier la probabilité de différentes variations sur un thème biologique : quelles combinaisons de mutations sont les plus susceptibles de survenir dans une protéine particulière, par exemple, ou quelles mutations chromosomiques sont le plus souvent trouvées ensemble dans la même cellule cancéreuse. McCandlish explique qu’il s’agit de problèmes d’estimation de la densité, un outil statistique qui prédit la fréquence à laquelle un événement se produit. L’estimation de la densité peut être relativement simple, comme tracer différentes hauteurs au sein d’un groupe de personnes. Mais lorsqu’il s’agit de séquences biologiques complexes, telles que les centaines ou les milliers d’acides aminés qui sont enchaînés pour construire une protéine, prédire la probabilité de chaque séquence potentielle devient étonnamment complexe.
McCandlish explique le problème fondamental que son équipe utilise les mathématiques pour résoudre :
« Parfois, si vous faites, disons, une mutation à une séquence protéique, cela ne fait rien. La protéine fonctionne bien. Et si vous faites une deuxième mutation, cela fonctionne toujours bien, mais alors si vous mettez les deux ensemble, maintenant vous avez une protéine cassée. Nous avons essayé de trouver des méthodes pour modéliser non seulement les interactions entre les paires de mutations, mais entre trois ou quatre ou n’importe quel nombre de mutations. «
Les méthodes qu’ils ont développées peuvent être utilisées pour interpréter les données d’expériences qui mesurent l’impact de centaines de milliers de combinaisons différentes de mutations sur la fonction d’une protéine.
Cette étude, rapportée dans les Actes de la National Academy of Sciences, a commencé par des conversations avec deux autres collègues du CSHL : le boursier du CSHL Jason Sheltzer et le professeur agrégé Justin Kinney. Ils ont travaillé avec McCandlish pour appliquer ses méthodes à l’expression des gènes et à l’évolution des mutations cancéreuses. Le logiciel publié par l’équipe de McCandlish permettra à d’autres chercheurs d’utiliser ces mêmes approches dans leur propre travail. Il dit qu’il espère qu’il sera appliqué à une variété de problèmes biologiques.