Des chercheurs de l’Université de Kyushu ont développé une méthode informatique innovante, appelée ddHodge, capable de reconstruire la dynamique complexe de la façon dont les cellules décident de leur destin. Comme indiqué dans Communications naturellescette approche ouvre la voie à une compréhension plus approfondie des processus biologiques impliqués dans le développement, la régénération et la maladie.
Comprendre comment une cellule en développement choisit son destin, comme se différencier en cellule nerveuse ou en cellule musculaire, est un défi central en biologie et en médecine. Pour étudier ces mécanismes, les scientifiques s'appuient souvent sur le séquençage de l'ARN unicellulaire (scRNA-seq), une technologie qui révèle quels gènes sont actifs dans les cellules individuelles. Bien que puissant, le scRNA-seq est destructeur, ce qui signifie qu’il ne peut fournir que des instantanés ponctuels des cellules, mais pas l’évolution de leurs états au fil du temps.
Des méthodes informatiques telles que la vitesse de l’ARN ont commencé à s’attaquer à cette limitation en déduisant à la fois la direction future immédiate d’une cellule et la « vitesse » à laquelle elle avance vers elle. Cependant, l’état d’une cellule est défini par d’innombrables gènes, ce qui la place dans un espace complexe de grande dimension. Comme les techniques actuelles ne peuvent pas représenter avec précision cet espace complet, elles le compressent en beaucoup moins de dimensions, perdant inévitablement des informations importantes sur la géométrie des données. En conséquence, il est impossible d’évaluer de manière cohérente la stabilité d’un état cellulaire, c’est-à-dire qu’on ne peut pas distinguer une cellule hautement plastique et instable à un point de ramification d’une cellule profondément engagée et stable.
Dans ce contexte, le professeur agrégé Kazumitsu Maehara de la Faculté des sciences médicales de l'Université de Kyushu et le professeur Yasuyuki Ohkawa de l'Institut médical de biorégulation de l'Université de Kyushu ont développé ddHodge, une méthode de préservation de la géométrie qui peut reconstruire avec plus de précision la dynamique de l'état cellulaire.
J'ai une formation en science statistique et, au cours de mes études supérieures, j'ai été exposé au HodgeRank, une méthode utilisée dans les problèmes de classement tels que le PageRank. Lorsque je me suis ensuite lancé dans la recherche en sciences de la vie, j'ai réalisé que la même idée mathématique pouvait aider à interpréter les transitions complexes et de grande dimension dans les données unicellulaires. »
Kazumitsu Maehara, professeur agrégé, Faculté des sciences médicales de l'Université de Kyushu
Leur technique est basée sur la décomposition de Hodge, un théorème mathématique puissant, qu'ils ont utilisé pour décomposer le mouvement des cellules dans un paysage d'états possibles en trois composants fondamentaux et mesurables. Le premier est le gradient, qui correspond au flux directionnel global à travers le paysage. Le résidu contient la boucle et les composantes harmoniques, qui rendent compte des flux cycliques ou rotationnels et peuvent ainsi révéler des processus répétitifs comme le cycle cellulaire.
« ddHodge peut être considéré comme un effort visant à adapter les techniques et les concepts développés dans les sciences mathématiques modernes, tels que la géométrie différentielle et le calcul numérique, aux exigences pratiques de l'analyse des données des sciences de la vie », explique Maehara. Le cadre proposé utilise des principes géométriques pour approximer la façon dont les états cellulaires « se déplacent » sur une structure de dimension inférieure tout en préservant les informations de forme intégrées dans les données de grande dimension, qui sont normalement perdues dans les méthodes standard reposant sur la réduction de dimensionnalité.
En appliquant ddHodge aux données scRNA-seq provenant d'environ 46 000 cellules embryonnaires de souris, les chercheurs ont découvert que plus de 88 % de la dynamique de l'expression génique au cours du développement embryonnaire précoce pouvait être expliquée par la composante gradient. Cela a confirmé, avec des données réelles, le concept de longue date en biologie du développement selon lequel les cellules se différencient en se déplaçant vers des états stables et en s'éloignant des « points de ramification ». De plus, en se concentrant sur ces points instables, les chercheurs ont pu identifier les gènes clés qui pilotent ou maintiennent la stabilité de l’état cellulaire à mesure que les cellules s’engagent dans une lignée.
Les chercheurs ont également évalué les performances de ddHodge à l'aide de simulations de données, révélant que même en présence de données partielles ou bruyantes, ddHodge était capable de reconstruire de manière fiable la dynamique de l'état cellulaire, avec une précision environ 100 fois supérieure à celle des autres approches conventionnelles.
Dans l’ensemble, ddHodge fournit un moyen fiable d’identifier les moments biologiques critiques, tels que le moment et l’emplacement exacts des décisions concernant le sort des cellules. « ddHodge peut décrire quantitativement, dans un espace de grande dimension, dans quelle direction, à quelle vitesse et avec quelle stabilité les cellules changent. Nous espérons qu'il contribuera largement à la compréhension de divers phénomènes biologiques, notamment le développement embryonnaire, la régénération tissulaire et la progression du cancer », ajoute Maehara. Cet outil pourrait prendre en charge la détection précoce d’états cellulaires pertinents pour les états pathologiques ou la régénération, ainsi qu’aider les scientifiques à analyser des ensembles de données à grande échelle utilisés dans les pipelines de découvertes pharmaceutiques et biotechnologiques.
Notamment, ddHodge a de nombreuses applications potentielles au-delà de la biologie et de la médecine. Les chercheurs pensent que cela pourrait être utilisé pour mieux comprendre d’autres processus complexes qui évoluent au fil du temps, notamment la dégradation des matériaux, les modèles climatiques et le comportement socio-économique. Ainsi, ddHodge illustre comment les concepts mathématiques modernes peuvent être utilisés pour mieux comprendre des processus et des systèmes qui autrement seraient obscurcis dans des ensembles de données géants de grande dimension.





















