Shift Bioscience propose un système de classement amélioré pour les modèles de cellules virtuelles pour accélérer la découverte de la cible des gènes

Shift Bioscience (Shift), une entreprise de biotechnologie découvrant la biologie du rajeunissement des cellules pour développer de nouvelles thérapies pour les maladies basées sur l'âge, a annoncé aujourd'hui les résultats d'une nouvelle étude détaillant une approche améliorée du classement des modèles de cellules virtuelles pour la découverte de gènes. La recherche décrit l'introduction de nouvelles métriques et de base pour évaluer les performances du modèle, offrant un cadre amélioré pour le développement de modèles de cellules virtuelles plus puissantes. Le nouveau système de classement permettra également à Shift pour accélérer son pipeline de découverte de cible de rajeunissement.

Les modèles de cellules virtuels formées à l'aide de données sur ARN (SCRNA) monocellulaire offrent une solution puissante pour le dépistage à grande échelle des changements phénotypiques provoqués par diverses perturbations, y compris la régulation à la hausse et à la baisse des gènes. Ils offrent une occasion unique d'élargir les programmes de découverte de cibles en permettant aux chercheurs de comprimer des siècles d'expériences du monde réel en mois d'expériences virtuelles, et donc d'identifier les cibles génétiques les plus prometteuses avant de progresser vers la recherche en laboratoire humide à forte intensité de ressources. Malgré cela, les études comparatives utilisant des mesures de performance communes ont rapporté que les modèles de cellules virtuels les plus importants sont surperformés par la moyenne de l'ensemble de données simple – une prédiction du résultat moyen de toutes les cellules au sein d'un ensemble de données.

La nouvelle étude, qui a été dirigée par le chef de l'apprentissage automatique de Shift, Lucas Paulo de Lima Camillo, a utilisé à la fois les données virtuelles et les données du monde réel pour révéler que des facteurs expérimentaux tels que le biais de contrôle et les perturbations faibles dénaturent les performances réelles du modèle lors de l'utilisation de mesures couramment utilisées. Sur la base de cette analyse, l'équipe a développé une série d'étapes qui peuvent être utilisées pour mieux classer les modèles et stimuler la concentration vers des changements plus significatifs biologiquement. Ces étapes de prétraitement comprennent des métriques de score de gène (DEG) exprimées différentiellement, des étalonnages de base négatifs et positifs et des objectifs d'optimisation de Deg-Aware. L'incorporation de cette nouvelle approche dans la modélisation des perturbations met mieux les modèles avec de mauvaises performances, garantissant que seuls les modèles efficaces sont exploités pour les programmes d'identification cible.

Dans cette recherche, notre équipe a montré qu'en se concentrant sur le développement de nouvelles métriques et de nouvelles lignes de base, nous pouvons plus facilement identifier des modèles qui démontrent une forte prévisibilité. Le document fournit des données fondamentales qui nous permettra de développer des modèles de perturbation plus puissants et utiles biologiquement, accélérant finalement notre pipeline thérapeutique et nous aidant à découvrir de nouvelles cibles pour la thérapeutique de rajeunissement.«

Lucas Paulo de Lima Camillo, chef de l'apprentissage automatique, Shift Bioscience