Dans une étude récente publiée dans Nature, les chercheurs ont développé Sturgeon, un réseau neuronal appris par transfert indépendant du patient, pour permettre la sous-classification moléculaire des tumeurs malignes du système nerveux central (SNC) basée sur des profils de parcimonie.
Étude: Classification ultra-rapide des tumeurs du SNC apprises en profondeur pendant la chirurgie. Crédit d’image : Gorodenkoff/Shutterstock.com
Sommaire
Arrière-plan
Les tumeurs du SNC nécessitent une intervention chirurgicale et doivent être soigneusement réséquées. Les approches actuelles, telles que l’imagerie préopératoire et l’analyse histologique peropératoire, pourraient être incorrectes.
Bien que le séquençage rapide des nanopores puisse aider à obtenir un profil de méthylation clairsemé pendant la chirurgie, la catégorisation reste difficile en raison du nombre limité de données et d’échantillons de référence.
À propos de l’étude
Dans la présente étude, les chercheurs ont conçu le classificateur d’apprentissage automatique Sturgeon pour la catégorisation des tumeurs du SNC pédiatriques et adultes, qui peut être utilisé pour améliorer la prise de décision chirurgicale.
Les chercheurs ont utilisé les données de séquençage des nanopores pour créer un modèle permettant de prédire la résection d’une tumeur du SNC. L’ensemble de données a été divisé en quatre volets pour la formation, la validation et l’étalonnage des sous-modèles, comprenant 2 801 profils de méthylation marqués de référence provenant d’échantillons de tumeurs du SNC et de tissus normaux.
Le réseau neuronal Sturgeon a été formé à l’aide d’une méthode d’apprentissage pédagogique, commençant par des simulations simples et progressant vers des simulations plus difficiles.
Le réseau a été formé à l’aide de simulations allant de 0,6 % à 14 % de parcimonie et affiné avec des simulations avec une parcimonie allant de 0,6 % à 6,3 %. Le classificateur a été affiné pour 3 000 époques à raison de 104 et validé sur 50 lots (dont 12 800 échantillons) pour 2 000 lots d’entraînement en calculant la sensibilité et la perte moyenne.
Les échantillons ont été classés à l’aide de quatre sous-modèles lors de l’inférence, et les scores du sous-modèle avec le niveau de confiance le plus élevé ont été utilisés pour la classification finale. Les chercheurs ont ajusté les plages de parcimonie du séquençage pour garantir une répartition égale des temps de séquençage simulés.
L’équilibre des classes a été révisé après chaque époque en augmentant les durées de suréchantillonnage et/ou de simulation des classes pour lesquelles le modèle d’apprentissage automatique fonctionnait mal. La méthode d’échelle de température a été utilisée pour l’étalonnage du modèle.
Les chercheurs ont généré 500 échantillons simulés à partir de l’ensemble de données de référence dans une plage de rareté comprise entre 0,6 % et 14 %. Pour étudier plus en détail la résilience de Sturgeon, des données de séquençage extra-réalistes des nanopores ont été générées en randomisant l’ordre des lectures séquencées.
Le modèle a été testé à l’aide de 94 profils de méthylation pédiatriques prélevés sur des personnes ayant subi une excision de tumeur du SNC au Centre Princess Máxima d’oncologie pédiatrique pour évaluer sa robustesse aux matériaux impurs.
Résultats
Sturgeon a fourni un diagnostic correct dans 45 des 50 échantillons séquencés rétrospectivement dans les 40 minutes suivant le début du séquençage. Il a été efficace en temps réel pendant 25 procédures, avec un délai de diagnostic inférieur à 90 minutes. Parmi eux, 18 (72 %) avaient raison, tandis que sept n’atteignaient pas le niveau de confiance acceptable.
Les performances de Sturgeon sont directement proportionnelles à la profondeur du séquençage, avec 0,6 % à 4 % des 450 000 régions CpG couvertes au cours des 50 premières minutes de séquençage simulé. L’échelle de température a réduit l’erreur d’étalonnage globale anticipée (ECE) dans l’ensemble de test de 0,025 à 0,002.
L’esturgeon a été identifié correctement (au seuil de 0,8) dans 95 % des cas avec un diagnostic définitif (32 412 sur 34 000 simulations d’échantillons) en 25 minutes de simulations de séquençage.
En utilisant le critère de 0,95, 86 % des échantillons simulés (29 316 sur 34 000) ont été correctement identifiés. Les performances ont quelque peu augmenté après 50 minutes de simulations de séquençage, avec 97 % (n = 33 020) des simulations de modèles atteignant un diagnostic précis avec un niveau de confiance de 0,80 et 91 % avec un score de 0,95.
Sturgeon a été le premier à transférer le processus de formation, de validation et d’étalonnage des modèles, difficilement informatique, en dehors du cadre temporel chirurgical, ce qui a permis d’obtenir des modèles de classification universelles, bien testés et très précis.
Le classificateur peut être utilisé dans des scénarios d’apprentissage fédéré, avec des délais d’exécution de 1,5 heure pour la plupart des échantillons, conformément au calendrier chirurgical. L’esturgeon n’a pu fonctionner avec succès que dans des échantillons avec une représentation suffisamment grande dans les données d’entraînement.
Une plus grande proportion de lectures de contrôle mélangées dégrade les performances en augmentant le nombre de situations dans lesquelles le classificateur ne parvient pas à obtenir une classification fiable.
Conclusions
Sur la base des résultats de l’étude, un diagnostic appris par machine basé sur un séquençage peropératoire à faible coût pourrait aider les neurochirurgiens à prendre des décisions, réduisant peut-être la comorbidité neurologique et évitant de futures procédures.
Sturgeon, un système d’apprentissage profond formé sur des données de séquençage simulées de nanopores, pourrait détecter efficacement les types de tumeurs dans la plupart des cas pédiatriques dans les 25 à 50 minutes suivant les simulations de séquençage. Avec seulement 45 minutes de séquençage, il a correctement catégorisé 72 % des cancers (18 sur 25) au niveau des sous-classes.
Le séquençage ultra-rapide de la méthylation présente un énorme potentiel dans d’autres domaines, tels que les diagnostics postopératoires réguliers, la réduction des délais d’exécution et la possibilité d’une utilisation dans les institutions périphériques et à faible revenu. Cependant, la quantité de tissu nécessaire peut constituer une contrainte.
L’esturgeon pourrait être utilisé avec une évaluation histologique par un pathologiste compétent, combinant les résultats histologiques et moléculaires pour un diagnostic peropératoire plus précis. Le modèle pourrait être utile pour guider la prise de décision dans des circonstances difficiles lorsque le diagnostic histologique est incertain.