Une méthode d'apprentissage en profondeur crée un atlas de référence complet des lymphocytes T CD8+, intégrant les données de séquençage de l'ARN unicellulaire et la diversité des récepteurs des lymphocytes T pour améliorer la compréhension des réponses immunitaires dans toutes les maladies.
Dans une étude récente publiée dans Méthodes naturellesles chercheurs ont développé « scAtlasVAE« , un modèle d'apprentissage en profondeur pour intégrer des données de séquençage à grande échelle de l'acide ribonucléique (ARN) unicellulaire (scRNA-seq), créant ainsi un atlas complet des lymphocytes T CD8+ avec des informations sur les récepteurs de lymphocytes T (TCR) appariés.
Ils ont trouvé des associations entre les sous-types de lymphocytes T CD8+, caractérisé trois sous-types de lymphocytes T épuisés distincts et révélé divers modèles clonaux et transcriptomiques dans l’inflammation auto-immune et d’origine immunitaire.
Sommaire
Arrière-plan
Des recherches émergentes mettent en évidence l’implication des lymphocytes T CD8+ dans les maladies auto-immunes, contribuant à la fois à la progression de la maladie et aux mécanismes de protection. Les progrès dans le profilage immunitaire unicellulaire permettent désormais l’analyse simultanée des transcriptomes des lymphocytes T CD8+ et des répertoires TCR, révélant l’hétérogénéité cellulaire, la dynamique clonale et les transitions fonctionnelles. Cependant, notre compréhension des sous-types de lymphocytes T CD8+ et de leurs paysages clonaux dans diverses conditions reste floue.
Les méthodes basées sur l'auto-encodeur variationnel (VAE) excellent dans l'intégration de grands ensembles de données, mais ont du mal avec les comparaisons entre atlas et la formation semi-supervisée sur divers critères d'annotation. Dans la présente étude, les chercheurs ont développé un modèle d’apprentissage en profondeur basé sur VAE pour intégrer et aligner des ensembles de données scRNA-seq dans toutes les études, permettant ainsi le transfert d’annotations de sous-types cellulaires.
À propos de l'étude
Un atlas des lymphocytes T CD8+ a été créé à partir des données de 68 études, de 961 échantillons de profilage immunitaire unicellulaire et de plus de 1,1 million de cellules dans 42 conditions. Les données ont été traitées et contrôlées en qualité, en filtrant les cellules dont l’expression génique ou les informations TCR étaient insuffisantes.
Pour intégrer et analyser cet ensemble de données, scAtlasVAE, un framework d'apprentissage en profondeur, a été développé. Il utilise un codeur inconditionnel par lots et un décodeur conditionnel par lots pour corriger les effets de lots et reconstruire les données d'expression génique à l'aide d'une distribution binomiale négative gonflée à zéro. scAtlasVAE prend en charge les modes non supervisé et supervisé, permettant des tâches telles que l'intégration d'atlas, l'annotation de sous-types de cellules et l'apprentissage par transfert.
scAtlasVAE a été comparé aux méthodes existantes. Une analyse de clonotype a été réalisée pour identifier des sous-types de lymphocytes T distincts avec des répertoires TCR uniques, ainsi que des clonotypes partagés dans différentes conditions. Le modèle a en outre été validé pour sa capacité à prédire les sous-types de lymphocytes T CD8+ dans des ensembles de données de requête.
En outre, l’étude a utilisé divers outils bioinformatiques pour l’analyse de l’expression génique et l’inférence des réseaux de régulation afin d’explorer les rôles fonctionnels des cellules T CD8+ dans différentes maladies.
Résultats et discussion
scAtlasVAE a démontré des performances supérieures dans plusieurs tâches d'analyse comparative, notamment l'intégration d'un seul atlas, l'intégration entre atlas et le transfert d'annotations de sous-types de cellules. En comparaison avec les méthodes existantes telles que scVI, scANVI, scPoli, SCALEX, Scanorama, Harmony et Seurat, scAtlasVAE a montré une correction améliorée de l'effet de lot et une préservation de la variance biologique.
L'analyse comparative de deux atlas établis, TCellLandscape et TCellMap, a confirmé son efficacité dans les modes d'apprentissage par transfert zéro et complet. Contrairement à d’autres méthodes, scAtlasVAE intègre des prédicteurs indépendants pour des sous-types de cellules distincts, permettant un meilleur alignement des annotations sur les ensembles de données.
En utilisant ce cadre, les lymphocytes T CD8+ ont été regroupés en 18 sous-types regroupés en huit catégories principales, notamment les lymphocytes T naïfs, les lymphocytes T mémoire centraux/effecteurs, les lymphocytes T effecteurs récemment activés, les lymphocytes T invariants associés à la muqueuse (MAIT), les lymphocytes T de type inné. cellules à haut potentiel cytotoxique (ILTCK), cellules T mémoire résidant dans les tissus, cellules T épuisées (Tex) et cellules en prolifération. L'intégration inter-atlas a validé ces sous-types et révélé de nouvelles populations telles que les cellules de type ILTCK (ILTCK-LC). L'analyse TCR appariée a montré une diversité réduite et une expansion clonale accrue dans les états pathologiques et les tumeurs. Parmi les cellules T épuisées, trois sous-types (GZMK+, ITGAE+, XBP1+) présentaient des profils transcriptomiques distincts et un enrichissement spécifique à la tumeur, reflétant divers rôles dans l'immunité contre le cancer.
Le partage de clonotypes a révélé que les cellules GZMK+ Tex partageaient des clonotypes avec des sous-types résidant dans les tissus et en circulation, tandis que les cellules ITGAE+ et XBP1+ Tex avaient des modèles de partage plus restreints. L'analyse à haute résolution a identifié les sous-types de Tex, notamment les cellules ISG+, DUSP1+, TCF7+ et TNFRSF9+. Dans l’inflammation induite par l’IPC (irAE), les cellules ITGAE+ Tex étaient prédominantes, montrant des différences par rapport à l’inflammation auto-immune. Les cellules ITGAE+ Tex présentaient des voies cytotoxiques améliorées.
Le modèle scAtlasVAE a annoté avec succès des ensembles de données externes, confirmant les alignements des sous-types Tex dans les atlas et mettant en évidence les similitudes entre l'inflammation irAE et les TIL du cancer. Le partage de clonotypes entre les cellules ILTCK-LC et MAIT suggère une diversité fonctionnelle.
Les limites de l'étude incluent le recours à des annotations définies par l'utilisateur pour des sous-types rares, une application restreinte aux cellules T CD8+ et la nécessité d'une validation expérimentale des sous-types nouvellement définis.
Conclusion
En conclusion, l’atlas intégré au TCR et le scAtlasVAE développés dans cette étude offrent une ressource précieuse pour étudier l’hétérogénéité et la dynamique des lymphocytes T CD8+. Ils permettent l’intégration d’ensembles de données croisés et améliorent la compréhension de divers systèmes biologiques.