Dans une étude récente publiée dans Microbiologie naturelleles chercheurs ont utilisé le séquençage du fusil de chasse pour extraire les lectures humaines de l’acide désoxyribonucléique (ADN) dans les échantillons fécaux de 343 individus japonais comprenant le principal ensemble de données de cette étude.
Ils ont utilisé ces données de métagénome intestinal pour reconstruire des informations personnelles. Certains participants à l’étude ont également fourni des données de séquençage du génome entier (WGS) pour une analyse de séquençage ultra-profonde du métagénome.
Étude: Reconstruction des informations personnelles à partir des lectures du génome humain dans les données de séquençage du métagénome intestinal. Crédit d’image : KaterynaKon/Shutterstock.com
Arrière-plan
Les connaissances concernant le microbiome humain, les micro-organismes habitant le corps humain, se sont considérablement développées au cours des dix dernières années, grâce aux avancées rapides de technologies telles que le séquençage métagénome par fusil de chasse.
Cette technologie permet le séquençage du composant non bactérien des échantillons de microbiome, y compris l’ADN de l’hôte. Par exemple, dans les échantillons fécaux, la quantité d’ADN de l’hôte est inférieure à 10 % mais est retirée pour protéger la vie privée des donneurs.
Le génotype germinal humain dans les données de métagénome est important pour permettre la ré-identification des individus. Cependant, les chercheurs et les donateurs doivent reconnaître qu’il est hautement confidentiel, donc le partager avec la communauté nécessite un examen attentif.
Outre les préoccupations éthiques liées au partage de ces données, il est nécessaire de comprendre que si les lectures humaines dans les données du métagénome ne sont pas supprimées avant le dépôt, quel type d’informations personnelles (par exemple, le sexe et l’ascendance) ces données pourraient-elles aider à récupérer ?
En outre, les lectures humaines dans les données du métagénome intestinal pourraient être une bonne ressource pour la criminalistique basée sur les selles, l’appel de variantes robuste et les estimations des risques de maladie basées sur les scores de risque polygéniques (par exemple, le diabète de type 2).
Étant donné que ces données pourraient aider à reconstruire quantitativement et précisément les informations sur le génotype, elles pourraient compléter les données WGS humaines.
À propos de l’étude
Dans la présente étude, les chercheurs ont appliqué quelques lectures humaines dans les données du métagénome intestinal de l’ensemble de données principal de l’étude pour reconstruire des informations personnelles, y compris le sexe génétique et l’ascendance. Pour prédire le sexe génétique et les ancêtres de ces 343 individus, ils ont utilisé respectivement la profondeur de séquençage des chromosomes sexuels et la méthode basée sur le score de vraisemblance modifiée.
De plus, les chercheurs ont développé des méthodes pour ré-identifier une personne à partir d’un ensemble de données de génotype. En outre, ils ont combiné deux approches harmonisées d’appel de génotype, l’appel direct de variants rares et l’imputation en deux étapes de variants communs, pour reconstruire les génotypes.
L’ensemble de données principal de l’étude comprenait 343 participants japonais, tandis que l’ensemble de données de validation pour l’analyse de prédiction génétique du sexe comprenait 113 individus japonais.
L’ensemble de données multi-ascendance, qui a aidé les chercheurs à valider l’analyse de prédiction de l’ascendance, comprenait 73 individus de différentes nationalités, y compris des échantillons d’individus à New Delhi, en Inde.
Les participants féminins et masculins dans chaque ensemble de données étaient respectivement 196 et 147, 65 et 48 et 25 et 48. De même, la tranche d’âge pour ces trois ensembles de données était de 20 à 88 ans, de 20 à 81 ans et de 20 à 61 ans, respectivement.
Résultats et conclusion
Étant donné que les lectures humaines dans les données du métagénome intestinal étaient dérivées de manière cohérente de tous les chromosomes, la profondeur de lecture du chromosome X était presque le double chez les femmes et celle du chromosome Y chez les hommes.
Ainsi, dans une analyse de régression logistique, lorsque les chercheurs ont appliqué un rapport de profondeur de lecture du chromosome Y: X de 0,43 à l’ensemble de données de validation, ce qui a correctement prédit le sexe génétique de 97,3 % des échantillons de l’étude.
Dans le microbiome humain et la recherche génétique, la faisabilité de la prédiction du sexe à l’aide des données du métagénome de l’intestin humain pourrait aider à éliminer les échantillons mal étiquetés.
L’analyse de l’étude a également aidé les chercheurs à prédire remarquablement l’ascendance de 98,3% des individus en utilisant les données du projet 1000 Genomes (1KG) comme référence.
Cependant, la méthode basée sur le score de vraisemblance a souvent classé à tort les échantillons sud-asiatiques (SAS) en américains (AMR) et européens (EUR), en particulier lorsque le nombre de lectures humaines était faible. C’est compréhensible car la diversité génétique de la population SAS est complexe.
La méthode basée sur le score de vraisemblance a également utilisé efficacement les données des zones génomiques à faible couverture démontrant la puissance quantitative des données du métagénome intestinal pour réidentifier les individus et a réussi à réidentifier 93,3 % des individus.
Malgré les préoccupations éthiques, la méthode de ré-identification utilisée dans cette étude pourrait aider au contrôle de la qualité des ensembles de données multi-omiques comprenant des données sur le métagénome intestinal et le génotype germinal humain.
En outre, les auteurs ont réussi à reconstruire des variantes communes à l’échelle du génome à l’aide d’approches génomiques. Historiquement, les chercheurs ont utilisé des échantillons de selles comme source de génomes germinaux pour les animaux sauvages et domestiques, mais pas pour les humains.
Ainsi, la poursuite du développement de méthodologies appropriées pourrait aider à utiliser efficacement le génome humain dans les données sur le métagénome intestinal et bénéficier à la recherche animale.
Néanmoins, l’étude a remarquablement démontré que des méthodes optimisées pourraient aider à reconstruire des informations personnelles à partir des lectures humaines dans les données du métagénome intestinal.
De plus, les résultats de cette étude pourraient servir de ressource directrice pour concevoir les meilleures pratiques d’utilisation des données déjà accumulées sur le métagénome intestinal de l’homme.