Deux techniques de séquençage de pointe ne sont plus en désaccord, grâce à un effort international dirigé par des scientifiques de l’Université de Californie à San Diego. Dans une étude publiée le 27 juillet 2023 dans Biotechnologie naturelleles chercheurs ont lancé une nouvelle base de données de référence appelée Greengenes2, qui permet de comparer et de combiner les données sur le microbiome dérivées de l’amplicon du gène de l’ARN ribosomal 16S (16S) ou des techniques de séquençage métagénomique shotgun.
« C’est un moment important dans la recherche sur le microbiome, car nous avons effectivement sauvé plus d’une décennie de données 16S qui auraient autrement pu devenir obsolètes dans le monde moderne du séquençage des fusils de chasse », a déclaré l’auteur principal Rob Knight, PhD, professeur dans les départements. de pédiatrie à la faculté de médecine de l’UC San Diego et de bioingénierie et d’informatique à la faculté d’ingénierie de l’UC San Diego Jacobs. « La normalisation des résultats entre ces deux méthodes améliorera considérablement nos chances de découvrir des biomarqueurs de microbiome pour la santé et la maladie. »
Les études sur le microbiome dépendent de la capacité des scientifiques à identifier les micro-organismes présents dans un échantillon. Pour ce faire, ils séquencent les informations génétiques de l’échantillon et les comparent à des bases de données de référence qui répertorient quelles séquences appartiennent à quels organismes. Le 16S et le séquençage shotgun sont les deux techniques les plus largement utilisées dans la recherche sur le microbiome, mais elles donnent souvent des résultats différents.
« De nombreux chercheurs ont supposé que les données du 16S et du séquençage des fusils de chasse étaient tout simplement trop différentes pour être intégrées », a déclaré le premier auteur de l’étude, Daniel McDonald, PhD, directeur scientifique de The Microsetta Initiative à l’UC San Diego School of Medicine. « Ici, nous montrons que ce n’est pas le cas et fournissons une base de données de référence que les chercheurs peuvent désormais utiliser pour faire exactement cela. »
La base de données originale Greengenes était largement utilisée dans le domaine du microbiome depuis plus d’une décennie. C’était la base de données de référence utilisée par des projets notables, notamment le National Institutes of Health Human Microbiome Project, l’American Gut Project, le Earth Microbiome Project et bien d’autres.
Cependant, l’une de ses limites fondamentales était qu’il s’appuyait sur la séquence d’un seul gène, 16S, pour identifier les organismes dans un échantillon. Ce gène bien étudié a longtemps été utilisé comme marqueur taxonomique, chaque organisme ayant son propre « code-barres » 16S. Cette méthode peut décrire le contenu d’un échantillon de microbiome avec une résolution au niveau du genre, mais elle ne peut pas toujours identifier des espèces ou des souches spécifiques de microbes, ce qui est important pour le travail clinique.
Les études modernes sur le microbiome sont depuis passées à l’utilisation du séquençage shotgun, qui examine l’ADN de tous les génomes des organismes, plutôt que de se concentrer sur un seul gène. Cette approche puissante donne aux chercheurs une plus grande spécificité au niveau de l’espèce et donne également un aperçu de la fonction des microbes.
Les scientifiques ont souvent attribué les écarts entre les deux techniques à des différences dans la façon dont les échantillons sont préparés en laboratoire. Cependant, la nouvelle étude démontre que les incompatibilités entre les deux techniques proviennent de différences de calcul, où une meilleure base de données de référence permet de tirer les mêmes conclusions des deux méthodes. Cela résout un problème important dans la reproductibilité de la recherche sur le microbiome et permet la réutilisation des données de millions d’échantillons dans des études plus anciennes.
En essayant de résoudre ces incompatibilités, les chercheurs ont d’abord élargi la base de données du génome entier Web of Life. Ils ont ensuite utilisé plusieurs nouveaux outils informatiques développés avec le co-auteur Siavash Mirarab, PhD, professeur agrégé à l’UC San Diego Jacobs School of Engineering, pour intégrer des séquences 16S complètes de haute qualité existantes dans la phylogénie du génome entier. Avec un autre outil d’apprentissage automatique développé par le groupe de Mirarab, ils ont placé des fragments 16S de plus de 300 000 échantillons de microbiome. Le résultat a été une vaste base de données de référence sur laquelle les données de séquençage du 16S et des fusils de chasse ont pu être cartographiées.
Pour confirmer si Greengenes2 aiderait à normaliser les résultats de l’une ou l’autre des techniques de séquençage, les chercheurs ont acquis à la fois des données de séquençage 16S et shotgun à partir des mêmes échantillons de microbiome humain et les ont analysés dans le contexte de la phylogénie Greengenes2. Les résultats des deux techniques ont montré des évaluations de la diversité, des profils taxonomiques et des tailles d’effet hautement corrélés ; quelque chose que les chercheurs n’avaient pas vu auparavant.
« Grâce à Greengenes2, un énorme référentiel de données 16S peut désormais être ramené dans le giron et même combiné avec des données de fusil de chasse modernes dans de nouvelles méta-analyses », a déclaré McDonald. « Il s’agit d’une avancée majeure dans l’amélioration de la reproductibilité des études sur le microbiome et le renforcement de la capacité des médecins à tirer des conclusions cliniques à partir des données sur le microbiome. »
Les co-auteurs incluent : Yueyu Jiang, Metin Balaban, Kalen Cantrell, Antonio Gonzalez, Giorgia Nicolaou, Se Jin Song et Andrew Bartko, tous à l’UC San Diego, ainsi que Qiyun Zhu à l’Arizona State University, James T. Morton au National Institutes of Health, Donovan H. Parks et Philip Hugenholtz de l’Université du Queensland, Søren Karst de l’Université de Columbia, Mads Albertsen de l’Université d’Aalborg, Todd DeSantis de Second Genome, Aki S. Havulinna, Pekka Jousilahti, Teemu Niiranen et Veikko Salomaa de Institut finlandais pour la santé et le bien-être, Susan Cheng du Brigham and Women’s Hospital et du Cedars-Sinai Medical Center, Mike Inouye de l’Université de Cambridge et du Baker Heart and Diabetes Institute, Mohit Jain de Sapient Bioanalytics et Leo Lahti de l’Université de Turku.