Grâce aux technologies de séquençage à haut débit, les méthodes métagénomiques shotgun ont été rendues possibles et ont effectivement transformé la microbiologie. Aujourd’hui, les progrès des technologies à lecture courte et longue surmontent bon nombre des défis précédents affectant le profilage métagénomique, en particulier des échantillons et de l’environnement très complexes.
Des chercheurs de l’Institut national de recherche pour l’agriculture, l’alimentation et l’environnement (INRAE) de France ont examiné les performances de sept plateformes de séquençage à lecture courte et longue dans l’analyse d’échantillons métagénomiques de haute complexité. L’étude, publiée dans la revue Nature Portfolio Données scientifiquesa exécuté des échantillons fictifs entre 2018 et 2019 sur divers séquenceurs grand public à l’époque, y compris les DNBSEQ-T7* et DNBSEQ-G400* de MGI.
Au sein de cette large gamme de technologies de séquençage testées, DNBSEQ-T7* a été reconnu pour son débit ultra-élevé et son excellente précision. « Nous avons été surpris par les performances du T7 », a déclaré l’auteur principal Mathieu Almeida, chargé de recherche à l’INRAE. « Il fournit un séquençage ultra-profond en une seule passe avec un faible taux d’erreur similaire par rapport aux autres plates-formes, ce qui en fait, au moment de notre étude, l’une des technologies les plus abordables pour le séquençage métagénomique. »
Dans l’étude, trois communautés microbiennes synthétiques inégales ont été construites, comprenant jusqu’à 87 ADN de souches microbiennes génomiques chacune et couvrant 29 phylums bactériens et archéens. Ils représentaient certaines des communautés les plus complexes et les plus diverses utilisées pour les comparaisons de technologies de séquençage. Le mock1 (71 souches) a été séquencé en utilisant toutes les plateformes, mock2 (64 souches) a été séquencé en plus pour estimer l’impact de diverses richesses microbiennes, tandis que les plateformes de MGI n’ont pas été réalisées sur mock3.
Pour évaluer l’impact de la profondeur de séquençage, l’équipe a effectué une analyse de sous-échantillonnage et comparé les abondances de génome observées et théoriques dans des échantillons à plusieurs profondeurs de 10 000 à 1 million de lectures. Dans l’ensemble, les corrélations de classement de Spearman pour toutes les plates-formes étaient élevées, supérieures à 0,9 lors de la cartographie d’au moins 100 000 lectures. Parmi eux, les corrélations de T7* et G400* sont les meilleures en mock1 et restent excellentes en mock2.
De plus, une analyse différentielle entre les abondances d’espèces observées et exceptées a été effectuée dans mock1. Les résultats ont montré que l’estimation de la surabondance ou de la sous-abondance pour la plupart des génomes avait peu à voir avec la plate-forme de séquençage, la longueur de lecture, la taxonomie, le contenu en GC, la taille du génome et l’exhaustivité du génome, même à une faible profondeur de 500 000 lectures. En fait, la plupart des génomes ont été estimés avec précision sur tous les séquenceurs, les abondances normalisées observées générées par T7 * étant très proches des valeurs exceptées.
Sur la base d’analyses de performances des différents séquenceurs, l’étude a formé une base de données d’analyse comparative de séquençage métagénomique microbien, fournissant aux chercheurs et aux scientifiques une référence complète et authentique pour la sélection de plateformes de séquençage. En particulier, les résultats ont démontré la valeur prometteuse du DNBSEQ-T7* de MGI dans le séquençage métagénomique.
Bénéficiant d’une stabilité et d’une précision élevées, comme le montrent les données, combinées à un débit exceptionnel, T7* constitue une plate-forme solide pour l’identification d’espèces et de gènes fonctionnels dans des communautés microbiennes très complexes. Ses systèmes biochimiques, fluidiques et optiques améliorés rendent non seulement le séquençage plus efficace et plus productif, mais continuent également de soutenir la recherche sur la structure et la diversité des communautés microbiennes.