Publié aujourd'hui dans le journal GigaScience est un nouvel outil open source basé sur le cloud appelé IDseq qui permet de détecter, d'identifier et de suivre rapidement les agents pathogènes émergents tels que le SARS-CoV-2.
Cet outil peut identifier les agents pathogènes avant qu'il n'y ait une séquence génomique complète disponible; ainsi, il peut être utilisé pour les flambées de maladies infectieuses actuelles et aussi pour les épidémies émergentes. Cela aidera considérablement à prévenir de futures pandémies.
La pandémie de coronavirus démontre l'importance de la surveillance mondiale des maladies infectieuses. Trouver la cause d'une épidémie de maladie infectieuse est difficile, surtout si elle provient d'un agent pathogène jusque-là inconnu.
IDseq, une plate-forme d'analyse métagénomique open source basée sur le cloud, identifie les agents pathogènes nouveaux et existants à l'origine de maladies à partir d'un échantillon donné – qu'il s'agisse d'un humain, d'un animal ou d'un parasite – pour fournir un rapport exploitable de ce qui se passe sur le sol dans les laboratoires et cliniques partout dans le monde.
« IDseq peut être considéré comme un radar d'alerte précoce pour les agents infectieux émergents ou nouveaux », a déclaré Joe DeRisi, PhD, co-président du Chan Zuckerberg Biohub, qui a contribué à l'identification du coronavirus du SRAS en 2003 et dont le laboratoire de recherche à l'Université de Californie à San Francisco a lancé l'outil IDseq. Il est conçu pour permettre à la communauté mondiale de la santé de tirer parti du coût toujours décroissant du séquençage pour suivre et identifier les maladies infectieuses dans pratiquement n'importe quel échantillon. «Au début de la pandémie de coronavirus, des chercheurs cambodgiens ont utilisé IDseq pour aider à confirmer et à séquencer l'ensemble du génome du premier cas de COVID-19 du pays en quelques jours, et en Californie, nous fournissons le SRAS-CoV- critique. 2 données génomiques aux responsables de la santé publique pour éclairer la recherche des contacts et les stratégies d'intervention. «
Dans une étude publiée dans GigaScience, les scientifiques utilisent diverses approches pour démontrer que l'outil IDseq est effectivement capable d'identifier de manière fiable les agents pathogènes émergents, parmi lesquels, comme preuve de principe, un prélèvement nasal d'un patient COVID-19 au Cambodge. Un partenariat entre le Chan Zuckerberg Biohub, l'Initiative Chan Zuckerberg (CZI) et la Fondation Bill et Melinda Gates a permis à ces chercheurs de séquencer et de confirmer le premier cas de COVID-19 du pays en quelques jours – pas les semaines où il pourrait prennent généralement. Les résultats démontrent qu'IDseq peut détecter la présence d'un pathogène émergent avant l'existence d'un génome de référence complet. IDseq contient également un nouveau flux de travail pour la construction de génomes consensus SARS-CoV-2.
«Le séquençage métagénomique (mNGS) est un outil incroyablement utile pour la détection des agents pathogènes en raison de sa nature hautement sensible et sans hypothèse», a déclaré Katrina Kalantar, biologiste informatique chez CZI. «Nous avons vu des laboratoires qui utilisent IDseq pour les études mNGS existantes se concentrer rapidement sur un séquençage plus ciblé du SRAS-CoV-2, ce qui a aidé les chercheurs à mieux comprendre les modèles de transmission des coronavirus.
Au Cambodge, les chercheurs ont téléchargé la séquence du génome dans le référentiel de données open source sur les pathogènes GISAID (Global Initiative on Sharing All Influenza Data) et sur Nextstrain, afin que les scientifiques puissent voir la séquence complète du génome du coronavirus SARS-CoV-2 et l'étudier dans le contexte plus large des séquences de coronavirus SARS-CoV-2 téléchargées dans le monde. Des chercheurs du Centre national cambodgien de parasitologie, d'entomologie et de lutte contre le paludisme (CNM) et de l'Institut national des allergies et des maladies infectieuses (NIAID) se sont associés à l'Institut Pasteur du Cambodge pour mener à bien cette recherche. Ces chercheurs font partie des nombreuses équipes à travers le monde qui reçoivent une formation en biologie moléculaire et en bioinformatique de l'équipe des maladies infectieuses du Biohub; accès gratuit, formation et calcul sur la plateforme IDseq de CZI; et l'équipement et les fournitures nécessaires pour commencer à travailler dans leur propre pays grâce aux subventions d'exploration des grands défis.
Contrairement aux tests spécifiques à un agent connu, comme le test PCR SARS-CoV-2, le mNGS est une méthode universelle qui peut détecter de nouveaux agents pathogènes pathogènes, ce qui peut être particulièrement utile dans les cas où les chercheurs ne savent pas ce qui en est la cause. une infection ou quels agents pathogènes circulent dans une zone particulière. Une expérience mNGS commence par des traces d'ADN amplifiant en masse des agents pathogènes à partir d'un échantillon d'un patient, ce qui donne des millions de petits morceaux de séquences d'ADN, ou lectures. Cet énorme ensemble de données doit ensuite être analysé et interprété à l'aide de techniques bioinformatiques. L'objectif est d'attribuer des fragments d'ADN individuels de l'échantillon clinique à des pathogènes spécifiques en tirant parti des connaissances des bases de données de séquences.
L'analyse de la quantité massive de données d'une expérience mNGS typique nécessite souvent une batterie d'outils bioinformatiques spécialisés, y compris une expertise hautement spécialisée et des logiciels coûteux sous licence commerciale – faisant du mNGS une méthode difficile d'accès. Le nouveau logiciel convivial IDseq est open source et disponible gratuitement pour la communauté mondiale de la santé, réduisant ainsi la barrière d'accès à la métagénomique. Les chercheurs peuvent réutiliser et s'appuyer sur le code, qui fonctionne via un service basé sur le cloud et une application Web conçue pour la collaboration et le partage de données. Le pipeline commence avec des données de séquençage brutes comme entrée, puis passe par les étapes de filtrage, de contrôle qualité, d'alignement, de reporting et de visualisation