La médecine de précision nécessite des mégadonnées. Afin d’améliorer le traitement des personnes atteintes de cancer ou de comprendre les maladies rares, les scientifiques et les cliniciens, ainsi que les technologies de l’IA ont besoin d’accéder à de plus grands ensembles de données de recherche en santé qui couvrent diverses populations et un large éventail de conditions. Pour l’IA, plus de données signifie une meilleure compréhension des maladies, ce qui conduira à un diagnostic et un traitement plus précis. En même temps, chaque hôpital ne verra qu’un nombre relativement restreint de personnes atteintes d’une maladie, et même à travers la province, nous n’avons accès qu’à une petite partie des données totales disponibles dans le monde. Pour créer les ensembles de données à grande échelle nécessaires pour faire avancer la médecine de précision, le partage des données à travers le pays et dans le monde est essentiel.
L’Infrastructure canadienne distribuée pour la génomique (CanDIG), présentée récemment dans un numéro spécial de Génomique cellulaire dédié au partage de données, est la solution du Canada pour permettre le partage de données à travers le pays (et connecter nos données à des ensembles de données à travers le monde). Dirigé à partir du Réseau universitaire de santé de Toronto avec des sites à l’Université McGill de Montréal et au BC Genome Science Center, CanDIG est une collaboration d’informaticiens, de spécialistes de l’IA, de cliniciens et de généticiens qui travaillent ensemble pour permettre les études nécessaires pour relever les défis de santé auxquels sont confrontés les Canadiens.
CanDIG est un projet pilote de l’Alliance mondiale pour la génomique et la santé (GA4GH), un effort international établissant des normes pour la génomique et les données de santé visant à améliorer l’interopérabilité dans le paysage génomique dans le monde entier. L’organisation a servi de point de mire pour le numéro spécial de ce mois-ci de Génomique cellulaire pour leurs travaux sur la génomique mondiale et les efforts de partage de données sur la santé. Le Canada a été un chef de file dans le GA4GH, hébergeant son siège social, dirigeant plusieurs flux de travail de projet et mettant en œuvre de nombreuses normes GA4GH. CanDIG, en tant que l’un des projets pilotes, a non seulement mis en œuvre les normes GA4GH, mais a aidé à informer et à créer bon nombre d’entre elles. CanDIG aide déjà les scientifiques à accéder à l’échelle nationale à des données génomiques à grande échelle qui étaient auparavant cloisonnées dans des provinces ou des hôpitaux individuels et commence à relier les ensembles de données génomiques du Canada à ceux du monde entier grâce à des collaborations telles que le Projet UE/Afrique/Canada CINECA.
La plateforme CanDIG a été développée pour répondre à la législation provinciale sur les soins de santé et la protection de la vie privée du Canada, en créant une fédération d’ensembles de données, en simplifiant les défis du partage à travers les frontières provinciales. CanDIG est également un élément clé de la prochaine plateforme numérique de santé et de découverte (DHDP), un effort de 200 millions de dollars financé en partie par le gouvernement canadien, qui soutiendra le partage des données génomiques de la Réseau des centres de cancérologie du Marathon de l’espoir Terry Fox. Mettre ces données à la disposition des chercheurs est essentiel pour libérer leur potentiel de découverte et permettre de meilleurs traitements contre le cancer, car les chercheurs les plus intelligents et les techniques d’apprentissage automatique les plus puissantes ne peuvent rien faire avec des données qu’ils ne peuvent pas trouver, accéder ou utiliser.
Devis:
« Dans des institutions comme l’UHN, nous construisons des ressources de données de plus en plus sophistiquées contenant des données sur la santé provenant de nombreuses sources différentes. La prochaine étape consiste à aider les chercheurs à transformer ces données en nouvelles connaissances en les rendant trouvables, disponibles et utilisables de manière uniforme, organisée et sécurisée. façon, et lui permettant d’être combiné avec des ensembles de données similaires dans d’autres hôpitaux. CanDIG est une étape importante pour permettre aux chercheurs de partout au Canada d’accéder à la richesse des données recueillies et générées partout au pays.
Dr Michael Brudno, chercheur principal de CanDIG, scientifique en chef des données de l’UHN et professeur d’informatique à l’Université de Toronto.
« En participant à la communauté GA4GH et à des projets internationaux comme le projet UE/Afrique/Canada CINECA, CanDIG commence à relier les efforts canadiens en génomique à ceux du monde entier. À mesure que les types de données de santé s’enrichissent et que les volumes augmentent, nous devons nous assurer que nos ensembles de données sont trouvables et utiles ; Le Canada est un chef de file mondial dans ce domaine.
Dr Guillaume Bourque, co-responsable CanDIG, professeur de génétique moléculaire à l’Université McGill et directeur du Centre canadien de génomique computationnelle (C3G).
« L’accès aux données du génome entier a été essentiel pour comprendre le spectre des mutations qui surviennent dans le cancer. CanDIG et les plateformes de découverte et de santé numériques de Terry Fox aideront les données recueillies par le Marathon of Hope Cancer Centers Network à être étudiées par autant de personnes approuvées. chercheurs que possible.
Dr Steve Jones, co-responsable CanDIG, chef de la bioinformatique et codirecteur au BC Michael Smith Genome Sciences Center