Les chercheurs ont publié une nouvelle collection de haute qualité de séquences du génome humain de référence qui capture beaucoup plus de diversité de différentes populations humaines que ce qui était auparavant disponible. Les travaux ont été menés par le Consortium international de référence sur le pangénome humain, un groupe financé par l’Institut national de recherche sur le génome humain (NHGRI), qui fait partie des National Institutes of Health.
La nouvelle référence « pangénome » comprend des séquences génomiques de 47 personnes, les chercheurs poursuivant l’objectif d’augmenter ce nombre à 350 d’ici la mi-2024. Avec chaque personne portant un ensemble apparié de chromosomes, la référence actuelle comprend en fait 94 séquences génomiques distinctes, avec un objectif d’atteindre 700 séquences génomiques distinctes d’ici l’achèvement du projet.
L’ouvrage, paru dans la revue Natureest l’un des nombreux articles publiés aujourd’hui par les membres du consortium.
Un génome est l’ensemble d’instructions de l’ADN qui aide chaque créature vivante à se développer et à fonctionner. Les séquences du génome diffèrent légèrement d’un individu à l’autre. Dans le cas des humains, les génomes de deux peuples sont, en moyenne, identiques à plus de 99 %. Les petites différences contribuent au caractère unique de chaque personne et peuvent fournir des informations sur sa santé, aider à diagnostiquer la maladie, prédire les résultats et orienter les traitements médicaux.
Pour comprendre ces différences génomiques, les scientifiques créent des séquences de référence du génome humain à utiliser comme « standard » – un amalgame numérique de séquences du génome humain qui peut être utilisé comme comparaison pour aligner, assembler et étudier d’autres séquences du génome humain.
La séquence originale de référence du génome humain a près de 20 ans et a été régulièrement mise à jour à mesure que la technologie progresse et que les chercheurs corrigent les erreurs et découvrent davantage de régions du génome humain. Cependant, il est fondamentalement limité dans sa représentation de la diversité de l’espèce humaine, car il se compose de génomes d’environ 20 personnes seulement, et la majeure partie de la séquence de référence provient d’une seule personne.
Tout le monde a un génome unique, donc l’utilisation d’une seule séquence génomique de référence pour chaque personne peut entraîner des inégalités dans les analyses génomiques. Par exemple, prédire une maladie génétique peut ne pas fonctionner aussi bien pour quelqu’un dont le génome est plus différent du génome de référence. »
Adam Phillippy, Ph.D., chercheur principal dans la branche de génomique computationnelle et statistique au sein du programme de recherche intra-muros du NHGRI et co-auteur de l’étude principale
La séquence actuelle du génome humain de référence présente des lacunes qui reflètent des informations manquantes, en particulier dans les zones répétitives et difficiles à lire. Les avancées technologiques récentes telles que le séquençage de l’ADN à lecture longue, qui lit de plus longues étendues d’ADN à la fois, ont aidé les chercheurs à combler ces lacunes pour créer la première séquence complète du génome humain. Cette séquence complète du génome humain, publiée l’année dernière dans le cadre du consortium Telomere-to-Telomere (T2T) financé par les NIH, est incorporée dans la référence actuelle du pangénome. En fait, de nombreux chercheurs du T2T sont également membres du Human Pangenome Reference Consortium.
En utilisant des techniques de calcul avancées pour aligner les différentes séquences du génome, les chercheurs ont construit une nouvelle référence de pangénome humain avec chaque assemblage dans le pangénome couvrant plus de 99 % de la séquence attendue avec une précision de plus de 99 %. Il s’appuie également sur la séquence génomique de référence précédente, ajoutant plus de 100 millions de nouvelles bases, ou « lettres » dans l’ADN. Alors que la séquence du génome de référence précédente était unique et linéaire, le nouveau pangénome représente de nombreuses versions différentes de la séquence du génome humain en même temps. Cela donne aux chercheurs un plus large éventail d’options pour utiliser le pangénome dans l’analyse d’autres séquences du génome humain.
« En utilisant la référence du pangénome, nous pouvons identifier plus précisément des variantes génomiques plus grandes appelées variantes structurelles », a déclaré Mobin Asri, titulaire d’un doctorat. étudiant à l’Université de Californie à Santa Cruz et co-premier auteur de l’article. « Nous sommes en mesure de trouver des variantes qui n’ont pas été identifiées à l’aide de méthodes précédentes qui dépendent de séquences de référence linéaires. »
Les variantes structurelles peuvent impliquer des milliers de bases. Jusqu’à présent, les chercheurs n’ont pas été en mesure d’identifier la majorité des variantes structurelles qui existent dans chaque génome humain à l’aide d’un séquençage à lecture courte en raison du biais d’utilisation d’une seule séquence de référence.
« La référence du pangénome humain nous permettra de représenter des dizaines de milliers de nouvelles variantes génomiques dans des régions du génome qui étaient auparavant inaccessibles », a déclaré Wen-Wei Liao, titulaire d’un doctorat. étudiant à l’Université de Yale et co-premier auteur de l’article. « Avec une référence de pangénome, nous pouvons accélérer la recherche clinique en améliorant notre compréhension du lien entre les gènes et les traits de la maladie. »
Le coût total du soutien aux travaux du Human Pangenome Reference Consortium devrait s’élever à environ 40 millions de dollars sur cinq ans, ce qui comprend les efforts pour créer la référence du pangénome humain, améliorer la technologie de séquençage de l’ADN, exploiter un centre de coordination, mener des activités de sensibilisation et créer des ressources pour la communauté des chercheurs à utiliser la référence du pangénome.
De nombreux individus dont les génomes ont été séquencés pour construire la nouvelle référence du pangénome humain ont été recrutés à l’origine dans le cadre du projet 1 000 génomes, un effort collaboratif et international financé en partie par le NIH qui visait à améliorer le catalogue des variantes génomiques dans diverses populations. Parce que la référence du pangénome humain est un travail en cours, les chercheurs du Consortium international de référence du pangénome humain continuent d’ajouter d’autres séquences du génome pour améliorer de plus en plus la qualité de la référence du pangénome.
« Les chercheurs fondamentaux et les cliniciens qui utilisent la génomique doivent avoir accès à une séquence de référence qui reflète la remarquable diversité de la population humaine. Cela contribuera à rendre la référence utile à tous, contribuant ainsi à réduire les risques de propagation des disparités en matière de santé », a déclaré Eric Green. , MD, Ph.D., directeur du NHGRI. « La création et l’amélioration d’une référence de pangénome humain s’aligne sur l’objectif du NHGRI de rechercher la diversité mondiale dans tous les aspects de la recherche en génomique, ce qui est crucial pour faire progresser les connaissances en génomique et mettre en œuvre la médecine génomique de manière équitable.
Conformément à cet effort, le Human Pangenome Reference Consortium comprend un groupe d’éthique intégré qui s’efforce d’anticiper les problèmes difficiles et d’aider à orienter le consentement éclairé, à hiérarchiser l’étude de différents échantillons, à explorer les éventuels problèmes réglementaires liés à l’adoption clinique et à travailler avec des partenaires internationaux et internationaux. Les communautés autochtones à intégrer leurs séquences génomiques dans ces efforts plus larges.
Les institutions impliquées dans le Human Pangenome Reference Consortium peuvent être trouvées sur la page principale du projet.
Comment l’activité physique et l’alimentation impactent le sommeil des adolescents