Un défi majeur en génétique humaine est de comprendre quelles parties du génome déterminent des traits spécifiques ou contribuent au risque de maladie. Ce défi est encore plus grand pour les variantes génétiques trouvées dans les 98 % du génome qui ne codent pas pour les protéines.
Une nouvelle approche développée par des chercheurs de l’Université de New York et du New York Genome Center combine des études d’association génétique, l’édition de gènes et le séquençage unicellulaire pour relever ces défis et découvrir des variantes causales et des mécanismes génétiques pour les traits des cellules sanguines.
Leur approche, baptisée STING-seq et publiée dans Sciencerelève le défi de relier directement les variantes génétiques aux traits et à la santé humains, et peut aider les scientifiques à identifier les cibles médicamenteuses pour les maladies à base génétique.
Au cours des deux dernières décennies, les études d’association à l’échelle du génome (GWAS) sont devenues un outil important pour l’étude du génome humain. À l’aide de GWAS, les scientifiques ont identifié des milliers de mutations ou de variantes génétiques associées à de nombreuses maladies, de la schizophrénie au diabète, ainsi que des traits tels que la taille. Ces études sont menées en comparant les génomes de grandes populations pour trouver des variantes qui surviennent plus souvent chez les personnes atteintes d’une maladie ou d’un trait spécifique.
GWAS peut révéler quelles régions du génome et quelles variantes potentielles sont impliquées dans des maladies ou des traits. Cependant, ces associations se retrouvent presque toujours dans les 98% du génome qui ne codent pas pour les protéines, ce qui est beaucoup moins bien compris que les 2% bien étudiés du génome qui codent pour les protéines. Une autre complication est que de nombreuses variantes se trouvent à proximité les unes des autres dans le génome et voyagent ensemble à travers les générations, un concept connu sous le nom de liaison. Cela peut rendre difficile de distinguer quelle variante joue un rôle véritablement causal par rapport aux autres variantes qui se trouvent juste à proximité. Même lorsque les scientifiques peuvent identifier quelle variante est à l’origine d’une maladie ou d’un trait, ils ne savent pas toujours sur quel gène la variante a un impact.
L’un des principaux objectifs de l’étude des maladies humaines est d’identifier les gènes et les variants causaux, qui peuvent clarifier les mécanismes biologiques et informer les cibles médicamenteuses de ces maladies. »
Neville Sanjana, professeur agrégé de biologie à NYU, professeur agrégé de neurosciences et de physiologie à la NYU Grossman School of Medicine, membre principal du corps professoral du New York Genome Center et co-auteur principal de l’étude
« L’énorme succès de GWAS a mis en évidence le défi d’extraire des informations sur la biologie des maladies à partir de ces ensembles de données massifs. Malgré tous nos efforts au cours des 10 dernières années, le verre n’était encore qu’à moitié plein – au mieux. Nous avions besoin d’une nouvelle approche « , a déclaré Tuuli Lappalainen, membre principal du corps professoral associé au New York Genome Center, professeur de génomique au KTH Royal Institute of Technology en Suède et co-auteur principal de l’étude.
Un remède contre la drépanocytose
Une percée scientifique récente dans le traitement de la drépanocytose ; une maladie génétique marquée par des épisodes de douleur intense ; illustre comment la combinaison de GWAS avec des outils moléculaires de pointe comme l’édition de gènes peut identifier des variantes causales et conduire à des thérapies innovantes. À l’aide de GWAS, les scientifiques ont identifié des zones du génome importantes pour la production d’hémoglobine fœtale, une cible basée sur sa promesse d’inverser l’anémie falciforme, mais ils ne savaient pas quelle variante exacte entraîne sa production.
Les chercheurs se sont tournés vers CRISPR – un outil d’édition de gènes qui utilise des « ciseaux moléculaires pour couper l’ADN », selon Sanjana – pour éditer les régions identifiées par GWAS. Lorsque des modifications CRISPR ont été effectuées à un endroit spécifique du génome non codant près d’un gène appelé BCL11Ail en résultait des taux élevés d’hémoglobine fœtale.
CRISPR a maintenant été utilisé dans des essais cliniques pour modifier cette région dans les cellules de la moelle osseuse de dizaines de patients atteints d’anémie falciforme. Une fois que les cellules modifiées sont réinjectées dans les patients, elles commencent à produire de l’hémoglobine fœtale, qui déplace la forme adulte mutée de l’hémoglobine, les guérissant efficacement de la drépanocytose.
« Cette réussite dans le traitement de la drépanocytose est le résultat de la combinaison des connaissances de GWAS avec l’édition de gènes », a déclaré Sanjana. « Mais il a fallu des années de recherche sur une seule maladie. Comment pouvons-nous intensifier cela pour mieux identifier les variantes causales et les gènes cibles de GWAS? »
GWAS rencontre CRISPR et le séquençage unicellulaire
L’équipe de recherche a créé un flux de travail appelé STING-seq-; Ciblage systématique et inhibition des locus GWAS non codants avec séquençage unicellulaire. STING-seq fonctionne en prenant GWAS à l’échelle de la biobanque et en recherchant des variantes causales probables en utilisant une combinaison de caractéristiques biochimiques et d’éléments régulateurs. Les chercheurs utilisent ensuite CRISPR pour cibler chacune des régions des génomes impliquées par GWAS et effectuer un séquençage unicellulaire pour évaluer l’expression des gènes et des protéines.
Dans leur étude, les chercheurs ont illustré l’utilisation de STING-seq pour découvrir des gènes cibles de variants non codants pour les traits sanguins. Les traits sanguins – tels que les pourcentages de plaquettes, de globules blancs et de globules rouges – sont faciles à mesurer dans les tests sanguins de routine et ont été bien étudiés dans GWAS. En conséquence, les chercheurs ont pu utiliser GWAS représentant près de 750 000 personnes d’horizons divers pour étudier les traits sanguins.
Une fois que les chercheurs ont identifié 543 régions candidates du génome susceptibles de jouer un rôle dans les traits sanguins, ils ont utilisé une version de CRISPR appelée inhibition CRISPR qui peut faire taire des régions précises du génome.
Après le silence CRISPR des régions identifiées par GWAS, les chercheurs ont examiné l’expression de gènes voisins dans des cellules individuelles pour voir si des gènes particuliers étaient activés ou désactivés. S’ils voyaient une différence dans l’expression des gènes entre les cellules où les variantes étaient et n’étaient pas réduites au silence, ils pourraient lier des régions non codantes spécifiques aux gènes cibles. Ce faisant, les chercheurs ont pu identifier quelles régions non codantes sont au cœur de traits spécifiques (et lesquelles ne le sont pas) et souvent aussi les voies cellulaires par lesquelles ces régions non codantes fonctionnent.
« La puissance de STING-seq est que nous pourrions appliquer cette approche à n’importe quelle maladie ou trait », a déclaré John Morris, associé postdoctoral au New York Genome Center et NYU et premier auteur de l’étude.
L’utilisation de STING-seq pour tester des grappes de variantes probables et voir leur impact sur les gènes élimine les conjectures que les scientifiques rencontraient auparavant lorsqu’ils étaient confrontés à un lien entre les variantes ou les gènes les plus proches des variantes, qui sont souvent mais pas toujours le gène cible. Dans le cas d’un trait sanguin appelé numération des monocytes, l’application de CRISPR a causé un gène, CD52pour se démarquer clairement comme significativement modifié- ; et tandis que CD52 était proche de la variante d’intérêt, ce n’était pas le gène le plus proche, il a donc pu être négligé en utilisant les méthodes précédentes.
Dans une autre analyse, les chercheurs ont identifié un gène appelé PTPRC qui est associé à 10 traits sanguins, y compris ceux liés aux globules rouges et blancs et aux plaquettes. Cependant, il existe plusieurs variantes non codantes identifiées par GWAS à proximité et il était difficile de comprendre lesquelles (le cas échéant) pourraient moduler PTPRC expression. L’application de STING-seq leur a permis d’isoler les variantes causales en voyant celles qui changeaient PTPRC expression.
STING-seq et au-delà
Bien que STING-seq puisse identifier le gène cible et la variante causale en faisant taire les variantes, il n’explique pas la direction de l’effet ; si une variante non codante spécifique augmentera ou réduira l’expression d’un gène voisin. Les chercheurs ont poussé leur approche un peu plus loin pour créer une approche complémentaire qu’ils appellent beeSTING-seq (édition de base STING-seq) qui utilise CRISPR pour insérer précisément une variante génétique au lieu de simplement inhiber cette région du génome.
Les chercheurs envisagent d’utiliser STING-seq et beeSTING-seq pour identifier les variantes causales d’un large éventail de maladies qui peuvent être traitées par l’édition de gènes ; comme cela a été utilisé dans l’anémie falciforme ; ou avec des médicaments qui ciblent des gènes ou des cellules spécifiques. voies.
« Maintenant que nous pouvons connecter des variantes non codantes à des gènes cibles, cela nous donne la preuve que de petites molécules ou des thérapies par anticorps pourraient être développées pour modifier l’expression de gènes spécifiques », a déclaré Lappalainen.