Une grande partie du génome humain est constituée de régions régulatrices qui contrôlent quels gènes sont exprimés à un moment donné dans une cellule. Ces éléments régulateurs peuvent être situés près d’un gène cible ou jusqu’à 2 millions de paires de bases de la cible.
Pour permettre ces interactions, le génome se boucle dans une structure 3D qui rapproche des régions éloignées. En utilisant une nouvelle technique, les chercheurs du MIT ont montré qu’ils pouvaient cartographier ces interactions avec une résolution 100 fois supérieure à ce qui était possible auparavant.
En utilisant cette méthode, nous générons les cartes de la plus haute résolution du génome 3D qui n’ont jamais été générées, et ce que nous voyons, ce sont de nombreuses interactions entre les activateurs et les promoteurs qui n’ont pas été vues auparavant. Nous sommes ravis de pouvoir révéler une nouvelle couche de structure 3D avec notre haute résolution. »
Anders Sejr Hansen, professeur adjoint de développement de carrière Underwood-Prescott en génie biologique au MIT et auteur principal de l’étude
Les découvertes des chercheurs suggèrent que de nombreux gènes interagissent avec des dizaines d’éléments régulateurs différents, bien qu’une étude plus approfondie soit nécessaire pour déterminer lesquelles de ces interactions sont les plus importantes pour la régulation d’un gène donné.
« Les chercheurs peuvent désormais étudier à moindre coût les interactions entre les gènes et leurs régulateurs, ouvrant un monde de possibilités non seulement pour nous mais aussi pour des dizaines de laboratoires qui ont déjà manifesté leur intérêt pour notre méthode », déclare Viraat Goel, étudiant diplômé du MIT et l’un des les principaux auteurs de l’article. « Nous sommes ravis d’apporter à la communauté de la recherche un outil qui les aide à démêler les mécanismes à l’origine de la régulation des gènes. »
Le post-doctorant du MIT, Miles Huseyin, est également l’un des principaux auteurs de l’article, qui paraît aujourd’hui dans Génétique naturelle.
Cartographie haute résolution
Les scientifiques estiment que plus de la moitié du génome est constituée d’éléments régulateurs qui contrôlent les gènes, qui ne représentent qu’environ 2 % du génome. Des études d’association à l’échelle du génome, qui relient des variantes génétiques à des maladies spécifiques, ont identifié de nombreuses variantes qui apparaissent dans ces régions régulatrices. Déterminer avec quels gènes ces éléments régulateurs interagissent pourrait aider les chercheurs à comprendre comment ces maladies surviennent et, éventuellement, comment les traiter.
La découverte de ces interactions nécessite de cartographier les parties du génome qui interagissent les unes avec les autres lorsque les chromosomes sont emballés dans le noyau. Les chromosomes sont organisés en unités structurales appelées nucléosomes – ; brins d’ADN étroitement enroulés autour des protéines – ; aider les chromosomes à s’insérer dans les petites limites du noyau.
Il y a plus de dix ans, une équipe comprenant des chercheurs du MIT a développé une méthode appelée Hi-C, qui a révélé que le génome est organisé comme un « globule fractal », ce qui permet à la cellule de bien emballer son ADN tout en évitant les nœuds. Cette architecture permet également à l’ADN de se déployer et de se replier facilement en cas de besoin.
Pour effectuer Hi-C, les chercheurs utilisent des enzymes de restriction pour découper le génome en plusieurs petits morceaux et lier biochimiquement des morceaux qui sont proches les uns des autres dans l’espace 3D au sein du noyau de la cellule. Ils déterminent ensuite les identités des pièces en interaction en les amplifiant et en les séquençant.
Alors que Hi-C révèle beaucoup sur l’organisation 3D globale du génome, il a une résolution limitée pour sélectionner des interactions spécifiques entre les gènes et les éléments régulateurs tels que les activateurs. Les amplificateurs sont de courtes séquences d’ADN qui peuvent aider à activer la transcription d’un gène en se liant au promoteur du gène – ; le site où commence la transcription.
Pour atteindre la résolution nécessaire pour trouver ces interactions, l’équipe du MIT s’est appuyée sur une technologie plus récente appelée Micro-C, qui a été inventée par des chercheurs de la faculté de médecine de l’Université du Massachusetts, dirigés par Stanley Hsieh et Oliver Rando. Micro-C a été appliqué pour la première fois dans la levure bourgeonnante en 2015, puis appliqué aux cellules de mammifères dans trois articles en 2019 et 2020 par des chercheurs dont Hansen, Hsieh, Rando et d’autres de l’Université de Californie à Berkeley et de la UMass Medical School.
Micro-C atteint une résolution plus élevée que Hi-C en utilisant une enzyme connue sous le nom de nucléase micrococcique pour hacher le génome. Les enzymes de restriction de Hi-C coupent le génome uniquement au niveau de séquences d’ADN spécifiques distribuées de manière aléatoire, ce qui donne des fragments d’ADN de tailles variables et plus grandes. En revanche, la nucléase micrococcique coupe uniformément le génome en fragments de la taille d’un nucléosome, chacun contenant 150 à 200 paires de bases d’ADN. Cette uniformité de petits fragments confère au Micro-C sa résolution supérieure à celle du Hi-C.
Cependant, étant donné que Micro-C étudie l’ensemble du génome, cette approche n’atteint toujours pas une résolution suffisamment élevée pour identifier les types d’interactions que les chercheurs voulaient voir. Par exemple, si vous voulez voir comment 100 sites génomiques différents interagissent les uns avec les autres, vous devez en séquencer au moins 100 multipliés par 100 fois, soit 10 000. Le génome humain est très grand et contient environ 22 millions de sites à la résolution du nucléosome. Par conséquent, la cartographie Micro-C de l’ensemble du génome humain nécessiterait au moins 22 millions multipliés par 22 millions de lectures de séquençage, ce qui coûterait plus d’un milliard de dollars.
Pour réduire ce coût, l’équipe a conçu un moyen d’effectuer un séquençage plus ciblé des interactions du génome, leur permettant de se concentrer sur les segments du génome qui contiennent des gènes d’intérêt. En se concentrant sur des régions couvrant quelques millions de paires de bases, le nombre de sites génomiques possibles diminue d’un millier de fois et les coûts de séquençage diminuent d’un million de fois, jusqu’à environ 1 000 $. La nouvelle méthode, appelée Region Capture Micro-C (RCMC), est donc capable de générer à peu de frais des cartes 100 fois plus riches en informations que les autres techniques publiées pour une fraction du coût.
« Nous avons maintenant une méthode pour obtenir des cartes de structure du génome 3D ultra-haute résolution d’une manière très abordable. Auparavant, c’était tellement inaccessible financièrement parce qu’il fallait des millions, voire des milliards de dollars, pour obtenir une haute résolution », a déclaré Hansen. . « La seule limitation est que vous ne pouvez pas obtenir le génome entier, vous devez donc savoir approximativement quelle région vous intéresse, mais vous pouvez obtenir une très haute résolution, à un prix très abordable. »
De nombreuses interactions
Dans cette étude, les chercheurs se sont concentrés sur cinq régions dont la taille varie de centaines de milliers à environ 2 millions de paires de bases, qu’ils ont choisies en raison de caractéristiques intéressantes révélées par des études antérieures. Ceux-ci incluent un gène bien caractérisé appelé Sox2, qui joue un rôle clé dans la formation des tissus au cours du développement embryonnaire.
Après avoir capturé et séquencé les segments d’ADN d’intérêt, les chercheurs ont trouvé de nombreux amplificateurs qui interagissent avec Sox2, ainsi que des interactions entre des gènes proches et des amplificateurs qui étaient auparavant invisibles. Dans d’autres régions, en particulier celles pleines de gènes et d’amplificateurs, certains gènes ont interagi avec jusqu’à 50 autres segments d’ADN, et en moyenne chaque site d’interaction a contacté environ 25 autres.
« Les gens ont déjà vu plusieurs interactions à partir d’un seul morceau d’ADN, mais c’est généralement de l’ordre de deux ou trois, donc voir autant d’entre elles était assez significatif en termes de différence », a déclaré Huseyin.
Cependant, la technique des chercheurs ne révèle pas si toutes ces interactions se produisent simultanément ou à des moments différents, ni lesquelles de ces interactions sont les plus importantes.
Les chercheurs ont également découvert que l’ADN semble s’enrouler dans des « microcompartiments » imbriqués qui facilitent ces interactions, mais ils n’ont pas été en mesure de déterminer comment les microcompartiments se forment. Les chercheurs espèrent qu’une étude plus approfondie des mécanismes sous-jacents pourrait éclairer la question fondamentale de la régulation des gènes.
« Même si nous ne sommes pas actuellement conscients de ce qui peut causer ces microcompartiments, et que nous avons toutes ces questions ouvertes devant nous, nous avons au moins un outil pour poser ces questions avec beaucoup de rigueur », déclare Goel.
En plus de poursuivre ces questions, l’équipe du MIT prévoit également de travailler avec des chercheurs du Boston Children’s Hospital pour appliquer ce type d’analyse aux régions génomiques qui ont été liées à des troubles sanguins dans des études d’association à l’échelle du génome. Ils collaborent également avec des chercheurs de la Harvard Medical School pour étudier des variantes liées à des troubles métaboliques.
La recherche a été financée par le Koch Institute Support (core) Grant du National Cancer Institute, des National Institutes of Health, de la National Science Foundation, d’un Solomon Buchsbaum Research Support Committee Award, du Koch Institute Frontier Research Fund, d’un NIH Fellowship et d’un Bourse EMBO.