La structure tridimensionnelle de l'ADN est déterminée par une série de règles spatiales basées sur des séquences de protéines particulières et leur ordre. C'est le résultat d'une étude récemment publiée dans Biologie du génome par Luca Nanni, doctorant en informatique et ingénierie au Politecnico di Milano, avec les professeurs Stefano Ceri de la même université et Colin Logie de l'université de Nimègue.
Le premier auteur de l'étude, Luca Nanni, a déclaré: «La plus grande innovation de notre étude réside dans l'identification de règles précises pour la disposition des protéines CTCF. La beauté et la simplicité de la grammaire de CTCF nous montrent comment la nature et l'évolution produisent de la régularité et des systèmes incroyablement ingénieux et fonctionnels. «
La connaissance de ces règles permet aux séquences CTCF d'être conçues pour obtenir la structure tridimensionnelle d'ADN souhaitée. Par exemple, il devrait être possible de faire interagir deux gènes déconnectés. Le moulage de la structure de l'ADN ouvrira les portes à la création de produits pharmaceutiques pour le traitement de maladies telles que le cancer. «
Luca Nanni, premier auteur de l'étude, Politecnico di Milano
La molécule d'ADN, qui mesurerait environ deux mètres de long si elle était complètement déroulée, s'enroule sur la base d'un système complexe qui maintient son accessibilité et sa lecture correcte pour résider dans le noyau de la cellule. Les domaines topologiques, qui sont censés agréger des zones d'ADN avec des rôles et des comportements similaires, sont cruciaux dans l'étude de la structure tridimensionnelle du génome.
Par exemple, des gènes ayant une fonction similaire sont susceptibles de résider dans le même domaine topologique. Nanni a poursuivi: « Nous nous sommes concentrés sur certaines séquences d'ADN spécifiques qui codent pour la protéine CTCF. »
« Cette protéine isole des portions d'ADN créant des barrières entre les différents domaines topologiques. A l'aide de simulations informatiques et de la création d'un modèle pour classer ces protéines selon leur orientation, nous avons identifié une régularité surprenante dans leur disposition le long de la séquence d'ADN. » L'étude a montré que l'orientation et l'ordre de ces séquences d'ADN permettent de reconstruire des domaines topologiques. Le génome humain se compresse suivant une logique de «grammaire» comprenant les séquences CTCF, l'orientation et la distance entre elles.
La source:
Référence du journal:
Nanni, L., et al. (2020) Les modèles spatiaux des sites CTCF définissent l'anatomie des TAD et leurs limites. Biologie du génome. doi.org/10.1186/s13059-020-02108-x.