Les humains et les chimpanzés ne diffèrent que par un pour cent de leur ADN. Les régions humaines accélérées (HAR) sont des parties du génome avec une quantité inattendue de ces différences. Les HAR étaient stables chez les mammifères pendant des millénaires, mais ont rapidement changé chez les premiers humains. Les scientifiques se sont longtemps demandé pourquoi ces morceaux d’ADN avaient tant changé et comment ces variations distinguaient les humains des autres primates.
Aujourd’hui, des chercheurs des instituts Gladstone ont analysé des milliers de HAR humains et chimpanzés et ont découvert que bon nombre des changements qui se sont accumulés au cours de l’évolution humaine avaient des effets opposés les uns des autres.
Cela aide à répondre à une question de longue date sur la raison pour laquelle les HAR ont évolué si rapidement après avoir été gelés pendant des millions d’années. Une variation initiale d’un HAR aurait peut-être trop augmenté son activité, puis il aurait fallu la refuser. »
Katie Pollard, PhD, directrice du Gladstone Institute of Data Science and Biotechnology et auteur principal de la nouvelle étude
Les résultats, dit-elle, ont des implications pour la compréhension de l’évolution humaine. De plus, parce qu’elle et son équipe ont découvert que de nombreux HAR jouent un rôle dans le développement du cerveau, l’étude suggère que des variations dans les HAR humains pourraient prédisposer les personnes aux maladies psychiatriques.
« Ces résultats ont nécessité des outils d’apprentissage automatique de pointe pour intégrer des dizaines de nouveaux ensembles de données générés par notre équipe, fournissant une nouvelle perspective pour examiner l’évolution des variantes HAR », déclare Sean Whalen, PhD, premier auteur de l’étude et chercheur principal. dans le laboratoire de Pollard.
Activé par l’apprentissage automatique
Pollard a découvert les HAR en 2006 en comparant les génomes humains et chimpanzés. Bien que ces segments d’ADN soient presque identiques chez tous les humains, ils diffèrent entre les humains et les autres mammifères. Le laboratoire de Pollard a ensuite montré que la grande majorité des HAR ne sont pas des gènes, mais des activateurs ; régions régulatrices du génome qui contrôlent l’activité des gènes.
Plus récemment, le groupe de Pollard a voulu étudier en quoi les HAR humains diffèrent des HAR des chimpanzés dans leur fonction d’amplificateur. Dans le passé, cela aurait nécessité de tester les HAR un par un chez la souris, en utilisant un système qui colore les tissus lorsqu’un HAR est actif.
Au lieu de cela, Whalen a entré des centaines d’amplificateurs connus du cerveau humain et des centaines d’autres séquences non amplificateurs dans un programme informatique afin qu’il puisse identifier des modèles qui prédisaient si un tronçon donné d’ADN était un amplificateur. Ensuite, il a utilisé le modèle pour prédire qu’un tiers des HAR contrôlent le développement du cerveau.
« Fondamentalement, l’ordinateur a pu apprendre les signatures des activateurs du cerveau », explique Whalen.
Sachant que chaque HAR présente de multiples différences entre les humains et les chimpanzés, Pollard et son équipe se sont demandé comment les variantes individuelles d’un HAR avaient un impact sur sa force d’amplification. Par exemple, si huit nucléotides d’ADN différaient entre un chimpanzé et un HAR humain, tous les huit avaient-ils le même effet, rendant l’amplificateur plus fort ou plus faible ?
« Nous nous sommes longtemps demandé si toutes les variantes des HAR étaient nécessaires pour qu’il fonctionne différemment chez l’homme, ou si certains changements ne faisaient que faire de l’auto-stop avec des plus importants », explique Pollard, qui est également chef de la division de bioinformatique du département d’épidémiologie et de biostatistique de l’UC San Francisco (UCSF), ainsi qu’un chercheur de Chan Zuckerberg Biohub.
Pour tester cela, Whalen a appliqué un deuxième modèle d’apprentissage automatique, qui a été conçu à l’origine pour déterminer si les différences d’ADN d’une personne à l’autre affectent l’activité de l’amplificateur. L’ordinateur a prédit que 43 % des HAR contiennent deux variantes ou plus avec des effets opposés importants : certaines variantes d’un HAR donné en ont fait un activateur plus fort, tandis que d’autres changements ont fait du HAR un activateur plus faible.
Ce résultat a surpris l’équipe, qui s’attendait à ce que tous les changements poussent l’enhancer dans la même direction, ou à ce que certains changements « auto-stoppeurs » n’aient aucun impact sur l’enhancer.
Mesure de la force HAR
Pour valider cette prédiction convaincante, Pollard a collaboré avec les laboratoires de Nadav Ahituv, PhD, et d’Alex Pollen, PhD, à l’UCSF. Les chercheurs ont fusionné chaque HAR à un petit code-barres ADN. Chaque fois qu’un HAR était actif, améliorant l’expression d’un gène, le code-barres était transcrit en un morceau d’ARN. Ensuite, les chercheurs ont utilisé la technologie de séquençage d’ARN pour analyser la quantité de ce code-barres présente dans n’importe quelle cellule, indiquant à quel point le HAR avait été actif dans cette cellule.
« Cette méthode est beaucoup plus quantitative car nous avons un nombre exact de codes-barres au lieu d’images de microscopie », explique Ahituv. « C’est aussi un débit beaucoup plus élevé ; nous pouvons examiner des centaines de HAR dans une seule expérience. »
Lorsque le groupe a mené ses expériences en laboratoire sur plus de 700 HAR dans des précurseurs de cellules cérébrales humaines et de chimpanzés, les données ont imité ce que les algorithmes d’apprentissage automatique avaient prédit.
« Nous n’aurions peut-être pas découvert de variantes HAR humaines avec des effets opposés si le modèle d’apprentissage automatique n’avait pas produit ces prédictions surprenantes », a déclaré Pollard.
Implications pour la compréhension des maladies psychiatriques
L’idée que les variantes HAR jouent à la corde sur les niveaux d’amplificateurs correspond bien à une théorie qui a déjà été proposée sur l’évolution humaine : que la cognition avancée dans notre espèce est aussi ce qui nous a donné des maladies psychiatriques.
« Ce que ce type de schéma indique est ce qu’on appelle une évolution compensatoire », explique Pollard. « Un changement important a été apporté à un activateur, mais c’était peut-être trop et a conduit à des effets secondaires nocifs, donc le changement a été réduit au fil du temps – c’est pourquoi nous voyons des effets opposés. »
Si les changements initiaux apportés aux HAR ont entraîné une augmentation de la cognition, peut-être que des changements compensatoires ultérieurs ont aidé à réduire le risque de maladies psychiatriques, spécule Pollard. Ses données, ajoute-t-elle, ne peuvent pas directement prouver ou réfuter cette idée. Mais à l’avenir, une meilleure compréhension de la contribution des HAR aux maladies psychiatriques pourrait non seulement éclairer l’évolution, mais aussi de nouveaux traitements pour ces maladies.
« Nous ne pourrons jamais remonter le temps et savoir exactement ce qui s’est passé dans l’évolution », déclare Pollard. « Mais nous pouvons utiliser toutes ces techniques scientifiques pour simuler ce qui aurait pu se passer et identifier les modifications de l’ADN les plus susceptibles d’expliquer des aspects uniques du cerveau humain, y compris sa propension aux maladies psychiatriques. »