Une analyse complète de plus de 500 000 variantes de protéines humaines révèle que 60 % des mutations faux-sens pathogènes réduisent la stabilité des protéines
Une analyse complète de plus de 500 000 variantes de protéines humaines révèle que 60 % des mutations faux-sens pathogènes réduisent la stabilité des protéines
Dans une étude récente publiée dans Nature, les chercheurs ont utilisé des tests de pointe, notamment des tests de synthèse massive en parallèle (MPS) et de complémentation de fragments protéiques en abondance (PCA), pour construire une base de données sur les mutations faux-sens humaines et leurs impacts sur les maladies (génétiques) non transmissibles.
La bibliothèque bien nommée « Human Domainome 1 » a calculé 563 534 variantes mutantes dans 522 domaines protéiques, ce qui représente une multiplication par cinq des connaissances scientifiques.
L’étude a en outre mesuré la contribution des variantes mutantes à la stabilité (pli) des protéines et, par conséquent, leur rôle dans la condition physique et la pathogénicité. Enfin, l'étude élucide les impacts de la stabilité du pli sur les manifestations des troubles dominants et récessifs et sur l'énergétique des effets mutationnels conservés.
Arrière-plan
Les mutations faux-sens sont des altérations génétiques résultant de la substitution d'une seule paire de bases (bp) dans une séquence d'acides aminés (aa) par une paire de bases différente, entraînant la traduction d'une protéine différente de celle prévue. Bien que la plupart soient inoffensives et passent inaperçues dans la vie de tous les jours, les chercheurs estiment que les mutations faux-sens sont responsables d'environ 33 % des maladies génétiques humaines.
Les mutations faux-sens sont étonnamment courantes : la population humaine héberge des dizaines de millions de ces variantes génétiques. Malheureusement, leurs impacts fonctionnels sur la pathogénicité humaine et les maladies restent largement inconnus.
À propos de l'étude
La présente étude utilise un ensemble de données expérimentales à grande échelle comprenant plus de 563 534 variantes génétiques pour élucider leurs effets cliniques sur 522 domaines protéiques humains, fournissant ainsi des informations sans précédent sur les impacts des mutations mineures sur les maladies humaines.
L'étude a utilisé la synthèse de l'ADN en tandem avec des expériences de sélection cellulaire pour créer le premier « Domainome humain » – un catalogue de la façon dont chaque aa, lorsqu'il est muté en tout autre aa possible (n = 19) à la même position dans le domaine, est fonctionnellement modifié. .
Les données de l’étude ont été créées à l’aide d’une technologie de pointe de synthèse massive en parallèle (mMPS) basée sur des micropuces, générant 1 230 584 variantes aa correspondant à 1 248 domaines protéiques.
Le point de vue scientifique dominant sur les effets des mutations faux-sens sur la santé postule que les changements dans les séquences aa modifient la stabilité du repliement des protéines résultantes, déclenchant ainsi des maladies génétiques. Pour vérifier ce point de vue, des tests de complémentation de fragments protéiques en abondance (aPCA) ont été effectués. Les tests utilisent le séquençage à haut débit de variantes regroupées (des centaines de milliers de protéines) pour quantifier les effets des altérations génétiques sur les taux de croissance cellulaire et la production d'enzymes (des cellules de levure) et révéler leurs mécanismes moléculaires.
Ces tests ont permis à l'étude d'évaluer les contributions relatives de différentes variantes génétiques à la condition physique humaine, d'identifier les sites fonctionnels (cibles potentielles de futures recherches cliniques) et d'évaluer la relation entre la stabilité des protéines et la pathogénicité.
De plus, l’étude a évalué les performances des prédicteurs informatiques des effets des variantes (VEP) – l’étalon-or actuel en matière de classification des variantes cliniques, pour leur exactitude. Notamment, l’ensemble de données d’évaluation fourni par cette étude est cinq fois plus volumineux que ce que la science connaissait auparavant.
Enfin, l’étude a utilisé un modèle thermodynamique dérivé de la fonction de partition de Boltzmann pour élucider la conservation des effets mutationnels et les fondements énergétiques des interactions de repliement des protéines.
Cotisations
L'étude élucide le rôle du repliement des protéines dans les maladies génétiques, en soulignant qu'environ 60 % des mutations faux-sens pathogènes déclenchent des maladies via une réduction de la stabilité des protéines.
L’instabilité des protéines s’est avérée être le principal facteur de formation de cataractes héréditaires, d’autres maladies oculaires, de fonte musculaire et de maladies neurologiques. Par exemple, l’étude a révélé que 72 % (13 mutations évaluées sur 18) des variantes génétiques associées à la cataracte étaient dues au repliement et à la déstabilisation des cristallines bêta-gamma, les protéines responsables du maintien de la clarté du cristallin.
Sur les 621 mutations pathogènes bien connues évaluées, 61 % résultaient de processus de déstabilisation similaires. Les troubles récessifs étaient particulièrement sensibles à la pathogénicité induite par la stabilité. Il a été constaté que les familles de protéines entièrement bêta étaient plus fortement touchées que les autres familles de protéines, biologiquement observables sous forme de réductions de la condition physique évolutive.
La base de données Human Dominome 1 constitue la source actuelle de données la plus complète pour les cliniciens, les chercheurs et les modèles d'apprentissage automatique informatiques/prédictifs, permettant la détection et la gestion précoces des maladies génétiques.
Notamment, bien qu’elles soient presque cinq fois plus vastes que les connaissances scientifiques collectives antérieures sur les mutations faux-sens, on estime qu’elles ne couvrent que 2,5 % des protéines humaines connues, ce qui nécessite de futures mises à jour pour atteindre son véritable potentiel.