En explorant le modèle génétique des protéines du liquide céphalo-rachidien, cette étude découvre de nouveaux marqueurs et cibles thérapeutiques qui pourraient débloquer des progrès dans le diagnostic et les soins de la maladie d'Alzheimer.
Étude : L'analyse protéogénomique du liquide céphalo-rachidien humain identifie une régulation neurologiquement pertinente et implique des protéines causales pour la maladie d'Alzheimer. Crédit d'image : Kateryna Kon/Shutterstock
Dans une étude récente publiée dans Génétique naturelleles chercheurs ont étudié la signature génomique du protéome du liquide céphalo-rachidien humain (LCR).
Les études d'association pangénomique (GWAS) sont devenues courantes au cours des 15 dernières années, avec des milliers de personnes étudiant de nombreuses maladies et traits, révélant des loci associés à la maladie. Néanmoins, traduire les associations en voies et thérapies est un défi, car l’identification des gènes causals et de leurs interactions nécessite l’intégration de données omiques et d’analyses plus approfondies en aval.
Les analyses de la régulation génétique de l'expression des gènes ont décrit des loci affectant les niveaux d'ARNm ; cependant, ces analyses négligent la biologie pertinente pour la maladie. En outre, la corrélation entre les niveaux d’ARNm et leurs protéines codées est faible et, par conséquent, le chevauchement entre les loci de traits quantitatifs d’expression (eQTL) et les QTL protéiques (pQTL) est également faible.
Les études portant sur les associations génétiques de protéines se sont principalement concentrées sur le plasma, et les rapports suggèrent peu de chevauchement entre la protéogénomique du plasma et du cerveau. Cependant, le ciblage des protéines du LCR a permis d’élucider les gènes responsables de certains locus de la maladie. Néanmoins, les études sont limitées par la petite taille des échantillons.
L'étude et les résultats
Dans la présente étude, les chercheurs ont étudié la signature génomique du protéome du LCR. Premièrement, une analyse protéogénomique du LCR a été réalisée à l’aide de données génétiques et protéomiques provenant de 3 506 Européens non apparentés. Ceux-ci comprenaient 1 021 sujets atteints de la maladie d'Alzheimer (MA) à apparition tardive, 1 242 patients atteints d'autres troubles neurodégénératifs et 1 243 témoins typiques sur le plan cognitif. Cette analyse a identifié 2 477 associations pQTL pour 2 042 aptamères.
Parmi eux, 48,6 % étaient trans-pQTL, et 51,4 % étaient cis-pQTL. Ensuite, étant donné que les maladies neurologiques étaient répandues dans l’ensemble de données, les chercheurs ont déterminé si les pQTL étaient cohérents chez les sujets cognitivement sains et affectés. Ils ont stratifié les sujets en groupes de biomarqueurs pertinents pour la MA et ont examiné les associations pour chaque groupe. Cela a révélé une corrélation robuste entre les groupes, ce qui suggère que les pQTL étaient cohérents d’un état pathologique à l’autre.
En outre, des analyses conditionnelles ont été effectuées sur tous les polymorphismes mononucléotidiques d'indexation afin d'identifier des signaux indépendants dans un locus. Au total, 3 885 associations conditionnellement indépendantes ont été identifiées. Alors que la plupart des protéines (54,4 %) avaient des associations uniques, deux protéines, la glutathion S-transférase μ1 et la protéine régulatrice du signal β1, avaient ≤ 16 associations indépendantes. cis associations.
Ensuite, les chercheurs ont examiné le chevauchement des pQTL du LCR avec les pQTL plasmatiques dérivés de 5 000 protéines. Au total, 4 735 aptamères se chevauchaient, couvrant 73,5 % des pQTL du LCR. Parmi ceux-ci, 67,6 % n’ont pas réussi à se colocaliser, ce qui indique des signaux spécifiques au LCR. De plus, les chercheurs ont comparé cis-Associations de pQTL aux eQTL provenant de tissus et de sang total neurologiquement pertinents. Ils ont noté le chevauchement le plus élevé avec les eQTL cortex/cervelet.
Près de la moitié de cis-Les pQTL ne se sont pas colocalisés avec les eQTL. Parmi ceux qui se chevauchaient, 78,9 % étaient colocalisés avec des tissus neurologiquement pertinents. Globalement, 33,6 % des LCR cis-Les pQTL étaient nouveaux et ne se localisaient pas avec les eQTL. Ensuite, les variantes d'index pQTL de chaque association ont été regroupées en utilisant un déséquilibre de liaison pour identifier les régions génomiques qui régulaient plusieurs protéines. Au total, 166 régions étaient associées à au moins deux protéines.
Notamment, trois régions étaient associées à plus de 50 protéines. Il s'agissait de chr19q13.32, chr3q28 et chr6p22.2-21.32.
Des analyses d'enrichissement du type cellulaire et de la voie ont été réalisées pour ces trois régions génomiques afin d'explorer le contexte cellulaire des protéines régulées. Un seul pQTL de la région chr3q28 a été observé dans le plasma, ce qui suggère qu'il s'agissait d'un point chaud spécifique au LCR. L'apolipoprotéine E (APOE) La région chr19q13.32 était associée à la plupart des protéines du LCR. Plus d'associations ont été observées dans cette région dans le LCR que dans le plasma.
Les protéines associées à la région chr19q13.32 comprenaient des biomarqueurs connus de la MA. De plus, l’équipe a intégré les associations pQTL avec la MA par le biais d’une étude d’association à l’échelle du protéome (PWAS), d’une randomisation mendélienne (MR) et d’une colocalisation. Le PWAS a révélé des associations significatives entre 125 pQTL (pour 108 protéines) et la MA.
MR a suggéré 17 protéines comme étant putativement causales pour la MA. Trente-deux protéines avaient des QTL colocalisés avec un risque de MA. Parmi les protéines priorisées par MR, colocalisation et PWAS, huit étaient significatives dans les trois méthodes, tandis que 38 étaient significatives dans au moins deux. Une recherche DrugBank a été effectuée pour identifier des composés thérapeutiques pour les protéines associées à la MA.
Sur les 38 protéines causales, des médicaments étaient disponibles pour 15 protéines. Enfin, l’équipe a développé un score de risque protéomique pour sélectionner les prédicteurs du statut de la maladie d’Alzheimer dans un ensemble de données de formation et a évalué sa capacité prédictive dans un ensemble de données de test indépendant. Le modèle de prédiction a stratifié avec précision les participants dans les deux ensembles de données et a obtenu de meilleurs résultats qu'un score de risque polygénique. Les performances du modèle sont restées constantes APOE génotypes et âges.
Conclusions
En résumé, les chercheurs ont identifié 3 885 associations pQTL significatives pour 1 883 protéines, qui étaient hautement spécifiques aux protéines et au CSF. Ils ont également observé des régions génomiques hautement pléiotropes et biaisées par le LCR sur les chromosomes 19q13.32 et 3q28. L'intégration de pQTL avec la MA a révélé 38 variantes présumées causales et plusieurs candidats à la réutilisation de médicaments pour la MA. De plus, un modèle prédictif basé sur les protéines associées à la MA a amélioré le PRS sous tous ses aspects, soulignant la proximité des protéines avec la maladie par rapport à la génétique.