Dans une étude récente publiée dans Médecine naturelleles chercheurs ont systématiquement étudié la constitution génétique de près de 20 000 femmes et hommes en termes de > 900 métabolites.
Les métabolites circulant dans le corps humain reflètent la physiologie humaine et l’unicité chimique d’un individu. Le métabolisme humain est dérégulé dans plusieurs maladies et est affecté par de multiples facteurs alimentaires, génétiques, médicamenteux et associés à la maladie. Une large gamme de technologies biomédicales à haut débit est disponible pour permettre l’évaluation des facteurs génétiques affectant la physiologie humaine ; cependant, les données de corégulation de différents métabolites sont limitées.
À propos de l’étude
Dans la présente étude, les chercheurs ont étudié les déterminants génétiques des variations de la physiologie humaine à l’aide de données métabolomiques non ciblées.
L’équipe a analysé l’architecture génétique de 913 métabolites parmi plus de 14 000 individus. Les données ont été utilisées pour définir des métabotypes génétiquement influencés (GIM) ou des groupes de métabolites influencés par ≥1,0 signal génétique partagé. Des échantillons de deux études de cohorte basées au Royaume-Uni (RU) : INTERVAL et EPIC-Norfolk, ont été analysés. Les métabolites ont été mesurés par chromatographie liquide et spectrométrie de masse et classés comme liés au métabolisme des lipides, des acides aminés, des xénobiotiques, des nucléotides, des peptides, des glucides, des cofacteurs et des vitamines et énergétiques.
Les composés aux identités chimiques indéterminées étaient appelés composés non annotés. Une modélisation de régression linéaire multivariable a été effectuée pour l’analyse. Des mesures métabolomiques ont été réalisées entre 2015 et 2017 pour les échantillons EPIC-Norfolk. Les niveaux de métabolites ont été évalués dans deux séries d’environ 6 000 échantillons chacune. L’équipe a validé les associations variantes-métabolites sentinelles régionales en méta-analysant les données de l’ensemble de découverte et de l’ensemble de validation.
Parmi les participants à l’étude EPIC-Norfolk, 5 698 et 5 841 individus ont été classés respectivement dans les ensembles de validation et de découverte. Des analyses de génotypage et d’imputation ont été effectuées dans lesquelles l’équipe a imputé les niveaux de métabolites prédits génétiquement («scores de métabolites») chez les participants à la biobanque britannique à l’aide de scores génétiques pondérés et a estimé leurs associations avec 1 457 termes de maladies rassemblés («phénodes»). Une analyse d’association à l’échelle du génome (GWAS) a été réalisée pour chaque métabolite séparément pour les échantillons. En outre, une analyse conditionnelle, une analyse de colocalisation et une analyse d’enrichissement pour les gènes responsables des IEM (erreurs innées du métabolisme) ont été effectuées.
L’hétérogénéité allélique a été évaluée et la co-régulation génétique des différents métabolites a été évaluée. L’équipe a également effectué une analyse phénotypique des variants génétiques associés aux métabolites, et des associations métaboliques à l’échelle du phénome ont été déterminées. Les résultats ont été techniquement validés à l’aide de données de séquence d’exome entier (WES) provenant de 3 924 échantillons de l’étude INTERVAL.
Les gènes causaux les plus probables ont été déterminés et la nouveauté de l’association de variantes a été évaluée en comparant les résultats avec ceux de deux études menées précédemment. Sur la base des associations génétiques identifiées et de la littérature scientifique organisée manuellement, les gènes causaux de haute confiance régulant les métabolites ont été défiés et leur pertinence clinique a été évaluée sur plus de 1 400 phénotypes.
Résultats
La convergence des présentations phénotypiques et métaboliques des gènes rares responsables de l’IEM a été observée avec des variants génétiques des gènes identifiés dans la population générale. Au total, 423 GIM ont été identifiés, dont principalement ≤15 variants génétiques et ≤89 métabolites. Pour 62 % (n = 264) GIM, un gène sur 253 gènes causals probables a été attribué sur la base d’une exploration approfondie des données. Les GIM tels que la stéroïde 5α-réductase 2 (SRD5A2) et la dihydropyrimidine déshydrogénase (DPYD) ont montré des implications cliniques importantes.
Une activité SRD5A2 plus élevée était associée à des risques plus élevés de calvitie masculine. Les associations génétiques étaient compatibles avec une activité SRD5A2 moindre et des niveaux moindres de conjugués d’androstérone, d’épiandrostérone, de 3α-androstanediol et de 3β-androstanediol. Des signaux génétiques partagés ont été observés entre divers métabolites androgènes et la calvitie masculine, avec rs112881196 comme variante causale. Le locus S1/S2 de la désaturase des acides gras (FAD) était associé aux métabolites les plus annotés.
La variance phénotypique moyenne expliquée par des variants conditionnellement indépendants était de 5,2 %, la plus élevée pour les classes d’acides aminés et d’énergie. Des niveaux inférieurs d’inhibiteurs de SRD5A étaient associés à des risques de dépression plus importants, le rs62142080 étant la variante causale probable. La variante rs72977723 impliquait une dégradation de l’uracile, tandis que rs184097503 et rs28933981 augmentaient les capacités de transport de la thyroxine. Des GIM capturant plusieurs fonctions géniques, telles que celles des transporteurs SLC7A2 (Slc7a2 solute carrier family 7) associés aux niveaux d’arginine ou de lysine, ont été observés.
Un enrichissement de 8,0 fois des gènes responsables de l’IEM a été observé avec des variants IEM cartographiés sur des gènes provoquant des troubles liés aux mitochondries, aux acides aminés et aux acides gras. Des niveaux inférieurs de vanillylmandélate étaient associés à des risques d’hypertension plus faibles, avec rs6271 comme variante causale. Des gènes responsables ont également été identifiés pour la maladie coronarienne [PCSK9 (Proprotein convertase subtilisin/kexin type 9), SORT1 (Sortiliin 1) and LDLR (low-density lipoprotein receptor)]dégénérescence maculaire [LIPC (hepatic lipase) and apolipoprotein E (APOE)/apolipoprotein C (APOC) 1,2,4]La maladie de Crohn [GCKR (glucokinase regulator) and FADS2] et maladie rénale chronique [GATM (Glycine amidinotransferase)].
Association entre les métabolites et les maladies, telles que les niveaux d’urate avec la goutte [odds ratio (OR) of 2.2]acides biliaires avec lithiase biliaire (OR de 0,6 pour le glycohyocholate) et lipides complexes avec hypercholestérolémie [OR of 1.8 for 1-dihomo-linoleoyl-GPC (20:2)] ont été observés. L’homoarginine plasmatique s’est avérée jouer un rôle clé dans la pathologie des maladies rénales chroniques et la 3-méthylglutarylcarnitine protégeait contre le développement de néoplasmes bénins dans le côlon.
Dans l’ensemble, les résultats de l’étude ont mis en évidence les déterminants génétiques des variations des métabolites humains et pourraient guider les futures évaluations d’association à l’échelle du métabolome.