Dans une étude récente publiée dans le European Journal of Human Genetics, les chercheurs ont développé deux scores multi-polygéniques (muti-PG) pour prédire les maladies coronariennes (CHD) en pesant et en intégrant linéairement les séquences génomiques phénotypiques (PGS) des maladies coronariennes et de nombreuses autres caractéristiques. .
Étude: Une combinaison linéaire pondérée de scores polygéniques pour un large éventail de caractères améliore la prédiction des maladies coronariennes. Crédit d’image : Theerani lerdsri/Shutterstock.com
Sommaire
Arrière-plan
Les PG pour les CHD sont calculés à l’aide d’informations statistiques résumées provenant d’études d’association pangénomiques spécifiques aux CHD (GWAS).
La pléiotropie, en revanche, est répandue dans les mécanismes biologiques et les variations liées à la maladie chevauchent fréquemment des voies causales présentant de nombreuses caractéristiques. En conséquence, l’intégration de données GWAS de variables supplémentaires peut améliorer les performances du PG pour CHD.
À propos de l’étude
La présente étude a examiné si un score polygénique avec divers PGS pour différentes caractéristiques liées aux maladies coronariennes serait plus fortement lié à la maladie coronarienne qu’une séquence génomique phénotypique spécifique à la maladie coronarienne.
Les chercheurs ont utilisé deux méthodologies similaires pour vérifier si une sommation linéairement pondérée des séquences phénotypiques du génome pour différentes variables peut améliorer la prédiction des maladies coronariennes en établissant deux scores multi-polygéniques :
- multiPGSCHDqui comprend 16 PGSS pour les maladies coronariennes et les facteurs contributifs développés à l’aide des statistiques GWAS pour les maladies coronariennes, et une autre maladie cardiovasculaire athéroscléreuse (ASCVD) comme ensemble de données de formation et la biobanque du Royaume-Uni (UKBB) comme ensemble de données de réglage, et
- ii) PGS étenduCHDen utilisant 3 170 PGS dans le catalogue de séquences phénotypiques du génome comme ensemble de données de formation et les données de l’étude sur le risque d’athérosclérose dans les communautés (ARIC) pour le réglage.
Les chercheurs ont évalué l’efficacité du PGS étenduCHD et multiPGSCHD parmi les individus de la Mayo Clinic, dont 43 578 adultes européens disposant de données de dossiers de santé électroniques (HER), dont 4 479 étaient des cas de coronaropathie, tandis que 39 099 étaient des témoins.
La régression Lasso a été utilisée pour entraîner les modèles de score multi-polygéniques. Les informations phénotypiques et génétiques dans la cohorte UKBB ont été générées en imputant l’ensemble de données du Wellcome Trust Center for Human Genetics.
Le panel du Human Reference Consortium (HRC) a imputé les données du génotype ARC. Regeneron Genetics a génotypé 1,4 million de variations dans la population de la Mayo Biobank vivant dans la communauté à l’aide du panel de polymorphisme mononucléotidique (SNP) Twist Diversity.
Variantes avec une fréquence d’allèle mineur (MAF) inférieure à 1,0 %, des données d’imputation inférieures à 0,30 dans l’UKBB, un taux d’appel inférieur à 0,990 et des valeurs p d’équilibre de Hardy-Weinberg (HWE) inférieures à 10.6 pour les cohortes Mayo Clinic et ARIC ont été exclues de l’analyse.
Les analyses de l’UKBB étaient limitées aux individus n’ayant aucun lien génétique avec d’autres individus. Le statut de CHD a été déterminé parmi les individus de la Mayo Biobank à l’aide des codes de diagnostic de la terminologie procédurale actuelle (CPT) et de la Classification internationale des maladies (CIM).
Les chercheurs n’ont pas utilisé les statistiques GWAS issues de méta-analyses, incluant des participants multi-ascendants dans lesquels l’UKBB était inclus en tant que cohorte.
Résultats
Dans des modèles comprenant 10 PC, l’âge et le sexe, une élévation d’un écart type du PGSCHD étendu et du multiPGSCHD était associée à un risque 1,7 fois et 1,7 fois plus élevé de maladie coronarienne, respectivement, chez les individus de Mayo Biobank.
Pendant ce temps, CHD_PRSCS, un score polygénique précédemment publié pour les maladies coronariennes, a augmenté la probabilité de 1,5. Une cardiopathie coronarienne était présente chez 18 %, 18 % et 16 % des patients dans les déciles supérieurs pour multiPGSCHD, extendPGSCHD et CHD_PRSCS, respectivement.
L’UKBB, une organisation non européenne, a été utilisée pour étudier la relation entre les différents statuts PGS et CHD. Une augmentation d’un écart-type du PGSCHD était liée à une augmentation de 1,8 fois du risque de maladie coronarienne.
Le modèle lasso, qui incluait PGSCHD et multiPGSCHDamélioration de la prédiction des CHD par rapport à un modèle avec uniquement des variables de base et seulement de manière marginale par rapport à un modèle avec PGSCHD.
La Mayo Biobank a également utilisé le PGSCHD et le multiPGSCHD pour les personnes d’origine non européenne. Lorsqu’il a été testé sur le même ensemble d’entraînement, le modèle lasso avait une aire sous la courbe (AUC) de 0,8.
Les PGS pour les maladies coronariennes, les maladies cardiovasculaires, l’athérosclérose coronarienne, les accidents vasculaires cérébraux ischémiques, l’hypertension et le diabète de type 2 étaient les plus significativement liés aux maladies coronariennes.
Les résultats ont indiqué que le PGS étenduCHD pourrait mieux réussir à stratifier les risques que les deux autres SPG. La création de PGS étendusCHDen revanche, nécessitait beaucoup de calculs en raison de la nécessité de calculer et de régler des milliers de PGS.
Les progrès peuvent être attribués à divers facteurs, notamment l’inclusion de PGS générés sur différentes ascendances et utilisant différentes méthodologies et les fonctionnalités supplémentaires incluses dans ExtendedPGS.CHD.
Conclusions
Dans l’ensemble, les résultats de l’étude ont montré que l’utilisation de plusieurs PGS pour les maladies cardiovasculaires (comme les maladies artérielles périphériques), les facteurs de risque (y compris l’hypertension et le diabète de type 2) et les marqueurs biologiques [including high-density lipoprotein-cholesterol (HDL-C) and non-HDL-C levels] amélioration de la prédiction des maladies coronariennes. MultiPGSCHD et PGS étenduCHD augmenté les performances de CHD_PRSCS.
Le multiPGSCHD et PGS étenduCHD les scores multipolygéniques ont montré une amélioration considérable des chances par écart type ; cependant, la différence entre leurs rapports de cotes était insignifiante.
Cette technique devrait connaître plus de succès si davantage de PGS sont créés à l’aide de GWAS plus grands et rendus disponibles dans des référentiels tels que le catalogue PGS, avec des implications pour les paramètres cliniques.