Les données sur les métabolites et l’IA se combinent pour redéfinir la façon dont nous mesurons le vieillissement et prévoyons l’espérance de vie.
Étude : L'âge métabolomique (MileAge) prédit la santé et la durée de vie : comparaison de plusieurs algorithmes d'apprentissage automatique. Crédit d'image : Sergueï Tarasov/Shutterstock
Dans une étude récente publiée dans la revue Avancées scientifiquesdes chercheurs du King's College de Londres ont exploré les horloges de vieillissement métabolomique à l'aide de modèles d'apprentissage automatique formés à partir des données sur les métabolites plasmatiques de la biobanque du Royaume-Uni. L’étude visait à évaluer le potentiel des horloges métabolomiques du vieillissement dans la prévision des résultats en matière de santé et de la durée de vie en évaluant leur précision, leur robustesse et leur pertinence par rapport aux indicateurs biologiques du vieillissement au-delà de l’âge chronologique.
Sommaire
Arrière-plan
Le vieillissement biologique, distinct de l'âge chronologique, reflète les dommages moléculaires et cellulaires qui influencent la santé et la susceptibilité aux maladies. L’âge chronologique ne peut à lui seul rendre compte de la variabilité des états physiologiques liés au vieillissement chez les individus. Cependant, les progrès récents dans les technologies omiques, en particulier la métabolomique, ont permis de mieux comprendre le vieillissement biologique grâce au profilage moléculaire.
Les métabolites, ou petites molécules issues des voies métaboliques, peuvent fournir des évaluations de la santé physiologique et sont liés aux résultats liés au vieillissement, tels que les maladies chroniques et la mortalité. Des études antérieures ont corrélé les données métabolomiques avec le vieillissement, mais ont été limitées par la taille limitée des échantillons et des marqueurs.
Des efforts récents visant à dériver des « horloges de vieillissement » à l'aide de l'apprentissage automatique à partir de données omiques ont démontré un pouvoir prédictif significatif pour les résultats en matière de santé. Cependant, il reste encore des défis à relever pour optimiser la précision et l’interprétabilité de ces modèles, notamment en utilisant la métabolomique.
L'étude actuelle
La présente étude a utilisé la spectroscopie de résonance magnétique nucléaire (RMN) pour analyser les données sur les métabolites plasmatiques de la biobanque britannique, impliquant 225 212 participants âgés de 37 à 73 ans. Les critères d'exclusion comprenaient la grossesse, les incohérences des données et les valeurs extrêmes des métabolites. L'ensemble de données comprenait 168 métabolites représentant les profils lipidiques, les acides aminés et les produits de glycolyse.
Les chercheurs ont appliqué 17 algorithmes d’apprentissage automatique, notamment la régression linéaire, les modèles arborescents et les techniques d’ensemble, à l’ensemble de données pour développer des horloges de vieillissement métabolomique. Ils ont également utilisé une approche rigoureuse de validation croisée imbriquée pour garantir une évaluation robuste du modèle.
Certaines des principales étapes de prétraitement comprenaient la gestion des valeurs aberrantes des métabolites et la correction des biais de prévision de l'âge inhérents aux modèles. Les modèles prédictifs visaient à estimer l'âge chronologique à l'aide de profils de métabolites, et les différences entre les âges prédits et réels étaient définies comme le « delta MileAge ». Des corrections statistiques ont été largement appliquées pour éliminer les biais systématiques et améliorer la précision des prévisions, en particulier pour les tranches d’âge plus jeunes et plus âgées.
Les modèles ont été évalués pour leur précision prédictive à l’aide de mesures telles que l’erreur absolue moyenne (MAE), l’erreur quadratique moyenne (RMSE) et les coefficients de corrélation. Par exemple, le modèle de régression cubiste a atteint un MAE de 5,31 ans, surpassant d'autres modèles comme les splines de régression adaptative multivariée (MAE = 6,36 ans). Une analyse plus approfondie a ajusté les prédictions pour éliminer les biais systématiques et améliorer leur alignement sur l'âge chronologique.
Conception et aperçu de l’étude. (A) Aperçu de l’approche de validation croisée imbriquée. MAE, erreur absolue moyenne ; RMSE, erreur quadratique moyenne. (B) Histogramme de la répartition chronologique par âge de l’échantillon analytique. Le mode statistique (âge, 61 ans) est affiché en rouge. (C) Distribution des niveaux de métabolites par âge chronologique, montrant des nuages de points de toutes les observations et des courbes lisses (notez la différence dans l’échelle de l’axe y). Les courbes lisses ont été estimées à l'aide de modèles additifs généralisés, avec des zones ombrées correspondant à des intervalles de confiance (IC) à 95 %. GlycA, glycoprotéines acétyles. (D) Nuage de points montrant le rapport de risque (HR) pour la mortalité toutes causes confondues et la bêta pour l’âge chronologique associé à une différence d’un écart-type dans les niveaux de métabolites. Les métabolites qui présentaient des associations statistiquement significatives avec l'âge chronologique et la mortalité toutes causes confondues sont indiqués en violet.
Résultats
Les résultats ont indiqué que les horloges de vieillissement métabolomique développées à partir des profils de métabolites plasmatiques pourraient différencier efficacement le vieillissement biologique du vieillissement chronologique. Parmi les différents modèles testés dans l’étude, le modèle de régression basé sur des règles cubistes a fourni les associations prédictives les plus fortes avec les marqueurs de santé et la mortalité et a surpassé les autres algorithmes en termes de précision et de robustesse.
De plus, les valeurs positives du delta MileAge, qui indiquaient un vieillissement accéléré, étaient liées à la fragilité, à des télomères plus courts, à une morbidité plus élevée et à un risque de mortalité accru. Plus précisément, une augmentation sur un an du delta du MileAge correspondait à une augmentation de 4 % du risque de mortalité toutes causes confondues, avec des rapports de risque (HR) dépassant 1,5 dans les cas extrêmes.
De plus, l’étude a montré que les personnes souffrant d’un vieillissement accéléré étaient plus susceptibles de déclarer une moins bonne santé et de souffrir de maladies chroniques. Les associations avec la fragilité et l’attrition des télomères étaient particulièrement prononcées, certaines différences équivalant à une disparité sur 18 ans dans les scores de l’indice de fragilité. Il est intéressant de noter que les femmes présentaient des deltas d’âge kilométrique légèrement plus élevés que les hommes dans la plupart des modèles.
L'étude a également confirmé la nature non linéaire des relations métabolites-âge et a souligné l'utilité des corrections statistiques pour améliorer la précision des prévisions. De plus, la comparaison des marqueurs de vieillissement existants a montré que les horloges métabolomiques du vieillissement captaient des signaux uniques liés à la santé et surpassaient souvent les prédicteurs les plus simples. Cependant, les résultats ont mis en évidence que le vieillissement ralenti (deltas de MileAge négatifs) ne se traduisait pas systématiquement par de meilleurs résultats en matière de santé, soulignant la complexité des mesures du vieillissement biologique.
Conclusions
Dans l’ensemble, l’étude a démontré l’utilité des horloges métabolomiques du vieillissement pour prédire le vieillissement biologique et les résultats de santé associés. En comparant plusieurs algorithmes d'apprentissage automatique, les résultats ont également montré les performances supérieures du modèle basé sur des règles cubistes pour relier les âges dérivés des métabolites aux marqueurs de santé et à la mortalité.
Les résultats suggèrent que les horloges de vieillissement métabolomiques recèlent un potentiel de gestion proactive de la santé et de stratification des risques et soulignent la nécessité d'une validation plus approfondie auprès de diverses populations et de données longitudinales pour une application clinique plus large. Cette étude établit une nouvelle référence pour le développement d’algorithmes, illustrant comment les profils métabolomiques peuvent offrir des informations exploitables sur le vieillissement et la santé.