Dans une étude récente publiée dans The Lancet Healthy Longevity, les chercheurs ont introduit un cadre d’estimation informatique de l’âge biologique explicable (ENABL Age) combinant l’apprentissage automatique avec l’intelligence artificielle explicable (XAI) pour prédire l’âge biologique avec des explications personnalisées.
Étude: ExplaiNAble BioLogical Age (ENABL Age) : un cadre d’intelligence artificielle pour un âge biologique interprétable. Crédit d’image : Nan_Got/Shutterstock.com
Sommaire
Arrière-plan
Le vieillissement exacerbe divers troubles liés à l’âge, tels que les maladies cardiaques, la neurodégénérescence et le cancer. La période écoulée depuis la naissance indique l’âge chronologique, tandis que le vieillissement est la réduction constante d’une fonction biologique qui augmente le risque de maladie ou de mortalité.
Mesurer l’état de vieillissement d’un individu (c’est-à-dire prédire l’âge biologique) est crucial pour comprendre et traiter les troubles liés à l’âge et augmenter la durée de vie. Bien que les horloges existantes utilisées pour l’estimation de l’âge biologique soient utiles, elles compromettent souvent l’interprétabilité et la précision.
Les études se sont concentrées sur les horloges biologiques de première génération visant à prédire l’âge chronologique. Ces horloges ont moins de liens avec le risque de mortalité que les horloges de deuxième génération, et leurs relations avec d’autres résultats du vieillissement sont variées.
Un nombre limité d’horloges biologiques de deuxième génération, telles que PhenoAge et GrimAge, ont été construites directement à partir des résultats du vieillissement. Cependant, ces investigations utilisaient des modèles linéaires et n’apportaient pas d’explications personnalisées.
À propos de l’étude
Dans la présente étude, les chercheurs ont présenté l’âge ENABL, une avancée par rapport aux méthodes existantes d’estimation de l’âge biologique.
Contrairement à d’autres méthodes, NABL Age a utilisé une approche combinant un apprentissage automatique compliqué avec des techniques XAI pour estimer directement les résultats associés à l’âge et transformer les estimations en âge biologique.
Des techniques XAI améliorées ont été utilisées pour dériver les valeurs des explications additives de Shapley (SHAP) et déterminer dans quelle mesure les caractéristiques d’entrée ont contribué à l’estimation de l’âge ENABL.
Pour développer l’horloge biologique ENABL Age, l’équipe a estimé un résultat associé à l’âge (par exemple, mortalité par cause ou toutes causes confondues) à l’aide d’arbres à gradient proportionnel de Cox (GBT) et de rapports de risque (HR), puis a redimensionné les estimations pour prédire l’âge biologique en analysant les données de l’Enquête nationale sur la santé et la nutrition (NHANES) et de la Biobanque du Royaume-Uni (UKBB).
Les âges individuels estimés par ENABL ont été décomposés en variables de risque à l’aide des méthodologies XAI existantes.
En outre, l’équipe a présenté des utilisations pratiques du modèle à travers deux variantes de l’horloge ENABL Age, à savoir ENABL Age clock-Q (utilisant les fonctionnalités du questionnaire) et ENABL Age-L (utilisant des analyses de sang régulières). Enfin, les mécanismes de vieillissement élucidés par les horloges d’âge ENABL ont été validés en effectuant une analyse d’association à l’aide de données d’études d’association pangénomiques (GWAS).
Les chercheurs ont réestimé les poids BioAge et PhenoAge (horloges d’estimation de l’âge biologique de deuxième génération construites avec des caractéristiques phénotypiques) sur les ensembles de données NHANES et UKBB.
Quatre-vingt pour cent des données ont été utilisées pour la formation, tandis que 20 % ont été utilisées pour la validation. L’ensemble de données UKBB comprenait 501 366 échantillons provenant d’individus âgés de 40 à 70 ans inscrits entre 2007 et 2014 en Écosse, au Pays de Galles et en Angleterre, et l’ensemble de données NHANES comprenait 47 084 échantillons provenant de résidents des États-Unis âgés de 18 à 80 ans inscrits à partir de 1999. à 2014.
Les caractéristiques manquantes dans la plupart des échantillons, les caractéristiques hautement corrélées et les personnes décédées pour des raisons externes ont été exclues.
Résultats
L’âge biologique estimé par l’ENABL a montré des corrélations significatives avec l’âge chronologique des participants (valeurs r de 0,8 et 0,7 pour les ensembles de données UKBB et NHANES, respectivement).
Les horloges pourraient distinguer les individus en bonne santé (c’est-à-dire dont l’âge chronologique dépasse l’âge biologique estimé par ENABL) de leurs homologues en mauvaise santé (c’est-à-dire, l’âge ENABL dépassant l’âge chronologique), estimant la mortalité plus efficacement que les horloges d’estimation d’âge existantes.
Les individus en mauvaise santé présentaient des log HR 3,0 à 12 fois plus élevés que les individus en bonne santé dans la méthode d’estimation de l’âge ENABL.
L’âge d’ENABL a atteint un pouvoir d’estimation de mortalité élevé, comme l’indiquent les valeurs de l’aire sous la courbe des caractéristiques de fonctionnement du récepteur (ROC) (AUC) de 0,8 pour la mortalité à cinq et dix ans parmi les participants à l’UKBB et de 0,9 pour les estimations de mortalité correspondantes parmi les participants à la NHANES.
ENABL Age a surpassé BioAge et PhenoAge dans les analyses de validation. Les explications individualisées révélant les contributions de caractéristiques particulières à l’âge ENABL ont fourni des informations précieuses sur le vieillissement.
Les analyses d’association avec les morbidités et les déterminants du risque associés au vieillissement ainsi que les résultats d’études d’association à l’échelle du génome sur les horloges d’estimation de l’âge ENABL développées à partir de plusieurs causes de mortalité ont montré que l’âge ENABL capturait des mécanismes distincts du vieillissement.
De plus, ENABL Age a capturé des parcours liés au vieillissement plus complets que BioAge et PhenoAge en utilisant n’importe quelle fonctionnalité disponible, fournissant ainsi une image plus réaliste de l’état de santé d’un individu, avec une accélération rapide d’ENABL Age indiquant une augmentation significative du risque de mortalité.
Le principal apport de la méthode réside dans sa grande interprétabilité. Les modèles arborescents ont obtenu de meilleurs résultats que les modèles linéaires pour l’ensemble de données UKBB, améliorant considérablement presque toutes les tâches d’estimation de la mortalité (circulatoire, respiratoire, digestive, toutes causes confondues, néoplasmes et autres causes).
De même, pour l’ensemble de données NHANES, les GBT ont surpassé les modèles linéaires dans sept tâches d’estimation de la mortalité sur dix, avec des améliorations significatives dans trois tâches.
Les performances d’estimation supérieures des GBT indiquent qu’elles pourraient capturer efficacement les signaux liés à la mortalité, qui sont également fortement associés au vieillissement.
Conclusion
Sur la base des résultats de l’étude, ENABL Age constitue une avancée significative dans l’utilisation de l’apprentissage automatique et de XAI pour estimer l’âge biologique. Cette avancée élargit la portée des études sur l’estimation de l’âge biologique.
ENABL Age s’est également révélé remarquablement prometteur dans des contextes cliniques, où il pourrait aider les professionnels de la santé à démêler les complexités des systèmes liés au vieillissement, s’avérant ainsi bénéfique pour une prise de décision clinique éclairée.