Un modèle d’IA peut prédire avec précision le risque de cancer du foie, suggère une étude

Un modèle d’apprentissage automatique pourrait-il aider les cliniciens à identifier plus tôt le risque de cancer du foie ? Crédit image : MoMo Productions/Getty Images

Un modèle d'apprentissage automatique a prédit avec précision le risque de carcinome hépatocellulaire (CHC) à l'aide de données cliniques de routine.
Le modèle a surpassé les outils existants sur le risque de cancer du foie en identifiant davantage de cas vrais tout en réduisant les faux positifs.
L'étude suggère que l'ajout de données complexes, telles que la génomique, n'a pas amélioré les performances, ce qui indique que des données cliniques simples et largement disponibles sont suffisantes pour une prévision efficace des risques.
L’outil pourrait aider les cliniciens à détecter plus tôt les personnes à risque, y compris celles sans maladie hépatique diagnostiquée, améliorant ainsi potentiellement le dépistage et les résultats pour les patients s’il est davantage validé.

Le cancer du foie est le sixième cause principale de décès par cancer aux États-Unis. Le carcinome hépatocellulaire (CHC) est le type le plus courant du cancer du foie chez l’adulte, représentant la majorité des cas. Cela survient généralement chez les personnes atteintes d'une maladie hépatique chronique résultant d'une hépatite ou d'une cirrhose.

Il n’est pas rare que des personnes reçoivent un diagnostic de CHC à un stade avancé. En effet, elle est généralement asymptomatique aux premiers stades. Les lignes directrices actuelles en matière de dépistage se concentrent principalement sur les personnes atteintes d'une maladie hépatique chronique existante.

Cependant, environ 20 % des cas de CHC peuvent survenir chez des personnes ne présentant aucun signe de maladie hépatique. Ainsi, ces personnes risquent également de recevoir un diagnostic tardif car elles ne répondent pas aux critères de surveillance.

Un diagnostic précoce du CHC est essentiel, car les personnes qui reçoivent un diagnostic tardif peuvent ne pas être adaptées aux options de traitement actuelles.

L’application potentielle de l’intelligence artificielle (IA) à la détection précoce du CHC suscite un intérêt croissant. Aujourd’hui, une nouvelle étude publiée dans Cancer Discovery suggère qu’un outil d’apprentissage automatique est capable de prédire le risque de CHC avec une grande précision.

Sommaire

L'étude met en valeur les lacunes des approches de dépistage actuelles

Bien que la maladie hépatique sous-jacente soit connue comme le facteur de risque le plus courant du CHC, les données probantes mettent en évidence le rôle d’autres facteurs, tels que le fait d’être un homme, le tabagisme et la consommation excessive d’alcool. Comme de multiples facteurs peuvent influencer le risque de CHC, l’identification des personnes à risque reste un défi en pratique clinique.

Pour résoudre ce problème, une équipe de recherche dirigée par Carolin Schneider, MD, professeur adjoint à l'Université RWTH d'Aix-la-Chapelle, s'est tournée vers l'apprentissage automatique, une forme d'IA capable d'analyser des ensembles de données complexes et d'identifier simultanément des modèles sur plusieurs variables.

Les chercheurs ont utilisé les données de la UK Biobank, qui comprend des informations sur la santé de plus de 500 000 personnes. Parmi ces participants, 538 cas de CHC ont été identifiés. Près de 70 % de ces cas sont survenus chez des personnes sans diagnostic préalable de cirrhose ou de maladie hépatique chronique.

Le modèle d'apprentissage automatique a été formé sur 80 % de l'ensemble de données et a effectué une première validation sur les 20 % restants.

Pour tester le modèle auprès d’une population plus large, l’équipe a également procédé à une validation externe à l’aide du programme de recherche All of Us. Cela comprenait des données provenant de plus de 400 000 personnes aux États-Unis et un bassin de participants plus diversifié. Le registre comprenait 445 cas de CHC.

Schneider a dit Actualités médicales aujourd'hui sur l’impact potentiel de cet outil : « Nous espérons que notre pré-dépistage pourra être utilisé en soins primaires pour trier ceux qui devraient recevoir des soins hépatologiques supplémentaires. »

« En identifiant potentiellement plus de personnes à risque plus tôt, nous pouvons développer des voies pour les orienter vers le dépistage ou la surveillance. Espérons que cela nous aidera à détecter le CHC à un stade plus précoce, car une détection plus précoce du CHC est fortement liée à des options de traitement plus curatives. »
– Caroline Schneider, MD

Des données cliniques simples se sont révélées très efficaces

Le modèle d’apprentissage automatique utilisait une approche de « forêt aléatoire ». Ceci décrit un algorithme qui combine les résultats de plusieurs arbres de décision pour générer des prédictions. Les chercheurs ont testé des modèles construits à partir de différents types de données cliniques.

La version la plus efficace, appelée modèle C, combinait les données démographiques des patients, les dossiers de santé électroniques et les résultats des analyses de sang de routine.

Les performances de ces modèles ont été évaluées en calculant l'aire sous la caractéristique de fonctionnement du récepteur (AUROC). Il s'agit d'une mesure de performance qui décrit la capacité de l'algorithme à faire la distinction entre deux groupes. Dans ce cas, ceux de la cohorte de validation avec CHC par rapport à ceux sans.

L’algorithme a obtenu un score AUROC de 0,88, 1 étant un score parfait. Cela indique que le modèle présente une grande précision dans la distinction entre les patients avec et sans CHC.

Notamment, l’ajout de données plus complexes, telles que la génomique, n’a pas amélioré de manière significative les performances. Cela suggère qu’il pourrait être possible de prédire le risque de CHC à l’aide de données cliniques simples et facilement disponibles sans avoir recours à des tests plus coûteux.

Surpassant les modèles actuels

Les chercheurs ont également comparé leur modèle avec des outils cliniques courants, notamment FIB-4, APRI, NFS et le score aMAP. Les professionnels de la santé utilisent généralement ces modèles pour évaluer la fibrose hépatique ou le risque de cancer chez les personnes atteintes d'une maladie hépatique connue.

Les résultats suggèrent que le modèle d’apprentissage automatique a globalement mieux fonctionné, identifiant davantage de cas réels de CHC, tout en réduisant les faux positifs.

« Les approches de surveillance actuelles sont largement basées sur la cirrhose, mais elles négligent les cas de CHC, car les maladies chroniques du foie, et en particulier la cirrhose, sont souvent sous-diagnostiquées », a déclaré Schneider. MNT.

« Notre modèle introduit une approche de présélection sur les données de routine telles que les informations démographiques de base, le mode de vie et les diagnostics ainsi que les tests de laboratoire de routine. Cette approche nous a permis d'identifier les individus à risque de CHC avec une meilleure précision/rappel que les scores actuellement utilisés dans notre cohorte testée », a-t-elle noté.

Pour rendre le modèle C plus pratique pour une utilisation clinique de routine, l’équipe l’a encore simplifié en réduisant le nombre de caractéristiques cliniques qu’elle examine. La version simplifiée examine seulement 15 caractéristiques cliniques régulièrement collectées et surpasse toujours les modèles existants.

« Nous avons présenté notre score final de manière à ce qu'il soit facilement transférable à d'autres systèmes de santé. Le modèle du top 15 se compose uniquement de paramètres mesurés en routine et nous fournissons du code pour l'exécuter sur des serveurs locaux », a ajouté Schneider.

Impact potentiel sur la détection précoce et les résultats pour les patients

Ces résultats suggèrent que le modèle pourrait aider les médecins de soins primaires à identifier ceux qui pourraient autrement être négligés dans le cadre des lignes directrices actuelles en matière de dépistage et à les orienter vers un dépistage du cancer du foie.

Cela pourrait être important pour le CHC, qui est souvent agressif mais plus facile à traiter lorsqu'il est détecté tôt.

Bien que le modèle C ait été principalement formé sur les données de participants blancs de la biobanque britannique, il a maintenu de solides performances lorsqu'il a été testé auprès de populations plus ethniquement diverses dans l'ensemble de données All of Us. Cela suggère que l’approche pourrait être largement applicable à différents groupes démographiques.

« Nos résultats soutiennent la transportabilité potentielle de notre modèle, mais nous souhaitons évidemment tester notre modèle dans autant de systèmes de santé que possible pour voir de quels facteurs dépend une bonne transportabilité et effectuer un calibrage et une validation régionaux », a déclaré Schneider.

Limites de l’étude et prochaines étapes

Bien que les résultats soient prometteurs, les auteurs notent plusieurs limites de l'étude. Ceux-ci incluent la conception rétrospective et le nombre relativement faible de participants atteints d'hépatite virale, l'une des principales causes de CHC.

Interrogé sur les projets futurs de test de ce modèle, Schneider a répondu MNT: « Nous avons besoin d'une validation prospective multicentrique qui montre que notre score identifie bien les patients qui ont besoin de soins hépatologiques. »

« L'incidence du CHC est faible, mais son déploiement dans les grands systèmes de santé nous aidera à valider de manière prospective notre pré-dépistage. Nous avons donc rendu le score et le pipeline complet librement disponibles, dans le but explicite de permettre des tests indépendants et une validation externe dans de nombreux systèmes de santé », a-t-elle ajouté.

Schneider a conclu : « Nous espérons que plusieurs sites cliniques testeront le modèle et sommes heureux de nous soutenir ! »

Bien que des recherches supplémentaires soient encore nécessaires pour valider le modèle C dans des populations supplémentaires et dans des contextes cliniques réels, les résultats mettent en évidence le potentiel croissant de l'IA dans les soins de santé, en particulier pour améliorer les stratégies de détection précoce de maladies telles que le cancer du foie.