Un modèle d’intelligence artificielle (IA) formé à l’aide d’informations séquentielles sur la santé dérivées de dossiers de santé électroniques a identifié un sous-ensemble d’individus présentant un risque 25 fois plus élevé de développer un cancer du pancréas dans les trois à 36 mois, selon les résultats présentés lors de la réunion annuelle 2022 de l’AACR, qui s’est tenue 8-13 avril.
« Pour le moment, il n’existe pas de biomarqueurs ou d’outils de dépistage fiables capables de détecter précocement le cancer du pancréas », a déclaré Bo Yuan, doctorant à l’Université de Harvard, qui a présenté l’étude. « Le but de cette étude était de développer un outil d’intelligence artificielle qui peut aider les cliniciens à identifier les personnes à haut risque de cancer du pancréas afin qu’elles puissent être inscrites à des programmes de prévention ou de surveillance et, espérons-le, bénéficier d’un traitement précoce. »
Le cancer du pancréas est un type de cancer agressif qui est souvent diagnostiqué à des stades ultérieurs en raison de son absence de symptômes précoces et a donc un pronostic relativement sombre, a déclaré Davide Placido, doctorant à l’Université de Copenhague et co-premier auteur de l’étude. Détecter le cancer du pancréas plus tôt dans l’évolution de la maladie peut améliorer les options de traitement pour ces patients, a-t-il noté.
Les progrès récents de l’IA ont conduit les chercheurs à développer des algorithmes de prédiction des risques pour divers types de cancer à l’aide d’images radiologiques, de diapositives de pathologie et de dossiers de santé électroniques. Les modèles tentant d’utiliser des diagnostics médicaux précancéreux – tels que les ulcères gastriques, la pancréatite et le diabète – comme indicateurs du risque de cancer du pancréas ont eu un certain succès, mais Yuan et ses collègues ont cherché à développer des modèles plus précis en incorporant des concepts d’algorithmes de traitement du langage.
Nous nous sommes inspirés de la similitude entre les trajectoires de la maladie et la séquence des mots en langage naturel. Les modèles précédemment utilisés n’utilisaient pas la séquence des diagnostics de maladie dans les dossiers médicaux d’un individu. Si vous considérez chaque diagnostic comme un mot, alors les modèles précédents traitaient les diagnostics comme un sac de mots plutôt qu’une séquence de mots qui forme une phrase complète. »
Bo Yuan, doctorant à l’Université de Harvard
Les chercheurs ont formé leur méthode d’IA à l’aide des dossiers de santé électroniques du registre national danois des patients, qui comprenait les dossiers de 6,1 millions de patients traités entre 1977 et 2018, dont environ 24 000 ont développé un cancer du pancréas. Les chercheurs ont saisi la séquence des diagnostics médicaux de chaque patient pour enseigner au modèle quels schémas de diagnostic étaient les plus prédictifs du risque de cancer du pancréas.
Les chercheurs ont ensuite testé la capacité de l’outil d’IA à prédire la survenue d’un cancer du pancréas dans des intervalles allant de trois à 60 mois après l’évaluation des risques.
À un seuil fixé pour minimiser les faux positifs, les personnes considérées comme « à haut risque » étaient 25 fois plus susceptibles de développer un cancer du pancréas de trois à 36 mois que les patients en dessous du seuil de risque. En revanche, un modèle qui ne tenait pas compte de la séquence des événements pathologiques précancéreux entraînait un risque accru considérablement plus faible pour les patients au-dessus d’un seuil correspondant.
Les chercheurs ont ensuite validé leurs découvertes en utilisant les dossiers médicaux électroniques du Mass General Brigham Health Care System. Les différences dans les pratiques de soins de santé et de tenue de dossiers entre les différents systèmes de soins de santé ont nécessité le recyclage du modèle sur le nouvel ensemble de données, a déclaré Yuan, et lors du recyclage, le modèle a fonctionné avec une précision comparable ; l’aire sous la courbe (une mesure de précision qui augmente à mesure que la valeur approche de 1) pour cet ensemble de données était de 0,88 contre 0,87 pour l’ensemble d’apprentissage d’origine.
Bien que la plupart des prises de décision de l’IA se soient produites dans les « couches cachées » d’un réseau neuronal complexe, ce qui rend difficile pour les chercheurs de déterminer exactement quels schémas de diagnostic prédisent le risque, Yuan et ses collègues ont trouvé des associations significatives avec certaines caractéristiques cliniques et le développement du cancer du pancréas. Par exemple, les diagnostics de diabète, de maladies du pancréas et des voies biliaires, d’ulcères gastriques et autres étaient associés à un risque accru de cancer du pancréas. Bien que ces connaissances puissent améliorer la stratification traditionnelle des risques dans certains cas, l’avantage de l’outil d’IA est qu’il intègre des informations sur les facteurs de risque dans le contexte de l’historique de la maladie d’un patient, a déclaré Placido.
« Le système d’IA s’appuie sur ces fonctionnalités dans leur contexte, et non de manière isolée », a déclaré Yuan.
Les chercheurs-; y compris le co-premier auteur Jessica Hjaltelin, PhD; les co-auteurs principaux Søren Brunak, PhD, et Chris Sander, PhD ; et les collaborateurs Peter Kraft, Ph.D., Michael Rosenthal, MD, PhD, et Brian Wolpin, MD, MPH-; espérons que cette recherche, une fois évaluée dans des essais cliniques, conduira à identifier les patients présentant un risque élevé de cancer du pancréas. Cela pourrait potentiellement aider à recruter des patients à haut risque dans des programmes centrés sur la prévention et un dépistage accru pour une détection précoce. Si le cancer est détecté tôt, a déclaré Placido, les chances de succès du traitement sont plus élevées.
« Ces résultats indiquent le potentiel des technologies informatiques avancées, telles que l’IA et l’apprentissage en profondeur, pour faire des prédictions de plus en plus précises basées sur l’historique de santé et de maladie de chaque personne », a déclaré Yuan.
Les limites de cette étude comprennent les difficultés de normalisation des données de santé électroniques entre différents systèmes de santé, en particulier dans différents pays, nécessitant la formation indépendante et l’application du modèle d’IA à différents ensembles de données. Des analyses supplémentaires sont également nécessaires pour tenir compte explicitement de la diversité ethnique. De plus, la précision de la prédiction diminue avec des intervalles de temps plus longs entre l’évaluation du risque et l’apparition du cancer.