Un programme d'intelligence artificielle a créé des explications sur les résultats des tests cardiaques qui étaient dans la plupart des cas précises, pertinentes et faciles à comprendre par les patients, selon une nouvelle étude.
L'étude a porté sur l'échocardiogramme (écho), qui utilise des ondes sonores pour créer des images du sang circulant dans les cavités et les valves du cœur. Les rapports d'écho comprennent des mesures numériques générées par ordinateur de la fonction, ainsi que des commentaires du cardiologue interprète sur la taille du cœur, la pression dans ses vaisseaux et l'épaisseur des tissus, qui peuvent signaler la présence d'une maladie. Sous la forme généralement générée par les médecins, les rapports sont difficiles à comprendre pour les patients, ce qui entraîne souvent des inquiétudes inutiles, affirment les auteurs de l'étude.
Pour résoudre ce problème, NYU Langone Health a testé les capacités d’une forme d’intelligence artificielle (IA) qui génère des options probables pour le mot suivant dans n’importe quelle phrase en fonction de la façon dont les gens utilisent les mots dans leur contexte sur Internet. L’un des résultats de cette prédiction du mot suivant est que ces « chatbots » génératifs d’IA peuvent répondre à des questions dans un langage simple. Cependant, les programmes d’IA – qui fonctionnent sur la base de probabilités au lieu de « réfléchir » et peuvent produire des résumés inexacts – sont censés assister, et non remplacer, les prestataires humains.
En mars 2023, NYU Langone a demandé à OpenAI, la société qui a créé le chatbot chatGPT, l'accès au dernier outil d'IA générative de la société, GPT4. NYU Langone Health a obtenu une licence pour l'une des premières « instances privées » de l'outil, ce qui a permis aux cliniciens d'expérimenter l'IA en utilisant des données de patients réels tout en respectant les règles de confidentialité.
À l'issue de cet effort et publié en ligne le 31 juillet dans le Journal de l'American College of Cardiology (JACC) Imagerie cardiovasculairel'étude actuelle a analysé une centaine de rapports rédigés par des médecins sur un type courant de test d'écho pour voir si GPT4 pouvait générer efficacement des explications conviviales des résultats des tests. Cinq échocardiographistes certifiés ont évalué les explications d'échographie générées par l'IA sur des échelles de cinq points en termes d'exactitude, de pertinence et de compréhensibilité, et ont convenu ou tout à fait convenu que 73 % d'entre elles pouvaient être envoyées aux patients sans aucune modification.
Toutes les explications de l'IA ont été jugées « entièrement vraies » (84 %) ou en grande partie correctes (16 %). En termes de pertinence, 76 % des explications ont été jugées comme contenant « toutes les informations importantes », 15 % « la plupart d'entre elles », 7 % « environ la moitié » et 2 % « moins de la moitié ». Aucune des explications comportant des informations manquantes n'a été jugée « potentiellement dangereuse », précisent les auteurs.
Notre étude, la première à évaluer GPT4 de cette manière, montre que les modèles d'IA génératifs peuvent être efficaces pour aider les cliniciens à expliquer les résultats de l'échocardiogramme aux patients. Des explications rapides et précises peuvent atténuer l'inquiétude des patients et réduire le volume parfois écrasant de messages des patients adressés aux cliniciens.
Dr Lior Jankelson, Ph. D., auteur correspondant, professeur associé de médecine à la NYU Grossman School of Medicine et responsable de l'intelligence artificielle pour la cardiologie à NYU Langone
Selon les auteurs de l’étude, l’obligation fédérale de communiquer immédiatement les résultats des tests aux patients, par le biais de la loi 21st Century Cures Act de 2016, a entraîné une augmentation spectaculaire du nombre de demandes de renseignements auprès des médecins. Les patients reçoivent les résultats bruts des tests, ne les comprennent pas et deviennent anxieux lorsqu’ils attendent que les médecins leur fournissent des explications, affirment les chercheurs.
Idéalement, les cliniciens devraient informer les patients des résultats de leur échocardiogramme dès qu’ils sont publiés, mais cela est retardé car les prestataires ont du mal à saisir manuellement de grandes quantités d’informations connexes dans le dossier médical électronique.
« Si les outils d’IA sont suffisamment fiables, ils pourraient aider les cliniciens à expliquer les résultats au moment où ils sont publiés », a déclaré le Dr Jacob Martin, premier auteur de l’étude et chercheur en cardiologie à NYU Langone. « Notre objectif est de mesurer l’impact des explications rédigées par l’IA et affinées par les cliniciens sur l’anxiété, la satisfaction et la charge de travail des patients. »
La nouvelle étude a également révélé que 16 % des explications fournies par l'IA contenaient des informations inexactes. Dans l'une des erreurs, le rapport d'échocardiogramme de l'IA indiquait qu'« une petite quantité de liquide, appelée épanchement pleural, était présente dans l'espace entourant votre poumon droit ». L'outil a conclu à tort que l'épanchement était faible, une erreur connue dans le secteur sous le nom d'« hallucination » de l'IA. Les chercheurs ont souligné que la supervision humaine est importante pour affiner les ébauches de l'IA, notamment pour corriger les inexactitudes avant qu'elles n'atteignent les patients.
L’équipe de recherche a également interrogé des participants sans formation clinique, recrutés pour obtenir le point de vue de profanes sur la clarté des explications de l’IA. En bref, ils ont été bien accueillis, ont déclaré les auteurs. Les participants non cliniques ont trouvé que 97 % des réécritures générées par l’IA étaient plus compréhensibles que les rapports originaux, ce qui a réduit les inquiétudes dans de nombreux cas.
« Cette analyse complémentaire souligne le potentiel de l'IA pour améliorer la compréhension des patients et atténuer leur anxiété », a ajouté Martin. « Notre prochaine étape consistera à intégrer ces outils perfectionnés dans la pratique clinique pour améliorer les soins aux patients et réduire la charge de travail des cliniciens. »
Aux côtés de Martin et Jankelson, les auteurs de l'étude NYU Langone étaient Muhamed Saric, Alan Vainrib, Daniel Bamira, Samuel Bernard, Richard Ro, Theodore Hill et Larry Chinitz de la division de cardiologie Leon H. Charney ; Jonathan Austrian et Yindalon Aphinyanaphongs du Medical Center Information Technology (MCIT) ; Hao Zhang et Vidya Koesmahargyo du Center for Healthcare Innovation & Delivery Science du département de santé de la population et Mathew Williams du département de chirurgie cardiothoracique.