Dans une récente étude publiée sur Prépublications avec The Lancet* Serveur de préimpression SSRN, des chercheurs de Guangzhou, en Chine, ont développé un système de diagnostic basé sur le traitement du langage naturel (PNL) ou l’intelligence artificielle (IA), LungDiag, pour diagnostiquer les maladies respiratoires à l’aide des dossiers de santé électroniques (DSE) de plusieurs hôpitaux en Chine.
De plus, ils ont comparé les performances de LungDiag en externe avec les médecins et ChatGPT 4.0.
Étude: LungDiag : Renforcer l’intelligence artificielle pour le diagnostic des maladies respiratoires grâce aux dossiers de santé électroniques. Crédit d’image : SomYuZu/Shutterstock.com
*Avis important: SSRN publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique/les comportements liés à la santé, ou traités comme des informations établies.
Sommaire
Arrière-plan
Le fardeau des maladies respiratoires augmente à l’échelle mondiale. Bon nombre de ces maladies partagent des symptômes et sont donc difficiles à diagnostiquer, ce qui, à son tour, entrave l’initiation d’un traitement en temps opportun. En conséquence, les résultats pour les patients sont médiocres et les coûts des soins de santé augmentent.
Ainsi, le Forum des sociétés respiratoires internationales (FIRS) a fait de la prévention et du diagnostic précoce des maladies respiratoires une priorité de recherche.
En raison de la diversité des données et des structures complexes, les DSE sont très peu structurés. Sa partie structurée, bien que relativement petite, comprend les diagnostics des patients, les prescriptions et les résultats des tests de laboratoire, tandis que les notes cliniques constituent sa partie non structurée.
À l’échelle mondiale, les DSE ont été adoptés comme sources de « mégadonnées » de données sur les soins de santé. Ainsi, si un algorithme NLP pouvait aider à extraire le phénotype clinique structuré des données du DSE, il pourrait améliorer le diagnostic des maladies respiratoires.
Un système de diagnostic intelligent utilisant les DSE est un besoin urgent et non satisfait pour diagnostiquer précocement des maladies respiratoires spécifiques.
À propos de l’étude
Dans la présente étude rétrospective, les chercheurs ont rassemblé les DSE de patients hospitalisés atteints de maladies respiratoires du premier hôpital affilié de l’Université médicale de Guangzhou pour la formation LungDiag et ses tests internes.
Ils ont collecté ces DSE entre le 1er novembre 2012 et le 30 octobre 2019, et les DSE de patients hospitalisés de trois autres hôpitaux en Chine pour des tests externes de LungDiag.
LungDiag a rempli deux fonctions principales : premièrement, il a utilisé la PNL pour identifier des phénotypes cliniques distincts à partir des DSE ; deuxièmement, il a utilisé l’apprentissage automatique pour classer les maladies respiratoires en fonction d’attributs cliniques précis connus.
L’algorithme PNL utilisé dans cette étude nécessitait une annotation manuelle et utilisait des techniques d’apprentissage en profondeur pour la normalisation des caractéristiques cliniques/phénotype dans les DSE. De même, l’équipe a utilisé un modèle Bi-LSTM-CRF avec un schéma de marquage « BIO » pour étiqueter les séquences de six entités phénotypiques, à savoir. les symptômes de la maladie, les noms, les résultats des tests quantitatifs/qualitatifs connexes, les résultats d’imagerie, les médicaments utilisés et les interventions chirurgicales effectuées.
Deux cliniciens humains ont extrait les caractéristiques phénotypiques des manuels médicaux et des directives cliniques pour affiner davantage celles extraites par le modèle d’étude. Enfin, l’équipe a utilisé le système de langage médical unifié ou UMLS pour extraire 442 caractéristiques cliniques associées au diagnostic des maladies respiratoires et les standardiser en 252 caractéristiques cliniques.
Résultats
L’ensemble de données de formation comprenait 31 267 DSE de 21 490 hommes et 9 777 femmes avec un âge médian de 64 ans. Selon les données du DSE, dix types de maladies respiratoires constituaient 80,7 % des maladies dans les DSE, et la maladie pulmonaire obstructive chronique, ou MPOC, était la Le plus répandu. L’ensemble de données de test externe comprenait 1 142 DSE supplémentaires.
Le système basé sur l’IA LungDiag a reconnu les entités dans les DSE et a extrait et interprété les principaux phénotypes cliniques avec précision et rappel, facilitant ainsi la classification des maladies. Ses performances ont mis en évidence la façon dont les systèmes automatisés pouvaient naviguer de manière transparente dans la complexité des DSE tout en rationalisant l’identification des phénotypes cliniques, une tâche fastidieuse pour le personnel de santé.
Le LungDiag a également surpassé les médecins obtenant des scores F1 pour le premier et les trois premiers diagnostics à 0,745 et 0,927, respectivement, et ChatGPT 4.0. ChatGPT a obtenu des scores F1 moyens similaires à ceux des médecins humains, mais pas à LungDiag. Cependant, le traitement des notes cliniques et la sécurisation de la confidentialité des données d’un patient à l’aide de LungDiag restent difficiles.
Les résultats de l’expérience d’ablation ont confirmé que les caractéristiques phénotypiques à grain fin présentaient des performances de diagnostic supérieures et permettaient à l’IA d’apprendre plus de caractéristiques. Par rapport aux caractéristiques phénotypiques à grain grossier, les caractéristiques à grain fin avaient une précision moyenne, un rappel et des scores F1 plus élevés.
En conséquence, ces scores ont augmenté de 2 %, 4 % et 3,3 % et de 2,3 %, 4 % et 3,4 % pour le premier et les trois premiers diagnostics, respectivement.
conclusion
Le système utilisé dans cette étude présente un potentiel important pour faciliter le diagnostic des maladies respiratoires. Cela pourrait également aider les professionnels de la santé à gérer les dossiers volumineux des patients hospitalisés et à offrir des conseils cliniques malgré les incertitudes diagnostiques.
En termes de performances, LungDiag a standardisé tous les diagnostics de sortie en dix types de maladies respiratoires et a atteint une précision moyenne, un rappel et un score F1 de 0,883, 0,819 et 0,899, respectivement, en reconnaissant les six entités phénotypiques.
Il a également démontré une grande précision dans la classification des maladies respiratoires, avec une précision médiane de 0,763, un rappel de 0,677 et un score F1 de 0,711 pour le premier et de 0,965, 0,897 et 0,927 pour les trois premiers diagnostics.
Dans l’ensemble, LungDiag a présenté des performances supérieures et une précision et un rappel exceptionnels.
*Avis important: SSRN publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique/les comportements liés à la santé, ou traités comme des informations établies.