Dans un article récent publié dans JAMA Neurologieles chercheurs ont testé si le modèle d’intelligence artificielle (IA), SCORE-AI, interprétait les électroencéphalogrammes cliniques (EEG) de routine avec une précision comparable à celle des experts humains.
Sommaire
Arrière-plan
L’EEG est un outil largement utilisé pour le diagnostic de l’épilepsie, une maladie neurologique affectant plus de 70 millions de personnes dans le monde. Il aide à distinguer l’épilepsie des autres affections neurologiques altérant la conscience.
Dans de nombreuses régions du monde, les experts humains pour la lecture et l’interprétation des EEG cliniques ne sont pas disponibles, ce qui soulève le besoin d’outils basés sur l’IA. Les experts en lecture des EEG cliniques, même dans les pays dotés des systèmes de soins de santé les plus avancés, sont des médecins qui manquent de formation complémentaire en interprétation de l’EEG, ce qui augmente les cas d’erreur de diagnostic d’épilepsie. Les références EEG toujours croissantes ont surchargé les experts formés dans les centres de soins tertiaires qui interprètent de grands volumes d’enregistrements EEG.
Étant donné que les modèles d’IA précédents traitaient d’aspects limités de l’interprétation de l’EEG, par exemple, l’identification de l’activité épileptiforme, il existe un besoin d’outils basés sur l’IA entièrement automatisés avec le potentiel d’améliorer les soins aux patients dans les régions éloignées où les experts en EEG sont minimes ou indisponibles pour une évaluation complète cliniquement pertinente. des EEG de routine.
À propos de l’étude
Dans la présente étude multicentrique sur la précision du diagnostic, les chercheurs ont développé et formé un modèle de réseau neuronal convolutif, SCORE-AI, en utilisant un vaste ensemble de données d’EEG hautement annotés enregistrés entre 2014 et 2020. Le système SCORE EEG (Standardized Computer-based Organized Reporting of EEG) , un outil logiciel, a annoté tous les EEG.
L’étude a porté sur tous les patients âgés de plus de trois mois. L’équipe a validé SCORE-AI à l’aide de trois ensembles de données de test indépendants, comme suit :
i) un ensemble de données multicentriques de 100 EEG représentatifs évalués par 11 experts ;
ii) un ensemble de données monocentrique de 9785 EEG évalués par 14 experts ; et
iii) un ensemble de données de 60 EEG avec une norme de référence externe pour l’analyse comparative avec des modèles d’IA publiés précédemment. Cependant, l’équipe a limité le benchmarking à la comparaison de la capacité à identifier les décharges épileptiformes en combinant des catégories focales et généralisées.
En outre, l’équipe a testé dans quelle mesure SCORE-AI distinguait un enregistrement EEG anormal d’un enregistrement EEG normal et classait les enregistrements anormaux dans les quatre catégories les plus pertinentes sur le plan clinique, à savoir, épileptiforme-focale, épileptiforme-focale généralisée et non épileptiforme-focale. anomalies épileptiformes-diffuses.
L’évaluation de l’enregistrement EEG comme normal, anormal ou une combinaison des quatre catégories anormales, telle qu’évaluée par SCORE-AI, a été considérée comme le résultat de l’étude. Cet outil a effectué une analyse entièrement automatisée sans implication d’interaction humaine.
L’intégration de SCORE-AI avec autoSCORE a mis en évidence les époques anormales dans l’enregistrement EEG afin que l’expert humain puisse ajuster l’évaluation automatisée si nécessaire. Ils ont déterminé l’accord interévaluateur entre SCORE-AI et les experts humains pour l’ensemble de données de test multicentrique.
L’équipe a utilisé un modèle et des seuils fixes pendant la phase de validation clinique. De plus, ils ont évité de sur-ajuster le modèle d’IA pendant cette phase. De plus, l’ensemble de données de test était indépendant de l’ensemble de données de développement.
Un ensemble de données de test plus important d’environ 10 000 EEG a assuré la généralisabilité. Différents experts humains ont fourni le standard de référence dans la phase de validation et de développement de l’étude. Ainsi, ils ont enregistré des EEG dans l’ensemble de données de test multicentrique en utilisant différents équipements EEG.
Résultats
L’ensemble de données de développement de l’étude comportait 30 493 enregistrements EEG annotés par 17 experts. Sans implication humaine, SCORE-AI a atteint des performances de niveau expert humain dans l’interprétation des EEG cliniques de routine. De plus, il a atteint une grande précision, avec une aire sous la courbe caractéristique de fonctionnement du récepteur (AUC) comprise entre 0,89 et 0,96 pour quatre types d’anomalies EEG.
Les enregistrements de moins de 20 minutes avaient une ASC inférieure à celle des enregistrements de plus de 20 minutes, avec des ASC moyennes de 0,887 et 0,903. De plus, les AUC d’enregistrements de plus longue durée ont montré des variations relatives minimes concernant la durée d’enregistrement dans 2 549 EEG de test de retenue et 9 785 EEG de l’ensemble de données cliniques plus large.
Par rapport à l’ensemble de données de test multicentrique, SCORE-AI avait une spécificité, une précision et une valeur prédictive positive nettement plus élevées, mais une sensibilité plus faible. Étant donné que SCORE-AI semble identifier les EEG normaux avec une précision de près de 100 %, les experts pourraient passer moins de temps à évaluer ces enregistrements et plus de temps sur les aspects les plus difficiles de la surveillance de l’épilepsie.
conclusion
Pour résumer, le SCORE-AI est l’un des premiers modèles basés sur l’IA à effectuer une évaluation cliniquement pertinente complète des EEG de routine, fournissant une classification plus complexe des anomalies EEG que les modèles d’IA publiés précédemment. L’identification de l’activité épileptiforme dans les EEG aide à diagnostiquer l’épilepsie avec précision et en temps opportun.
Les performances de niveau expert de SCORE-AI ont principalement réduit les erreurs d’interprétation de l’EEG, ce qui pourrait aider à éviter le problème de la faible concordance interévaluateur dans les sites où les médecins ayant une expérience limitée lisent les EEG, c’est-à-dire les milieux de pratique courants en neurologie.
En conséquence, les chercheurs ont intégré le SCORE-AI à des systèmes d’équipement EEG cliniques largement utilisés. Cela pourrait les aider à convertir SCORE-AI en d’autres interfaces informatiques car il n’a pas besoin de matériel spécialisé pour la mise en œuvre.