Dans une étude récente publiée dans npj Mental Health Research, les chercheurs ont effectué une revue systématique pour déterminer si l’intelligence artificielle (IA) pouvait être une stratégie prometteuse pour le diagnostic du trouble de stress post-traumatique (SSPT).
Étude: Examen systématique de l’apprentissage automatique dans les études sur le SSPT pour l’évaluation automatisée du diagnostic. Crédit d’image : Suriyawut Suriya/Shutterstock.com
Arrière-plan
Des approches d’apprentissage automatique (ML) ont été utilisées pour diagnostiquer et traiter le SSPT, une maladie souvent mal diagnostiquée en raison de ses aspects cliniques et biochimiques complexes.
Cette méthode peut potentiellement améliorer les résultats cliniques tout en réduisant les coûts associés aux handicaps à long terme, réduisant ainsi le fardeau des individus à l’échelle mondiale.
À propos de l’étude
Dans la présente étude, les chercheurs ont présenté le rôle de l’apprentissage automatique dans le diagnostic automatisé du SSPT.
Des approches statistiques ont été utilisées pour regrouper les résultats des études incluses et donner des conseils sur les aspects cruciaux de la mise en œuvre des tâches d’apprentissage automatique.
Celles-ci comprenaient (i) la sélection du modèle d’apprentissage automatique le plus approprié pour l’ensemble de données, (ii) l’identification des fonctionnalités d’apprentissage automatique optimales sur la base de la méthode de diagnostic sélectionnée, (iii) la détermination d’une taille d’échantillon optimale en fonction de la distribution des données, et (iv) la mise en œuvre outils appropriés pour évaluer et valider les performances du modèle.
Des bases de données telles que Embase, MEDLINE, Scopus, PsycINFO, Compendex et IEEE Xplore, couvrant la période de 1946 à 2022, ont été consultées jusqu’au 18 octobre 2022. Deux chercheurs ont examiné les données de manière indépendante et ont résolu les divergences par discussion.
Seuls les enregistrements publiés en anglais qui utilisaient des modèles basés sur l’apprentissage automatique pour effectuer un diagnostic automatisé du SSPT et des mesures d’évaluation spécifiées utilisées pour rendre compte des performances du modèle ont été inclus.
Dossiers en double, études de cas, articles non publiés dans des revues, dossiers sans rapport avec le diagnostic du SSPT, dossiers sans mention de paramètres d’évaluation, dossiers concernant principalement la sélection de caractéristiques et dossiers axés sur la prédiction des résultats futurs, les facteurs de risque de contracter le SSPT ou le la trajectoire des symptômes plutôt que le diagnostic du SSPT ont été exclus de l’analyse.
La qualité de l’étude actuelle a été déterminée à l’aide des mesures d’évaluation fournies [such as accuracy, precision, recall, F1 scores, and area under the curve (AUC) values] parmi les études sélectionnées.
Résultats
Au total, 3 186 enregistrements ont été identifiés, dont 1 654 sont restés après la suppression des doublons. Après la sélection des titres et des résumés, 1 502 enregistrements ont été exclus et, par conséquent, 152 études ont été soumises à une sélection du texte intégral, parmi lesquelles 111 enregistrements qui ne satisfaisaient pas aux critères d’éligibilité ont été exclus. En conséquence, 41 enregistrements ont été pris en compte pour l’analyse finale.
La taille de l’échantillon variait de 24 individus à 2 124 496 enquêtes, avec une médiane de 179 échantillons pour l’ensemble de la recherche analysée. Les modèles de validation croisée K-fold (30 études) et de support Vector Machine (SVM, 12 études) ont été les plus largement utilisés dans les études incluses. Les modèles d’apprentissage profond (DL), SVM et mixtes ont surpassé les autres dans les études incluses.
Support Vector Machine, un modèle d’apprentissage automatique de longue date, a été sélectionné en raison de sa grande efficacité et de son adaptabilité aux données de petite et moyenne taille, ainsi que de ses exigences de traitement relativement modestes.
Les modèles d’IA de réseau neuronal convolutif (CNN) et de réseau neuronal récurrent (RNN), y compris la mémoire à long terme (LSTM), ont été utilisés comme classificateurs. L’amygdale, l’hippocampe, le cortex préfrontal et l’insula ont fourni des résultats prédictifs significatifs lorsqu’ils ont été obtenus à l’aide de techniques d’imagerie par résonance magnétique fonctionnelle (IRMf).
Les modèles ML sont de plus en plus utilisés pour diagnostiquer le SSPT, en particulier dans les contextes cliniques où le risque de symptômes de SSPT est élevé. Cependant, les dépenses élevées en équipements spécialisés et le besoin de personnel expérimenté limitent l’utilisation de ces modèles.
Les modèles DL nécessitaient moins d’ingénierie de fonctionnalités et étaient particulièrement bénéfiques pour la classification du SSPT en raison de leur capacité à choisir des fonctionnalités informatives.
En revanche, les recherches reposant sur des questionnaires auto-documentés et d’autres approches de diagnostic du SSPT, telles que des bases de données ou des enquêtes en ligne, comportaient généralement des nombres d’échantillons plus élevés. Ces sources de données étaient moins spécifiques au SSPT, avec des échantillons variés, ce qui rendait difficile l’obtention de caractéristiques prédictives efficaces pour le dépistage du SSPT.
Le déséquilibre des données pourrait également conduire à un surajustement des modèles d’apprentissage automatique et à une perte de généralisabilité des résultats. La taille limitée des échantillons, les comorbidités, les contrôles d’étude inadéquats, la perte de généralisabilité et la distribution inégale des données ont influencé l’efficacité des modèles ML pour la classification du SSPT.
Un surajustement dû à un petit nombre d’échantillons pourrait réduire la précision, le rappel et l’exactitude du modèle. Les communautés minoritaires peuvent être sous-représentées en raison du déséquilibre des données, et les problèmes éthiques et juridiques doivent être soulignés.
La pertinence des données et les ressources informatiques étaient des facteurs importants pour déterminer les modèles de ML optimaux. Les modèles ML traditionnels, tels que les modèles SVM et d’ensemble, étaient de préférence utilisés pour les données significativement liées au diagnostic du SSPT et nécessitant une ingénierie minimale des fonctionnalités, telles que les données de neuroimagerie.
Les modèles DL, ou MLP, ont été considérés comme acceptables pour les données audio, visuelles et textuelles complexes. Les déséquilibres de données peuvent être corrigés via des approches de rééchantillonnage et d’ensemble. La validation du modèle est essentielle pour garantir l’exactitude et la fiabilité du ML.
En divisant les données et en entraînant le modèle sur certaines partitions tout en en évaluant d’autres, la validation croisée pourrait minimiser la variance du modèle. Des tests de permutation doivent être effectués pour vérifier la fiabilité du modèle et éliminer les effets stochastiques.
Dans l’ensemble, les résultats de l’étude ont mis en évidence le potentiel de l’IA dans le diagnostic du trouble de stress post-traumatique. L’IA peut fournir des approches rentables, fiables et rapides pour diagnostiquer le SSPT, en particulier pour les personnes stigmatisées qui ont du mal à obtenir des soins de santé mentale appropriés.
Cependant, en raison de problèmes d’éthique et de confidentialité, ainsi que du manque de règles établies, l’application réelle des systèmes d’IA doit encore être affinée. Les résultats pourraient être utilisés pour orienter les recherches futures sur le diagnostic automatisé du SSPT, en soulignant l’importance de l’IA dans le diagnostic précoce du SSPT.
Comment manger moins peut aider à prolonger la durée de vie