Dans une étude récente publiée dans la revue Nature Medicine, des chercheurs ont testé la capacité des médecins spécialisés et généralistes à diagnostiquer les maladies cutanées en fonction du teint de la peau dans une situation de télédermatologie simulée.
Les approches basées sur l’apprentissage profond pour le diagnostic basé sur l’image peuvent améliorer les décisions cliniques, mais leur efficacité est inconnue en raison d’erreurs systématiques, en particulier lors de l’évaluation des groupes sous-représentés. L’avenir de l’apprentissage automatique en médecine pourrait comporter des collaborations médecin-machine, avec des interfaces spécifiques à un domaine basées sur des modèles d’apprentissage automatique aidant les connaissances cliniques à générer des diagnostics plus précis. La reconnaissance des experts est essentielle pour ignorer les recommandations automatisées. Les premières recherches sur la télédermatologie store-and-forward révèlent que les systèmes d’apprentissage profond peuvent améliorer la précision des diagnostics généralistes, mais des incertitudes subsistent quant aux performances de l’expertise des médecins et des groupes sous-représentés.
Étude : Une température corporelle élevée est associée à des symptômes dépressifs : résultats de l’étude TemPredict. Crédit d’image : RossHelen/Shutterstock
À propos de l’étude
Dans la présente étude, les chercheurs ont effectué une analyse numérique auprès de 389 dermatologues certifiés (BCD) et 459 médecins de soins primaires (PCP) de 39 pays pour évaluer l’exactitude du diagnostic fourni par les médecins généralistes et spécialistes dans des simulations de télédermatologie.
L’étude portait sur 364 photos de 46 troubles dermatologiques et demandait aux participants de soumettre un maximum de quatre diagnostics différentiels. La plupart des images représentaient huit maladies cutanées relativement courantes. L’équipe a recruté plusieurs médecins participants et a conçu l’étude pour tirer des enseignements précieux des stratégies de gamification telles que la rétroaction, les récompenses, la compétition et les règles distinctes. Ils ont découvert un espace de conception reproductible comprenant différents tons de peau, troubles cutanés, connaissances des médecins, collaborations médecin-machine, précision d’aide à la décision clinique et conceptions d’interface utilisateur.
Les chercheurs ont mesuré la précision des diagnostics sans et avec l’aide de l’intelligence artificielle sur les peaux foncées et claires et ont suivi des techniques d’audit algorithmique. L’équipe s’est concentrée sur les maladies de la peau sur la base de trois critères : (i) trois dermatologues certifiés en exercice ont identifié ces maladies comme les maladies les plus probables pour lesquelles l’équipe peut trouver des disparités de précision selon les tons de peau des patients ; (ii) ces maladies sont relativement courantes ; et (iii) ces maladies apparaissent suffisamment fréquemment dans les manuels de dermatologie et les atlas d’images de dermatologie pour que l’équipe puisse sélectionner au moins cinq images des deux types de peau les plus foncés après avoir demandé un examen de contrôle qualité par des dermatologues certifiés.
Pour proposer des prédictions de diagnostic basées sur la vision par ordinateur, l’équipe a formé un réseau neuronal convolutif pour classer neuf étiquettes : les huit maladies cutanées d’intérêt et une autre catégorie. Les chercheurs ont affiné le modèle sur 31 219 images dermatologiques cliniques diverses provenant de l’ensemble de données Fitzpatrick 17k et des images supplémentaires obtenues à partir de manuels, d’atlas de dermatologie et de moteurs de recherche en ligne. L’équipe a comparé le système DLS aux performances des médecins dans le diagnostic des maladies de la peau à l’aide de l’architecture VGG-16 affinée sur 31 219 images cliniques de dermatologie.
Résultats
Les médecins généralistes et les spécialistes ont atteint une précision diagnostique de 19 % et 38 %, respectivement, et ont montré une précision inférieure de quatre points de pourcentage pour les diagnostics chez les personnes à peau foncée par rapport aux personnes à peau claire. L’aide à la décision basée sur l’apprentissage profond a amélioré la précision des diagnostics des médecins de > 33 %, mais a élargi les écarts dans la précision des diagnostics des médecins généralistes pour différentes carnations.
Les précisions les plus élevées des médecins généralistes, des médecins de premier recours, des résidents en dermatologie et des dermatologues certifiés étaient respectivement de 18 %, 19 %, 36 % et 38 % sur les images (à l’exclusion des images de contrôle de l’attention) et de 16 %, 17 %, 35 % et 37 %, respectivement, pour les photographies représentant les huit principales maladies cutanées étudiées. Le diagnostic clinique principal le plus souvent identifié pour les images réalisées par les PCP et les BCD était correct dans 33 % et 48 % des observations, respectivement.
Dans 77,0 % des photos, un ou plusieurs BCD ont identifié des étiquettes de référence dans les diagnostics différentiels, alors qu’un ou plusieurs PCP l’ont fait dans 58 %. Après avoir été témoin d’une estimation DLS précise, un ou plusieurs BCD incluaient des étiquettes de référence dans les diagnostics différentiels sur 98,0 % des photos. Sur toutes les photos, les participants ont détecté des troubles sur les peaux plus foncées (prédits FST 5,0 et 6,0) avec une précision moindre que ceux sur les peaux plus claires.
En examinant indépendamment les catégories de médecins, les précisions les plus élevées des dermatologues certifiés, des résidents en dermatologie, des médecins de soins primaires et d’autres médecins étaient inférieures de cinq points de pourcentage, cinq points de pourcentage, trois points de pourcentage et cinq points de pourcentage pour les photos de peau plus foncée que celles de peau plus claire, respectivement. De même, les meilleures précisions de diagnostic des dermatologues certifiés, des résidents en dermatologie, des médecins de premier recours et d’autres médecins ont été réduites de trois points de pourcentage, cinq points de pourcentage, quatre points de pourcentage et quatre points de pourcentage pour les photos de peau plus foncée par rapport à une peau plus claire. , respectivement. Les BCD étaient 4,4 points de pourcentage plus susceptibles de recommander des patients à la peau foncée à un dermatologue pour un deuxième avis.
Les résultats de l’étude ont montré que l’aide à la décision basée sur l’apprentissage profond peut augmenter la précision du diagnostic des médecins dans les situations de télédermatologie. Les BCD avaient une précision de diagnostic parmi les trois premiers de 38 %, tandis que les PCP en avaient 19 %. Les résultats concordent avec des recherches antérieures indiquant que les experts surpassent les généralistes en matière de diagnostic des maladies de la peau, mais que la précision est inférieure à celle des études antérieures. La précision du diagnostic des spécialistes et des généralistes était moins bonne sur les images à peau foncée que sur celles à peau claire. Les BCD et les PCP ont obtenu des résultats supérieurs de quatre points de pourcentage sur les photos à peau claire par rapport aux photos à peau foncée. L’aide à la décision basée sur le DLS a amélioré la précision du diagnostic top 1 de 33 % pour les BCD et de 69 % pour les PCP, ce qui a entraîné une plus grande sensibilité lors de l’identification de troubles cutanés particuliers.