Une équipe de recherche dirigée par le professeur Park Sang-Hyun du département de génie robotique et mécatronique (également responsable de la majeure en intelligence artificielle) de la DGIST (président Kuk Yang) a développé un modèle d’apprentissage en profondeur faiblement supervisé qui peut montrer avec précision la présence et l’emplacement du cancer dans des images pathologiques basées uniquement sur des données où le cancer est présent. Les modèles d’apprentissage en profondeur existants devaient construire un ensemble de données, dans lequel l’emplacement du cancer était dessiné avec précision, pour spécifier le site du cancer. Le modèle d’apprentissage en profondeur développé dans cette étude a amélioré l’efficacité et devrait apporter une contribution significative au domaine de recherche concerné.
Généralement, il est nécessaire de marquer avec précision l’emplacement du site du cancer pour résoudre les problèmes liés au zonage qui indique les informations de localisation du cancer, ce qui prend beaucoup de temps et donc un coût accru.
Pour résoudre ce problème, le modèle d’apprentissage faiblement supervisé qui zone les sites de cancer avec uniquement des données approximatives telles que « si le cancer dans l’image est présent ou non » est actuellement à l’étude. Cependant, cela détériorerait considérablement les performances si le modèle d’apprentissage faiblement supervisé existant était appliqué à un énorme ensemble de données d’images pathologiques où la taille d’une image est aussi grande que quelques gigaoctets. Pour résoudre ce problème, les chercheurs ont tenté d’améliorer les performances en divisant l’image pathologique en patchs, mais les patchs divisés perdent la corrélation entre les informations de localisation et chaque donnée fractionnée, ce qui signifie qu’il y a une limite à l’utilisation de toutes les informations disponibles.
En réponse, l’équipe de recherche du professeur Park Sang-Hyun a découvert une technique de segmentation jusqu’au site du cancer uniquement basée sur les données apprises indiquant la présence d’un cancer par lame. L’équipe a développé une technologie de compression d’image pathologique qui apprend d’abord au réseau à extraire efficacement les caractéristiques significatives des patchs grâce à un apprentissage contrastif non supervisé et l’utilise pour détecter les principales caractéristiques tout en conservant chaque information de localisation pour réduire la taille de l’image tout en maintenant la corrélation entre les patchs. Plus tard, l’équipe a développé un modèle qui peut trouver la région qui est très susceptible d’avoir un cancer à partir des images de pathologie compressées en utilisant une carte d’activation de classe et zoner toutes les régions qui sont très susceptibles d’avoir un cancer à partir de l’ensemble des images de pathologie à l’aide d’un module de corrélation de pixels (PCM).
Le modèle d’apprentissage en profondeur nouvellement développé a montré un score de coefficient de similarité de dés (DSC) allant jusqu’à 81 – 84 uniquement avec les données d’apprentissage avec des étiquettes de cancer au niveau de la diapositive dans le problème de zonage du cancer. Il a largement dépassé les performances des méthodes de niveau patch précédemment proposées ou d’autres techniques d’apprentissage faiblement supervisées (score DSC : 20 – 70).
« Le modèle développé dans le cadre de cette étude a grandement amélioré les performances de l’apprentissage faiblement supervisé des images pathologiques, et il devrait contribuer à améliorer l’efficacité de diverses études nécessitant une analyse d’images pathologiques », a déclaré le professeur Park Sang-Hyeon Park qui a ajouté : « Si nous pouvons encore améliorer la technologie associée à l’avenir, il sera possible de l’utiliser universellement pour divers problèmes de zonage d’images médicales. »
Entre-temps, les résultats de cette étude ont été reconnus pour leur excellence et ont été publiés dans MédiIA (Analyse d’images médicales Journal), une revue académique internationale faisant autorité dans le domaine de l’analyse d’images médicales.