Une nouvelle étude menée par un scientifique en intelligence artificielle (IA) décrit une méthode pour prédire le COVID-19 à partir d’un seul coup CT thoracique. Le développement de tels outils sophistiqués pour le diagnostic de cette infection, avec des manifestations protéiformes, pourrait aider à réduire le besoin de tests invasifs.
Crédit d’image: medrxiv.org/content/10.1101/2020.12.01.20241786v1.full.pdf
Un diagnostic définitif de COVID-19 est effectué par un test de réaction en chaîne transcriptase-polymérase inverse (RT PCR) pour l’ARN viral. La radiographie du thorax est également un outil utile.
Au début de la pandémie, les enquêteurs ont recommandé l’utilisation de la tomodensitométrie thoracique et celle-ci est restée parmi les méthodes les plus précises pour prédire la présence de
Infection par le SRAS-CoV-2 avant que les résultats du test d’ARN viral ne soient disponibles. En fait, à certains stades de la maladie, le scanner thoracique peut être plus sensible que le test PCR.
Sommaire
Utilisation de l’IA pour le diagnostic COVID-19
De nombreux chercheurs se sont tournés vers l’utilisation de l’IA sous la forme de modèles d’apprentissage machine profond tels que les réseaux de neurones convolutifs (convnets) pour aider à interpréter les tomodensitogrammes thoraciques pour la présence de COVID-19, ainsi que pour la segmentation des lésions observées.
Dans la plupart des cas, les paramètres utilisés pour classer les résultats utilisent des extracteurs de fonctionnalités tels que ResNet couplés à une sortie logit spécifique au problème, comme COVID-19 vs Common Pneumonia.
Lorsqu’il s’agit de segmenter les lésions, la plupart des modèles utilisent un modèle de segmentation sémantique comme U-Net qui peut faire des prédictions des masques pour différentes classes au niveau des pixels, ou améliorer le classificateur en ajoutant des fonctionnalités profondes à la prédiction de masque.
Utilisation conjointe de la segmentation / détection / classification d’image
Dans l’article actuel, publié en pré-impression sur le medRxiv * serveur en décembre 2020, l’auteur décrit une architecture mono-coup. La technique utilise un modèle récent, COVID-CT-Mask-Net, qui ajoute une fonction de classification aux modèles comme le masque de détection / segmentation de pointe R-CNN.
Le masque R-CNN est capable de détecter et de segmenter des objets séparés dans les images. Il peut «comprendre» des objets séparés mais ne peut pas faire de prédictions de classe d’image.
Le module de classification est basé sur la capacité du détecteur à prédire les boîtes englobantes et les masques, équipés de scores de confiance normalisés, dans les régions d’intérêt (ROI). Le résultat est que le masque prédit la classe de l’objet détecté.
Les prédictions sont converties, par lots, en un vecteur indiquant les caractéristiques qui entraînent le module de classification. Des travaux antérieurs de ce chercheur ont abouti à plusieurs versions modifiées de ce modèle qui sont tronquées et légères, mais peuvent prédire le COVID-19 et segmenter les lésions aussi précisément que le modèle de base.
Cependant, ce modèle utilise toujours deux étapes, d’abord, la formation du modèle de segmentation (Mask R-CNN) à l’aide de masques de vérité terrain, puis la dérivation d’un modèle de classification qui est ensuite formé sur les données d’image étiquetées (à savoir COVID-19, Common Pneumonie et images de contrôle).
Simplifier à une approche en une seule étape
Pour éviter cette approche en deux phases, le document utilise une solution différente selon laquelle un modèle à un seul coup (SSM) est formé pour segmenter les lésions dans le scanner thoracique et prédire la classe d’image, en utilisant un modèle unique court. Le fondement de cette technique est la capacité du Mask R-CNN à détecter l’objet et à segmenter son masque.
Les chercheurs ont testé deux méthodes possibles. Avec l’un, le modèle de segmentation nécessitait un pré-entraînement, mais l’autre évite cette étape.
Pour la phase de classification, trois méthodes ont été examinées. La branche de segmentation du RoI pourrait être utilisée à nouveau pour créer un lot de classification d’images. Ou bien, le module RoI pourrait être équipé d’une branche de classification parallèle pour créer les ROI du classificateur d’images. La troisième manière est de permettre l’adaptation simultanée des deux branches, segmentation et classification, sans pré-formation.
Ceux-ci sont représentés comme suit par les chercheurs:
1. branche de segmentation pré-entraînée + branche unique pour segmentation + classification, 2. branche de segmentation pré-entraînée + deux branches parallèles pour segmentation + classification
3. formation à partir de zéro + deux branches parallèles pour la segmentation + la classification
Le troisième est le plus simple en termes de formation puisqu’il se passe de pré-formation.
Avantages du modèle à un seul coup
Le document revendique plusieurs avantages à l’utilisation du SSM.
- En utilisant un modèle à un seul coup, les chercheurs peuvent éviter le pré-entraînement et permettre à la fois la détection et la segmentation de la lésion ainsi que la prédiction du diagnostic de COVID-19, pneumonie commune ou contrôle, à partir du scanner thoracique.
- Les modèles mesurent moins de 10 M, ce qui permet une formation et une évaluation rapides. Une tranche CT de 512×512 peut être traitée pour la segmentation et la prédiction de classe d’image en 3,8 à 7,1 secondes sur un processeur.
- De nouvelles données peuvent être entrées facilement avec de simples adaptations au modèle.
Ce modèle rapide et fiable a plusieurs fonctionnalités nouvelles et utilise des modèles tronqués qui améliorent la qualité de la classification ainsi que la prédiction des classes d’images. Il équilibre la sensibilité pour la prédiction COVID-19, à 93%, avec la sensibilité, à ~ 96,8%.
Ainsi, ce modèle avec seulement 8,27 millions de paramètres est aussi précis dans la prédiction de classe d’image que le classificateur pleine taille COVID-CT-Mask-Net [TS20b], avec une plus grande dorsale ResNet50 + FPN. Il est également capable d’atteindre la précision de segmentation du masque R-CNN avec ResNet50 + FPN.
Quelles sont les implications?
Le journal prétend être « le premier article qui présente une solution unique pour la segmentation des instances de lésion et la classification COVID-19. » Cela pourrait accélérer la prédiction du COVID-19 sur la base de la tomodensitométrie thoracique et améliorer l’utilité déjà grande de cet outil.
Ces résultats ont exploité la force des boîtes englobantes, pour la localisation des lésions, et le score de confiance, pour la force des lésions. Les études futures se concentreront sur l’utilisation d’autres caractéristiques des lésions, telles que leur configuration et leurs caractéristiques, y compris l’apparence folle du pavage, le motif diffus et l’atténuation, qui sortent du cadre des boîtes de délimitation utilisées. Cela pourrait être grâce à l’utilisation de masques des objets pour permettre une idée plus précise de leurs formes.
*Avis important
medRxiv publie des rapports scientifiques préliminaires qui ne sont pas examinés par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, orienter la pratique clinique / les comportements liés à la santé, ou traités comme des informations établies.
Référence du journal:
- Ter-Sarkisov, A. (2020). Modèle léger à prise unique pour la détection des lésions et la prédiction du COVID-19 à partir de tomodensitométries thoraciques. medRxiv préimpression. doi: https://doi.org/10.1101/2020.12.01.20241786. https://www.medrxiv.org/content/10.1101/2020.12.01.20241786v1