Le modèle d'IA Virchow surpasse les méthodes cliniques dans la détection du cancer

Dans une étude récente publiée dans la revue Médecine naturelleune grande équipe de chercheurs aux États-Unis a discuté de l'utilisation du modèle fondamental Virchow pour l'analyse informatique des rapports pathologiques et a démontré son utilisation dans l'analyse histopathologique pour prédire les biomarqueurs et identifier les cellules dans sept formes rares et neuf formes courantes de cancer.

L'ensemble de données de formation, l'algorithme de formation et l'application de Virchow, un modèle fondamental pour la pathologie computationnelle. unLes données de formation peuvent être décrites en termes de patients, de cas, d’échantillons, de blocs ou de diapositives, comme indiqué. b–dLa distribution des diapositives en fonction du statut cancéreux (b), chirurgie (c) et le type de tissu (d). etLe flux de données pendant la formation nécessite le traitement de la diapositive en tuiles, qui sont ensuite recadrées en vues globales et locales. FSchéma des applications du modèle de fondation utilisant un modèle d'agrégation pour prédire les attributs au niveau de la lame. GI, gastro-intestinal. Étude : Un modèle de base pour la pathologie computationnelle de qualité clinique et la détection des cancers rares

Sommaire

Arrière-plan

Le diagnostic des cancers repose traditionnellement sur l'examen de préparations histopathologiques de lames d'hématoxyline et d'éosine au microscope optique. Les progrès de la technologie numérique et de la pathologie computationnelle ont remplacé cette méthode par des images de lames entières qui peuvent être examinées par ordinateur, faisant de cette forme de diagnostic une partie intégrante de la pratique clinique courante.

L’utilisation de l’intelligence artificielle (IA) dans le diagnostic et la caractérisation des cancers à l’aide d’images numérisées de lames entières a également connu une croissance substantielle, les efforts initiaux étant axés sur l’amélioration des flux de travail. Cependant, des études récentes ont exploré un sous-domaine dans lequel l’IA est largement utilisée pour analyser des images de lames entières afin de révéler plus que de simples informations diagnostiques, notamment les réponses thérapeutiques et le pronostic. Cela réduit également la dépendance aux tests génomiques et aux méthodes basées sur l’immunohistochimie pour le diagnostic du cancer.

À propos de l'étude

Dans la présente étude, les chercheurs ont discuté du plus grand modèle fondamental développé à ce jour, Virchow. Ils ont démontré son utilité pour prédire les biomarqueurs du cancer dans un large éventail de cancers courants et rares.

Les modèles fondamentaux sont des réseaux neuronaux à grande échelle formés sur de très grands ensembles de données à l'aide d'un apprentissage auto-supervisé. Ces modèles créent des représentations de données appelées intégrations, qui peuvent recueillir des données généralisées à partir de grands ensembles de données pour être appliquées dans des cas où les données sont inadéquates et pour des tâches prédictives telles que la détermination des résultats cliniques, des changements génomiques et des réponses thérapeutiques.

Un modèle fondamental efficace peut capturer des modèles à large spectre tels que l’architecture tissulaire, la morphologie nucléaire, la morphologie cellulaire, la nécrose, les modèles de coloration, la néovascularisation, l’inflammation et l’expression de biomarqueurs qui peuvent être utilisés pour prédire diverses caractéristiques d’images de lames entières.

Les chercheurs ont discuté ici de Virchow, le plus grand modèle fondateur développé à ce jour, nommé d'après le pathologiste moderne pionnier Rudolf Virchow. Le modèle a été formé sur un ensemble de données considérable de près de 1,5 million d'images de lames entières à l'hématoxyline et à l'éosine obtenues auprès de cent mille patients enregistrés au Memorial Sloan Kettering Cancer Center (MSKCC). L'ensemble de données se compose d'échantillons de tissus bénins et malins obtenus à partir de résections et de biopsies de 17 types de tissus.

Virchow est un modèle de transformation de la vision comprenant 632 millions de paramètres. Il est formé à l'aide d'un algorithme auto-supervisé qui utilise des régions locales et globales des tuiles de tissu pour créer des intégrations d'images de lames entières qui peuvent être utilisées pour des tâches prédictives.

Pour mettre en évidence les applications cliniques et l’utilité d’un modèle fondamental aussi vaste, les chercheurs ont utilisé les plongements Virchow créés à partir du grand ensemble de données d’images de diapositives entières pour former un modèle pan-cancer et évaluer ses performances dans la prédiction des formes courantes et rares de cancer au niveau de l’échantillon dans divers tissus.

L'étude a comparé les performances des intégrations Virchow avec celles des intégrations Phikon, UNI et CTransPath et a évalué l'utilité des intégrations Virchow selon deux catégories. La première était la performance du modèle de détection pan-cancer formé à l'aide des intégrations Virchow sur un ensemble de données de test composé d'un mélange d'ensembles de données du MSKCC et de sources externes couvrant sept types de cancers rares et neuf types courants. L'efficacité des intégrations Virchow dans la prédiction de biomarqueurs à l'aide de données provenant de cancers tels que les cancers du poumon, de la vessie, du sein et du côlon a également été évaluée.

Résultats

L'étude a montré que les intégrations Virchow démontraient la double valeur d'un modèle fondamental de pathologie en étant généralisable et en fournissant une efficacité des données d'entraînement. Le modèle pan-cancer formé sur les intégrations Virchow a pu détecter non seulement les formes courantes de cancer, mais également les sous-types histologiques plus rares dans l'ensemble de données de test.

De plus, les performances du modèle pan-cancer étaient comparables à celles des modèles de détection du cancer de qualité clinique et, dans le cas de certains cancers rares, dépassaient même celles des modèles cliniques bien qu'ils aient été formés sur des ensembles de données avec moins d'étiquettes spécifiques aux tissus.

Les chercheurs ont déclaré que le niveau de performance du modèle était particulièrement remarquable étant donné que l'ensemble de données utilisé pour former le modèle pan-cancéreux n'a pas subi l'enrichissement de sous-population et le contrôle de qualité effectués pour la formation des modèles d'IA utilisés commercialement et cliniquement.

$a, b, Performances mesurées par l'ASC de trois produits cliniques par rapport au modèle pan-cancer formé sur des inclusions de Virchow, sur les ensembles de données de variantes rares (a) et de tests de produits (b). Le détecteur pan-cancer, formé sur des inclusions de modèles de base de Virchow, atteint des performances similaires à celles des produits de qualité clinique en général et les surpasse sur les variantes rares de cancers. c, Le détecteur pan-cancer a été formé sur moins d'échantillons étiquetés que les modèles cliniques de prostate, de sein et de BLN, y compris une petite fraction des échantillons de tissus de prostate (bleu sarcelle), de sein (bleu) et de BLN (jaune) sur lesquels ces modèles cliniques ont été respectivement formés. d, Une catégorisation des modèles d'échec du modèle pan-cancer et quatre exemples canoniques des principaux types d'échecs. Dans tous les panneaux, * est utilisé pour indiquer la signification statistique par paires (*P < 0,05, **P < 0,01, ***P < 0,001, ****P < 0,0001 ; test de DeLong par paires). Les barres d'erreur indiquent l'intervalle de confiance bilatéral à 95 %, estimé avec la méthode de DeLong. C., carcinome. Inv., invasif.$ un,bPerformances mesurées par l'ASC de trois produits cliniques par rapport au modèle pan-cancer formé sur les inclusions de Virchow, sur la variante rare (un) et des ensembles de données de test de produits (b). Le détecteur pan-cancer, formé sur les modèles de fondation Virchow, atteint des performances similaires à celles des produits de qualité clinique en général et les surpasse sur les variantes rares de cancers. cLe détecteur de pan-cancer a été formé sur moins d'échantillons étiquetés que les modèles cliniques de la prostate, du sein et du BLN, y compris une petite fraction des échantillons de tissus de la prostate (sarcelle), du sein (bleu) et du BLN (jaune) sur lesquels ces modèles cliniques ont été respectivement formés. dUne catégorisation des modèles d'échec du modèle pan-cancer et quatre exemples canoniques des principaux types d'échecs. Dans tous les panneaux, * est utilisé pour indiquer la signification statistique par paire (*P < 0,05, **P < 0,01, ***P < 0,001, ****P < 0,0001 ; test de DeLong par paire). Les barres d'erreur indiquent l'intervalle de confiance bilatéral à 95 %, estimé avec la méthode de DeLong. C., carcinome. Inv., invasif.

Conclusions

Pour conclure, l’étude a montré qu’un modèle pan-cancéreux formé à l’aide d’intégrations de Virchow était capable d’obtenir des performances comparables et souvent meilleures que les modèles de qualité clinique dans la détection de formes courantes et rares de cancer, malgré un entraînement sur des ensembles de données contenant moins d’étiquettes de tissus.

Dans l’ensemble, les résultats ont mis en évidence l’importance et l’utilité de modèles fondamentaux tels que Virchow dans des applications impliquant des quantités limitées de données de formation, fournissant la base de divers modèles cliniques en pathologie cancéreuse.