Pour déterminer le type et la gravité d’un cancer, les pathologistes analysent généralement de fines tranches d’une biopsie tumorale au microscope. Mais pour comprendre quels changements génomiques conduisent la croissance de la tumeur – ; informations qui peuvent guider la façon dont il est traité – ; les scientifiques doivent effectuer le séquençage génétique de l’ARN isolé de la tumeur, un processus qui peut prendre des semaines et coûter des milliers de dollars.
Aujourd'hui, les chercheurs de Stanford Medicine ont développé un programme informatique basé sur l'intelligence artificielle qui peut prédire l'activité de milliers de gènes dans les cellules tumorales sur la base uniquement des images de microscopie standard de la biopsie. L'outil, décrit en ligne dans Communications naturelles Le 14 novembre, a été créé à partir des données de plus de 7 000 échantillons de tumeurs divers. L’équipe a montré qu’elle pouvait utiliser des images de biopsie collectées en routine pour prédire les variations génétiques des cancers du sein et prédire les résultats pour les patients.
Ce type de logiciel pourrait être utilisé pour identifier rapidement les signatures génétiques dans les tumeurs des patients, accélérant ainsi la prise de décision clinique et économisant des milliers de dollars au système de santé.
Olivier Gevaert, PhD, professeur de science des données biomédicales et auteur principal de l'article
Les travaux ont également été dirigés par Marija Pizuria, étudiante diplômée de Stanford, et par les boursiers postdoctoraux Yuanning Zheng, PhD, et Francisco Perez, PhD.
Poussé par la génomique
Les cliniciens ont de plus en plus guidé la sélection des traitements contre le cancer – ; y compris les chimiothérapies, les immunothérapies et les thérapies hormonales – ; à recommander à leurs patients en fonction non seulement de l'organe touché par le cancer d'un patient, mais également des gènes qu'une tumeur utilise pour alimenter sa croissance et sa propagation. L'activation ou la désactivation de certains gènes pourrait rendre une tumeur plus agressive, plus susceptible de métastaser ou plus ou moins susceptible de répondre à certains médicaments.
Cependant, l’accès à ces informations nécessite souvent un séquençage génomique coûteux et long.
Gevaert et ses collègues savaient que l'activité des gènes au sein de cellules individuelles peut modifier l'apparence de ces cellules d'une manière qui est souvent imperceptible à l'œil humain. Ils se sont tournés vers l’intelligence artificielle pour trouver ces modèles.
Les chercheurs ont commencé avec 7 584 biopsies de cancer provenant de 16 types de cancer différents. Chaque biopsie a été découpée en coupes minces et préparée à l'aide d'une méthode connue sous le nom de coloration à l'hématoxyline et à l'éosine, qui est la norme pour visualiser l'apparence générale des cellules cancéreuses. Informations sur les transcriptomes des cancers – ; quels gènes les cellules utilisent activement – ; était également disponible.
Un modèle fonctionnel
Après que les chercheurs aient intégré leurs nouvelles biopsies de cancer ainsi que d'autres ensembles de données, notamment des données transcriptomiques et des images provenant de milliers de cellules saines, le programme d'IA – ; qu'ils ont nommé SEQUOIA (quantification d'expression basée sur des diapositives utilisant une attention linéarisée) – ; a pu prédire les modèles d'expression de plus de 15 000 gènes différents à partir des images colorées. Pour certains types de cancer, l’activité génétique prédite par l’IA présentait une corrélation de plus de 80 % avec les données réelles sur l’activité génétique. En général, plus les échantillons d’un type de cancer donné étaient inclus dans les données initiales, meilleurs étaient les résultats du modèle sur ce type de cancer.
« Il a fallu plusieurs itérations du modèle pour arriver au point où nous étions satisfaits des performances », a déclaré Gevaert. « Mais finalement, pour certains types de tumeurs, cela a atteint un niveau tel qu'il peut être utile en clinique. »
Gevaert a souligné que les médecins n’examinent souvent pas les gènes un par un pour prendre des décisions cliniques, mais plutôt les signatures génétiques qui incluent des centaines de gènes différents. Par exemple, de nombreuses cellules cancéreuses activent les mêmes groupes de centaines de gènes liés à l’inflammation ou des centaines de gènes liés à la croissance cellulaire. Comparé à ses performances pour prédire l’expression de gènes individuels, SEQUOIA était encore plus précis pour prédire si des programmes génomiques aussi vastes étaient activés.
Pour rendre les données accessibles et faciles à interpréter, les chercheurs ont programmé SEQUOIA pour afficher les résultats génétiques sous forme de carte visuelle de la biopsie de la tumeur, permettant aux scientifiques et aux cliniciens de voir comment les variations génétiques pourraient être distinctes dans différentes zones d'une tumeur.
Prédire les résultats pour les patients
Pour tester l'utilité de SEQUOIA pour la prise de décision clinique, Gevaert et ses collègues ont identifié des gènes du cancer du sein dont le modèle pourrait prédire avec précision l'expression et qui sont déjà utilisés dans les tests génomiques commerciaux du cancer du sein. (Le test MammaPrint approuvé par la Food and Drug Administration, par exemple, analyse les niveaux de 70 gènes liés au cancer du sein pour fournir aux patientes un score du risque de récidive de leur cancer.)
« Le cancer du sein possède un certain nombre de signatures génétiques très bien étudiées qui se sont révélées, au cours de la dernière décennie, fortement corrélées aux réponses au traitement et aux résultats pour les patients », a déclaré Gevaert. « Cela en faisait un cas de test idéal pour notre modèle. »
SEQUOIA, a montré l'équipe, pourrait fournir le même type de score de risque génomique que MammaPrint en utilisant uniquement des images colorées de biopsies tumorales. Les résultats ont été répétés sur plusieurs groupes différents de patientes atteintes d’un cancer du sein. Dans chaque cas, les patients identifiés comme à haut risque par SEQUOIA ont eu des résultats moins bons, avec des taux plus élevés de récidive du cancer et un délai plus court avant la récidive de leur cancer.
Le modèle d'IA ne peut pas encore être utilisé dans un environnement clinique – ; il doit être testé dans des essais cliniques et être approuvé par la FDA avant d'être utilisé pour guider les décisions de traitement – ; mais Gevaert a déclaré que son équipe améliore l'algorithme et étudie ses applications potentielles. À l’avenir, a-t-il déclaré, SEQUOIA pourrait réduire le besoin de tests coûteux d’expression génique.
« Nous avons montré à quel point cela pourrait être utile pour le cancer du sein, et nous pouvons désormais l'utiliser pour tous les cancers et examiner n'importe quelle signature génétique existante », a-t-il déclaré. « C'est une toute nouvelle source de données que nous n'avions pas auparavant. »
Les scientifiques de Roche Diagnostics étaient également les auteurs de l’article.
Le financement de cette recherche a été assuré par l'Institut national du cancer (subvention R01 CA260271), une bourse de la Belgian American Educational Foundation, une subvention du Fonds Wetenschappelijk Onderzoek-Vlaanderen, la Commission espagnole Fulbright et l'Université de Gand.