Un algorithme informatique peut efficacement trouver des mutations génétiques qui fonctionnent ensemble pour provoquer le cancer ainsi que d’autres indices génétiques importants que les chercheurs pourraient un jour utiliser pour développer de nouveaux traitements pour une variété de cancers.
Rapport dans le journal Les frontières de la bioinformatiqueune équipe dirigée par l'Université de l'État de Washington a utilisé un nouveau modèle informatique en réseau pour trouver des mutations concomitantes ainsi que d'autres similitudes entre les éléments de séquence d'ADN de plusieurs types de cancer. Le modèle permet de rechercher plus facilement des modèles dans d'énormes quantités de données génétiques sur le cancer.
« Il ne s’agit pas d’une étude portant sur un cancer en particulier, dans laquelle on plonge pour essayer de le comprendre, mais plutôt sur de nombreux cancers ensemble, à la recherche de modèles et d’éléments qui pourraient un jour être utilisés pour la découverte de médicaments. »
Assefaw Gebremedhin, auteur correspondant, professeur associé, École de génie électrique et d'informatique de la WSU
Le cancer est souvent présenté comme une seule maladie, mais il s'agit en réalité d'un spectre de maladies dans lesquelles différentes mutations motrices dictent la progression et le pronostic de la maladie, a déclaré Steven Roberts, co-auteur et chercheur en génétique moléculaire à l'Université du Vermont. Une meilleure compréhension de la fréquence des différentes mutations et des gènes moteurs dans les différents types de cancer pourrait aider à prioriser les cibles possibles pour le traitement. Mais les chercheurs sur le cancer ont été entravés dans leur recherche d'indices par l'énorme quantité de calculs nécessaires pour étudier de longues séquences génétiques et un grand nombre de mutations.
« Nous ne pouvons pas vraiment examiner toutes les séquences, car l'espace de calcul serait trop important », a déclaré Roberts. « Si vous essayez de rassembler toutes les données génomiques et de les analyser toutes, le problème mathématique devient exponentiel et vous submergez le système. »
Le modèle de réseau développé par l’équipe WSU, appelé DiWANN, est plus clairsemé et plus efficace que les modèles de réseau existants sans perdre de composants structurels clés.
« Ce modèle permet de représenter les choses de manière minimale sans perdre d'informations », a déclaré Gebremedhin. « Notre modèle tente de comprendre les relations entre les séquences de manière plus efficace, et par efficace, j'entends qu'elles peuvent être calculées rapidement. Avec cette représentation minimale du réseau, vous pouvez obtenir plus d'informations et rendre le calcul évolutif. »
Depuis le développement de leur modèle DiWANN il y a cinq ans, les chercheurs l'ont utilisé pour étudier la répartition géographique des maladies transmises par les tiques ainsi que la propagation de la COVID-19 pendant la pandémie.
Dans le cadre de cette étude, les chercheurs ont ajouté une étape de réduction des données pour réduire encore davantage la quantité de calculs requis et un deuxième modèle informatique pour obtenir des informations plus approfondies sur les gènes coexistants. Shruti Patil, étudiante au doctorat en informatique à la WSU, a dirigé cet effort et est la première auteure de l'étude.
Les chercheurs ont ainsi découvert que deux mutations du cancer du pancréas apparaissent presque toujours ensemble, ce qui n'était jusqu'alors qu'une suspicion. L'une des mutations, la protéine tumorale 53, inhibe la croissance tumorale tandis que l'autre, connue sous le nom de KRAS, est un facteur de prolifération.
Les chercheurs ont identifié des types de cancer étroitement liés les uns aux autres et susceptibles d’être sensibles aux traitements médicamenteux courants. Certains cancers étaient homogènes, c’est-à-dire qu’ils présentaient tous des mutations similaires conduisant au cancer, tandis que d’autres types de cancers présentaient une grande variété de mutations différentes.
« Certains types de cancer sont très homogènes et leurs mutations motrices sont presque toujours les mêmes, mais il existe d'autres types de cancer où la situation est très hétérogène », a déclaré Roberts. « Ce sont ceux-là, d'après nos prévisions, qui seront probablement les plus difficiles à traiter. »
Parce qu’il fournit des informations éparses, le modèle de réseau WSU permet aux chercheurs d’élargir le nombre de tumeurs qu’ils peuvent étudier.
« Cela augmente notre capacité à détecter de nouvelles interactions et de nouveaux aspects du comportement de ces tumeurs », a déclaré Roberts. « Si nous pouvons réellement analyser de grands ensembles de données, ce sera un moyen beaucoup plus rapide de procéder. »
Les chercheurs travaillent actuellement à la mise au point d'un outil en ligne destiné aux experts en santé publique, afin que les chercheurs en santé puissent utiliser plus facilement le modèle pour étudier des questions complexes liées au cancer et à d'autres maladies. Ces travaux ont été soutenus par la National Science Foundation et le National Cancer Institute.