Les mutations génétiques causent des centaines de troubles non résolus et incurables. Parmi elles, les mutations de l’ADN dans un petit pourcentage de cellules, appelées mutations mosaïques, sont extrêmement difficiles à détecter car elles existent dans un petit pourcentage de cellules.
Lors de la numérisation des 3 milliards de bases du génome humain, les détecteurs logiciels de mutation d’ADN actuels ne sont pas bien adaptés pour discerner les mutations en mosaïque qui se cachent parmi les séquences d’ADN normales. En conséquence, les généticiens médicaux doivent souvent examiner les séquences d’ADN à l’œil nu pour tenter d’identifier ou de confirmer les mutations en mosaïque – ; une entreprise chronophage pleine de possibilités d’erreur.
Écrit dans le numéro du 2 janvier 2023 de Biotechnologie naturelledes chercheurs de la faculté de médecine de l’Université de Californie à San Diego et du Rady Children’s Institute for Genomic Medicine décrivent une méthode permettant d’apprendre à un ordinateur à repérer les mutations en mosaïque à l’aide d’une approche d’intelligence artificielle appelée « apprentissage en profondeur ».
Étude : Détection de variantes de nucléotide unique en mosaïque indépendante du contrôle avec DeepMosaic. Crédit d’image : Laurent T / Shutterstock
L’apprentissage en profondeur, parfois appelé réseaux de neurones artificiels, est une technique d’apprentissage automatique qui apprend aux ordinateurs à faire ce qui vient naturellement aux humains : apprendre par l’exemple, en particulier à partir de grandes quantités d’informations. Par rapport aux modèles statistiques traditionnels, les modèles d’apprentissage en profondeur utilisent des réseaux de neurones artificiels pour traiter les données représentées visuellement. En conséquence, les modèles fonctionnent de manière similaire au traitement visuel humain, avec une précision et une attention aux détails beaucoup plus grandes, conduisant à des avancées significatives dans les capacités de calcul, y compris la détection des mutations.
« Un exemple de trouble non résolu est l’épilepsie focale », a déclaré l’auteur principal de l’étude, Joseph Gleeson, MD, professeur Rady de neurosciences à la faculté de médecine de l’UC San Diego et directeur de la recherche en neurosciences au Rady Children’s Institute for Genomic Medicine.
« L’épilepsie touche 4 % de la population et environ un quart des crises focales ne répondent pas aux médicaments standard. Ces patients nécessitent souvent une excision chirurgicale de la partie focale du cerveau en court-circuit pour arrêter les crises. Parmi ces patients, des mutations en mosaïque dans le cerveau peut provoquer une concentration épileptique.
« Nous avons eu de nombreux patients épileptiques dont nous n’avons pas pu identifier la cause, mais une fois que nous avons appliqué notre méthode, appelée » DeepMosaic « , aux données génomiques, la mutation est devenue évidente. Cela nous a permis d’améliorer la sensibilité du séquençage de l’ADN. dans certaines formes d’épilepsie, et a conduit à des découvertes qui pointent vers de nouvelles façons de traiter les maladies du cerveau. »
Gleeson a déclaré que la détection précise des mutations de la mosaïque est la première étape de la recherche médicale vers le développement de traitements pour de nombreuses maladies.
Le co-premier et co-auteur correspondant Xiaoxu Yang, Ph.D., chercheur postdoctoral dans le laboratoire de Gleeson, a déclaré que DeepMosaic avait été formé sur près de 200 000 variantes simulées et biologiques à travers le génome jusqu’à ce que « enfin, nous soyons satisfaits de sa capacité à détecter les variantes à partir de données qu’il n’avait jamais rencontrées auparavant. »
Pour former l’ordinateur, les auteurs ont alimenté des exemples de mutations mosaïques fiables ainsi que de nombreuses séquences d’ADN normales et ont appris à l’ordinateur à faire la différence. En s’entraînant et en se recyclant à plusieurs reprises avec des ensembles de données de plus en plus complexes et en sélectionnant entre une douzaine de modèles, l’ordinateur a finalement été en mesure d’identifier les mutations en mosaïque bien mieux que les yeux humains et les méthodes précédentes. DeepMosaic a également été testé sur plusieurs ensembles de données de séquençage indépendants à grande échelle qu’il n’avait jamais vus, surpassant les approches précédentes.
« DeepMosaic a surpassé les outils traditionnels pour détecter le mosaïcisme à partir de séquences génomiques et exoniques », a déclaré le co-premier auteur Xin Xu, ancien assistant de recherche de premier cycle à la faculté de médecine de l’UC San Diego et maintenant scientifique des données de recherche chez Novartis. « Les principales caractéristiques visuelles captées par les modèles d’apprentissage en profondeur sont très similaires à ce sur quoi les experts se concentrent lorsqu’ils examinent manuellement les variantes. »
DeepMosaic est disponible gratuitement pour les scientifiques. Les chercheurs ont déclaré qu’il ne s’agissait pas d’un programme informatique unique, mais d’une plate-forme open source qui peut permettre à d’autres chercheurs de former leurs propres réseaux de neurones pour obtenir une détection plus ciblée des mutations en utilisant une configuration similaire basée sur l’image.
Les co-auteurs incluent Martin W. Breuss, Danny Antaki, Laurel L. Ball, Changuk Chung, Jiawei Shen, Chen Li et Renee D. George, UC San Diego et Rady Children’s Institute for Genomic Medicine ; Yifan Wang, Taejeong Bae et Alexei Abyzov, Clinique Mayo ; Yuhe Cheng, Ludmil B. Alexandrov et Jonathan L. Sebat, UC San Diego ; Liping Wei, Université de Pékin ; et NIMH Brain Somatic Mosaicism Network.
Le financement de cette recherche provenait en partie des National Institutes of Health (subventions U01MH108898 et R01MH124890), du San Diego Supercomputer Center et de l’UC San Diego Institute of Genomic Medicine.
NBT : Vidéo d’introduction de la « Détection de variantes de nucléotide unique en mosaïque indépendante du contrôle avec DeepMosaic »