Un outil innovant basé sur l’IA exploite des descriptions variées de symptômes, ainsi que des preuves issues de la littérature scientifique et des ensembles de données génomiques, pour identifier les variantes génétiques associées à la maladie.
Dans le cadre d’une étape majeure vers la compréhension des complexités génétiques des maladies rares, les chercheurs de KAUST ont dévoilé un outil qui pourrait faciliter le diagnostic de ces conditions énigmatiques.
Nommée STARVar, la méthode exploite un large éventail de sources de données – notamment des informations générales provenant de la littérature scientifique, des informations génomiques provenant de lectures de séquences d’ADN et des symptômes cliniques provenant de dossiers de patients individuels – pour identifier avec précision les variantes génétiques associées aux maladies.
La nouvelle ressource basée sur l’intelligence artificielle se distingue des autres outils de priorisation des gènes en raison de l’accent mis sur les symptômes réels des patients, quelle que soit la manière dont ces descriptions cliniques sont documentées.
« STARVar est un outil unique et efficace qui présente l’avantage de donner la priorité aux variantes génomiques en utilisant des symptômes de patients exprimés de manière flexible dans un texte libre », déclare Șenay Kafkas, chercheur en bioinformatique à KAUST et premier auteur d’un nouveau rapport détaillant l’innovation. outil.
Les méthodes traditionnelles exigent souvent que les présentations cliniques adhèrent à des vocabulaires standardisés, ce qui empêche une compréhension plus nuancée et précise des symptômes des patients. La réalité, cependant, est que les médecins et les chercheurs transmettent fréquemment les données des patients en utilisant une terminologie qui va au-delà des termes prédéfinis.
STARVar — abréviation de Symptom-based Tool for Automatic Ranking of Variants — propose désormais une solution plus dynamique et adaptable en pratique.
Conçue par l’informaticien Robert Hoehndorf de KAUST et les membres de son équipe, la méthode peut interpréter les données sur les symptômes enregistrées dans des formats standardisés ou en langage naturel.
Lorsqu’il a été évalué sur différents ensembles de données génomiques – générés à l’aide de variantes cliniques collectées auprès de patients, à la fois en Arabie Saoudite et dans d’autres pays du monde – STARVar a surpassé plusieurs autres outils de priorisation des variantes qui ne peuvent fonctionner qu’avec des symptômes représentés de manière rigide. En particulier, l’algorithme a systématiquement classé la bonne variante associée à la maladie au sommet ou presque de la liste des variantes candidates potentielles dans ces tests de validation.
Illustrant l’impact de STARVar dans un contexte réel, les chercheurs ont également utilisé l’outil pour aider à diagnostiquer une jeune fille saoudienne qui présentait des signes de raideur articulaire, des bosses sous la peau et des lésions osseuses.
Sur près de 800 variantes génétiques suspectes découvertes par le séquençage génomique, STARVar a habilement réduit les possibilités à une mutation solitaire. Cette mutation, dans un gène appelé MMP2, était déjà connue pour être pathogène et était donc impliquée comme étant probablement à l’origine de l’état de la jeune fille.
STARVar est désormais disponible gratuitement en ligne et Kafkas espère voir la communauté de la génétique clinique l’adopter et intégrer la méthode analytique dans ses flux de travail génomiques.
STARVar se présente comme un outil unique et efficace, qui fera la lumière sur les maladies rares et fournira un soutien diagnostique vital aux cliniciens et aux familles affectées. »
Șenay Kafkas, chercheur en bioinformatique à KAUST