L’amélioration du criblage virtuel grâce à l’apprentissage automatique a permis de diviser par 10 le temps de traitement de 1,56 milliard de molécules de type médicament. Des chercheurs de l’Université de Finlande orientale se sont associés à l’industrie et à des superordinateurs pour réaliser l’un des plus grands dépistages virtuels de médicaments au monde.
Dans leurs efforts pour trouver de nouvelles molécules médicamenteuses, les chercheurs s’appuient souvent sur un criblage rapide et assisté par ordinateur de grandes bibliothèques de composés pour identifier les agents susceptibles de bloquer une cible médicamenteuse. Une telle cible peut, par exemple, être une enzyme permettant à une bactérie de résister aux antibiotiques ou à un virus d’infecter son hôte. La taille de ces collections de petites molécules organiques a connu une augmentation massive au cours des dernières années. Les bibliothèques se développant plus rapidement que la vitesse des ordinateurs nécessaires à leur traitement, le criblage d’une bibliothèque de composés moderne à l’échelle d’un milliard contre une seule cible médicamenteuse peut prendre plusieurs mois, voire plusieurs années, même en utilisant des superordinateurs de pointe. Il est donc évident que des approches plus rapides sont désespérément nécessaires.
Dans une étude récente publiée dans le Journal d’information et de modélisation chimiquesle Dr Ina Pöhner et ses collègues de l’école de pharmacie de l’Université de Finlande orientale se sont associés à l’organisation hôte des puissants superordinateurs finlandais, CSC – IT Center for Science Ltd. – et aux collaborateurs industriels d’Orion Pharma pour étudier les perspectives de l’apprentissage automatique dans le accélération des écrans virtuels à grande échelle.
Avant d’utiliser l’intelligence artificielle pour accélérer le dépistage, les chercheurs ont d’abord établi une base de référence : lors d’une campagne de dépistage virtuel d’une ampleur sans précédent, 1,56 milliard de molécules de type médicament ont été évaluées contre deux cibles pharmacologiquement pertinentes pendant près de six mois avec l’aide des superordinateurs Mahti et Puhti et amarrage moléculaire. L’amarrage est une technique informatique qui adapte les petites molécules dans une région de liaison de la cible et calcule un « score d’amarrage » pour exprimer leur adéquation. De cette façon, les scores d’amarrage ont d’abord été déterminés pour l’ensemble des 1,56 milliards de molécules.
Ensuite, les résultats ont été comparés à un écran optimisé par l’apprentissage automatique à l’aide de HASTEN, un outil développé par le Dr Tuomo Kalliokoski d’Orion Pharma, co-auteur de l’étude.
HASTEN utilise l’apprentissage automatique pour connaître les propriétés des molécules et comment ces propriétés affectent le score des composés. Lorsqu’on lui présente suffisamment d’exemples tirés de l’amarrage conventionnel, le modèle d’apprentissage automatique peut prédire les scores d’amarrage pour d’autres composés de la bibliothèque beaucoup plus rapidement que l’approche d’amarrage par force brute.
Dr Tuomo Kalliokoski d’Orion Pharma
En effet, avec seulement 1 % de l’ensemble de la bibliothèque ancrée et utilisée comme données d’entraînement, l’outil a correctement identifié 90 % des composés les plus performants en moins de dix jours.
L’étude représente la première comparaison rigoureuse d’un outil d’accueil optimisé par l’apprentissage automatique avec une base de référence d’accueil conventionnelle à l’échelle giga. « Nous avons constaté que l’outil optimisé par l’apprentissage automatique reproduisait de manière fiable et répétée la majorité des composés les plus performants identifiés par l’amarrage conventionnel dans un laps de temps considérablement réduit », explique Pöhner.
« Ce projet est un excellent exemple de collaboration entre le monde universitaire et l’industrie, et de la façon dont CSC peut offrir l’une des meilleures ressources informatiques au monde. En combinant nos idées, nos ressources et notre technologie, il a été possible d’atteindre nos objectifs ambitieux », poursuit le professeur. Antti Poso, qui dirige le groupe de découverte informatique de médicaments au sein de la communauté de recherche DrugTech de l’Université de Finlande orientale.
Les études à une échelle comparable restent insaisissables dans la plupart des contextes. Ainsi, les auteurs ont publié dans le domaine public de grands ensembles de données générés dans le cadre de l’étude : leur bibliothèque de criblage prête à l’emploi pour l’amarrage qui permet à d’autres d’accélérer leurs efforts de criblage respectifs, et l’ensemble de leurs 1,56 milliards de résultats d’amarrage composé pour deux cibles comme données de référence. Ces données encourageront le développement futur d’outils permettant d’économiser du temps et des ressources et feront, à terme, progresser dans le domaine de la découverte informatique de médicaments.