Dans une revue récente publiée dans la revue Nature, les chercheurs ont examiné les récentes percées dans les outils de découverte de ligands, leur potentiel à remodeler le processus de recherche et de développement de médicaments et les obstacles rencontrés.
Les technologies assistées par ordinateur pour le développement de médicaments sont utilisées depuis plusieurs années. Ces derniers temps, l’industrie pharmaceutique et le milieu universitaire ont connu une évolution vers l’adoption d’outils informatiques. La transition est facilitée par l’abondance de données sur les caractéristiques des ligands et la liaison aux cibles thérapeutiques, les structures protéiques tridimensionnelles (3D) et l’émergence de bibliothèques virtuelles à la demande comprenant des milliards de petites molécules de type médicament. Pour utiliser pleinement les ressources, des approches informatiques rapides pour un dépistage efficace et rapide à l’échelle du giga sont nécessaires.
Dans la présente revue, les chercheurs ont examiné les données existantes sur les approches assistées par ordinateur dans la découverte et le développement de médicaments (DDD).
Étude : Approches informatiques rationalisant la découverte de médicaments. Crédit d’image : angellodeco/Shutterstock
Technologie d’intégration à très grande échelle (VLS) pour identifier les hits de haute qualité
La Protein Data Bank (PDB) comprend plus de 200 000 structures de protéines. L’imagerie microscopique cryo-électronique haute résolution et les rayons X couvrent plus de 90 % des familles de protéines, et les lacunes restantes sont comblées par la modélisation et/ou l’homologie AlphaFold2. Les espaces chimiques utilisés pour cribler et synthétiser des candidats-médicaments potentiels sont passés de 107 molécules prêtes à l’emploi à > 3,0 x 10dix molécules synthétisées à la demande de 2015 à 2022, avec un potentiel d’extension à >1015 composés.
Par rapport à HTS (105 à 107) et la découverte de ligands basée sur des fragments (FBLD, 103 à 105), le criblage de bibliothèques codées par l’acide désoxyribonucléique (ADN) à l’échelle giga (DEL) (1010) et le VLS à l’échelle giga utilisent des bibliothèques initiales considérablement plus grandes (10dix à 1015). Le taux de réussite (%) du dépistage HTS et DEL à l’échelle giga est similaire (0,01 à 0,5), plus élevé pour FBLD (1,0 à 5,0) et le plus élevé pour VLS (10 à 40unoù un représente la proportion d’occurrences estimées qui ont été confirmées expérimentalement).
L’affinité pour les coups initiaux est très faible pour FBLD (petits fragments de 100 à 1 000,0 μM), faible (1,0 t 10 μM) pour HTS, moyenne pour le criblage DEL (0,1 à 10 μM) et moyenne à élevée (0,010 à 10 μM) pour VLS. En plus de l’optimisation basée sur la relation quantitative structure-activité (QSAR) pour l’identification des pistes, HTS nécessite une synthèse personnalisée des relations structure-activité, FBLD nécessite la croissance ou la fusion des fragments, et le criblage DEL nécessite une resynthèse de résultats sans étiquette.
VLS implique une optimisation quantitative des relations structure-activité basée sur les structures de catalogue et nécessite un dixième (0,0 à 50) du nombre de processus de synthèse personnalisés requis pour le dépistage HTS, FBLD et DEL pour identifier les pistes. De plus, HTS et FBLD ne génèrent pas de nouveaux hits. Les processus HTS nécessitent des sauts d’échafaudage ou des modifications, et FBLD nécessite des conceptions rationnelles pour atteindre la nouveauté de la propriété intellectuelle (PI). Au contraire, la plupart des hits VLS sont nouveaux.
Les limitations de HTS incluent des tailles de bibliothèque modestes, des modes de liaison inconnus et un équipement coûteux ; Les limites de la FBLD incluent le besoin d’équipements coûteux pour la résonance magnétique nucléaire (RMN), la résonance plasmonique de surface (SPR) et l’imagerie par rayons X, ainsi que de nombreuses étapes d’optimisation ; Le dépistage DEL entraîne plusieurs faux positifs et nécessite une resynthèse hors coup d’acide désoxyribonucléique. Le VLS nécessite des ressources de calcul, qui ont été réduites de plus de 1 000 fois avec le VLS de type modulaire.
Les algorithmes de criblage virtuel sont basés sur des structures protéiques, des ligands ou les deux. Les algorithmes basés sur les protéines nécessitent des structures à haute résolution, tandis que ceux basés sur les ligands nécessitent de grands ensembles de données pour l’activité des ligands. Le criblage hybride nécessite des données sur l’activité des ligands et les complexes 3D protéine-ligand pour générer des empreintes digitales d’interaction tridimensionnelle et des modèles basés sur l’intelligence artificielle (IA).
Types de bibliothèques chimiques et technologie informatique pour rationaliser la découverte de médicaments
Les entreprises pharmaceutiques criblent en interne un nombre énorme de composés, tandis que les collections des fournisseurs permettent une livraison rapide (<1,0 semaine) de molécules en stock présentant des échafaudages de type chimique uniques qui peuvent être recherchés facilement et sont compatibles avec le criblage à haut débit (HTS ). Cependant, le coût de gestion des bibliothèques de médicaments physiques, leur croissance lente et leur petite taille limitent leur applicabilité.
Les espaces REAL et chimiques à la demande permettent une synthèse parallèle rapide de molécules à la demande à partir de plus de 12 000 blocs de construction subissant plus de 180 réactions, avec un taux de réussite de > 80,0 % et une livraison en 2,0 à 3,0 semaines. Les exemples incluent Galaxy de WuXi, Enamine REAL et CHEMriya d’Otava. L’inclusion de synthons supplémentaires (par exemple, à l’aide de l’algorithme V-SYNTHES) et d’échafaudages de réaction permet une grande nouveauté et une croissance polynomiale rapide pour le développement de médicaments basés sur l’espace chimique virtuel.
L’algorithme V-SYNTHES peut être utilisé pour cribler efficacement >31 milliards de composés, dont >3,0 x10dix composés de l’espace RÉEL et> 1015 composés à partir d’espaces chimiques élargis, en énumérant entièrement les molécules qui s’adaptent de manière optimale à la poche cible. Les espaces génératifs (GDB-13,17,18 et GDBChEMBL) incluent toutes les molécules et espaces chimiques théoriquement concevables. Seule la plausibilité de type théorique, prédite entre 1 023 et 1 060 molécules de type médicamenteux, limite ces domaines.
Malgré une large couverture des espaces, les taux de réussite et les voies réactionnelles des composés produits ne sont pas connus, ce qui justifie une estimation informatique de leur capacité à synthétiser des médicaments candidats. Dans les espaces génératifs, les graphes atomiques sont utilisés pour générer des structures d’hydrocarbures saturés et des squelettes comprenant des molécules insaturées. Les squelettes sont élargis par substitution d’hétéroatomes et convertis en composés significatifs.
La découverte de médicaments basée sur le calcul est basée sur des espaces chimiques virtuels à la demande ou génératifs facilement accessibles, ainsi que sur des outils de calcul basés sur la structure et sur l’IA qui rationalisent le processus de découverte de médicaments. Par rapport au calendrier standard de découverte du gène au plomb de quatre à six ans, la technologie basée sur le calcul peut identifier des candidats-médicaments potentiels dans un délai de 2,0 à 12 mois.
L’utilisation d’approches rapides et flexibles d’amarrage, d’apprentissage en profondeur ou de notation avec des outils de post-traitement plus précis basés sur la mécanique quantique et la perturbation de l’énergie libre (FEP) peut augmenter les résultats à haute affinité pour les espaces chimiques à l’échelle du giga. En outre, l’expansion rapide du cloud computing à faible coût, des puces spécialisées et de l’accélération de l’unité de traitement graphique (GPU) facilite également les outils de calcul.
Sur la base des résultats de l’examen, l’écosystème DDD semble passer d’un système assisté par ordinateur à un système piloté par ordinateur pour une découverte de médicaments rapide et rentable à l’aide d’outils élaborés de prédiction de la puissance et de pistes puissantes et sélectives. Cependant, les estimations informatiques nécessitent une validation en effectuant in vitro et in vivo expériences à chaque étape du pipeline de découverte de médicaments.