L’utilisation de méthodes informatiques pour étudier les structures secondaires complexes des molécules d’acide ribonucléique (ARN) a longtemps été d’une importance significative pour la recherche biologique et le développement de médicaments, en particulier avec l’essor des ARN synthétiques.
Étude: Repliement de l’ARN à l’aide d’ordinateurs quantiques. Crédit d’image : Gorodenkoff / Shutterstock.com
Les structures secondaires des molécules d’ARN peuvent impacter leur stabilité, leur fonction de traduction et de transcription, ainsi que leur compacité. Cependant, la vérification des structures secondaires par des méthodes expérimentales prend énormément de temps.
Bien que les méthodes de calcul puissent varier considérablement, beaucoup sont limitées dans leur capacité à traiter des structures comprenant des pseudonœuds. En fait, même les méthodes les plus efficaces pour résoudre les structures secondaires de l’ARN ne peuvent pas résoudre efficacement les pseudonœuds.
Dans un récent Biologie computationnelle PLOS étude, les chercheurs étudient la possibilité d’utiliser l’informatique quantique pour créer des méthodes capables de résoudre plus efficacement et plus rapidement ces structures.
Arrière-plan
Les ordinateurs quantiques sont souvent classés en modèles de porte ou en recuit quantique. Les recuits quantiques, par exemple, ont une gamme d’applications beaucoup plus étroite que les systèmes de modélisation de grille et se concentrent sur l’optimisation des solutions aux problèmes en minimisant un problème hamiltonien.
La prédiction de la structure secondaire de l’ARN a été mise en œuvre sous la forme d’un modèle quadratique binaire (BQM) sur un recuit quantique à onde D (QA) avec un hamiltonien conçu pour optimiser le nombre de paires de bases consécutives non chevauchantes. Les pseudo-nœuds ont imposé des pénalités et des contraintes supplémentaires ont été utilisées pour empêcher les bases de former plus d’une paire.
Les données classiques ont été encodées sur un dispositif quantique, chaque tige possible étant mappée sur un seul qubit. Les qubits qui renvoient une valeur de un lors de la mesure représentent des tiges qui contribuent à une structure secondaire.
L’équation utilise un terme énergétique récompensant des tiges plus longues et deux constantes accordables. La structure secondaire finale peut ensuite être déterminée en enregistrant les valeurs de tous les qubits et en sauvegardant toutes les tiges qui étaient représentées par des qubits renvoyant ‘1’.
Cependant, si l’unité de traitement quantique (QPU) est directement chargée avec le BQM, les données renvoyées sont considérablement bruyantes, un plus grand nombre de qubits aggravant le problème. L’onde D utilise un dispositif classique comme solveur hybride, qui décompose le problème en éléments plus petits avant de les transmettre au QPU pour qu’il les résolve.
(a) Représentation matricielle des paires de bases potentielles. Les tiges sont surlignées en nuances de gris et entourées de noir ou de bleu. Les couleurs ne servent qu’à aider à distinguer les tiges. (b) Représentations structurelles des tiges. Les lignes grises indiquent des liaisons covalentes, les lignes rouges indiquent l’appariement de bases et les lignes violettes en pointillés représentent les paires de bases dans une configuration de pseudonœud. La couleur des cases correspond aux tiges identifiées en (a). (c) Chaque radical possible est attribué à un qubit sur le dispositif quantique. Si le qubit renvoie « 1 », alors la tige associée est incluse dans la structure secondaire de l’ARN. Sinon, la tige est exclue.
Résultats de l’étude
Dans l’étude actuelle, un solveur compatible MPI a été écrit pour comparer avec le solveur hybride. En utilisant cette méthode, les systèmes contenant 45 qubits peuvent être résolus en moins de 24 heures en utilisant 7 900 cœurs d’unité centrale de traitement (CPU).
La structure prédite par l’algorithme est ensuite comparée à la solution connue, la sensibilité reflétant la fraction de paires de bases correctement identifiée et la spécificité reflétant la fraction de paires de bases mappées à la structure dans le bon ordre.
La pseudobase a été récupérée pour des exemples de séquences d’ARN avec des pseudonœuds confirmés à utiliser comme ensemble de test, toutes les séquences présentant des similitudes supérieures à 95 % étant exclues.
La plupart des séquences ont donné trop de tiges possibles pour chaque énumération. Ainsi, la longueur de la plus petite tige possible a été augmentée à quatre, excluant les tiges les plus courtes et réduisant la taille de l’espace de solution. L’ensemble de test final contenait 27 séquences et un test de base a montré une sensibilité de 0,97 et une spécificité de 0,93.
Les systèmes contenant entre 45 et 881 tiges ont été évalués en utilisant à la fois l’informatique quantique et une méthode d’algorithme de Monte Carlo à échange de répliques parallèle (REMC). La méthode REMC a montré une sensibilité et une spécificité légèrement plus élevées que la méthode QC ; cependant, en moyenne, les résultats étaient très similaires.
Les chercheurs ont ensuite choisi de comparer ces résultats à trois algorithmes existants trouvés dans la littérature actuelle, notamment SPOT-RNA, ProbKnot et ViennaRNA. Alors que les deux premiers algorithmes sont capables de prédire les pseudonœuds, l’ARN de Vienne ne l’est pas.
Comme prévu, l’ARN de Vienne a été le pire de toutes les méthodes, suivi de ProbKnot et de SPOT-ARN. Notamment, SPOT-RNA a fonctionné presque aussi bien que QC sur des ensembles de données avec plus de 45 tiges, mais pas aussi bien sur des ensembles de données avec moins.
conclusion
Les résultats de l’étude actuelle démontrent qu’il est possible de développer un potentiel de repliement classique mappé sur du matériel quantique. Bien que cette approche n’ait pas surpassé certaines méthodes actuelles, elle fournit une preuve de concept pour un développement plus approfondi de méthodes similaires à l’avenir.
Les chercheurs proposent ici de nombreuses façons d’améliorer ce type de système, par exemple en permettant au modèle de tenir compte des paires non-Watson-Crick ou oscillantes. L’informatique quantique a donc le potentiel d’être incroyablement utile pour les futures tentatives de résolution du repliement de l’ARN, car des solutions d’énergie minimale pour les grands espaces de recherche combinatoire peuvent être trouvées rapidement. De plus, les CQ ont la possibilité d’employer des potentiels plus complexes, ce qui pourrait conduire à une plus grande spécificité et sensibilité à l’avenir.