La pandémie actuelle de COVID-19 causée par un virus à ARN simple brin, qui aurait franchi les barrières d'espèces pour infecter l'homme, s'est propagée rapidement à travers le monde, infectant plus de 10 millions d'individus. Le virus, maintenant connu sous le nom de coronavirus 2 du syndrome respiratoire aigu sévère (SRAS-CoV-2), est l'agent causal de la maladie COVID-19. La maladie COVID-19 est une maladie respiratoire dont les symptômes peuvent aller de très légers à graves et comprennent de la fièvre, de la toux, un mal de gorge et un essoufflement.
À l'heure actuelle, la recherche d'antiviraux et de thérapies est en bonne voie, mais le manque de compréhension complète de la structure virale et de la biologie reste un défi.
Maintenant, une nouvelle étude menée par des scientifiques du Whitehead Institute for Biomedical Research, du Massachusetts Institute of Technology et de la Boston University School of Medicine et publiée sur le serveur de préimpression bioRxiv en juin 2020 décrit les structures d'ARN au sein du virus qui jouent un rôle régulateur critique dans la transcription virale, et révèlent également des différences significatives dans la structure de certaines cibles médicamenteuses majeures au sein du virus.
Sommaire
Structures d'ARN secondaire importantes pour la réplication et la transcription
Les études antérieures sur les structures des coronavirus montrent plusieurs régions conservées qui jouent un rôle essentiel dans la réplication virale, comme le 5 ’UTR, le 3’ UTR et l’élément frameshift (FSE). Leur structure a également été dérivée du calcul à l'aide de données expérimentales, à partir de techniques telles que les sondes RNAse et la spectroscopie de résonance magnétique nucléaire (RMN). De plus, l'importance fonctionnelle des structures secondaires de ces régions sous-génomiques a été rapportée pour la réplication et la transcription virales.
L'élément Frameshift
Le FSE, par exemple, est près de la frontière ORF1a / ORF1b et agit pour décaler le cadre de lecture ribosomique d'un nucléotide. Cela contourne le codon d'arrêt à la fin de l'ORF1a et fournit une exposition pour les protéines codées ORF1b comme l'ARN polymérase ARN dépendante de l'ARN viral (RdRP). Pour de nombreux virus, le taux de décalage de cadre est strictement réglementé, car de petits changements dans le pourcentage de décalage de cadre entraînent une modification spectaculaire de la production d'ARN génomique et de la dose virale requise pour l'infection.
Pour cette raison, le FSE est une cible thérapeutique principale, et des médicaments à petites molécules sont étudiés pour modifier le taux de ce glissement au niveau des ribosomes et ainsi inhiber la traduction des protéines virales.
Sondage à l'échelle du génome de la structure intracellulaire de l'ARN SARS-CoV-2 avec DMS-MaPseq. (A) Schéma du protocole expérimental pour sonder les structures d'ARN viral avec DMS-MaPseq. (B) Corrélation des réactivités DMS pour chaque base entre deux répétitions biologiques. (C) Couverture à l'échelle du génome en fonction de la position. La couverture à chaque position représente la couverture moyenne sur une fenêtre de 400 nt. (D) Signal et bruit en fonction de la position du génome pour l'ARN non traité et traité par DMS. Le signal (taux de mutation pour A et C) et le bruit (taux de mutation pour G et U) à chaque position ont été tracés comme la moyenne de la fenêtre de 100 nt. Une fraction mutationnelle de 0,01 à une position donnée représente 1% des lectures présentant une discordance ou une suppression à cette position. (E) Modèle en cellule de l'UTR 5 'et début de la structure ORF1a. Les bases sont colorées par leur signal DMS; les bases qui ne sont pas réactives au DMS sont de couleur blanche.
Absence de modèle FSE validé
Le FSE du SARS-CoV est presque identique à celui du SARS-CoV-2, avec une seule différence nucléotidique. L'étude par RMN montre qu'il s'agit d'une structure pseudoknot à 3 tiges. La présence du pseudoknot provoque une pause ribosomique puis un rétrogradage d'un nucléotide pour détendre la tension. Jusqu'à présent, cependant, le taux de tels déplacements dans le SRAS-CoV-2 est inconnu.
Il n'y a pas de modèle de structure d'ARN validé pour le FSE, et pour de nombreux autres éléments génomiques fonctionnellement importants des CoV sont encore inconnus. Cela comprend la plupart des séquences de régulation de la transcription (TRS). Ces courtes séquences sont essentielles pour la transcription de l'ARN sous-génomique (sgRNA), la séquence transcrite de base à partir de laquelle toutes les protéines qui sont codées en dehors de l'ORF1ab sont traduites.
Le génome du SRAS-CoV-2 a 10 TRS, un situé à l'extrémité 5 ', un leader TRS et le reste du corps TRS, un avant chacun des cadres de lecture ouverts autres que ORF1ab. Ces corps TRS génèrent 9 sgRNA par transcription discontinue.
Les premiers modèles de calcul in silico ont été améliorés à l'aide de sondes chimiques pour une analyse d'ARN à l'échelle du génome, car celles-ci ont fourni des mesures in vivo essentielles des structures in vivo.
L'étude: sondage DMS de la structure de l'ARN
L'étude actuelle utilise la sonde sulfate de diméthyle (DMS) pour sonder la structure secondaire de l'ensemble du génome de l'ARN. Les chercheurs disent: «Nos résultats révèlent des différences majeures dans les prévisions silico et mettent en évidence les structures physiologiques des éléments fonctionnels connus. Nos travaux fournissent des données expérimentales sur la biologie structurale des virus à ARN et éclaireront les efforts de développement de diagnostics et de thérapies à base d'ARN pour le SRAS-CoV-2. »
Les chercheurs ont ajouté du DMS aux cellules Vero infectées et ont effectué un profilage mutationnel avec séquençage, car le DMS se couple rapidement aux adénines et cytosines non appariées in vivo. Ils ont trouvé cinq boucles de tige (SL) dans l’UTR 5 ’et trois boucles de tige près du début de l’ORF1a. Ceux-ci ont différentes fonctions vitales.
Boucles de tige fonctionnellement importantes
SL1 est nécessaire pour la réplication virale, SL2, qui est le plus hautement conservé dans cette région, est requis pour la réplication, et SL3 contient le TRS leader nécessaire pour la transcription discontinue. SL4 est nécessaire pour la synthèse de l'ARNg s, en maintenant un espacement approprié entre les boucles de tige en amont et en aval.
Régions structurées et accessibles
Tous les tronçons qui avaient au moins 10 bases appariées consécutives ou 14 bases non appariées sont appelés respectivement structurés ou accessibles. Les premiers pourraient être des cibles thérapeutiques, et 215 ont été identifiés dans cette étude, y compris certaines structures avec des fonctions connues et beaucoup avec des fonctions inconnues.
Les régions accessibles pourraient servir de cibles de thérapies d'oligonucléotides antisens, et 261 d'entre elles ont été identifiées ici. Il est important de noter que 11 régions accessibles sont présentes dans l'ORF-N, qui est présent dans presque tous les sgRNA, ce qui signifie qu'ils peuvent tous être ciblés par ce type de thérapie, ensemble ou individuellement.
Ils ont également constaté que les SRT sont situés dans des boucles de tige dans 7 des 9 cas.
Structure alternative du FSE
Les chercheurs ont également examiné la structure FSE au sein des cellules et ont constaté qu'au lieu de la formation de pseudoknot en aval d'une séquence glissante où le transcrit décale d'un nucléotide, il existe un appariement alternatif réalisé par la moitié de la tige canonique 1, à 10 bases en amont, du séquence glissante. C'est ce qu'on appelle la tige alternative 1 (AS!).
Cette structure repliée n'est visualisée que lorsque toute la longueur de la molécule d'ARN est fournie dans le contexte de la séquence FSE. En effet, seul le génome sur toute la longueur offre la gamme complète des possibilités d'appariement, ce qui conduit à l'adoption de la tige alternative 1, comme structure prédominante. Cette séquence d'appariement est conservée à travers le clade des sarbecovirus et semble leur être unique.
Le FSE forme également deux structures différentes au sein des cellules, les structures 1 et 2, mais des études supplémentaires seront nécessaires pour déterminer si celles-ci contribuent à l'efficacité du changement de cadre en arrêtant le ribosome sur le site glissant plutôt que loin de lui.
Modèle de structures alternatives régulant le décalage de cadre. Lorsque l'ARN génomique se replie dans la structure alternative 1 (en haut), le site glissant réside dans une boucle au milieu d'une longue boucle de tige. Lorsque le ribosome commence à dérouler l'ARN, il peut s'arrêter à la base de la tige, mais cette pause est loin du site glissant. Au moment où le ribosome atteint le site glissant, la structure devant lui a été déroulée. À mesure que le ribosome continue, il atteindra le codon d'arrêt en amont et terminera la traduction. En revanche, la structure alternative 2 (en bas) forme une boucle de tige de 75 nt juste en face du site glissant. Cette boucle de tige peut provoquer une pause du ribosome, un décalage de cadre de -1 nt et contourner le codon d'arrêt en amont pour continuer la traduction.
Implications et importance thérapeutique
Des travaux antérieurs montrent que la formation de pseudoknots ou de tiges stables juste en amont de la séquence glissante améliore les taux de changement de trame. Pourtant, aucune étude spécifique sur l'efficacité de la traduction de ORF1ab dans les cellules infectées par le sarbecovirus n'est connue.
L'étude suggère également l'implication de la protéine N dans la liaison et le déroulement du TRS pour lui permettre de fonctionner. Si la stabilité du TRS est altérée, cela pourrait réduire son affinité pour la protéine N, qui à son tour pourrait altérer l'expression des sgRNA. Cela pourrait donc être une autre cible thérapeutique.
Dans l'ensemble, l'étude met en évidence plusieurs structures d'ARN majeures sur l'ensemble du génome et suggère un nouveau modèle structurel FSE, le modèle principal étant la tige alternative 1. Les chercheurs indiquent la direction de nouveaux travaux: «Les travaux futurs impliqueront de déterminer par quel mécanisme et dans quelle mesure les structures alternatives du SARS-CoV-2 FSE régulent la traduction de ORF1ab, ainsi que si le FSE peut se replier en un pseudoknot dans les cellules.
Ce type de compréhension pourrait permettre le développement de thérapies plus précisément conçues et efficaces.
*Avis important
bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas examinés par les pairs et, par conséquent, ne doivent pas être considérés comme concluants, orienter la pratique clinique / les comportements liés à la santé, ou traités comme des informations établies.