Dans une récente étude publiée sur bioRxiv* serveur de préimpression, les chercheurs ont cherché à savoir si les régions à faible complexité (LCR) étaient plus responsables de l’épidémie actuelle de virus du monkeypox (MPX) (MPXV) du clade IIb 2022 plutôt que des polymorphismes mononucléotidiques (SNP).
Sommaire
Arrière plan
L’épidémie de MPXV en cours est due à une infection par la sous-clade IIb MPXV. Contrairement aux cas de MPX causés par le clade I et le clade IIa-MPXV, le pronostic actuel de l’épidémie est largement favorable, malgré une transmission MPXV interhumaine considérablement plus efficace. Le MPXV a évolué en raison des pressions sélectives des hôtes et des pertes de gènes interagissant avec l’hôte. À ce jour, il y a eu des explications génomiques insatisfaisantes pour les SNP expliquant la transmissibilité accrue du MPXV.
À propos de l’étude
La présente étude a cherché à déterminer si les variations de la LCR étaient principalement responsables des altérations du génome du MPXV et de l’épidémiologie inattendue de l’épidémie de MPXV 2022.
Les séquences de la lignée II sous-clade B.1 MPXV ont été assemblées de novo en utilisant une méthode de cartographie qui impliquait l’utilisation de la métagénomique en fusil de chasse et le séquençage en lectures courtes de l’acide ribonucléique (ARN) et de l’acide désoxyribonucléique (ADN) extraits d’écouvillons de lésions vésiculaires de patients MPX diagnostiqués entre le 18 mai et le 14 juillet 2022 en Espagne.
La résolution LCR a été réalisée sur la base de la cartographie du génome de référence, et en silicone analyses ont été effectuées. Les résultats ont été appliqués à des ensembles de données MPXV NCBI (centre national d’information sur la biotechnologie) SRA (archive de lecture de séquences) accessibles au public (n = 35) de lectures brutes d’une seule molécule. Pour déterminer la séquence LCR réelle, une combinaison de différentes stratégies de séquençage a été utilisée.
La distribution des LCR parmi les différents groupes de gènes de poxvirus orthologues de protéines fonctionnelles majeures (OPG) et l’étendue de la diversité parmi les 21 LCR identifiés ont été comparées. Pour tous les LCR dans tous les échantillons de données, les fréquences alléliques ont été caractérisées et évaluées de manière comparative.
Résultats
Un génome MPXV HQS 353R qui représentait l’épidémie MPXV actuelle de 2022 a été déterminé avec précision sur la base des variations de LCR avec des variations significatives de STR dans les LCR. Dans le génome MPXV, l’entropie LCR était significativement plus élevée que l’entropie SNP. In silico les analyses ont indiqué que l’expression, la traduction, la stabilité ou la fonction des MPXV OPG 153, 204 et 208 pourraient être affectées par l’accordéon évolutif génomique impliquant des expansions et des contractions rythmiques du génome.
Un total de 48 séquences du génome MPXV ont été déterminées avec une profondeur de lecture ≥10X et 39 697 742 lectures HQ pour chaque écouvillon. Un contig, deux contigs, trois contigs et un contig appartenaient à MPXV avec une couverture de 101 %, 97 % et 97 %, respectivement, de la séquence MPXV-M5312_HM12_Rivers. Au total, 21 LCR ont été identifiés avec des paires de LCR 10/11 et 1/4 ayant des copies similaires dans les formations complémentaires inverses.
LCR3 contenait un TR avec l’ATAT [ACATTATAT]n séquence, et l’analyse a indiqué que n = 52. Aucune des séquences du génome de l’orthopoxvirus MPXV disponibles publiquement n’avait un TR aussi long. Quatre séquences du génome MPXV de la lignée IIb clade B.1 de l’épidémie actuelle de MPXV de 2022 ont montré n = 54 à 62 répétitions LCR3, et le nombre de STR a différencié les séquences des séquences du génome de la lignée IIb sous-clade A (12 à 42 STR dans les régions LCR3) , indiquant une forte variabilité génétique dans LCR3.
De même, des différences de STR spécifiques à la lignée MPXV de la sous-clade IIb ont été détectées dans la paire 1/4 LCR. La paire contenait un STR avec le [AACTAACTTATGACTT]n séquence, et les résultats de l’analyse ont indiqué que n = 16. LCR3 semblait avoir une plus grande longueur depuis le débordement viral, alors que la longueur de la paire 1/4 LCR semblait avoir diminué, se comportant comme un accordéon génomique avec le temps.
Les séquences génomiques MPXV_USA_2022_MA001 et 353R de la lignée II de la sous-clade B.1 avaient 67 SNP contre les séquences d’isolat de référence de la lignée II de la sous-clade A. De plus, le 353R HQS contenait deux autres paires de SNP sur des répétitions inversées (ITR) à droite et à gauche, résultant en un codon d’arrêt du gène OPG015. Les séquences MPXV_USA_2022_MA001 et 353R différaient également par deux indels (insertions-délétions) de bases situées aux positions 077,133 et 273,173, correspondant respectivement aux différences de la région LCR2 et de la région LCR5.
Le 353R HQS différait de 1 338 paires de bases (pb) et de 1 342 pb en longueurs génomiques par rapport aux séquences MPXV M5312_HM12_Rivers et MPXV_USA_2022_MA001, respectivement. Les LCR MPXV ont été distribués de manière non aléatoire avec une force de sélection purificatrice significative contre l’introduction de LCR dans les sites centraux conservés. Dans 353R HQS, les régions LCR 2, 5, 7, 10, 11 et 21 ont montré une diversité génomique intra-hôte, avec des valeurs d’entropie comprises entre 0, 2 et 1, 7, avec une variété significativement plus grande dans les LCR que dans les SNP. La distance euclidienne moyenne entre les échantillons pour les LCR variait entre 0,1 (LCR21) et 0,7 (LCR2), et les différences de LCR ont montré une signification statistique.
La paire LCR 10/11 et LCR7 ont montré des variations intra-hôtes considérables et des différences alléliques prépondérantes entre les échantillons. Les LCR 5, 6 et 7 étaient situés dans un site conservé central défini du génome du MPXV entre les positions génomiques 130 000 et 138 000, et le site comprenait les OPG-152, 153 et 154. LCR7 était situé dans un centre ORF fonctionnel, tandis que LCR3 et 21 étaient situés dans le site promoteur/départ, modifiant probablement le site de départ de l’ORF. La région entre les positions 170 000 et 180 000 comprenait les LCR 2, 3, 19, 20 et 21 et était un autre site d’impact fonctionnel.
Dans l’ensemble, les résultats de l’étude ont montré que la majeure partie de la variabilité génomique du MPXV se produisait dans les LCR. Par conséquent, la recherche mettant l’accent sur les différences phénotypiques de MPXV devrait se concentrer sur les variations de LCR plutôt que sur les variations de SNP.
*Avis important
bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique/les comportements liés à la santé, ou traités comme des informations établies.