Une équipe internationale de chercheurs a identifié un gène auparavant non caractérisé dans le génome du coronavirus du syndrome respiratoire aigu sévère 2 (SRAS-CoV-2) qui peut être important pour comprendre les origines et l'évolution de la maladie à coronavirus 2019 (COVID-19).
Le gène nouvellement identifié, que les chercheurs ont nommé ORF3c, est un exemple de gène chevauchant (OLG). Selon les auteurs, les OLG sont des éléments génomiques fonctionnels qui ont été quelque peu négligés dans le passé, bien qu'ils aient été précédemment indiqués dans les origines des pandémies virales.
Les chercheurs affirment que leur analyse démontrant que le SRAS-CoV-2 contient un OLG qui n'a pas encore été correctement étudié montre que les OLG méritent plus d'attention, d'autant plus que leur contribution à l'émergence de virus zoonotiques peut être plus importante que ce qui est actuellement réalisé.
Une version pré-imprimée du document est accessible sur le serveur bioRxiv *, tandis que l'article fait l'objet d'un examen par les pairs.
Nouveau coronavirus SARS-CoV-2 Micrographie électronique à balayage colorisée d'une cellule apoptotique (bleue) infectée par des particules du virus SARS-COV-2 (rouge), isolée d'un échantillon de patient. Image capturée au NIAID Integrated Research Facility (IRF) à Fort Detrick, Maryland. Crédits: NIAID
Sommaire
L'OLGS représente un domaine de nouveauté sous-étudié
L'épidémie de COVID-19 qui a balayé le monde depuis son épidémie à Wuhan, en Chine en décembre 2019, a soulevé de nombreuses questions sur la façon dont le virus a évolué pour passer des animaux aux humains.
La compréhension des mécanismes potentiels nécessite une compréhension approfondie des génomes viraux, mais un domaine sous-étudié est l'émergence de nouveaux OLG. Bien que les OLG viraux soient courants et aient été précédemment liés au début des pandémies, ils restent largement ignorés dans les études sur les pathogènes émergents.
Ces gènes permettent à une séquence existante de nucléotides codant pour des protéines de coder une nouvelle protéine supplémentaire dans un cadre de lecture différent. Cette «surimpression» améliore la compression des informations génomiques et peut conférer un avantage génétique important, car les séquences à décalage de cadre préservent certaines propriétés des protéines.
Cependant, l'analyse de séquence des OLG est compliquée par le fait qu'une mutation peut entraîner la modification de deux protéines. Les techniques d'annotation du génome ont également tendance à manquer les OLG car elles favorisent un cadre de lecture ouvert dans une région donnée du génome.
«De telles incohérences contrecarrent la recherche»
Dans le cas des bétacoronavirus liés au SRAS (sous-genre Sarbecovirus), les chercheurs connaissent certains OLG, mais ils ont été largement ignorés et rapportés de manière incohérente. Par exemple, les annotations de ORF3b, ORF9b et ORF9c sont en conflit ou manquent complètement dans le génome de référence Wuhan-Hu-1 SARS-CoV-2, et aucun gène se chevauchant dans ORF3a n'est indiqué dans le SARS de l'Université de Californie à Santa Cruz (UCSC). Navigateur du génome -CoV-2.
«De telles incohérences entravent la recherche, car les OLG peuvent jouer un rôle clé dans l'émergence de nouveaux virus», écrivent Xinzhu Wei (Université de Californie, Berkeley) et ses collègues.
Qu'a trouvé la nouvelle étude?
Maintenant, les chercheurs rapportent que leur enquête sur de nouveaux candidats OLG dans le SRAS-CoV-2 a identifié le nouveau gène ORF3c.
Ce gène a, en fait, été documenté précédemment, disent-ils. Cependant, il n'a pas été nommé et les annotations manquaient ou étaient combinées avec ORF3b d'autres sarbecovirus, qui a une position génomique différente et est situé dans un cadre de lecture différent.
Le profilage des ribosomes a montré que l'ORF3c démontre clairement des preuves de traduction et possède d'importantes propriétés immunologiques.
L'équipe a ensuite effectué une analyse évolutive aux niveaux inter-espèces, inter-hôte et intra-hôte. Ils ont découvert que 21 génomes de sarbecovirus représentatifs montraient que l'ORF3c existait également dans certains coronavirus de pangolin, mais pas dans les coronavirus de chauve-souris.
L'analyse de près de 4 000 génomes du SRAS-CoV-2 a montré que l'ORF3c avait acquis un nouveau codon d'arrêt qui s'est produit beaucoup plus fréquemment au cours de la pandémie actuelle de COVID-19. De plus, le séquençage de 401 échantillons de SARS-CoV-2 a révélé que la mutation ORF3c était présente dans divers hôtes.
Étonnamment, le nouveau codon d'arrêt auquel le gène avait acquis avait fait rapidement de l'auto-stop avec un haplotype de protéine de pointe SARS-CoV-2, qui, selon les auteurs, « semble conduire à la propagation de la pandémie européenne ».
Fenêtre coulissante inter-espèces de gènes chevauchant N. Analyse OLGenie par paires du gène N à travers les sarbecovirus, dans le cadre de lecture ss13. Chaque génome a été comparé au SARS-CoV-2 (côté gauche) et au SARS-CoV (tracé du côté droit).
Quelles sont les implications de l'étude?
L'équipe affirme que leurs résultats fournissent des preuves solides que SARS-CoV-2 a un troisième OLG qui n'a pas été correctement identifié ou analysé jusqu'à présent.
« Nos résultats comparent ORF3c à d'autres gènes accessoires viraux importants recombinés, perdus, divisés ou tronqués avant ou pendant les épidémies, y compris ORF3b et ORF8 dans les sarbecovirus », écrivent les chercheurs.
«Les OLG méritent beaucoup plus d'attention, car leur évolution rapide peut être plus importante que ce qui est actuellement apprécié dans l'émergence de virus zoonotiques», concluent-ils.
*Avis important
bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, orienter la pratique clinique / les comportements liés à la santé, ou traités comme des informations établies.