L’agent pathogène causal de la maladie à coronavirus 2019 (COVID-19) – le coronavirus 2 du syndrome respiratoire aigu sévère (SRAS-CoV-2) – a conduit à la plus grande pandémie des temps modernes. Ce virus est l’un des sept coronavirus connus pour provoquer des maladies humaines. Bien que étroitement lié au SRAS-CoV de 2002, il est beaucoup plus infectieux et a une longue période d’incubation.
Ainsi, bien qu’elle soit beaucoup moins meurtrière que la première, elle a entraîné des millions de morts dans le monde. Le premier cas a été signalé sur un marché de fruits de mer à Wuhan, en Chine. Depuis, de nombreuses théories ont émergé quant à son origine.
Une nouvelle étude en Acta Mathematica Scientia suggère que le virus peut être originaire de plusieurs pays presque simultanément, plutôt que de se propager de la Chine au reste du monde.
Sommaire
Coronavirus de la chauve-souris étroitement lié
Le séquençage génomique montre que le virus est le plus étroitement lié au coronavirus de chauve-souris RaTG13. Cela semble indiquer qu’il est issu d’une lignée de coronavirus de chauve-souris. Le RaTG13, cependant, provenait d’un échantillon de 2013 et formait une lignée différente, incapable de transmission humaine directe.
De nombreux scientifiques se sont concentrés sur la collecte et le séquençage d’échantillons d’hôtes intermédiaires putatifs, y compris le pangolin, le vison et les civettes, mais aucune chaîne claire n’est observable jusqu’à présent.
Objectif de l’étude
La première transmission chez les humains a été signalée à Wuhan, tandis que d’autres pays ont signalé leurs premiers cas en février 2020. Cependant, selon les chercheurs, des preuves montrent que le virus circulait déjà dans ces pays en décembre 2019, notamment en Italie, en France et aux États-Unis. .
En l’absence de séquences virales complètes à partir d’échantillons prélevés à cette date dans ces pays, la présente étude espérait examiner comment les séquences actuellement en circulation du virus peuvent être retracées jusqu’à leur apparition la plus précoce chez l’homme.
Contrairement à l’alignement de séquences multiples (MSA), qui est la méthode conventionnelle de recherche de relations entre les séquences génomiques, l’article a utilisé une méthode de vecteur naturel k-mer pour coder la séquence complète du génome viral en tant que vecteurs, basée sur GISAID (Global Initiative pour le partage de toutes les données sur la grippe).
Méthode plus précise
La méthode MSA aligne les séquences comparées pour obtenir une matrice de similitudes entre elles. Cependant, une telle similitude ne satisfait pas la propriété d’inégalité triangulaire de la distance mathématique et ne peut donc pas montrer la distance biologique réelle de différentes séquences.
La méthode k-mer code les séquences vectorielles et définit leur distance naturelle afin de mesurer leur proximité les unes des autres. Alors que la plupart des études n’incluent qu’une seule valeur k pour estimer les distances entre les séquences, les travaux actuels portent sur tous les k-mers pour k ≥ 1.
Ils ont développé une nouvelle métrique qui satisfait les propriétés de positivité, de non-négativité, de symétrie et d’inégalité triangulaire. « La beauté de notre nouvelle métrique naturelle est qu’elle contient des informations sur les distributions de 1-mer à k-mer et est une métrique mathématique pour deux séquences génomiques.. »
Le RaTG13 étant le plus proche en relation avec le SRAS-CoV-2, sa distance a été calculée à partir de chacun des génomes séquencés à partir d’isolats de ce dernier.
Quels ont été les résultats?
La séquence RaTG13 s’est avérée être la plus proche (distance naturelle la plus courte) de celles de cinq isolats de France, d’Inde, des Pays-Bas, d’Angleterre et des États-Unis.
Fait intéressant, les isolats viraux dans ces cinq cas étaient tout aussi proches de RaTG13 que l’était l’isolat de Wuhan. Les distances avec les cinq premiers étaient toutes légèrement inférieures à 31000, ce qui était la distance entre l’isolat de Wuhan et RaTG13.
Ces résultats indiquent que l’endroit où la transmission interhumaine du SRAS-CoV-2 s’est produite pour la première fois est extrêmement peu probable à Wuhan, mais en France, en Inde, aux Pays-Bas, en Angleterre et aux États-Unis, avec un taux de précision supérieur à 91%.«
Différences par rapport aux études antérieures
Des études antérieures avaient déjà suggéré cette possibilité, puisqu’une équipe de scientifiques avait détecté des anticorps anti-virus aux États-Unis en décembre 2019, alors qu’aucun cas n’avait encore été signalé dans ce pays. De même, une étude française a montré la présence de séropositivité (anticorps anti-SARS-CoV-2 immunoglobuline (Ig) G) en novembre 2019.
Ces études n’incluaient pas de séquences complètes, empêchant la validation de leurs résultats par la méthode actuelle. Cet article avance au-delà des utilisations antérieures des techniques basées sur k-mer en employant une correspondance individuelle entre la séquence du génome et le vecteur naturel k-mer.
Puisqu’à n’importe quelle valeur de k, les k-mers résultants seront utilisés pour calculer la métrique nouvellement définie dans cette étude. Cette méthode conserve toutes les informations disponibles pour prédire la similitude biologique réelle entre deux séquences.
Les chercheurs ont choisi RaTG13 comme génome de référence car il n’a pas encore été prouvé que le génome de référence SARS-CoV-2 (NC 045512.2) est la souche la plus ancienne. Le coronavirus de la chauve-souris étant très similaire au virus actuel, la distance par rapport à sa séquence devait montrer à quel point les souches émergentes de différents pays sont apparues.
Quelles sont les implications?
Sur la base des résultats, nous concluons qu’avant l’épidémie de Wuhan, en Chine, le SRAS-CoV-2 existait probablement déjà dans d’autres pays tels que la France, l’Inde, les Pays-Bas, l’Angleterre et les États-Unis.. »
Cela confirme l’existence de certains échantillons testés positifs au COVID-19 avant le premier cas officiellement signalé dans ces pays.