En récupérant 329 942 enregistrements de coronavirus 2 du syndrome respiratoire aigu sévère (SRAS-CoV-2) dans la base de données GISAID, les chercheurs d’une société de logiciels à Cambridge ont décrit la variabilité génétique du SRAS-CoV-2 afin d’éclairer d’autres études. Leurs conclusions sont actuellement disponibles sur le bioRxiv* serveur de préimpression pendant qu’il fait l’objet d’un examen par les pairs.
Plus d’un an et demi après le début de la pandémie, nous ne savons toujours pas exactement pourquoi il existe une transmissibilité si élevée du SRAS-CoV-2, un agent causal de la maladie à coronavirus 2019 (COVID-19). De plus, la présentation clinique d’une infection peut varier considérablement d’un individu à l’autre, indépendamment de plusieurs facteurs de risque reconnus.
La recombinaison génétique à travers les frontières des espèces hôtes est l’une des caractéristiques clés du SRAS-CoV-2. En conséquence, le génome de ce virus abrite des signatures indiquant de multiples événements de recombinaison, incorporant vraisemblablement de nombreuses espèces et de vastes régions géographiques.
Par conséquent, les analyses de polymorphismes nucléotidiques simples sont particulièrement bénéfiques pour dévoiler des génomes fortement mutés et comprendre les modèles de changement viral. Plus précisément, les modèles de relation entre les polymorphismes nucléotidiques simples et leurs conséquences peuvent être prévus à partir du génotypage, du suivi de la transmission et de l’analyse des protéines.
Par conséquent, alors que la connaissance commune des voies de signalisation du SRAS-CoV-2, du fonctionnement des protéines, ainsi que de l’interaction des protéines avec les cellules et d’autres protéines, continue de s’accumuler rapidement en raison de sa nouveauté, il est urgent d’explorer le SRAS-CoV. -2 changements.
Cela a été récemment poursuivi par des chercheurs de la société de logiciels Quantori à Cambridge (États-Unis) et du Mental Health Research Center à Moscou (Russie), car ils affirment que la clé pour comprendre le succès mondial du SRAS-CoV-2 est cachée dans son génome.
Sommaire
Une plongée profonde dans la base de données GISAID
Ce groupe de recherche a analysé 329 942 enregistrements SARS-CoV-2 obtenus à partir de la base de données GISAID, qui est la base de données accessible au public la plus complète au monde où sont stockées les données sur la grippe et (depuis le début de la pandémie) SARS-CoV-2.
Le scientifique a abordé la qualité des enregistrements téléchargés dans la base de données susmentionnée, la répartition par sexe, la conservation des gènes, les polymorphismes nucléotidiques uniques, les grappes, les insertions et les suppressions, et une matrice de coefficients de corrélation.
Les coordonnées génomiques ont été acquises à partir du Genome Browser de l’Université de Californie à Santa Cruz (UCSC), un visualiseur graphique open source basé sur le Web pour afficher les séquences du génome et leurs annotations. De plus, des alignements de séquences ont été effectués pour chaque gène séparément.
Enfin, l’exhaustivité de la base de données GISAID a également été abordée par les chercheurs, car de nombreux champs ont été mal remplis ou laissés en blanc. L’analyse de l’exploration de métadonnées a abouti à une hypothèse sur l’inégalité entre les sexes dans les soins médicaux dans certains pays.
Quarante-trois clusters ont été révélés par HDBScan. La légende à droite contient les numéros de cluster et les schémas de couleurs.
Une émergence potentielle de nouvelles variantes
Cette étude a montré que les mutations survenant avec une fréquence élevée (c’est-à-dire plus de 0,3 %) ne sont pas abondantes et représentent 155 changements lorsque tous les gènes sont concernés. De plus, de nombreuses mutations abritaient des changements concomitants qui pourraient modifier les conséquences pour le virus ou un hôte humain.
Une mise en garde importante est que la plupart des données proviennent du Royaume-Uni (RU), ce qui entraîne un biais global des données en faveur des statistiques britanniques. Cependant, il était encore visible que deux groupes étaient formés par des mutations trouvées dans des échantillons téléchargés principalement par l’Australie et le Danemark, indiquant une émergence potentielle de variantes « australiennes » ou « danoises » du SARS-CoV-2.
De plus, l’analyse de conservation a identifié les gènes ORF6 et E comme cibles potentielles de traitement ou de vaccin en raison de leur haute conservation. Il existe également une possibilité de l’existence d’un sous-type d’un variant B.1.1.7, auparavant connu sous le nom de variant britannique.
La nécessité de poursuivre les recherches
Malgré l’accumulation quotidienne d’une vaste quantité de connaissances, les conséquences exactes de nombreuses mutations virales sont à ce jour inconnues. Pourtant, une abondance de mutations concomitantes nous incite à poursuivre des recherches supplémentaires sur leur signification et leur potentiel de création de nouvelles variantes.
« Pris ensemble, nos résultats décrivent la variabilité génétique du SRAS-CoV-2 et peuvent être utilisés pour des recherches ultérieures dans différents domaines scientifiques », déclarent les auteurs de l’étude dans ce bioRxiv papier. « Nos résultats indiquent des zones du génome du SRAS-CoV-2 sur lesquelles les chercheurs peuvent se concentrer pour une analyse structurelle et fonctionnelle plus approfondie », concluent-ils.
Dans tous les cas, une telle croissance de données sans précédent et une telle augmentation des analyses d’experts offrent une myriade d’opportunités pour développer des politiques spécifiques guidées par la science qui aideront à la conception et à la mise en œuvre de pratiques épidémiologiques strictes pour prévenir de futures épidémies.
*Avis important
bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, orienter la pratique clinique/le comportement lié à la santé, ou traités comme des informations établies.