Dans une récente étude publiée sur bioRxiv* serveur de préimpression, les chercheurs ont présenté un nouveau cadre mathématique basé sur les données de séquence génomique pour la détection rapide des variants d’intérêt (VoI) et des variants préoccupants (VoC) du coronavirus du syndrome respiratoire aigu sévère 2 (SRAS-CoV-2) dans une séquence virale multiple alignement (MSA).
Sommaire
Arrière plan
La surveillance génomique joue un rôle vital dans la lutte contre les souches de virus de l’acide ribonucléique (ARN) plus immunoévasives et virulentes et est particulièrement nécessaire pour une atténuation efficace de la maladie à coronavirus 2019 (COVID-19). Les efforts de séquençage génomique ont facilité la surveillance virologique et épidémiologique en temps quasi réel ; cependant, l’identification efficace des variantes dans les séquences du SRAS-CoV-2 qui pourraient constituer des menaces potentielles reste difficile. Les méthodes d’analyse de corrélation existantes ne se prêtent pas à l’analyse co-évolutive.
À propos de l’étude
Dans la présente étude, les chercheurs ont présenté un nouveau cadre pour détecter rapidement les VoI et les VoC du SRAS-CoV-2 avec une série chronologique MSA pour les génomes du SRAS-CoV-2. Les blocs de construction du cadre étaient des paires de motifs co-évolutifs identifiés par des signaux co-évolutifs dans le MSA.
La méthode a été appliquée au SARS-CoV-2, en considérant des relations par paires pour analyser les alertes émises entre novembre 2020 et août 2021 avec une résolution hebdomadaire pour l’Angleterre, les États-Unis d’Amérique, l’Amérique du Sud et l’Inde. L’objectif était d’identifier les paires de motifs co-évolutifs maximaux au sein de la MSA au lieu de considérer l’émergence de mutations spécifiques.
L’équipe a construit des simplexes hautement dimensionnels basés sur les distances de couplage de paires co-évolutives. L’équipe a développé et analysé des alertes et des clusters avec des fractions substantielles d’alertes déclenchées par des motifs nouvellement émergents. Par la suite, les alertes ont été testées et la base de données de l’initiative mondiale sur le partage de toutes les données sur la grippe (GISAID) a été utilisée pour obtenir des données sur les séquences du SRAS-CoV-2 de manière rétrospective.
Le cadre a émis des alertes sans a priori hypothèses, à l’exception de la séquence Wuhan-Hu-1 (référence) sur laquelle les MSA ont été construits. Les alertes étaient liées à des variantes établies du SRAS-CoV-2 et a postériori la connaissance des souches VoI/VoC a été utilisée pour évaluer la précision des alertes émises.
L’objectif principal des alertes était de faciliter une analyse biologique rapide pour quelques sites critiques. Une fraction substantielle des clusters inclus comprenait des sites nouvellement actifs qui représentaient d’importants composants de fitness additif des clusters sous-jacents et pourraient indiquer l’émergence d’un bloc fonctionnel ou d’un événement mutationnel. La distance P et la distance J avec k-means et HCS-clustering ont été utilisées pour l’analyse.
Résultats
Une alerte en Angleterre a marqué la montée d’Alpha en temps opportun, > 4 semaines plus tôt que les désignations OMS et Pango. Les 28 mutations définissant Alpha ont été divisées en trois blocs. Sur sept alertes en Inde, une alerte correspondait à un groupe de 14 motifs, dont 13 étaient des sites actifs qui ont été confirmés comme faisant partie des 20 mutations Delta VoC caractéristiques organisées en quatre blocs co-évolutifs qui n’ont pas émergé immédiatement ; cependant, les 13 postes sont devenus inactifs après 21 jours.
Aux États-Unis, sept alertes ont été observées, dont trois marquaient l’émergence de Delta AY.3 et présentaient 31 mutations caractéristiques, dont 11 appartenaient exclusivement à l’AY.3. En Amérique du Sud, 23 alertes ont été observées, dont cinq alertes ont confirmé l’émergence d’une nouvelle variante. La prévalence de la variante Lambda en mars 2021 était faible et n’avait pas été attribuée à une lignée Pango; cependant, des signaux de co-évolution distincts mappés à Lambda ont été identifiés six semaines à l’avance.
Cinq alertes ont été déclenchées au cours de la première semaine de décembre, à savoir : (i) un nouveau groupe émergent de 13 sites non mappés sur une VoI/VoC, (ii) un groupe de 20 sites, dont 17 réels ou (+) sites cartographiés à Alpha, (iii) un groupe de 15 sites, dont neuf étaient des sites réels, (iv) un groupe de 16 sites, dont 15 étaient des sites réels cartographiés à Delta, et (v) un tout nouveau groupe émergent de 12 sites réels, cartographiés sur la sous-lignée Delta AY.3.
Au cours de la troisième semaine de décembre, un groupe de 23 sites réels a émergé, cartographié sur la variante Gamma. Le cadre n’a pas émis d’alertes d’émergence de variantes de Mu, et les mutations caractéristiques de Mu étaient une recombinaison de mutations présentes dans Alpha, Delta et Gamma. Les sites mutationnels étaient déjà actifs dans la population générale ; ainsi, ils n’étaient pas considérés comme des sites réels. Les matrices étaient hautement symétriques, ce qui indique que le regroupement HCS et le regroupement k-means ont produit des résultats similaires pour les distances P et J et que les deux mesures ont capturé la co-évolution du SRAS-CoV-2.
conclusion
Dans l’ensemble, les résultats de l’étude ont montré comment les motifs pouvaient fournir des informations sur l’organisation des mutations caractéristiques d’une VoI/VoC, en les organisant en blocs co-évolutifs. L’extraction de signaux co-évolutifs à l’aide de l’analyse MSA pourrait améliorer la compréhension de l’importance des mutations du SARS-CoV-2 et pourrait permettre une détection rapide des variants émergents du SARS-CoV-2.
Le cadre n’exigeait pas a priori connaissances phylogénétiques ou toute analyse d’impact biologique et pourrait être considéré comme un système de guidage qui alertait non seulement les sites où l’analyse biologique devait être effectuée, mais aussi quantifiait le taux de co-évolution. Le cadre pourrait fournir des données importantes aux biologistes puisque l’identification de la relation de co-évolution pourrait fournir des indices sur les mécanismes biologiques sous-jacents.
*Avis important
bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique/les comportements liés à la santé, ou traités comme des informations établies.