Dans une étude pré-imprimée publiée sur Place de la Recherche* et actuellement à l’étude à Rapports scientifiquesles chercheurs ont classé et regroupé les variantes du coronavirus 2 du syndrome respiratoire aigu sévère (SRAS-CoV-2) en fonction de leurs images d’imagerie des automates cellulaires (CAI) et des distances de Hamming, afin de déterminer les évolutions virales.
Le SRAS-CoV-2 contient de l’acide ribonucléique (ARN) simple brin et quatre protéines – enveloppe (E), nucléocapside (N), matrice (M) et les protéines Spike (S) – dans sa structure moléculaire. Des mutations dans les glycoprotéines virales S ont conduit à l’émergence rapide et alarmante de variantes génétiquement modifiées avec une transmission virale, une infectiosité et une réplication intracellulaire améliorées. Ainsi, l’évaluation génétique de la protéine S est pertinente pour la formulation de vaccins améliorés et de médicaments thérapeutiques.
Bien que des études antérieures aient étudié la structure de la protéine S, les méthodes utilisées telles que l’analyse de similarité, les méthodes d’alignement et le traitement d’image étaient très compliquées. Ainsi, les auteurs de cette étude ont utilisé le CAI, une technique plus simple, économique et efficace utilisant des codes numériques discrets et des règles évolutives facilement compréhensibles pour évaluer des structures protéiques complexes.
Sommaire
À propos de l’étude
Dans la présente étude, les auteurs ont évalué la glycoprotéine virale S des variantes préoccupantes du SRAS-CoV-2 (VoC) – la souche initiale de Wuhan et ses variantes mutées : Alpha, Beta, Gamma, Delta, Omicron, P2 et B.1.1 .28 – en utilisant une approche combinatoire des images CAI des séquences de la protéine S avec les distances de Hamming (DH) métrique pour évaluer la similarité et les différences des variantes et pour déterminer les évolutions virales. Cette méthode a permis la classification et le regroupement de séquences de protéines d’ascendance et de localisation similaires et de les différencier des autres protéines présentes dans des bases de données génétiques telles que UniProt et GenBank.
CAI est composé de quatre composants : les cellules voisines, une grille, une règle d’évolution de transition locale et des états comme un ou zéro. Les règles évolutives impliquent l’évaluation des cellules voisines puisque ces cellules contiennent des acides aminés (aa) qui affectent la fonction et le repliement des protéines. Pour coder génétiquement 1 273 séquences aa de la protéine S, un codage numérique comprenant des codes à cinq et huit chiffres pour chaque aa constitutif et des codes reflétant les propriétés physicochimiques basées sur la complémentarité, la similarité, la théorie de l’information et la théorie de la reconnaissance moléculaire a été utilisé.
Dans cette étude, le codage génétique des séquences variantes était basé sur chaque aa hydrophobicité, mis en correspondance avec les codes de la protéine entière contenant 6 365 cellules, avec huit états de cellules voisines, et l’ensemble des états comme un ou zéro pour créer un un image CAI tridimensionnelle. En utilisant CAI, 25 635 évolutions ont été possibles. La règle de Wolfram a été utilisée pour classer les VoC et les différencier des autres séquences virales.
Résultats et discussion
La protéine S de la famille SARS-CoV a démontré un motif caractéristique en forme de V dans toutes les images CAI avec des différences dans l’image de chaque variante en fonction du type et du nombre de mutations génétiques. Ces différences visuelles dans les images CAI dénotaient l’évolution de chaque variante mutée. Les images CAI ont ensuite été classées dans la classe Wolfram IV présentant un comportement entre les types périodique (classe II) et chaotique (classe III).
La variante Omicron avait le plus grand nombre de mutations, indiqué par le D le plus élevéH valeurs, avec 33 substitutions aa dans sa glycoprotéine virale S et la présence de la mutation NF01Y. Ces nombreuses modifications étaient responsables d’une transmission virale accrue et d’une efficacité virale réduite. La variante Delta portant la mutation P681R était la plus proche de la souche Wuhan avec le moins de mutations, comme indiqué par le plus petit DH valeurs.
Conclusion
La présente étude suggère que les variantes du SRAS-CoV-2 génétiquement modifiées avec des mutations et des ancêtres similaires peuvent être regroupées en fonction du DH à partir de la souche initiale de Wuhan calculée sur les images CAI pour développer des relations phylogénétiques et évolutives entre les variants du SARS-CoV-2.
Les résultats de l’étude mettent également en évidence la déviation génétique de la variante Omicron la plus mutée avec la dégénérescence moléculaire et la variabilité génétique les plus élevées dues aux substitutions aa au site 501, par rapport aux autres VoC. Selon la présente étude, la convergence rapide de aa pourrait conduire à l’émergence simultanée des variantes génétiques Alpha, Beta et Gamma sur trois continents différents simultanément.
L’équipe de chercheurs a également souligné que les mutations dans les séquences protéiques des variants du SRAS-CoV-2 entraînent une dégénérescence génétique et une variabilité structurelle. Une dégénérescence plus élevée a été associée à une transmission virale accrue et a contribué à la propagation rapide de la pandémie de COVID-19 à travers le monde.
*Avis important
Research Square publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique/les comportements liés à la santé, ou traités comme des informations établies.