Dans une récente étude publiée sur bioRxiv* serveur de prépublication, les chercheurs ont développé et validé une approche pour l’inférence conjointe du bruit de mesure et de la dérive génétique en analysant des données de séries chronologiques de fréquences de lignée.
Sommaire
Arrière plan
La dérive génétique aléatoire dans la dynamique des épidémies de maladies infectieuses au niveau de la population résulte du caractère aléatoire de la transmission entre les hôtes et de la mort ou du rétablissement de l’hôte. Des études ont signalé une forte dérive génétique dans les séquences du coronavirus du syndrome respiratoire aigu sévère 2 (SARS-CoV-2) résultant d’événements de super-propagation, qui devraient affecter considérablement l’évolution virale et l’épidémiologie de la maladie à coronavirus 2019 (COVID-19). Le bruit résultant du processus de mesure, y compris le biais dans l’obtention de données à travers l’emplacement et le temps, pourrait confondre les estimations de la dérive génétique.
À propos de l’étude
Dans la présente étude, les chercheurs ont développé une approche pour déduire conjointement la puissance du bruit de mesure et de la dérive génétique à partir de données de fréquence de lignée variant dans le temps, ce qui a permis de surdisperser le bruit de mesure (au lieu de maintenir l’uniformité) et de faire varier la puissance de la surdispersion avec le temps ( au lieu d’être constant). Ils ont également validé la précision de l’approche via des simulations.
HMM (modélisation de Markov cachée) a été utilisé avec des états observés continus et des états cachés représentant respectivement les fréquences observées et vraies. La possibilité de transition entre les états cachés a été définie par la dérive génomique, dans laquelle la fréquence vraie moyenne était basée sur les fréquences vraies déterminées au cours de la période précédente. Pour les fréquences rares, la variance est corrélée aux valeurs moyennes basées sur la taille effective de la population [Ne
La possibilité d’émission entre les états observés et cachés était basée sur le bruit de mesure tel que la valeur moyenne des fréquences observées était égale aux fréquences réelles. Dans le cas des fréquences rares, la valeur de la variance des fréquences observées était corrélée à la valeur moyenne indiquant les écarts dépendant du temps par rapport à l’échantillonnage de type uniforme. La modélisation a été effectuée en supposant que le nombre de personnes et les fréquences de lignage étaient suffisamment élevés pour appliquer le théorème de la limite centrale.
Le modèle a généré des «superlignées» en regroupant les lignées en fonction des distances phylogénétiques de sorte que la valeur totale de l’abondance et de la fréquence des lignées dépasse la valeur seuil, produisant 486, 4083, 6 225 et 24 867 souches de pré-B du SRAS-CoV-2. 1.177, B.1.177, variantes Alpha et Delta, respectivement. L’équipe a supposé que le Ne
Par la suite, les paramètres les plus susceptibles de représenter l’ensemble de données ont été déterminés. Le modèle a été validé en effectuant des simulations à l’aide de N variant dans le tempse
Le N inférée
Résultats
La puissance de la dérive génétique était systématiquement supérieure à celle estimée à partir du nombre observé de personnes positives au SRAS-CoV-2 en Angleterre d’un à trois ordres de grandeur, au fil du temps, même après correction du bruit de mesure. La dérive génétique élevée n’a pas pu être expliquée sur la base de la super-diffusion, mais peut être partiellement expliquée par les structures de la communauté deme dans les réseaux de contact des hôtes. L’écart n’a pas pu être expliqué par des corrections tenant compte de la dynamique épidémiologique (modélisation SIR ou SEIR).
L’échantillonnage des personnes infectées par le SRAS-CoV-2 de la population anglaise était largement uniforme pour l’ensemble de données. L’équipe a trouvé la preuve d’un arrangement spatial dans la dynamique de la transmission de la variante B.1.177, de la variante Alpha et de la variante Delta. Le N estimée
Le N inféré par HMMe
Conclusion
Dans l’ensemble, les résultats de l’étude ont montré que la force de la dérive génétique dans la transmission du SRAS-CoV-2 en Angleterre était supérieure aux estimations et ont indiqué que d’autres méthodes d’études de modélisation sont nécessaires pour mieux comprendre les mécanismes à l’origine des niveaux élevés de dérive génétique du SRAS-CoV- 2 en Angleterre.
*Avis important
bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas évalués par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique/les comportements liés à la santé, ou traités comme des informations établies.