L'étude met en valeur le potentiel de la variation minoritaire et des méthodes de séquençage alternatives pour améliorer la compréhension épidémiologique de la transmission de la tuberculose
Dans une étude récente publiée dans Le microbe Lancetles chercheurs ont étudié la variation au sein d'un hôte Mycobactérie tuberculose complexe (MTBC) et si cela augmente les inférences de transmission.
Sommaire
Arrière-plan
La réduction du fardeau mondial de la tuberculose nécessite une diminution des infections incidentes au MTBC. Néanmoins, la période de latence longue et variable de l’infection rend difficile l’identification des sources de transmission et les interventions.
De plus, les approches d’inférence de transmission ne parviennent souvent pas à détecter la plupart des liens de transmission dans les contextes à forte incidence. Ainsi, des stratégies nouvelles et accessibles sont nécessaires pour délimiter les modèles de transmission à haute résolution.
Les approches d’inférence de transmission du MTBC reposent sur des génomes consensuels uniques provenant d’individus infectés. Cependant, le MTBC présente un rythme d’évolution relativement lent, ce qui signifie une diversité limitée des épidémies. De plus, des génomes identiques de MTBC ont été isolés chez plusieurs individus, ce qui rend difficile la reconstruction des chaînes de transmission. Bien que la diversité des MTBC ait été rapportée chez les personnes infectées, il n’est pas clair si cette variation au sein de l’hôte améliore l’inférence sur la transmission.
À propos de l'étude
Dans la présente étude, les chercheurs ont quantifié la variation du MTBC au sein de l’hôte et ont étudié si elle améliorait l’inférence de transmission. Ils ont réanalysé les données de séquence provenant d’études antérieures sur la transmission des ménages MTBC, en utilisant les membres des ménages comme proxys pour les liens de transmission. La base de données PubMed a été recherchée pour trouver des études pertinentes contenant des données brutes de séquençage et des données épidémiologiques accessibles au public. Les données de séquence brutes ont été traitées à l'aide d'un pipeline d'identification de variantes.
Les chercheurs ont quantifié des variantes minoritaires dans les gènes de la proline-proline-acide glutamique (PPE) et de l'acide proline-glutamique (PE). Les variantes minoritaires ont été définies comme des positions avec ≥ deux allèles et une fréquence d'allèles mineurs > 1 %. Les gènes PPE et PE ont été exclus des analyses ultérieures car ils pourraient être plus sujets aux erreurs. La variation moyenne des minorités par échantillon a été comparée entre les études à l'aide du test de somme des rangs de Wilcoxon.
Le coefficient de corrélation de Pearson a été utilisé pour mesurer les associations entre le nombre total de variantes minoritaires, la fréquence des allèles mineurs et la profondeur médiane de la couverture. En outre, le nombre de variantes minoritaires partagées entre les membres du ménage et de variantes minoritaires partagées entre des paires épidémiologiquement non liées a été estimé. Des modèles de régression logistique ont été adaptés, incluant uniquement les variantes minoritaires partagées, uniquement les membres du cluster génétique, ou les deux.
L'appartenance à un cluster génétique a été définie par des seuils de polymorphisme de 5 nucléotides simples (SNP) et de distance génétique de 12-SNP. Les courbes des caractéristiques de fonctionnement du récepteur (ROC) ont été utilisées pour estimer les performances des modèles dans la classification des ménages par rapport aux paires non apparentées. Les corrélations entre la distance génétique entre les variantes minoritaires partagées et les séquences consensus MTBC ont été testées à l'aide du coefficient de corrélation de Pearson.
Résultats
Au total, trois études sur la transmission domestique ont été identifiées ; ils ont été menés respectivement au Brésil, au Canada et en Angleterre. Par rapport aux paires de séquences sélectionnées au hasard dans la population, il y avait une variation limitée entre les séquences de MTBC dans les isolats du même ménage ou parmi les isolats provenant d'individus épidémiologiquement liés.
De plus, les séquences consensus de MTBC provenant d'individus ayant des liens épidémiologiques étaient les plus proches voisins phylogénétiques. Les distances génétiques entre les séquences consensus étaient souvent supérieures aux seuils communs 12-SNP et 5-SNP, 15,6 % et 44,4 % des couples de ménages n'atteignant pas ces seuils, respectivement. Les gènes PPE et PE présentaient un nombre disproportionnellement élevé de variantes minoritaires.
Il y avait des différences significatives dans la variation minoritaire en dehors des gènes PPE et PE entre les études. Les variantes minoritaires étaient uniques en termes de localisation et aucune n’a été identifiée dans plus de cinq échantillons. Seulement 1,3 % des variantes minoritaires étaient des mutations stop et 50 % étaient des variantes faux-sens. Notamment, les cinq variantes les plus courantes se sont produites dans les régions intergéniques des études.
La profondeur médiane de la couverture était significativement corrélée au nombre de variantes minoritaires en dehors des gènes PPE et PE. Une corrélation négative a été observée entre la fréquence des allèles mineurs et la profondeur de couverture du site. La variation minoritaire par échantillon était associée aux isolats de la lignée 2 de MTBC et négativement associée aux isolats des lignées 3 et 4.
De plus, les isolats provenant de paires de ménages présentaient plus de variantes minoritaires en dehors des gènes PPE et PE que ceux provenant de paires sélectionnées au hasard. La distribution des variantes minoritaires partagées était significativement différente entre les paires épidémiologiquement liées et non liées. La variation partagée au sein de l'hôte en dehors des gènes PPE et PE était associée de manière significative à l'appartenance au ménage. Le regroupement génomique était également associé à l’appartenance au ménage.
Les courbes ROC ont indiqué que l'inclusion de la variation partagée au sein de l'hôte améliorait la précision des prédictions. Les variantes minoritaires partagées ont diminué avec une augmentation de la distance génétique entre les échantillons parmi les paires épidémiologiquement non liées. Cependant, pour les paires de ménages, aucune corrélation significative n'a été observée entre la distance génétique entre les séquences consensus et le nombre de variantes minoritaires partagées.
Conclusions
Dans l’ensemble, l’étude a révélé que la variation du MTBC au sein de l’hôte persiste dans les données de séquence de la culture, son ampleur variant au sein et entre les études. De plus, les isolats de MTBC provenant de personnes épidémiologiquement liées présentent des niveaux de variation plus élevés que les individus non liés.
Ces résultats suggèrent que la variation minoritaire pourrait fournir des informations épidémiologiques précieuses pour les déductions en matière de transmission. Des travaux supplémentaires sont nécessaires pour optimiser les approches d'acquisition et d'intégration des variations au sein d'un hôte dans des pipelines automatisés pour la transmission et l'inférence phylogénétique.