Le virus du coronavirus 2 du syndrome respiratoire aigu sévère (SRAS-CoV-2) qui est apparu à Wuhan, en Chine, à la fin de 2019 a provoqué la pandémie de la maladie à coronavirus en cours 2019 (COVID-19), qui a affecté plus de 39,8 millions de vies dans le monde et fait des victimes plus de 1,11 million de décès à ce jour. Alors que de vastes efforts de séquençage sont en cours pour comprendre l'évolution de ce virus, plusieurs études avec des données de séquençage du SRAS-CoV-2 montrent différentes fréquences alléliques du virus chez le même patient, un phénomène appelé hétéroplasmie.
L'explication la plus probable de ces lectures virales hétérogènes intra-patient est l'existence de multiples souches virales. La recombinaison est une explication improbable car les chances que le virus soit fonctionnel après le démontage à l'intérieur de la cellule hôte et le réassemblage en un virion ayant une séquence différente sont assez faibles. Bien qu'il existe des preuves de multiples lignées de virus SRAS-CoV-2 chez le même patient COVID-19, aucune preuve de recombinaison de sous-lignées chez le même patient n'est disponible à ce jour.
Sommaire
Implications cliniques de l'hétéroplasmie
Des souches multiples d'un virus infectant le même patient ont d'énormes implications cliniques en épidémiologie, en traitement et en contrôle de la pandémie. Les variations dans les souches virales peuvent indiquer différents niveaux de transmissibilité, différents mécanismes de résistance aux médicaments, des réponses variables au traitement et expliquer la grande variété de symptômes. Compte tenu de l'importance de cela dans le traitement et le développement de vaccins, il est impératif que plus la recherche se concentre sur l'hétéroplasmie du SRAS-CoV-2.
Des chercheurs d'IBM Research, T.J. Watson Research Center, NY, États-Unis, a récemment présenté un cadre méthodologique commun pour interpréter la phylogénomique à partir de données génomiques pour plusieurs maladies, y compris le COVID-19 et le cancer. Leur travail est publié sur le serveur de pré-impression bioRxiv*.
Dans le cas du cancer, l'hétérogénéité tumorale chez un patient indique une hétéroplasmie intra-patient, et l'absence de recombinaison dans les cellules tumorales est une hypothèse acceptée. Les chercheurs émettent l'hypothèse que, tout comme les différentes fréquences des variantes génomiques d'une tumeur indiquent plusieurs clones de tumeurs et offrent un moyen de les déduire par ordinateur, les différentes fréquences de variantes dans les lectures génomiques virales offrent les moyens de calculer les multiples sous-lignages co-infectants.
Schéma du cadre Concerti. Étant donné un ensemble d'échantillons génomiques multi-patients (COVID-19) ou multi-sites, multi-temps (cancer), l'algorithme analyse la distribution de fréquence d'altération sous-jacente comme entrée et effectue une (1) sélection négative pour filtrer les altérations apparaissant. Un (2) regroupement multidimensionnel est effectué pour identifier les pseudoclones / lignées qui seront ensuite enrichis par un (3) regroupement d'échantillons unique qui (4) fusionne les altérations initialement sélectionnées négativement. (5) Toutes les phylogénies potentielles sont générées et évaluées pour la compatibilité. Enfin, l'ensemble des structures phylogénétiques consolidées au fil du temps ou du site est produit avec des scores de vraisemblance.
Un algorithme pour comprendre les phylogénies évolutives
L'étude décrit un cadre de calcul appelé Concerti pour déduire des phylogénies dans les deux scénarios ci-dessus. Pour démontrer la précision de cet algorithme, les chercheurs ont reproduit certains résultats précédemment connus dans les deux scénarios. Ils ont également identifié une nouvelle mutation parallèle potentielle dans le virus SRAS-CoV-2 et découvert de nouveaux clones présentant des mutations résistantes à la thérapie dans le contexte du cancer.
Selon les chercheurs, la capacité de Concerti à extraire et intégrer des informations à partir de plusieurs points, sites, moments ou échantillons permet de découvrir des arbres phylogénétiques qui capturent l'hétérogénéité spatiale et temporelle. Ces modèles de phylogénie peuvent avoir un impact direct sur les thérapies car ils peuvent mettre en évidence la «naissance» de clones qui peuvent héberger des mécanismes de résistance au traitement, la «mort» de sous-clones avec des cibles médicamenteuses et l'acquisition de mutations fonctionnellement pertinentes dans les clones qui peuvent sembler cliniquement non pertinentes.
Arbre d'évolution des tumeurs Concerti T pour le patient GI1. Arbre d'évolution tumorale T pour les données multi-sites GI1 de patients atteints d'un cancer du côlon. Les bords du T sont marqués par les gènes cancéreux connus et les couleurs désignent les pseudoclones distincts estimés par Concerti. Les nœuds foliaires représentent chacun des sites de lésion distincts. Les arbres T à un seul site sont représentés en bas sous forme de disques empilés et les tailles sont proportionnelles aux valeurs de prévalence.
L'équipe a démontré comment Concerti pouvait être appliqué à tout ensemble de données de séquençage génomique avec différentes fréquences d'allèles, qu'il s'agisse du cancer ou du SRAS-CoV-2, et comment les résultats fournis par l'algorithme peuvent avoir des implications cliniques significatives spécifiques à une maladie.
«Nous démontrons dans cet article comment Concerti peut être appliqué à n'importe quel ensemble de données de séquençage génomique avec des fréquences d'allèles variables, qu'il s'agisse d'un cancer ou du nouveau virus SARS-CoV-2 à l'origine de la pandémie COVID-19, et les résultats peuvent avoir des effets spécifiques à la maladie implication clinique. «
L'intégration spécifique de données multipoints pourrait améliorer la réponse au traitement
Identifier la présence de nombreuses souches virales chez un seul hôte peut avoir un impact profond sur les approches de traitement, les efforts de développement de vaccins et les stratégies d'atténuation des infections. Les données Concerti pour les patients atteints de COVID-19 montrent la capacité d'identifier des souches virales en fonction de différentes fréquences d'allèles et ainsi découvrir la présence de nouvelles homoplasies. Les chercheurs estiment que les résultats fournis par Concerti répondent efficacement aux défis cruciaux auxquels sont confrontées les recherches dans le développement de thérapies et de vaccins.
Avec le cancer, une surveillance précise de l'évolution de la tumeur au cours de l'évolution de la maladie peut aider à identifier de nouvelles cibles médicamenteuses et de nouvelles méthodes thérapeutiques qui pourraient stabiliser cette maladie et gérer les pressions de l'exposition au traitement et les changements de l'environnement de la tumeur. Les résultats de l'étude mettent en évidence comment l'intégration spécifique des données multipoints par Concerti pourrait faciliter des plans de traitement plus optimisés et ciblés localement pour une meilleure réactivité au traitement.
«Les résultats de Concerti abordent les défis énormes auxquels les recherches sont confrontées lors du développement de 396 thérapies et peuvent aider à faciliter le développement de vaccins efficaces.
*Avis important
bioRxiv publie des rapports scientifiques préliminaires qui ne sont pas examinés par des pairs et, par conséquent, ne doivent pas être considérés comme concluants, orienter la pratique clinique / les comportements liés à la santé, ou traités comme des informations établies.