Long COVID est apparu comme une pandémie au sein de la pandémie. Alors que les scientifiques s’efforcent de démêler les nombreuses questions restantes sans réponse sur l’impact de l’infection initiale sur le corps, ils doivent maintenant également rechercher pourquoi certaines personnes développent des symptômes chroniques débilitants qui durent des mois, voire des années de plus.
Un nouvel outil d’apprentissage automatique est là pour vous aider.
Développé par une équipe de chercheurs d’institutions à travers le pays, dirigée par Justin Reese de Berkeley Lab et Peter Robinson de Jackson Lab, le logiciel analyse les entrées dans les dossiers de santé électroniques (DSE) pour trouver des symptômes communs entre les personnes qui ont reçu un diagnostic de longue durée. COVID et pour définir les sous-types de la condition. La recherche, qui est décrite dans un nouvel article dans eBioMedicine, a également identifié de fortes corrélations entre différents sous-types longs de COVID et des conditions préexistantes telles que le diabète et l’hypertension.
Selon Reese, chercheur en informatique dans le domaine des biosciences de Berkeley Lab, cette recherche aidera à améliorer notre compréhension de comment et pourquoi certaines personnes développent de longs symptômes de COVID et pourrait permettre des traitements plus efficaces en aidant les cliniciens à développer des thérapies adaptées à chaque groupe. Par exemple, le meilleur traitement pour les patients souffrant de nausées et de douleurs abdominales peut être très différent d’un traitement pour ceux qui souffrent de toux persistante et d’autres symptômes pulmonaires.
L’équipe a développé et validé son logiciel à l’aide d’une base de données d’informations DSE de 6 469 patients diagnostiqués avec un long COVID après des infections confirmées au COVID-19.
Fondamentalement, nous avons trouvé de longues caractéristiques COVID dans les données du DSE pour chaque long patient COVID, puis avons évalué la similarité patient-patient à l’aide de la similarité sémantique, ce qui permet essentiellement une « correspondance floue » entre les caractéristiques – par exemple, « toux » n’est pas la même chose que « essoufflement », mais ils sont similaires puisqu’ils impliquent tous deux des problèmes pulmonaires. Nous comparons tous les symptômes pour la paire de patients de cette manière et obtenons un score de la similitude des deux patients COVID de longue durée. Nous pouvons ensuite effectuer un apprentissage automatique non supervisé sur ces scores pour trouver différents sous-types de COVID longs. »
Justin Reese du laboratoire de Berkeley
Ils ont appliqué l’apprentissage automatique à ces scores de similarité patient-patient pour regrouper les patients en groupes, qui ont ensuite été caractérisés en analysant les relations entre les symptômes et les maladies préexistantes et d’autres caractéristiques démographiques, telles que l’âge, le sexe ou la race.
Reese et ses collègues notent que l’outil sera pratique pour les chercheurs car l’approche d’apprentissage automatique à sa base s’adapte automatiquement aux différents systèmes de DSE, permettant aux chercheurs de collecter des données auprès d’une grande variété d’établissements médicaux.
Cette recherche s’appuie sur des travaux antérieurs pour développer l’ontologie du phénotype humain, une base de données et un outil de recherche en libre accès qui fournit un vocabulaire normalisé des symptômes et des caractéristiques trouvés dans toutes les maladies humaines.