Le COVID-19 et ses dernières souches Omicron continuent de provoquer des infections dans tout le pays et dans le monde. La sérologie (sanguine) et les tests moléculaires sont les deux méthodes les plus couramment utilisées pour le dépistage rapide de la COVID-19. Parce que les tests COVID-19 utilisent des mécanismes différents, ils varient considérablement. Les tests moléculaires mesurent la présence d’ARN viral du SARS-CoV-2 tandis que les tests sérologiques détectent la présence d’anticorps déclenchés par le virus SARS-CoV-2.
Actuellement, il n’existe aucune étude existante sur la corrélation entre la sérologie et les tests moléculaires et sur les symptômes du COVID-19 qui jouent un rôle clé dans la production d’un résultat de test positif. Une étude du Collège d’ingénierie et d’informatique de la Florida Atlantic University utilisant l’apprentissage automatique fournit de nouvelles preuves importantes pour comprendre comment les tests moléculaires et les tests sérologiques sont corrélés, et quelles caractéristiques sont les plus utiles pour faire la distinction entre les résultats positifs au COVID-19 et les résultats des tests.
Des chercheurs du College of Engineering and Computer Science ont formé cinq algorithmes de classification pour prédire les résultats des tests COVID-19. Ils ont créé un modèle prédictif précis en utilisant des caractéristiques de symptômes faciles à obtenir, ainsi que des caractéristiques démographiques telles que le nombre de jours après l’apparition des symptômes, la fièvre, la température, l’âge et le sexe.
L’étude démontre que les modèles d’apprentissage automatique, formés à l’aide de symptômes simples et de caractéristiques démographiques, peuvent aider à prédire les infections au COVID-19. Résultats, publiés dans la revue Santé intelligenteidentifient les principales caractéristiques des symptômes associés à l’infection au COVID-19 et fournissent un moyen de dépistage rapide et de détection rentable de l’infection.
Les résultats révèlent que le nombre de jours présentant des symptômes tels que la fièvre et des difficultés respiratoires joue un rôle important dans les résultats des tests COVID-19. Les résultats montrent également que les tests moléculaires ont des jours d’apparition post-symptôme beaucoup plus étroits (entre trois et huit jours), par rapport aux jours post-apparition des symptômes des tests sérologiques (entre cinq et 38 jours). En conséquence, le test moléculaire a le taux de positivité le plus bas car il mesure l’infection actuelle.
De plus, les tests COVID-19 varient considérablement, en partie parce que la réponse immunitaire et la charge virale des donneurs – la cible de différentes méthodes de test – changent continuellement. Même pour le même donneur, il peut être possible d’observer différents résultats positifs/négatifs à partir de deux types de tests.
Les tests moléculaires dépendent de la charge virale et les tests sérologiques dépendent de la séroconversion, qui est la période pendant laquelle le corps commence à produire des niveaux détectables d’anticorps. Ces deux tests dépendent du temps. Nos résultats suggèrent que le nombre de jours post-symptomatiques est très important pour un test COVID-19 positif et doit être soigneusement pris en compte lors du dépistage des patients.
Xingquan « Hill » Zhu, Ph.D., auteur principal et professeur au Département de génie électrique et d’informatique de la FAU
Pour l’étude, les chercheurs ont utilisé les résultats des tests de 2 467 donneurs, chacun testé à l’aide d’un ou plusieurs types de tests COVID-19, qui ont été collectés comme banc d’essai. Ils ont combiné les symptômes et les informations démographiques pour concevoir un ensemble de fonctionnalités pour la modélisation prédictive à l’aide des cinq types de modèles d’apprentissage automatique. En recoupant les types de tests et les résultats, ils ont examiné la corrélation entre la sérologie et les tests moléculaires. Pour la prédiction des résultats des tests, ils ont étiqueté les 2 467 donneurs comme positifs ou négatifs en utilisant leurs résultats de tests sérologiques ou moléculaires, et ont créé des caractéristiques de symptômes pour représenter chaque donneur pour l’apprentissage automatique.
« Parce que COVID-19 produit un large éventail de symptômes et que le processus de collecte de données est essentiellement sujet aux erreurs, nous avons regroupé des symptômes similaires dans des bacs », a déclaré Zhu. « Sans normalisation des rapports de symptômes, l’espace des caractéristiques des symptômes augmente considérablement. Pour lutter contre cela, nous avons utilisé cette approche de regroupement, qui a pu réduire l’espace des caractéristiques des symptômes tout en conservant les informations sur les caractéristiques des échantillons. »
En utilisant des fonctionnalités bin créées, combinées aux cinq algorithmes d’apprentissage automatique, ces modèles prédictifs ont atteint plus de 81 % de scores AUC (aire sous la courbe ROC, qui fournit une mesure globale des performances sur tous les seuils de classification possibles), et plus de 76 % pourcentage de précision de la classification.
« Une caractéristique unique de notre banc d’essai est que certains donneurs peuvent avoir plusieurs résultats de test, ce qui nous a permis d’analyser la relation entre les tests sérologiques et les tests moléculaires, et également de comprendre la cohérence au sein de chaque type de test », a déclaré Zhu.
Les cinq modèles d’apprentissage automatique utilisés par les chercheurs sont Random Forest, XGBoost, Logistic Regression, Support Vector Machine (SVM) et Neural Network. Ils ont comparé les performances en utilisant trois mesures de performance : la précision, le score F1 et l’AUC.
« La modélisation prédictive est compliquée par de nombreuses questions déroutantes sans réponse par la recherche. Le banc d’essai créé par nos chercheurs est en effet nouveau et montre clairement la corrélation entre différents types de tests COVID-19 », a déclaré Stella Batalama, Ph.D., doyen, FAU College of Ingénierie et informatique. « Nos chercheurs ont conçu une nouvelle façon de réduire les caractéristiques des symptômes bruyants pour l’interprétation clinique et la modélisation prédictive. Ces approches de modélisation prédictive basées sur l’IA deviennent de plus en plus puissantes pour lutter contre les maladies infectieuses et de nombreux autres aspects des problèmes de santé.
Le co-auteur de l’étude est Magdalyn E. Elkin, titulaire d’un doctorat. étudiant au département de génie électrique et informatique de la FAU.
Ce travail a été soutenu par la National Science Foundation.