La pandémie COVID-19 a touché plus de 825 000 personnes aux États-Unis, mais le nombre quotidien de nouveaux cas et de décès n'est pas précis. Une nouvelle étude publiée sur le serveur de préimpression medRxiv en avril 2020, on signale que l'intérêt pour la recherche sur Internet pourrait être utilisé comme moyen de prédire l'incidence quotidienne des cas aux États-Unis, comme cela a été prouvé en Chine.
Étude: Tendances et prévisions de l'incidence et des décès quotidiens de COVID-19 aux États-Unis: un modèle basé sur les intérêts de recherche. Crédit d'image: haysekiz / Shutterstock
Sommaire
L'importance de la modélisation
COVID-19 progresse régulièrement dans de nombreuses régions du monde, à la fois dans les pays développés et en développement. La Chine a réussi à modéliser l'incidence quotidienne de COVID-19. Pourtant, l'épicentre s'est déplacé aux États-Unis, où des dizaines de milliers de nouveaux cas s'ajoutent au total quotidien.
Malgré cela, peu de recherches ont été effectuées sur les tendances de l'incidence quotidienne et des décès dus au COVID-19 aux États-Unis. L'étude actuelle est basée sur un modèle chinois qui montre une corrélation entre l'intérêt des termes de recherche Google sur Internet et l'incidence quotidienne de la maladie, avec un décalage de 9 jours en moyenne. C'est également le cas des tendances en Europe, à Taïwan et en Iran.
La recherche sur Internet a également été utilisée pour modéliser et détecter les épidémies de grippe aux États-Unis et en Australie. La présente étude tente d'analyser l'association entre l'incidence quotidienne et la mortalité due au COVID-19 aux États-Unis et l'intérêt manifesté pour les termes de recherche Google liés à la maladie.
Comment s'est faite la modélisation?
Les chercheurs ont extrait des données sur le nombre de nouveaux cas et de nouveaux décès par jour sur le site Web 1-point-3-acres.com et la base de données John Hopkins le 9 avril 2020. Google Trends a été utilisé pour rechercher les données sur la recherche pertinente entre le 1er mars et le 10 avril 2020. Ils ont utilisé neuf termes en tout, tels que COVID-19, COVID, coronavirus, pneumonie, températures élevées, toux, cœur Covid, pneumonie Covid et diabète Covid.
L'intérêt de recherche, tel que représenté sur les tendances de Google, montre à quel point ce terme est populaire par rapport au pic de popularité par heure et par région. Il est noté entre 0 et 100 – données inadéquates pour évaluer l'intérêt de recherche pour le terme et la popularité maximale, respectivement.
Ils ont ensuite examiné la corrélation de l'intérêt de recherche pour chaque terme avec l'incidence quotidienne et les décès quotidiens, avec une période de latence de 20 et 23 jours, respectivement. Ils ont utilisé les 3 premiers termes pour construire un modèle linéaire généralisé pour chacun de ces résultats. Enfin, ces modèles ont été utilisés pour prédire l'incidence quotidienne et les nouveaux décès aux États-Unis à l'avenir.
Les prédictions ont été testées par rapport aux données réelles au fur et à mesure qu'elles sont entrées pour évaluer l'exactitude de la prédiction.
Qu'est-ce que l'étude a montré?
Les chercheurs ont choisi d'utiliser les données de John Hopkins en raison de la cohérence légèrement meilleure des données. Au cours de la période d'étude, il y a eu 555 245 nouveaux cas et 22 019 décès de COVID-19 aux États-Unis.
Les tendances d'intérêt des termes de recherche étaient en retard de deux jours sur la date de recherche, sur Google Trends. Le terme de recherche le plus populaire était COVID plutôt que COVID-19, et le premier a été utilisé pour l'analyse.
Les coefficients de corrélation de chaque terme de recherche dépendent du temps de latence. La corrélation la plus élevée a été observée pour le COVID, la pneumonie au COVID et le cœur Covid, l'intérêt de recherche pour ces trois termes étant fortement corrélé à l'incidence quotidienne et aux nouveaux décès, mais avec un décalage de 12 et 19 jours, respectivement.
Les prévisions pour l'incidence quotidienne et les nouveaux cas montrent un plateau prévu pour environ 12 jours, ce qui pourrait signifier qu'à l'avenir, ces résultats montreront un plateau. Par rapport aux données prospectives, la précision de la prédiction des nouveaux cas était modérée à bonne, tandis que les nouveaux décès étaient prédits avec une précision faible à bonne.
Que nous disent les résultats?
Il s'agit de la première étude à montrer l'excellente corrélation entre l'intérêt pour la recherche et l'incidence quotidienne et les nouveaux décès. Au cours du court suivi de 4 jours, la précision de la prédiction était modérée à très bonne.
Les chercheurs disent que plus d'études doivent valider leurs résultats. Si tel est le cas, ce type de modélisation peut aider à prévoir et à préparer les tendances à venir concernant les cas et les décès.
La précédente étude en Chine a signalé un décalage de 9 jours, alors que les États-Unis ont été de 12 jours. Cette différence pourrait être due à plusieurs facteurs tels que la baisse du taux de dépistage aux États-Unis par rapport à la Chine, conduisant à une sous-estimation de l'incidence quotidienne réelle; retard dans le lancement des tests aux États-Unis, ce qui entraîne des délais plus longs; les différences dans les caractéristiques physiques et socioéconomiques des patients aux États-Unis et en Chine; et les différences possibles dans les sous-types du virus circulant en Chine et aux États-Unis.
L'utilisation des tendances de Google pour analyser les tendances des termes de recherche COVID et les corréler avec le nombre de nouveaux décès et cas aux États-Unis permet de mieux comprendre les paramètres de la pandémie. Le nombre de termes de recherche utilisés ici est plus élevé que les deux utilisés dans les modèles précédents.
Les tendances d'intérêt suggèrent une prévalence élevée de pneumonie et de maladie cardiaque par rapport aux cas et décès quotidiens associés au COVID-19, peut-être parce que les lésions cardiaques et la pneumonie sont si fréquentes chez ces patients. Les délais plus longs offrent peut-être une occasion plus importante d'intervenir.
Les chercheurs prévoient de continuer à mettre à jour le modèle avec les dernières données, ce qui permettra une prédiction plus précise en réduisant les biais de sélection et de rappel à l'avenir. Ils rapportent une corrélation supérieure entre l'intérêt des termes de recherche et le nombre quotidien de nouveaux cas et décès par rapport aux études chinoises antérieures.
Dans l'ensemble, cette modélisation rétrospective basée sur la population montre une excellente corrélation avec la mortalité quotidienne et l'incidence de COVID-19 aux États-Unis, avec une précision de prédiction modérée à bonne.