Dans une étude récente publiée dans Rapports scientifiquesles chercheurs ont développé et formé un modèle d’apprentissage profond d’intelligence artificielle (IA) pour prédire le nombre de cas de COVID-19 dans 14 jours.
Étude: Une nouvelle approche d’apprentissage profond bidirectionnel LSTM pour la prévision du COVID-19. Crédit d’image : PopTika/Shutterstock.com
Sommaire
Arrière-plan
Ce modèle utilise une combinaison de cas confirmés quotidiennement, de politiques gouvernementales spécifiques à une région, de chiffres de reproduction et de détails de vols des 30 jours précédents pour prédire avec précision les futures épidémies de COVID-19.
La validation du modèle à l’aide des données COVID-19 de 190 pays révèle que le modèle présente des taux d’erreur aussi faibles que 33 %, améliorant ainsi la précision pour les pays connaissant plusieurs vagues de COVID-19.
Des modèles d’apprentissage profond comme celui-ci peuvent nous aider à nous protéger contre de futures pandémies en fournissant aux décideurs politiques les meilleures informations pour utiliser leurs ressources disponibles.
Modèles prédictifs dans la prévision des pandémies
La pandémie actuelle de maladie à coronavirus 2019 (COVID-19) reste la pire de l’histoire récente, l’Organisation mondiale de la santé (OMS) estimant à ce jour plus de 771 millions de cas et près de 7 millions de décès.
La surveillance et la prévision de la propagation des pandémies font partie intégrante d’une planification efficace du confinement et de l’allocation des ressources. Bien que les prévisions à court terme fondées sur l’analyse de séries chronologiques se soient révélées utiles, elles ne donnent pas aux décideurs politiques suffisamment de temps pour prévenir les catastrophes avant qu’elles ne surviennent ou pour se préparer adéquatement face à des besoins sans précédent en matière d’infrastructures médicales.
Un certain nombre de groupes de recherche ont tenté de simuler la propagation du COVID-19 au cours des premières phases de la pandémie. L’approche la plus populaire consistait à utiliser des modèles épidémiologiques compartimentés (par exemple, SIR et SER) pour identifier les points chauds potentiels de la maladie.
De plus, les calculs du nombre de reproduction (Rt), soit l’estimation des cas provenant d’un seul individu infecté, ont été utilisés pour améliorer le pouvoir prédictif et la précision de ces modèles épidémiologiques.
En exploitant la puissance de calcul dont dispose aujourd’hui l’humanité et les immenses données disponibles pour les former, des modèles d’apprentissage automatique (ML) et d’apprentissage profond basés sur des estimations de séries chronologiques ont été développés pour prédire les épidémies de COVID-19 quelques jours ou semaines auparavant.
Ces normes de référence étaient la méthode ARIMA (Autoregressive Integrated Moving Average). Cependant, les réseaux neuronaux récurrents (RNN) et leur mémoire dérivée à long terme (LSTM) ont également été testés par la Chine, les États-Unis, l’Inde, le Canada, l’Australie et certains pays européens.
Un inconvénient notable de ces modèles était qu’ils étaient conçus pour prédire les épidémies dans l’une des rares régions/pays, empêchant ainsi leur utilisation à l’échelle mondiale. De plus, des facteurs externes, notamment la politique de confinement, n’ont pas été pris en compte lors de leur développement, ce qui a entraîné des taux d’erreur élevés et un faible pouvoir prédictif.
À propos de l’étude
La présente étude emprunte à la méthode de prévision globale des Centers for Disease Control and Prevention (CDC) des États-Unis, qui repose sur la conviction que la mortalité et la prévalence d’une pandémie diminuent après 30 jours de mise en œuvre d’une politique de confinement.
Dans cette étude, les chercheurs ont développé et formé des modèles LSTM d’apprentissage profond combinant plusieurs facteurs dépendants du temps (cas confirmés quotidiennement, Rt, politique de confinement, mobilité et données de vol) pour prédire les résultats du COVID-19 dans 14 jours à l’aide des données du 30 jours précédents.
L’ensemble de données de formation comprenait des données de prévalence du 22 janvier 2020 au 31 janvier 2021 de l’Université Johns Hopkins. Les données relatives à 24 variables dépendantes du temps provenant de 190 pays ont été acquises sur ourworldindata.com et sur des bases de données open source en ligne similaires.
Le Guide officiel des compagnies aériennes (OAG) a été utilisé comme référentiel pour les données de vol. Le Rt effectif est dérivé de la publication 2020 de Medina-Ortiz et al. sur le Rt de la maladie à coronavirus.
Le modèle LSTM préliminaire a été conçu pour utiliser les 30 jours de données précédents comme entrées séquentielles et une seule prédiction 14 jours dans le futur comme sortie. La modélisation a été réalisée individuellement pour les 190 pays en formation et validation.
Pour améliorer la précision globale du modèle et surmonter la principale limitation du LSTM, à savoir que l’état actuel ne peut être calculé que via le contexte arrière, des modèles bidirectionnels de mémoire à long et court terme (BiLSTM) ont été générés et entraînés sur le même ensemble de données que le modèle préliminaire.
« L’algorithme BiLSTM fusionne les fonctions idéales du RNN bidirectionnel et du LSTM. Cela se fait en combinant deux états cachés, qui permettent aux informations de provenir de la couche arrière et de la couche avant. »
Le réglage des hyper-paramètres du modèle a été effectué par essais et erreurs à l’aide d’un optimiseur rmsprop avec une erreur absolue moyenne (MAE) comme fonction de perte. La précision du modèle a été évaluée en comparant les résultats du modèle avec les données du monde réel.
Les mesures d’évaluation statistique utilisées comprenaient l’erreur quadratique moyenne (RMSE), l’erreur absolue moyenne en pourcentage (MAPE), l’erreur absolue moyenne (MAE) et l’erreur absolue totale en pourcentage.
Enfin, les performances du modèle ont été comparées aux calculs du modèle ARIMA sur la même période afin d’établir l’utilité du modèle BiLSTM par rapport à l’étalon-or actuel.
Résultats de l’étude
Cette étude présente le premier effort dans lequel des données open source multivariables, y compris des données de vol, ont été exploitées pour développer et former un modèle ML pour les prévisions d’épidémies de COVID-19.
Les résultats révèlent que le modèle pourrait prédire avec précision la prévalence quotidienne du COVID-19 entre le 9 janvier 2021 et le 31 janvier 2021 avec une erreur médiane de seulement 35 %. Les lectures d’erreur maximales étaient nettement inférieures à celles produites par le modèle ARIMA, l’étalon-or actuel en matière de prévision d’une pandémie.
L’algorithme BiLSTM a en outre le potentiel d’améliorer encore son pouvoir prédictif en incorporant des variables supplémentaires par rapport aux 24 données préexistantes et des données supplémentaires de formation sur la prévalence.
La validation utilisant les données de 84 pays a révélé que les modèles BiLSTM fonctionnaient mieux pour les pays connaissant plusieurs vagues de COVID-19, ce qui suggère une précision améliorée grâce à des ensembles de données de formation plus vastes.
Un deuxième modèle utilisant moins de variables a atteint des taux d’exactitude et d’erreur similaires, ce qui suggère que le modèle reste robuste même dans des conditions de déficit de données.
« Les prévisions peuvent fournir des informations potentiellement utiles pour faciliter une meilleure allocation des ressources et une meilleure planification du confinement par les prestataires de soins de santé et aider les décideurs politiques à gérer les conséquences du COVID-19 sur un horizon temporel plus long. Pour les travaux futurs, une approche globale pour combiner les deux modèles et potentiellement d’autres temps. -des modèles candidats en série peuvent être explorés.
Conclusions
Dans la présente étude, les chercheurs ont développé, formé et validé un modèle d’IA d’apprentissage profond pour prédire les incidences du COVID-19. Le modèle a utilisé un ensemble de 24 variables provenant de 190 pays sur 30 jours pour prévoir les épidémies de COVID-19 dans 14 jours.
Les tests sur modèles ont révélé un taux d’erreur médian de 35 %, qui s’est amélioré pour les pays qui ont connu plusieurs vagues de COVID-19 et plus de 10 000 cas confirmés. Les taux d’erreur maximaux étaient nettement inférieurs à ceux produits par la méthode ARIMA, la référence actuelle en matière de prévisions pandémiques.
Ensemble, ces résultats révèlent que ce modèle BiLSTM est un outil robuste pour fournir aux décideurs politiques les informations nécessaires pour allouer au mieux leurs ressources.