Des chercheurs en Chine ont proposé une approche d'apprentissage basée sur la machine qui prédit la transmission de COVID-19 et estime le nombre de cas asymptomatiques avec plus de précision que les modèles de transmission de virus classiques.
L'utilisation du simulateur à grain fin basé sur l'apprentissage automatique (MLSim) pour améliorer la modélisation du processus de transmission complexe et le nombre potentiel de cas asymptomatiques pourrait aider les décideurs à équilibrer plus efficacement les mesures de confinement.
Sommaire
Individus asymptomatiques
Le virus COVID-19, qui peut être transmis entre humains, ne provoque pas toujours les symptômes associés de la maladie tels que des problèmes respiratoires, des maux de gorge et de la fièvre. Cependant, les personnes asymptomatiques sont toujours infectieuses et peuvent transmettre la maladie à d'autres. De plus en plus de preuves suggèrent que le nombre d'individus asymptomatiques mais infectieux augmente, une étude a estimé que jusqu'à 60% des patients pourraient être asymptomatiques ou ne souffrir que de symptômes bénins.
Il est essentiel d'estimer le nombre d'infections asymptomatiques qui n'ont pas été détectées pour contenir le virus afin d'empêcher sa propagation. Cependant, cela est difficile à faire avec précision.
« Pendant ce temps, si nous pouvons modéliser la façon dont le virus se transmet, il est tout à fait possible de déduire le nombre non observé de patients asymptomatiques à partir des données épidémiques observées », écrivent Zhi-Hua Zhou (Université de Nanjing, Nanjing) et ses collègues.
L'article est actuellement disponible en pré-impression dans le service MedRxiv, pendant qu'il fait l'objet d'un examen par les pairs.
Modèles actuels d'estimation de la transmission
Actuellement, il existe deux façons principales de modéliser la transmission et de prédire la propagation de la maladie.
L'une consiste à utiliser des modèles de transmission dynamique tels que le modèle SIR (Susceptible Infected Recovered), qui prend en compte les cas sensibles, les cas infectieux, les cas récupérés et utilise des équations pour modéliser les changements chez les individus. Ces modèles sont efficaces pour généraliser la transmission prévue à long terme. Cependant, ils simplifient souvent trop le processus de transmission complexe et réel et peuvent être difficiles à associer aux données épidémiologiques, ce qui provoque un nombre important d'erreurs.
Une autre approche consiste à utiliser des modèles d'apprentissage automatique tels que les réseaux de neurones récurrents (RNN) avec une mémoire à court terme (LTSM), qui correspondent bien aux données épidémiques et font des prédictions précises qui s'appliquent à un avenir proche. Cependant, ces modèles sont difficiles à utiliser pour faire des prévisions à long terme, ainsi que difficiles à interpréter et difficiles à prendre en compte pour différentes décisions.
L'approche proposée par l'équipe
Maintenant, Zhou et ses collègues ont testé l'approche du simulateur à grain fin (MLSim) basé sur l'apprentissage automatique à l'aide de paramètres obtenus dans 31 provinces chinoises et six autres pays.
«Les modèles de transmission de virus traditionnels font généralement plus d'hypothèses que MLSim et ne laissent que quelques paramètres à déterminer», écrivent-ils. «Le fait d'avoir plus de paramètres à optimiser permet à MLSim d'avoir une meilleure capacité de représentation que les modèles traditionnels.»
Les auteurs disent que MLSim intègre de nombreux facteurs pratiques tels que la progression de la maladie pendant la période d'incubation; mouvement des personnes entre les régions les cas asymptomatiques et non détectés et l'efficacité des mesures de prévention et de confinement.
La façon dont ces facteurs interagissent est modélisée à l'aide d'une dynamique de transmission virtuelle avec des paramètres indéterminés que l'apprentissage automatique a mis en évidence dans les données épidémiques. En apprenant à ajuster étroitement les données du monde réel, MLSim prédit ensuite le nombre d'individus asymptomatiques.
Les prédictions du simulateur
L'équipe rapporte que MLSim a fait des prévisions plus précises que les modèles basés sur SEIR et LSTM. Après avoir tiré des enseignements des données disponibles pour la partie continentale de la Chine, MLSim a constaté que le nombre d'individus asymptomatiques aurait pu être de 150 408, ce qui représente 65% du nombre total d'infections inféré, y compris les cas non détectés. Le nombre inféré de personnes asymptomatiques mais infectieuses le 15 avrile était de 41 387 en Italie; 21 118 en Allemagne; 354 657 aux États-Unis; 40 379 en France et 144 424 au Royaume-Uni.
Les résultats du simulateur ont également révélé que si les mesures de confinement que le gouvernement avait introduites pour le continent avaient été mises en place 1, 3, 5 et 7 jours plus tard qu'elles ne l'étaient (23 janvier), le nombre respectif de cas confirmés le 12 juin aurait été de 109 039 (129%), 183 930 (218%), 313 342 (371%) et 537 555 (637%).
Conclusion de l'équipe
«Les simulateurs à grain fin basés sur l'apprentissage automatique peuvent mieux modéliser le processus complexe de transmission de maladies dans le monde réel, et peuvent ainsi aider à la prise de décisions sur des mesures de confinement équilibrées», écrivent Zhou et son équipe. « Le simulateur a également révélé le grand nombre potentiel d'infections asymptomatiques non détectées, ce qui pose un grand risque pour le confinement du virus. »
Les chercheurs soulignent également que ce type d '«approche hybride d'apprentissage des connaissances et des données» n'était pas communément reconnu par la communauté du machine learning.
«Mais nous l'avons trouvé très utile lorsque les données sont rares alors que les connaissances sont riches mais inexactes, comme la situation d'une nouvelle épidémie de contagion», conclut l'équipe.
Référence de la revue:
Zhou Z et al. COVID-19 Estimation des infections asymptomatiques. MedRxiv 2020. doi: https://doi.org/10.1101/2020.04.19.20068072