Le même type de méthodes d’apprentissage automatique utilisées pour piloter des voitures autonomes et battre les meilleurs joueurs d’échecs pourrait aider les personnes atteintes de diabète de type 1 à maintenir leur glycémie dans une plage de sécurité.
Des scientifiques de l’Université de Bristol ont montré que l’apprentissage par renforcement, un type d’apprentissage automatique dans lequel un programme informatique apprend à prendre des décisions en essayant différentes actions, surpasse de manière significative les contrôleurs de glycémie commerciaux en termes de sécurité et d’efficacité. En utilisant l’apprentissage par renforcement hors ligne, où l’algorithme apprend à partir des dossiers des patients, les chercheurs améliorent les travaux antérieurs, montrant qu’un bon contrôle de la glycémie peut être obtenu en apprenant des décisions du patient plutôt que par essais et erreurs.
Le diabète de type 1 est l’une des maladies auto-immunes les plus répandues au Royaume-Uni et se caractérise par une insuffisance de l’hormone insuline, responsable de la régulation de la glycémie.
De nombreux facteurs affectent la glycémie d’une personne et il peut donc être difficile et fastidieux de sélectionner la bonne dose d’insuline pour un scénario donné. Les dispositifs de pancréas artificiels actuels fournissent un dosage automatisé de l’insuline mais sont limités par leurs algorithmes de prise de décision simplistes.
Cependant, une nouvelle étude, publiée aujourd’hui dans le Journal d’informatique biomédicale, montre que l’apprentissage par renforcement hors ligne pourrait représenter une étape importante des soins pour les personnes vivant avec la maladie. L’amélioration la plus importante a été observée chez les enfants, qui ont connu une heure et demie supplémentaire dans la plage de glycémie cible par jour.
Les enfants représentent un groupe particulièrement important car ils sont souvent incapables de gérer leur diabète sans aide et une amélioration de cette ampleur se traduirait par des résultats de santé à long terme nettement meilleurs.
Ma recherche explore si l’apprentissage par renforcement pourrait être utilisé pour développer des stratégies de dosage d’insuline plus sûres et plus efficaces. Ces algorithmes basés sur l’apprentissage automatique ont démontré des performances surhumaines en jouant aux échecs et en pilotant des voitures autonomes, et pourraient donc apprendre à effectuer un dosage d’insuline hautement personnalisé à partir de données de glycémie pré-collectées.
Harry Emerson, auteur principal de l’étude, Département de mathématiques de l’ingénieur, Université de Bristol
« Ce travail particulier se concentre spécifiquement sur l’apprentissage par renforcement hors ligne, dans lequel l’algorithme apprend à agir en observant des exemples de bon et de mauvais contrôle de la glycémie.
« Les méthodes d’apprentissage par renforcement préalable dans ce domaine utilisent principalement un processus d’essais et d’erreurs pour identifier les bonnes actions, qui pourraient exposer un patient du monde réel à des doses d’insuline dangereuses. »
En raison du risque élevé associé à un dosage incorrect de l’insuline, des expériences ont été réalisées à l’aide du simulateur UVA/Padova approuvé par la FDA, qui crée une suite de patients virtuels pour tester les algorithmes de contrôle du diabète de type 1. Des algorithmes d’apprentissage par renforcement hors ligne de pointe ont été évalués par rapport à l’un des algorithmes de contrôle du pancréas artificiel les plus largement utilisés. Cette comparaison a été menée sur 30 patients virtuels (adultes, adolescents et enfants) et a pris en compte 7 000 jours de données, les performances étant évaluées conformément aux directives cliniques en vigueur. Le simulateur a également été étendu pour prendre en compte les défis de mise en œuvre réalistes, tels que les erreurs de mesure, les informations incorrectes sur les patients et les quantités limitées de données disponibles.
Ce travail fournit une base pour la recherche continue sur l’apprentissage par renforcement dans le contrôle de la glycémie ; démontrant le potentiel de l’approche pour améliorer les résultats de santé des personnes atteintes de diabète de type 1, tout en soulignant les lacunes de la méthode et les domaines de développement futur nécessaires.
L’objectif ultime des chercheurs est de déployer l’apprentissage par renforcement dans des systèmes de pancréas artificiels du monde réel. Ces appareils fonctionnent avec une surveillance limitée du patient et nécessiteront par conséquent des preuves significatives de sécurité et d’efficacité pour obtenir l’approbation réglementaire.
Harry a ajouté : « Cette recherche démontre le potentiel de l’apprentissage automatique pour apprendre des stratégies de dosage d’insuline efficaces à partir des données pré-collectées sur le diabète de type 1. La méthode explorée surpasse l’un des algorithmes commerciaux de pancréas artificiel les plus largement utilisés et démontre une capacité à tirer parti des habitudes d’une personne et programme pour réagir plus rapidement aux événements dangereux. »