Les modèles d'IA s'appuyant sur les images de Google Street View peuvent mal interpréter les caractéristiques environnementales, conduisant à des efforts de santé publique malavisés pour réduire l'obésité et le diabète, prévient une nouvelle étude.
Étude: L’utilisation de big data sans connaissance du domaine a un impact sur la prise de décision en matière de santé publiqueCrédit photo : TippaPat / Shutterstock.com
Une étude récente publiée dans la revue PNAS Sciences de l'environnement révèle que le recours à l’intelligence artificielle (IA) et aux images de Google Street View (GSV) pour soutenir la planification urbaine peut conduire à des conclusions trompeuses qui pourraient avoir des effets néfastes sur les interventions de santé publique visant à lutter contre l’obésité et le diabète.
Sommaire
Comment l’IA est-elle utilisée dans la planification urbaine ?
Les progrès récents de l’IA ont accéléré l’intégration de cette technologie dans des domaines cruciaux, tels que la santé publique et l’urbanisme, qui peuvent potentiellement affecter un grand nombre de personnes au niveau communautaire. Par exemple, les images GSV ont été combinées à la détection d’objets par apprentissage profond pour évaluer les résultats sanitaires associés aux propriétés de quartier définies par secteur de recensement.
Les données du GSV fournissent des informations sur l'environnement, notamment sur les types de végétation, ainsi que sur le développement urbain, comme les réseaux routiers et les structures des bâtiments. Ces données ont été exploitées à l'aide de l'apprentissage profond pour concevoir des interventions locales ciblant les maladies mentales et cardiométaboliques et la prévalence de la maladie à coronavirus 2019 (COVID-19).
Cependant, les modèles prédictifs qui utilisent l’IA se heurtent à certains défis, notamment l’incapacité à identifier les données erronées et biaisées et la tendance à établir des corrélations erronées qui éclairent ensuite ces prévisions. Ces défis sont exacerbés lorsque d’autres facteurs peuvent influencer les associations entre l’exposition et les effets sur la santé.
Qu'a montré l'étude ?
L’étude actuelle a examiné la manière dont les caractéristiques environnementales dérivées du GSV interagissent avec la prévalence moyenne de l’obésité et du diabète dans le secteur de recensement de la ville de New York. Elle a également évalué la relation entre ces problèmes de santé et l’inactivité physique, qui contribue de manière significative à cette association.
Les données dérivées du GSV ont indiqué qu'une densité de passages piétons plus élevée est corrélée à une prévalence de maladie plus faible. L'impact de l'activité physique sur l'obésité était plus important que celui sur le diabète, ce qui était attendu sur la base des estimations précédentes des passages piétons basées sur le GSV. Cependant, par rapport aux études précédentes, aucune association n'a été observée entre les estimations du GSV de la densité des trottoirs et les résultats en matière de santé.
Intervention sur l'inactivité physique par rapport à la fonction GSV
L’effet de la prévalence des passages pour piétons et des trottoirs sur les résultats en matière de santé était dû à la prévalence de l’inactivité physique dans le secteur de recensement. Ainsi, plutôt que l’environnement bâti lui-même, ce sont les niveaux d’activité physique dans ce secteur de recensement qui ont influencé les changements dans les résultats en matière de santé.
Avec chaque unité de réduction de l’inactivité physique, la prévalence de l’obésité et du diabète a diminué respectivement de 4,17 et 17,2 fois, par rapport à une seule unité de diminution de la prévalence des passages pour piétons.
Environnement bâti désynchronisé avec les fonctionnalités du GSV
L'environnement bâti, qui a servi de base aux inférences faites par les étiquettes GSV dans la ville, ne correspond pas à la réalité. Par exemple, des trottoirs peuvent être représentés près des ponts ou des autoroutes alors qu'ils sont absents, alors qu'un trottoir bloqué peut être signalé comme absent.
Ces résultats indiquent que l’IA peut produire des estimations d’intervention inexactes en raison de sa dépendance aux caractéristiques dérivées du GSV pour détecter les associations avec les résultats de santé et de son manque de connaissance des facteurs médiateurs importants. Ainsi, le modèle doit être spécifiquement décrit et la voie par laquelle ces caractéristiques exercent leurs effets doit être prise en compte. Ces mesures de protection garantiront que la cible est identifiée avec précision et que l’efficacité des diverses interventions est correctement estimée.
Conclusions
Contrairement aux études précédentes, qui s’appuyaient sur des analyses qualitatives pour comparer les zones, l’étude actuelle, pour la première fois, compare les caractéristiques du GSV avec la réalité du terrain.
Les chercheurs ont utilisé un cadre causal pour compenser les facteurs médiateurs comme l’activité physique. Cela a révélé que si 10 % des échantillons des deux tertiles les plus bas d’inactivité physique étaient améliorés, une réduction significative de 4,17 et 17,2 fois de la prévalence de l’obésité et du diabète sucré, respectivement, serait observée.
Néanmoins, les limites des données, ainsi que l’évolution de l’état de l’environnement bâti, le comportement individuel et les conséquences sur la santé doivent être soigneusement précisés lors de l’exploitation de ce type de données pour les interventions de santé publique.
Cette étude met en évidence des problèmes critiques de robustesse et de spécification de modèle dans l'utilisation de sources de données émergentes, montrant que les données peuvent ne pas mesurer ce qui est prévu, et qu'ignorer les médiateurs peut entraîner des estimations biaisées de l'effet de l'intervention..”