Une étude révèle ce que les gens demandent le plus souvent aux chatbots IA sur la santé

Qu'il s'agisse de symptômes nocturnes ou d'aide pour les rendez-vous et les formalités administratives, cette étude montre comment les gens se tournent vers les chatbots IA pour obtenir bien plus que de simples informations sur la santé.

Étude : Utilisation publique d'un chatbot LLM généraliste pour les requêtes de santé. Crédit d'image : Azurhino/Shutterstock

Dans une étude récente publiée dans la revue Nature Santéchercheurs chez Microsoft IARedmond, WA, États-Unis, a analysé plus de 500 000 conversations anonymisées liées à la santé avec Microsoft Copilot pour caractériser ce que les gens demandent sur la santé.

La santé est l’un des domaines à enjeux élevés sur lesquels les gens interrogent l’intelligence artificielle (IA) les chatbots. De la conversation IAen particulier ceux alimentés par de grands modèles de langage (LLM), comme ChatGPT, Copilot et Gemini, joue un rôle de plus en plus important pour de nombreux utilisateurs, allant du premier point de contact lors de l'apparition des symptômes aux questions sur les médicaments et à la compréhension des interactions avec les professionnels de santé et le système de santé. De la conversation IA représente un changement majeur dans la façon dont les humains interagissent avec la technologie numérique et les plateformes d’information.

Sommaire

Conception de l'étude de requête sur la santé copilote

Dans la présente étude, les chercheurs ont analysé les conversations liées à la santé à l’aide de Microsoft Copilot pour caractériser les questions que les gens posent sur la santé. Un échantillon aléatoire de conversations avec Copilot a été tiré quotidiennement en janvier 2026. Chaque conversation s'est vu attribuer un sujet général, une intention générale et un résumé préservant la confidentialité, et les conversations classées comme « santé et forme physique » ont été incluses dans cette étude.

De plus, chaque conversation a été attribuée à l'une des 12 catégories générales d'intentions de santé à l'aide d'un LLM-classificateur basé sur. Ensuite, un LLMLa méthode de regroupement basée sur la classification a été appliquée à un sous-échantillon aléatoire de 10 000 conversations. Chaque conversation de ce sous-échantillon a été annotée avec des attributs supplémentaires. Le LLM a reçu environ 250 résumés et attributs de conversations et les a regroupés par parcours utilisateur.

Résultats relatifs aux informations sur la santé et aux intentions personnelles

Dans l’ensemble, l’ensemble de données analytiques comprenait 617 827 conversations classées dans la catégorie santé et forme physique. La plus grande catégorie d’intentions en matière de santé était l’information et l’éducation sur la santé, représentant environ 41 % des conversations.

Cette catégorie comprenait des requêtes de santé non personnalisées, notamment des informations nutritionnelles générales, les causes des problèmes de santé et le fonctionnement des médicaments. Étant donné que certaines questions générales peuvent refléter des préoccupations personnelles, la part réelle des préoccupations personnelles pourrait être plus élevée, ce qui ferait probablement de la proportion déclarée une limite inférieure.

De plus, de nombreuses requêtes portaient sur des conditions et des traitements spécifiques plutôt que sur des informations générales sur la santé, ce qui suggère que les gens peuvent rechercher des informations générales sur la santé pour prendre des décisions personnelles. Les conversations sur mobile étaient plus fréquentes la nuit, tandis que celles sur ordinateur avaient lieu principalement pendant la journée. La répartition des intentions de santé différait considérablement selon les plateformes.

Répartition de l'utilisation des intentions de santé, en pourcentage de conversations.

Type d'appareil et modèles d'utilisation selon l'heure de la journée

Hormis l’information et l’éducation sur la santé, qui représentaient environ 40 % sur les deux types d’appareils, les modèles d’utilisation variaient d’un appareil à l’autre. Les différences étaient les plus notables en termes d’intention personnelle et professionnelle. Par exemple, le soutien académique et la recherche représentaient 16,9 % des conversations sur ordinateur mais 5,3 % sur mobile, tandis que les questions sur les symptômes et les problèmes de santé représentaient 15,9 % sur mobile mais 6,9 % sur ordinateur.

La stratification des intentions de santé par heure a révélé que l'utilisation de Copilot sur ordinateur se produisait souvent parallèlement à d'autres activités, telles que la recherche, la rédaction de thèses ou la paperasse. Par exemple, les conversations sur les formalités médicales culminaient pendant les heures de travail, tandis que celles liées au soutien académique et à la recherche augmentaient tout au long de la journée, en particulier après les heures d'école et de travail. De plus, les intentions personnelles augmentent le soir ou la nuit, tandis que les intentions savantes diminuent.

Les auteurs ont toutefois noté que ces modèles temporels étaient basés sur des données transversales et pourraient refléter des différences quant aux utilisateurs de Copilot à différents moments de la journée plutôt que des changements au sein d'une seule personne.

Requêtes personnelles sur la santé et implications pour la navigation dans les soins

Enfin, l’équipe a étudié sur qui portaient les requêtes de santé en utilisant un sous-échantillon de 2 165 conversations. Ce sous-échantillon comprenait trois intentions personnelles : le bien-être émotionnel, les questions sur les symptômes et les problèmes de santé, ainsi que les questions sur l'état de santé et les soins.

Dans chaque catégorie, la plupart des questions portaient sur des préoccupations personnelles ; cependant, 1 requête sur 7 concernait des tiers, comme un partenaire, un enfant ou un parent, pour des questions sur les symptômes et des catégories d'informations sur l'état de santé.

Pris ensemble, les résultats révèlent des modèles distincts de IA engagement pour des conversations liées à la santé. Les questions de santé personnelle, notamment concernant les symptômes et le bien-être émotionnel, ont augmenté le soir et la nuit. Ce modèle de requêtes sur le bien-être est cohérent avec des recherches antérieures sur un rythme diurne dans l'affect négatif, dans lequel l'affect négatif a tendance à être le plus faible le matin et augmente tout au long de la journée, culminant la nuit, bien que l'étude n'ait pas pu déterminer si cela reflétait des changements de sentiments au sein des mêmes utilisateurs ou des différences entre les utilisateurs actifs à des moments différents.

Près d’un cinquième des conversations impliquaient des utilisateurs décrivant des symptômes personnels, des résultats de tests ou des conditions. De plus, les modèles d’utilisation variaient considérablement selon le type d’appareil. Les intentions personnelles en matière de santé étaient plus courantes sur mobile, tandis que l'utilisation d'ordinateurs de bureau comprenait principalement le soutien académique, les formalités médicales et la recherche.

Pourcentage de conversations sur trois intentions (questions sur les symptômes, informations sur l'état et bien-être émotionnel) liées à l'utilisateur, une personne dépendante, une autre ou inconnue.

L'étude a également révélé que de nombreux utilisateurs demandaient de l'aide à Copilot pour naviguer dans les systèmes de santé, notamment pour trouver des prestataires, comprendre la couverture et gérer les rendez-vous ou la paperasse, ce qui suggère que la conversation IA est utilisé pour résoudre les frictions administratives ainsi que les questions de santé.

L'étude présente plusieurs limites ; Premièrement, l'analyse s'est appuyée exclusivement sur les journaux Copilot, qui reflètent une plate-forme et un contexte utilisateur spécifiques.

Deuxièmement, l’échantillon comprenait des conversations sur un seul mois ; en tant que tel, les effets saisonniers pourraient influencer les distributions d’intentions.

Troisièmement, l'étude a examiné uniquement les requêtes, pas les résultats, et par conséquent, il n'a pas été possible de déterminer si les utilisateurs recherchaient des soins ultérieurs ou si les informations reçues amélioraient leur prise de décision.

Les recherches futures devraient viser à déterminer si les informations fournies par les conversations IA aide réellement les utilisateurs.