Ma Clinique
  • À la une
  • Actualités
    • Médecines douces
    • Enfants
    • Chirurgie esthétique
  • Chirurgiens esthétiquesNew
  • Contactez-nous
Pas de résultat
View All Result
Ma Clinique : L'information médicale par des professionnels de la santé
Pas de résultat
View All Result

Accueil » Actualités médicales » Miriad transforme l'IA médicale pour livrer des questions et réponses précises

Miriad transforme l'IA médicale pour livrer des questions et réponses précises

par Ma Clinique
11 juin 2025
dans Actualités médicales
Temps de lecture : 5 min
Close-up of a doctor interacting with smartphone, showing messaging symbols for online healthcare

Un vaste nouvel ensemble de données médicales aide les modèles d'IA à répondre à des questions de santé complexes avec une plus grande précision, en apportant des médecins et des chercheurs un peu plus près de l'IA clinique basée sur des preuves dignes de confiance.

Étude: Miriad: augmentation des LLM avec des millions de paires de questions-réponse médicale. Crédit d'image: meeboonstudio / shutterstock.com

* Avis important: arxiv Publie des rapports scientifiques préliminaires qui ne sont pas évalués par les pairs et, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique / comportement lié à la santé, ou traités comme des informations établies.

Une étude récente publiée sur le serveur de préparation Arxiv a cherché à relever les défis des modèles de grande langue (LLM) existants en introduisant un nouvel ensemble de données appelé Miriad, qui prend en charge des millions de paires de questions-réponse médicale.

Sommaire

  • Évolution des modèles de grandes langues pour le domaine des soins de santé
  • Qu'est-ce que Miriad?
  • Développement de données de données Miriad et évaluation de la qualité
  • Interactive Miriad Atlas et autres résultats expérimentaux
  • Conclusions

Évolution des modèles de grandes langues pour le domaine des soins de santé

Bien que les LLM aient bien fonctionné dans diverses tâches de traitement du langage naturel, telles que la traduction et la réponse aux questions, elles manquent souvent d'exactitude factuelle et des dernières informations. Cette limitation a un impact significatif sur le secteur des soins de santé, où la précision factuelle est cruciale.

L'approche de génération augmentée (RAG) de récupération a été développée pour surmonter la limitation ci-dessus, qui ne nécessite pas de réglage fin de LLMS coûteux. Initialement, les systèmes de récupération développés étaient basés sur des bases de données vectorielles standard. Bien que la réalisation de performances de récupération élevées en utilisant des modèles précédents ait été difficile, des modèles de récupération générale récemment avancés, tels que E5, Colbert ou Jina-Colbert-V2, ont présenté des performances importantes en raison de grands ensembles de données de formation. En règle générale, les ensembles de données comprennent des échantillons appariés de requêtes et de documents, c'est-à-dire un format de réponse aux questions.

Actuellement, le domaine médical n'a pas de jeux de données de récupération à grande échelle, de haute qualité et ouvertement accessibles, qui pourraient être exploités par ailleurs pour développer des systèmes de récupération optimisés pour des informations médicales. Les ensembles de données de réponses médicaux actuellement disponibles (QA), tels que MeDMCQA, PubMedqa ou MedQA, ont de nombreuses limites. Par exemple, PubMedqa se concentre sur des sections d'articles spécifiques et n'offre pas de réponses en forme libre, tandis que MeDQA contient des questions à choix multiples (MCQ). Les ensembles de données QA existants sont sensiblement petits, allant entre des milliers et des centaines de milliers d'échantillons.

Qu'est-ce que Miriad?

MiRiad représente un ensemble de données à grande échelle comprenant des instructions médicales et des réponses qui ont été générées de manière semi-synthétique à l'aide de LLMS. Chaque paire de réponses aux questions est fondée sur la littérature médicale évaluée par des pairs.

Contrairement aux ressources précédentes, Miriad est un ensemble de données plutôt qu'un nouveau modèle. Cet ensemble de données fournit des informations précises, surmontant les limites des LLM antérieures.

Contrairement aux LLMS conventionnels, Miriad fournit un lien source vers chaque paire de réponses à des questions. Miriad propose des informations médicales et biomédicales complètes, couvrant 56 sujets médicaux et disciplines.

Développement de données de données Miriad et évaluation de la qualité

L'ensemble de données Miriad a été développé à partir d'une collection à grande échelle de requêtes et de réponses médicales. Initialement, 894 352 documents médicaux ont été utilisés pour le traitement LLM, avec une option pour augmenter l'ensemble de données à l'avenir.

Chaque article a été divisé en passages, que le modèle de langage GPT-3.5-turbo traité en fonction des invites standard pour générer des paires de QA autonomes. Toutes les questions médicales ont été associées à des réponses liées à un passage source. Plus de 10 millions de paires QA brutes ont été initialement générées, jetant les bases de l'ensemble de données Miriad.

De multiples étapes de contrôle de la qualité, telles que le filtrage basé sur des règles, les annotations d'experts humains et le filtrage basé sur LLM, ont été effectuées pour assurer un ensemble de données de haute qualité. Par exemple, un filtre basé sur des règles a éliminé les paires d'AQ qui reposaient sur des références méta-linguistiques au passage source. Cette stratégie a supprimé environ 5 millions de paires d'AQ non satisfaisantes. L'annotation basée sur LLM a aidé à maintenir les données factuelles et pertinentes du domaine. Pour évaluer l'accord entre l'annotation basée sur LLM et l'humanité, cinq experts médicaux ont examiné un sous-ensemble de 56 passages et 168 paires d'AQ.

Alors que les experts humains ont été impliqués dans la validation, la majeure partie du contrôle de la qualité a été effectuée en utilisant un filtrage automatisé basé sur LLM en raison de l'échelle de l'ensemble de données. Ce processus de génération semi-synthétique, bien que vaste, peut encore entraîner des inexactitudes résiduelles. Les auteurs reconnaissent que Miriad représente un tremplin significatif dans la conservation des connaissances médicales pour les applications d'IA plutôt qu'un critère d'évaluation entièrement complet.

Miriad a été lancé en deux versions: Miriad-5.8m et Miriad-4.4m. Après le filtrage basé sur des règles, Miriad-5.8m est formé avec 5 821 948 échantillons, tandis que Miriad-4.4 M est formé avec 4 487 542 échantillons après toute la séquence des étapes de contrôle de la qualité. Une approche de reformulation de la littérature a permis aux paires d'AQ qui en résultent dans la littérature médicale évaluée par les pairs.

Interactive Miriad Atlas et autres résultats expérimentaux

Miriad-Atlas, une interface utilisateur interactive hébergée par le Web, permet aux utilisateurs de naviguer et d'explorer des informations approfondies. Les utilisateurs peuvent se renseigner sur des conditions rares, telles que la maladie de Creutzfeldt-Jakob, en localisant simplement les informations pertinentes dans le paysage des connaissances médicales. L'aspect interactif a transformé Miriad d'un atout statique à un outil exploratoire pour les chercheurs ou les médecins. Chaque paire de réponses à requête est cartographiée visuellement et les utilisateurs peuvent retrouver la source d'origine de vérification et de lecture plus approfondie.

La présente étude a comparé trois conditions expérimentales: la récupération en utilisant les paires de QA de Miriad (Rag-Miriad), la récupération à partir de passages bruts (passage de chiffon) et une ligne de base sans augmentation de récupération (sans Ragr), où le LLM répond directement à la question.

Les données expérimentales ont révélé que Miriad peut être directement utilisé comme source supplémentaire de connaissances pour améliorer les performances des chiffons médicaux dans les LLM jusqu'à 6,7% par rapport au texte non structuré de la même source dans certaines tâches de référence. Cependant, la taille de l'amélioration variait en fonction du choix du modèle de langue et de la méthode d'intégration, avec les gains les plus évidents observés dans les modèles open source avec des connaissances médicales intégrées limitées.

Les données expérimentales ont également indiqué que Miriad pourrait être utilisé directement pour former des modèles de recherche d'informations médicales, améliorant davantage la qualité de récupération. En outre, Miriad a amélioré le potentiel des LLM pour déterminer les hallucinations médicales de 22,5 à 37% (score de mesure F1), avec les améliorations les plus importantes observées dans les sous-ensembles annotés par l'homme.

Il est important de noter que si ces améliorations sont prometteuses, elles sont spécifiques aux configurations expérimentales et à des ensembles de données utilisés dans l'étude. Il est averti que les performances peuvent varier avec d'autres tâches, modèles ou configurations de récupération.

Conclusions

Miriad permet aux chercheurs et aux médecins d'obtenir des informations complètes et précises en permettant aux utilisateurs d'explorer, de rechercher et d'affiner visuellement des informations médicales à partir de millions de requêtes et de réponses organisées par sujet et discipline.

Sur la base des résultats de la recherche, les scientifiques sont optimistes que Miriad permettra aux chercheurs, aux soignants et aux patients en leur fournissant des systèmes de recherche médicale avancés, des applications de chiffon améliorées et des interfaces cliniques cliniques fondées sur les connaissances.

Des travaux en cours sont encore nécessaires pour élargir la couverture médicale, affiner la génération de l'AQ et réduire continuellement les inexactitudes potentielles.

Téléchargez votre copie PDF maintenant!

* Avis important: arxiv Publie des rapports scientifiques préliminaires qui ne sont pas évalués par les pairs et, par conséquent, ne doivent pas être considérés comme concluants, guider la pratique clinique / comportement lié à la santé, ou traités comme des informations établies.

Précédent

Le nouveau vaccin contre le cancer est prometteur contre les tumeurs pancréatiques mortelles

Suivant

L'odeur de nourriture déclenche une plénitude par la voie du cerveau nouvellement trouvé

Ma Clinique

Ma Clinique

L'équipe Ma Clinique : professionnels de la santé et spécialistes en médecine générale. Notre objectif est de vous fournir les informations dont vous avez besoin pour prendre des décisions éclairées sur vos soins de santé.

Articles populaires

Comment bien choisir sa couverture santé selon ses besoins

Comment bien choisir sa couverture santé selon ses besoins

27 mai 2026
Top 10 des références de matériel dentaire

Top 10 des références de matériel dentaire

13 mai 2026
Sortie d'hospitalisation en 2026 : la maison de convalescence est-elle devenue l'étape obligatoire pour une guérison complète ?

Sortie d’hospitalisation en 2026 : la maison de convalescence est-elle devenue l’étape obligatoire pour une guérison complète ?

8 mai 2026
Comment préparer sa première injection de toxine botulique ?

Comment préparer sa première injection de toxine botulique ?

1 mai 2026
Comment l’augmentation mammaire peut-elle améliorer votre bien-être ?

Comment l’augmentation mammaire peut-elle améliorer votre bien-être ?

10 avril 2026

Articles recommandés

Augmentation mammaire naturelle : les différentes méthodes pour une poitrine de rêve

Augmentation mammaire naturelle : les différentes méthodes pour une poitrine de rêve

14 juin 2023
Comment protéger et prendre soin de votre peau après une brûlure

Comment protéger et prendre soin de votre peau après une brûlure

9 août 2023
Comparateur mutuelle Assurland.com : Trouvez la meilleure offre d'assurance

Comparateur mutuelle Assurland.com : Trouvez la meilleure offre d’assurance

8 avril 2024

Quels sont les différents soins dentaires pratiqués en urgence ?

23 septembre 2022
Transpiration excessive : quels remèdes naturels ?

Transpiration excessive : quels remèdes naturels ?

23 septembre 2022
Justin Jedlica, le Ken humain

Dérives de la chirurgie esthétique : deux sosies de Ken humain !

28 août 2019
Quels sont les actes de chirurgie esthétique les plus populaires ?

Quels sont les actes de chirurgie esthétique les plus populaires ?

23 septembre 2022
Santé mentale et télétravail, quel impact sur le la qualité de vie ?

Santé mentale et télétravail, quel impact sur le la qualité de vie ?

13 avril 2023
Choisir l’institut de beauté idéal : 5 astuces pour y arriver

Choisir l’institut de beauté idéal : 5 astuces pour y arriver

11 avril 2024
Troubles auditifs : comprendre et gérer leurs impacts

Troubles auditifs : comprendre et gérer leurs impacts

5 juin 2024
Blépharoplastie à Paris : découvrez les avantages de cette intervention esthétique

Blépharoplastie à Paris : découvrez les avantages de cette intervention esthétique

11 août 2023
Guide complet sur la trousse de premier secours dans le milieu médical et professionnel

Guide complet sur la trousse de premier secours dans le milieu médical et professionnel

21 juin 2024

Qui sommes-nous ?

Ma Clinique

Ma Clinique : L'information médicale par des professionnels de la santé.

Ma Clinique est géré par des professionnels de la santé qui ont à cœur de fournir des informations médicales précises et actualisées. Nous sommes une équipe de médecins et d'autres professionnels de la santé, et avons des années d'expérience dans le domaine de la médecine.

Nous trouver

Ma Clinique
11 rue Jules Ferry
01500 Ambérieu-en-Bugey
France

[email protected]

  • Mentions légales
  • Contactez-nous

© 2026 Copyright - Ma Clinique - [email protected]

Pas de résultat
View All Result
  • À la une
  • Actualités
    • Médecines douces
    • Enfants
    • Chirurgie esthétique
  • Chirurgiens esthétiques
  • Contactez-nous

© 2026 Copyright - Ma Clinique - [email protected]

Ce site utilise les cookies. En continuant votre navigation sur ce site, vous acceptez l'utilisation des cookies afin d'assurer le bon déroulement de votre visite et de réaliser des statistiques d'audience. Visitez nos mentions légales .