Sous la direction de Helmholtz Munich, des scientifiques ont développé une solution logicielle accessible spécialement conçue pour l’analyse de données médicales complexes. Le logiciel open source appelé « ehrapy » permet aux chercheurs de structurer et d’examiner systématiquement de grands ensembles de données hétérogènes. Le logiciel est à la disposition de la communauté scientifique mondiale pour qu’elle l’utilise et le développe.
Ehrapy doit combler une lacune critique dans l'analyse des données de santé, explique Lukas Heumos, l'un des principaux développeurs et chercheur à l'Institut de biologie computationnelle de Helmholtz Munich et à l'Université technique de Munich (TUM) : « Jusqu'à présent, il n'existait aucun outil standardisé permettant d'analyser systématiquement et efficacement des données médicales diverses et complexes. Avec ehrapy, nous avons changé la donne. » L'équipe à l'origine d'ehrapy est issue de la recherche biomédicale et possède une vaste expérience dans l'analyse d'ensembles de données scientifiques complexes. « Le secteur de la santé est confronté aux mêmes défis en matière d'analyse de données que ceux qui travaillent dans les laboratoires », a souligné Heumos au début du projet ehrapy.
Approche exploratoire – analyse sans hypothèses
En collaboration avec de nombreux autres contributeurs, Heumos a utilisé son expertise en développement de logiciels scientifiques pour créer une solution d'analyse des données des patients : « Ehrapy permet de découvrir de nouveaux modèles et de générer des informations sans avoir à analyser les données sur la base d'une supposition ou d'une hypothèse spécifique. » Cette approche exploratoire, explique Heumos, est une caractéristique unique d'ehrapy.
Ehrapy permet aux chercheurs de trier, de regrouper et d'analyser des ensembles de données volumineux, hétérogènes et complexes sans aucune hypothèse préalable. Cela ouvre de nouvelles perspectives qui peuvent ensuite être explorées plus en profondeur. Heumos explique : « L'approche exploratoire apporte de nouvelles perspectives à l'analyse des données de santé. En raison de leur complexité et de leur hétérogénéité, ces données ne sont souvent pas analysées aussi efficacement qu'elles pourraient l'être. » Ehrapy ouvre ainsi de nouvelles perspectives pour rendre les données de santé plus utiles à la recherche et à la pratique médicales.
L’objectif à long terme : une utilisation systématique dans la pratique clinique
Ehrapy a été conçu dès le départ comme un logiciel open source. « Il était important pour nous de mettre le logiciel à disposition de la communauté scientifique dès le premier jour », souligne Heumos. Le logiciel est disponible sous forme de package Python sur GitHub, une plateforme en ligne de développement de logiciels, et peut être utilisé et développé par des chercheurs du monde entier.
Actuellement, ehrapy se concentre sur l'analyse efficace et rapide des ensembles de données de recherche, tels que ceux stockés dans les grands centres de recherche en santé. « L'utilisation systématique dans la pratique clinique est un objectif à long terme, mais pour l'instant, nous nous concentrons sur la fourniture d'un outil puissant à la communauté des chercheurs », explique Heumos.
À l’avenir, l’équipe prévoit de fournir des bases de données standardisées pour les dossiers médicaux électroniques (DME). Ces bases de données permettront une meilleure intégration et analyse de grands volumes de données médicales. En outre, cela facilitera le développement d’atlas de DME qui peuvent servir d’ensembles de données de référence pour contextualiser et annoter de nouveaux ensembles de données.
Un long voyage
« Ehrapy permet une analyse complète des données dans tous les systèmes, ce qui peut constituer une étape clé pour les futurs systèmes d'IA en médecine. J'espère donc une adoption relativement rapide sur différents sites », déclare le professeur Fabian Theis, directeur de l'Institut de biologie computationnelle de Helmholtz Munich et professeur à la TUM : « L'établissement de telles technologies en médecine est un processus long qui peut prendre des décennies. Notre objectif est de combler le fossé entre la recherche biomédicale et l'application pratique en médecine. » Fabian Theis explique en outre que l'équipe de développement se concentre sur des méthodes d'analyse de données exploratoires sous une forme holistique pour révéler plus facilement les connexions cachées. « Nous essayons également de soutenir les acteurs universitaires et commerciaux du secteur de la santé. »