Le cancer est l’une des maladies les plus dévastatrices au monde. En 2023, plus de 1,9 million de nouveaux cas de cancer et 609 820 décès devraient survenir aux États-Unis seulement. Alors que des efforts sont en cours pour améliorer les outils de diagnostic, les microARN sont à la pointe de la recherche biomédicale.
Les microARN, ou miARN, sont une classe de petits acides ribonucléiques (ARN) non codants, essentiels à toutes les fonctions biologiques. Le rôle principal des miARN dans le corps humain est la régulation des gènes. En tant que tels, ils régulent une variété de processus biologiques et pathologiques, y compris la formation et le développement du cancer. En fait, de nombreux cancers sont étroitement associés à la fonctionnalité des miARN.
L’association des miARN avec le développement du cancer a stimulé l’intérêt pour l’étude des données de profilage de l’expression des miARN en tant qu’outil de diagnostic potentiellement moins invasif pour la détection précoce. Des méthodologies d’apprentissage automatique ont été utilisées pour développer des modèles de classification pan-cancer à haute performance et pour identifier des biomarqueurs de miARN potentiellement nouveaux pour l’investigation clinique. Cependant, il est essentiel de comprendre comment ces techniques de science des données sont corrélées aux processus biologiques établis pour faire progresser l’intégration dans les environnements cliniques.
Pour explorer davantage la faisabilité des miARN en tant que biomarqueurs pour la classification du cancer et améliorer les applications de classification clinique, des chercheurs du College of Engineering and Computer Science de la Florida Atlantic University ont créé un modèle de diagnostic du cancer multiclasse utilisant des profils d’expression de miARN. Leur méthodologie a utilisé un processus itératif qui a appliqué plusieurs techniques clés à un ensemble de données en constante augmentation de données de quantification de l’expression des miARN.
Pour l’étude, les chercheurs ont évalué la relation entre les principales caractéristiques des miARN sélectionnées par les modèles d’apprentissage automatique et les biomarqueurs miARN vérifiés cliniquement et biologiquement. Ils ont développé des modèles d’apprentissage automatique Support Vector Machine et Random Forest pour la classification du cancer, et ont ajouté de manière itérative des classes de cancer aux modèles multiclasses. Ils ont examiné la relation entre les miARN pertinents identifiés grâce à la sélection des caractéristiques et les mesures de performance des modèles de classification sur 20 itérations. Chaque itération a ajouté un autre site d’échantillonnage primaire aux modèles multi-classes, augmentant ainsi le nombre de types de cancer impliqués.
Les chercheurs ont examiné l’évolution des mesures de réussite à mesure que davantage de types de cancer étaient introduits dans le sous-ensemble, comment la signature 20-miARN changeait à mesure que davantage de types de cancer étaient introduits dans le sous-ensemble et les caractéristiques de l’ensemble de données complet via l’analyse en composantes principales, une technique populaire pour analyser de grands ensembles de données contenant un nombre élevé de dimensions ou de caractéristiques.
Contrairement aux études précédentes, qui ne se sont concentrées que sur les signatures de caractéristiques des miARN pour un ensemble de données multiclasse final, cette étude a suivi les changements de pertinence clinique et biologique après chaque ajout d’un type de tissu cancéreux.
Résultats de l’étude, publiés dans la revue de l’Institute of Electrical and Electronics Engineers IEEE Xplore, indiquent que les modèles avec un plus grand nombre de classes de cancer se tournent vers la concentration sur les miARN cancéreux divers d’une plus grande pertinence avec une fonctionnalité caractérisée. L’étude suggère que les miARN peuvent être très uniques à des tissus cancéreux spécifiques et peuvent être de puissants biomarqueurs pour la détection et la classification ; cependant, les biomarqueurs vérifiés actuels se dirigent vers plus de miARN à l’échelle du cancer lors de la détection du cancer.
L’étude fournit des informations sur les relations potentielles entre la pertinence clinique globale de la signature d’extraction de caractéristiques et les mesures de réussite des modèles et démontre la faisabilité de l’utilisation d’une signature de cancer miARN multitissulaire comme signature généralisable pour la détection du cancer à classe unique dans un certain nombre de cancers importants.
Les résultats ont montré qu’à mesure que le nombre de classes de cancer augmentait, les mesures de performance diminuaient, mais le pourcentage de pertinence de la signature de sélection des caractéristiques du miARN augmentait légèrement avant de se stabiliser. De plus, après avoir effectué une analyse en composantes principales, les tissus non cancéreux de tous les échantillons avaient des visualisations d’expression très similaires, tandis que tous les tissus cancéreux avaient des profils uniques.
Les microARN sont très prometteurs pour les futurs tests de diagnostic, car ils peuvent être détectés directement à partir de fluides biologiques tels que le sang, l’urine ou la salive, ainsi que la disponibilité de techniques de mesure de haute qualité pour les miARN. Cela rend la compréhension et la caractérisation de la base biologique derrière les outils potentiels de classification des miARN cruciales pour l’intégration dans les environnements cliniques. »
Oneeb Rehman, auteur correspondant et titulaire d’un doctorat. candidat au Département de génie électrique et d’informatique au sein du Collège d’ingénierie et d’informatique de la FAU
Sous la supervision de Rehman, une équipe d’étudiants de premier cycle en conception et co-auteurs Charles Briandi et Eyan Eubanks, dirigée par Matthew Acs et Richard Acs, du Département de génie électrique et d’informatique, a participé à l’étude. Hanqi Zhuang, Ph.D., co-auteur, président et professeur du Département de génie électrique et d’informatique, a servi de mentor à l’équipe.
« Cette étude, qui a exploré la relation entre la composition des microARN et divers types de cancers, a des implications importantes pour l’utilisation potentielle des miARN comme biomarqueurs dans la recherche et le domaine clinique », a déclaré Stella Batalama, Ph.D., doyen, FAU Collège d’ingénierie et d’informatique. « Ce qui est particulièrement impressionnant dans cette recherche, c’est qu’elle a impliqué un certain nombre de nos étudiants de premier cycle qui ont collaboré pour rechercher une meilleure façon de gérer une maladie qui touche des millions de personnes dans le monde chaque année. »
La recherche a utilisé les données du portail de données Genomic Data Commons, qui a été parrainé par le National Cancer Institute.