Le développement de modèles prédictifs statistiques et d’aide à la décision clinique a toujours été réalisé en sélectionnant et en ajustant manuellement des ensembles de variables prédictives. Cet axe de recherche vise à dépasser ces approches historiques en apprenant à partir de données réelles, telles que les DSE ou les données de cohorte. Les DSE se composent de données structurées, telles que les données démographiques, les diagnostics, l’exposition aux médicaments, les données omiques et les données non structurées, telles que les notes cliniques ou les rapports d’anatomie pathologique.
L’objectif de cet axe est de développer des méthodes et des outils pour exploiter les données des patients dans leur grande variété et complexité. Cela comprend l’extraction et la transformation des données brutes en caractéristiques techniques et en représentations apprises de bonne qualité qui permettront ou faciliteront le développement d’autres approches d’aide à la décision clinique et de découverte de connaissances, telles que celles présentées dans les axes 2 et 3.
Mots-clés : Extraction d’informations, traitement du langage naturel, phénotypage, évaluation communautaire du phénotypage, apprentissage des représentations du patient.
Principales publications :
Hybrid Deep Learning for Medication-Related Information Extraction From Clinical Texts in French: MedExt Algorithm Development Study Jouffroy J, Feldman SF, Lerner I, Rance B, Burgun A, Neuraz A. (2021) JMIR Medical Informatics, 17934. DOI: 10.2196/17934. link
Learning the grammar of prescription: recurrent neural network grammars for medication information extraction in clinical texts. Lerner I, Jouffroy J, Burgun A, Neuraz A. (2020). arXiv preprint arXiv :2004.11622. link
Next generation phenotyping using narrative reports in a rare disease clinical data warehouse. Garcelon N, Neuraz A, Salomon R, Bahi-Buisson N, Amiel J, Picard C, Mahlaoui N, Benoit V, Burgun A, Rance B. (2018). Orphanet journal of rare diseases, 13(1), 85. DOI: 10.1186/s13023-018-0830-6 link
Can reproducibility be improved in clinical natural language processing? A study of 7 clinical NLP suites. Digan W, Névéol A, Neuraz A, Wack M, Baudoin D, Burgun A, Rance B. (2020) J Am Med Inform Assoc. Dec 15:ocaa261. DOI: 10.1093/jamia/ocaa261. link