Parcours professionnel
- 191h équivalent T.D. (ETD)
- Niveaux : DUT 1ère et 2ème années, Licence Professionnelle
- Enseignements : Programmation orientée objet, Programmation évènementielle, Systèmes Unix, Gestion de projet, Bases de données, Intégration web
- 183h ETD
- Niveaux : Licence 1, 2, 3 - Master 1
- Enseignements : Programmation impérative en C, Algorithmique avancée, Langages web, Programmation orientée objet (Java) et Interfaces Homme-Machine (Java)
- 128h ETD
- Niveaux : 1ère et 2ème années, enseignement en section internationale
- Enseignements : Initiation à la programmation, Algorithmique et programmation structurée, Gestion de projet
- Conception et développement d'un entrepôt de données de santé, modélisation et intégration de données de biologie moléculaire, développement d'outils de recherche et visualisation
- Développement d'une application web de représentation graphique de variations génétiques
- Développement d'un module web d'analyse statistique de données génétiques
Formation
Langues
Compétences
Domaines d'expertise
Fouille de données - Indexation
Ingéniérie des connaissances
Bases de données
Architecture logicielle
Recherche d'information
Programmation
Python
C
Java
Javascript
R
Aptitudes transversales
Communication orale
Supervision et gestion de projet
Travail en équipe pluri-disciplinaire
Rédaction scientifique et technique
Conception pédagogique e-learning (Moodle)
Recherche
Mes travaux de recherche s'inscrivent dans la large problématique de recherche d'information dans les données issues du Dossier Patient Informatisé (DPI). Les aspects abordés dans cette problématique sont multiples : d'une part la mise en œuvre d'une recherche d'information clinomique au sein du DPI et d'autre part la recherche d'information au sein de données non structurées issues du DPI. Au cours de ma thèse, dans un premier temps, je me suis intéressée à la problématique d'intégration au sein du DPI d'informations dépassant le cadre de la médecine pour intégrer des données, informations et connaissances provenant de la biologie moléculaire ; les données omiques, issues de la génomique, protéomique ou encore métabolomique. L'intégration de ce type de données permet d'améliorer les systèmes d'information en santé, leur interopérabilité ainsi que le traitement et l'exploitation des données à des fins cliniques. La modélisation des dossiers, l'exploration des codages et de nouveaux modes de saisie, la sémantique des informations stockées sont alors des éléments essentiels. Un enjeu important est d'assurer l'intégration de données hétérogènes, grâce à des recherches sur les modèles conceptuels de données, sur les ontologies et serveurs terminologiques et sur les entrepôts sémantiques. L'intégration de ces données et leur interprétation selon un même modèle de données conceptuel sont un verrou important. Enfin, il est important d'intégrer recherche clinique et recherche fondamentale afin d'assurer une continuité des connaissances entre recherche et pratique clinique et afin d'appréhender la problématique de personnalisation des soins. Ma thèse a ainsi abouti à la conception et au développement d'un modèle générique des données omiques exploité dans une application prototype de recherche et visualisation dans les données omiques et cliniques d'un échantillon de 2 000 patients.
Mon second axe de travail est l'indexation multi terminologique de documents médicaux à travers le développement de l'outil Extracteur de Concepts Multi-Terminologique (ECMT). Cet outil exploite les terminologies intégrées au portail terminologique Health Terminology/Ontology Portal (HeTOP) pour identifier des concepts dans des documents non structurés. Ainsi, à partir d'un document rédigé par un humain, et donc porteur potentiellement d'erreurs de frappe, d'orthographe ou de grammaire, l'enjeu est d'identifier des concepts et ainsi structurer l'information contenue dans le document. Pour la recherche d'information médicale, l'indexation présente un intérêt incontournable pour la recherche dans les documents non structurés, comme les comptes-rendus de séjour ou d'examens. J'ai proposé à cette fin plusieurs méthodes et leur évaluation suivant deux axes : l'indexation de textes médicaux à l'aide de plusieurs terminologies et le traitement du langage naturel dans les textes médicaux narratifs. L'évaluation de ces méthodes a donné de très bons résultats à l'occasion de la compétition CLEF eHealth 2017 où l'outil d'extraction d'information conçu a obtenu la première place pour le traitement des textes rédigés en français et la quatrième place pour le traitement des textes rédigés en anglais. Par ailleurs, ces travaux sont valorisés grâce à un partenariat avec l'entreprise Alicante qui distribue l'outil ECMT dans plusieurs centres hospitaliers français.
Ingéniérie des connaissances, Fouille de données, Extraction d'information, Vocabulaires contrôlés, Traitement du langage naturel, Recherche d'information, Intégration de données hétérogènes
Participation à des projets de recherche
- Un outil d'extraction d'information multi-terminologique dans les textes biomédicaux
- Support pour la valorisation par la société ALICANTE
- Développements en Java, services REST/SOAP, gestion de bases de données Oracle
- Une plateforme pluri-disciplinaire offrant de nouvelles solutions pour la constitution et l’accès à des bases documentaires numériques
- Participation aux réunions
- Intervention lors du Workshop de fin de projet PlaIR 2.0 Journée « Plateforme d’Indexation Régionale 2.0 », le 29/11/16
- Développements en C, Python, Java
- Un système de recherche d'information et de visualisation des données médicales
- Participation aux réunions plénières
- Participation à la tâche « Recherche d'Information » (état de l'art, définition des stratégies de recherche d'information adaptées aux cas d'utilisation, développement du moteur de recherche en Java) et à la rédaction du livrable
- Participation à la tâche « Entrepôt de données » (état de l'art, modélisation) et à la rédaction du livrable
- Participation à la tâche « Représentation et visualisation » (implémentation) en coordination avec l'équipe INSERM U936, Université de Rennes
- Participation à la tâche « Évaluation » en coordination avec l'équipe LESIM, Université de Bordeaux
Enseignement
IUT de Rouen, 2018-2019
Niveau | Cours | CM | TD | TP |
---|---|---|---|---|
DUT 2è | M3203 Programmation orientée objet en Javascript | 75 | ||
DUT 2è | AT202 Intégration Web | 30 | ||
DUT 1è | M2206 Intégration Web | 45 | ||
DUT 1è | M1203 Architecture Système et Réseaux | 4,5 | 54 | |
LPro | Gestion de projet | 24 | ||
LPro | Bases de données | 24 |
Université de Rouen Normandie, 2017-2018
L1 | Bases de la programmation impérative en C | 36 | ||
L1 | Méthodologie de la programmation impérative | 24 | 32 | |
L2 | Méthodologie de la programmation orientée objet | 24 | ||
L2/L3 | Langages Web | 80 | ||
L3 | Interfaces homme-machine | 50 | ||
M1 | Environnement professionnel 2 | 2 | 2 |
INSA Rouen Normandie, 2015-2017
L1 | Initiation à la programmation impérative | 14 | ||
L1 | Algorithmique et programmation structurée | 100 | ||
L2 | Projet Informatique | 14 |
Total heures enseignées : CM - 6,5h, TD - 202h, TP - 426h soit 495,75h équivalent TD.
Publications
ACL | C-ACTI | C-ACTN | C-AFF | C-COM | TH |
---|---|---|---|---|---|
2 | 8 | 3 | 2 | 3 | 1 |
Articles dans des revues internationales ou nationales avec comité de lecture
Cabot, C., Darmoni, S. J., Soualmia, L. F., Cimind: A phonetic-based tool for multilingual named entity recognition in biomedical texts. Journal of Biomedical Informatics 94, 103176 (2019).
Coutant, S., Cabot, C., Lefebvre, A., Léonard, M., Prieur-Gaston, E., Campion, D., Lecroq, T., Dauchel, H., EVA : Exome Variation Analyzer, an efficient and versatile tool for filtering strategies in medical genomics. BMC bioinformatics 13, S9 (2012).
Conférences internationales avec comité de lecture
Cabot, C., Soualmia, L. F., Darmoni, S. J., SIBM at CLEF eHealth Evaluation Lab 2017 : Multilingual Information Extraction with CIM-IND in CEUR-WS Working Notes of the Conference and Labs of the Evaluation Forum (CLEF 2017) (2017).
Cabot, C., Soualmia, L. F., Grosjean, J., Griffon, N., Darmoni, S. J., Evaluation of the Terminology Coverage in the French Corpus LiSSa. Studies in health technology and informatics 235, 126-130 (2017).
Cabot, C., Soualmia, L. F., Dahamna, B., Darmoni, S. J., SIBM at CLEF eHealth Evaluation Lab 2016 : Extracting Concepts in French Medical Texts with ECMT and CIMIND in CEUR-WS Working Notes of the Conference and Labs of the Evaluation Forum (CLEF 2016) 1609 (2016), 47-60.
Cabot, C., Lelong, R., Grosjean, J., Soualmia, L. F., Darmoni, S. J., Retrieving Clinical and Omic Data from Electronic Health Records. Studies in health technology and informatics 221, 115-115 (2016).
Lelong, R., Cabot, C., Soualmia, L. F., Darmoni, S. J., Semantic Search Engine to Query into Electronic Health Records with a Multiple-Layer Query Language in MEDIR workshop (2016).
Cabot, C., Soualmia, L. F., Grosjean, J., Lelong, R., Darmoni, S. J., Integrating and Retrieving Clinical and Omic Data in Electronic Health Records in 7th International Workshop on Knowledge Representation for Health Care (KRH4C) and 8th International Workshop on Process-oriented Information Systems in Healthcare (ProHealth) (2015), 154-159.
Soualmia, L. F., Cabot, C., Dahamna, B., Darmoni, S. J., SIBM at CLEF e-Health Evaluation Lab 2015 in CEUR-WS Working Notes of the Conference and Labs of the Evaluation Forum (CLEF 2015) 1391 (2015).
Cabot, C., Grosjean, J., Lelong, R., Lefebvre, A., Lecroq, T., Soualmia, L. F., Darmoni, S. J., Omic Data Modelling for Information Retrieval in International Work-Conference on Bioinformatics and Biomedical Engineering (2014), 415-424.
Conférences nationales avec comité de lecture
Cabot, C., Soualmia, L. F., Darmoni, S. J., CIM-IND : Un système multilingue pour l’extraction d’information dans les textes cliniques in 4e édition du Symposium sur l’Ingénierie de l’Information Médicale (2017).
Cabot, C., Soualmia, L. F., Darmoni, S. J., Intégration de données cliniques et omiques pour la recherche d’information dans le Dossier Patient Informatisé in Actes des 26èmes Journées Francophones d’Ingénierie des Connaissances (IC), associées à la Plateforme de l’Association Française pour l’Intelligence Artificielle (Rennes, France, 2015), 183-193.
Lelong, R., Cabot, C., Merabti, T., Grosjean, J., Griffon, N., Dahamna, B., Massari, P., Darmoni, S., Information Retrieval in Electronic Health Records Using a Multiple Layer Query Language in Journées Recherche en Imagerie et Technologies pour la Santé 2015 (2015).
Affiches
Cabot, C., Soualmia, L. F., Dahamna, B., Darmoni, S. J., ECMT : Indexation multi-terminologique de documents biomédicaux in 1er Forum Franco-Québécois d’Innovation en Santé, Polytechnique Montréal (2016).
Cabot, C. GC- VC/DGE : a user-friendly web application for Going over Concordance across results from NGS bioinformatics analytic pipelines in ECCB 2014 (Strasbourg, France, 2014).
Participation aux rencontres scientifiques et activités de vulgarisation
Cabot, C., Soualmia, L. F., Darmoni, S. J., Recherche d’information dans les données cliniques et omiques au sein du Dossier Patient Informatisé Journée Plateforme d’Indexation 2.0. Nov. 2016.
Cabot, C., Soualmia, L. F., Grosjean, J., Lelong, R., Darmoni, S. J., Integrating and retrieving clinical and omic data in electronic health records 15 ans du Master de Bioinformatique de l’Université de Rouen Normandie. Mai 2015.
Cabot, C. GC- VC/DGE : a user-friendly web application for Going over Concordance across results from NGS bioinformatics analytic pipelines 3ème Journée Scientifique de l’IRIB. Caugé, France, 2014.
Mémoires
Cabot, C. Recherche d’information clinomique dans le Dossier Patient Informatisé : modélisation, implantation et évaluation. Université de Rouen Normandie, 2017.
Thèse soutenue le 21 décembre 2017 devant un jury composé de :
- M. Stéfan Darmoni, PUPH, Université Rouen Normandie, Directeur de thèse
- Mme Lorraine Goeuriot, MCF, Université Grenoble Alpes, Examinateur
- Mme Marie-Christine Jaulent, DR, LIMICS Inserm U1142, Rapporteur
- Mme Lina Soualmia, MCF, HDR, Université Rouen Normandie, Codirectrice de thèse
- M. Laurent Vercouter, PU, INSA Rouen Normandie, Examinateur
- M. Pierre Zweigenbaum, DR, LIMSI CNRS UPR3251, Rapporteur