Parcours professionnel

Enseignante en informatique

Septembre 2019 - Aujourd'hui
ESIGELEC, Département TIC

Attachée Temporaire d'Enseignement et de Recherche

Septembre 2018 - Août 2019
IUT de Rouen, département Multimédia et Internet
LITIS, Équipe Traitement de l'Information en Biologie Santé
  • 191h équivalent T.D. (ETD)
  • Niveaux : DUT 1ère et 2ème années, Licence Professionnelle
  • Enseignements : Programmation orientée objet, Programmation évènementielle, Systèmes Unix, Gestion de projet, Bases de données, Intégration web

Attachée Temporaire d'Enseignement et de Recherche

Septembre 2017 - Août 2018
Université de Rouen Normandie, Département d'Informatique
LITIS, Équipe Traitement de l'Information en Biologie Santé
  • 183h ETD
  • Niveaux : Licence 1, 2, 3 - Master 1
  • Enseignements : Programmation impérative en C, Algorithmique avancée, Langages web, Programmation orientée objet (Java) et Interfaces Homme-Machine (Java)

Chargée d'enseignement

2015 - 2017
INSA Rouen Normandie, Département Sciences et Techniques pour l'Ingénieur
  • 128h ETD
  • Niveaux : 1ère et 2ème années, enseignement en section internationale
  • Enseignements : Initiation à la programmation, Algorithmique et programmation structurée, Gestion de projet

Ingénieur bioinformatique

2012 - 2014
Centre Hospitalier Universitaire de Rouen
  • Conception et développement d'un entrepôt de données de santé, modélisation et intégration de données de biologie moléculaire, développement d'outils de recherche et visualisation

Stage de recherche

Février 2012 - Juin 2012
LITIS, Équipe Traitement de l'Information en Biologie Santé
  • Développement d'une application web de représentation graphique de variations génétiques
  • Développement d'un module web d'analyse statistique de données génétiques

Formation

Docteur en Informatique

2014 - 2017
Université de Rouen Normandie

Master Bioinformatique, modélisation et statistique en alternance

2011 - 2014
Université de Rouen Normandie

Licence Biochimie Biologie Moléculaire option Bioinformatique

2008 - 2011
Université de Rouen Normandie

Langues

Français
Anglais (Courant, TOEIC 950)
Allemand (Intermédiaire)

Compétences

Domaines d'expertise

Fouille de données - Indexation

Ingéniérie des connaissances

Bases de données

Architecture logicielle

Recherche d'information

Programmation

Python

C

Java

Javascript

R

Aptitudes transversales

Communication orale

Supervision et gestion de projet

Travail en équipe pluri-disciplinaire

Rédaction scientifique et technique

Conception pédagogique e-learning (Moodle)

Recherche

Mes travaux de recherche s'inscrivent dans la large problématique de recherche d'information dans les données issues du Dossier Patient Informatisé (DPI). Les aspects abordés dans cette problématique sont multiples : d'une part la mise en œuvre d'une recherche d'information clinomique au sein du DPI et d'autre part la recherche d'information au sein de données non structurées issues du DPI. Au cours de ma thèse, dans un premier temps, je me suis intéressée à la problématique d'intégration au sein du DPI d'informations dépassant le cadre de la médecine pour intégrer des données, informations et connaissances provenant de la biologie moléculaire ; les données omiques, issues de la génomique, protéomique ou encore métabolomique. L'intégration de ce type de données permet d'améliorer les systèmes d'information en santé, leur interopérabilité ainsi que le traitement et l'exploitation des données à des fins cliniques. La modélisation des dossiers, l'exploration des codages et de nouveaux modes de saisie, la sémantique des informations stockées sont alors des éléments essentiels. Un enjeu important est d'assurer l'intégration de données hétérogènes, grâce à des recherches sur les modèles conceptuels de données, sur les ontologies et serveurs terminologiques et sur les entrepôts sémantiques. L'intégration de ces données et leur interprétation selon un même modèle de données conceptuel sont un verrou important. Enfin, il est important d'intégrer recherche clinique et recherche fondamentale afin d'assurer une continuité des connaissances entre recherche et pratique clinique et afin d'appréhender la problématique de personnalisation des soins. Ma thèse a ainsi abouti à la conception et au développement d'un modèle générique des données omiques exploité dans une application prototype de recherche et visualisation dans les données omiques et cliniques d'un échantillon de 2 000 patients.

Mon second axe de travail est l'indexation multi terminologique de documents médicaux à travers le développement de l'outil Extracteur de Concepts Multi-Terminologique (ECMT). Cet outil exploite les terminologies intégrées au portail terminologique Health Terminology/Ontology Portal (HeTOP) pour identifier des concepts dans des documents non structurés. Ainsi, à partir d'un document rédigé par un humain, et donc porteur potentiellement d'erreurs de frappe, d'orthographe ou de grammaire, l'enjeu est d'identifier des concepts et ainsi structurer l'information contenue dans le document. Pour la recherche d'information médicale, l'indexation présente un intérêt incontournable pour la recherche dans les documents non structurés, comme les comptes-rendus de séjour ou d'examens. J'ai proposé à cette fin plusieurs méthodes et leur évaluation suivant deux axes : l'indexation de textes médicaux à l'aide de plusieurs terminologies et le traitement du langage naturel dans les textes médicaux narratifs. L'évaluation de ces méthodes a donné de très bons résultats à l'occasion de la compétition CLEF eHealth 2017 où l'outil d'extraction d'information conçu a obtenu la première place pour le traitement des textes rédigés en français et la quatrième place pour le traitement des textes rédigés en anglais. Par ailleurs, ces travaux sont valorisés grâce à un partenariat avec l'entreprise Alicante qui distribue l'outil ECMT dans plusieurs centres hospitaliers français.

Ingéniérie des connaissances, Fouille de données, Extraction d'information, Vocabulaires contrôlés, Traitement du langage naturel, Recherche d'information, Intégration de données hétérogènes

Participation à des projets de recherche

ECMT - Centre Hospitalier Universitaire de Rouen
  • Un outil d'extraction d'information multi-terminologique dans les textes biomédicaux
  • Support pour la valorisation par la société ALICANTE
  • Développements en Java, services REST/SOAP, gestion de bases de données Oracle
PlaIR - Union Européenne, Région Normandie, GRR Logistique, Mobilité, Numérique
  • Une plateforme pluri-disciplinaire offrant de nouvelles solutions pour la constitution et l’accès à des bases documentaires numériques
  • Participation aux réunions
  • Intervention lors du Workshop de fin de projet PlaIR 2.0 Journée « Plateforme d’Indexation Régionale 2.0 », le 29/11/16
  • Développements en C, Python, Java
RAVEL - Tecsan ANR-11-TECS-012
  • Un système de recherche d'information et de visualisation des données médicales
  • Participation aux réunions plénières
  • Participation à la tâche « Recherche d'Information » (état de l'art, définition des stratégies de recherche d'information adaptées aux cas d'utilisation, développement du moteur de recherche en Java) et à la rédaction du livrable
  • Participation à la tâche « Entrepôt de données » (état de l'art, modélisation) et à la rédaction du livrable
  • Participation à la tâche « Représentation et visualisation » (implémentation) en coordination avec l'équipe INSERM U936, Université de Rennes
  • Participation à la tâche « Évaluation » en coordination avec l'équipe LESIM, Université de Bordeaux
GC-DGE - Une application web dédiée à la comparaison de pipelines d'analyse différentielle RNA-seq
EVA - Un outil efficace et polyvalent pour le filtrage de variations génétiques d'intérêt clinique en génomique médicale

Enseignement

IUT de Rouen, 2018-2019

Niveau Cours CM TD TP
DUT 2è M3203 Programmation orientée objet en Javascript 75
DUT 2è AT202 Intégration Web 30
DUT 1è M2206 Intégration Web 45
DUT 1è M1203 Architecture Système et Réseaux 4,5 54
LPro Gestion de projet 24
LPro Bases de données 24

Université de Rouen Normandie, 2017-2018

L1 Bases de la programmation impérative en C 36
L1 Méthodologie de la programmation impérative 24 32
L2 Méthodologie de la programmation orientée objet 24
L2/L3 Langages Web 80
L3 Interfaces homme-machine 50
M1 Environnement professionnel 2 2 2

INSA Rouen Normandie, 2015-2017

L1 Initiation à la programmation impérative 14
L1 Algorithmique et programmation structurée 100
L2 Projet Informatique 14

Total heures enseignées : CM - 6,5h, TD - 202h, TP - 426h soit 495,75h équivalent TD.

Publications

ACL C-ACTI C-ACTN C-AFF C-COM TH
283231

Articles dans des revues internationales ou nationales avec comité de lecture

Cabot, C., Darmoni, S. J., Soualmia, L. F., Cimind: A phonetic-based tool for multilingual named entity recognition in biomedical texts. Journal of Biomedical Informatics 94, 103176 (2019).

Coutant, S., Cabot, C., Lefebvre, A., Léonard, M., Prieur-Gaston, E., Campion, D., Lecroq, T., Dauchel, H., EVA : Exome Variation Analyzer, an efficient and versatile tool for filtering strategies in medical genomics. BMC bioinformatics 13, S9 (2012).

Conférences internationales avec comité de lecture

Cabot, C., Soualmia, L. F., Darmoni, S. J., SIBM at CLEF eHealth Evaluation Lab 2017 : Multilingual Information Extraction with CIM-IND in CEUR-WS Working Notes of the Conference and Labs of the Evaluation Forum (CLEF 2017) (2017).

Cabot, C., Soualmia, L. F., Grosjean, J., Griffon, N., Darmoni, S. J., Evaluation of the Terminology Coverage in the French Corpus LiSSa. Studies in health technology and informatics 235, 126-130 (2017).

Cabot, C., Soualmia, L. F., Dahamna, B., Darmoni, S. J., SIBM at CLEF eHealth Evaluation Lab 2016 : Extracting Concepts in French Medical Texts with ECMT and CIMIND in CEUR-WS Working Notes of the Conference and Labs of the Evaluation Forum (CLEF 2016) 1609 (2016), 47-60.

Cabot, C., Lelong, R., Grosjean, J., Soualmia, L. F., Darmoni, S. J., Retrieving Clinical and Omic Data from Electronic Health Records. Studies in health technology and informatics 221, 115-115 (2016).

Lelong, R., Cabot, C., Soualmia, L. F., Darmoni, S. J., Semantic Search Engine to Query into Electronic Health Records with a Multiple-Layer Query Language in MEDIR workshop (2016).

Cabot, C., Soualmia, L. F., Grosjean, J., Lelong, R., Darmoni, S. J., Integrating and Retrieving Clinical and Omic Data in Electronic Health Records in 7th International Workshop on Knowledge Representation for Health Care (KRH4C) and 8th International Workshop on Process-oriented Information Systems in Healthcare (ProHealth) (2015), 154-159.

Soualmia, L. F., Cabot, C., Dahamna, B., Darmoni, S. J., SIBM at CLEF e-Health Evaluation Lab 2015 in CEUR-WS Working Notes of the Conference and Labs of the Evaluation Forum (CLEF 2015) 1391 (2015).

Cabot, C., Grosjean, J., Lelong, R., Lefebvre, A., Lecroq, T., Soualmia, L. F., Darmoni, S. J., Omic Data Modelling for Information Retrieval in International Work-Conference on Bioinformatics and Biomedical Engineering (2014), 415-424.

Conférences nationales avec comité de lecture

Cabot, C., Soualmia, L. F., Darmoni, S. J., CIM-IND : Un système multilingue pour l’extraction d’information dans les textes cliniques in 4e édition du Symposium sur l’Ingénierie de l’Information Médicale (2017).

Cabot, C., Soualmia, L. F., Darmoni, S. J., Intégration de données cliniques et omiques pour la recherche d’information dans le Dossier Patient Informatisé in Actes des 26èmes Journées Francophones d’Ingénierie des Connaissances (IC), associées à la Plateforme de l’Association Française pour l’Intelligence Artificielle (Rennes, France, 2015), 183-193.

Lelong, R., Cabot, C., Merabti, T., Grosjean, J., Griffon, N., Dahamna, B., Massari, P., Darmoni, S., Information Retrieval in Electronic Health Records Using a Multiple Layer Query Language in Journées Recherche en Imagerie et Technologies pour la Santé 2015 (2015).

Affiches

Cabot, C., Soualmia, L. F., Dahamna, B., Darmoni, S. J., ECMT : Indexation multi-terminologique de documents biomédicaux in 1er Forum Franco-Québécois d’Innovation en Santé, Polytechnique Montréal (2016).

Cabot, C. GC- VC/DGE : a user-friendly web application for Going over Concordance across results from NGS bioinformatics analytic pipelines in ECCB 2014 (Strasbourg, France, 2014).

Participation aux rencontres scientifiques et activités de vulgarisation

Cabot, C., Soualmia, L. F., Darmoni, S. J., Recherche d’information dans les données cliniques et omiques au sein du Dossier Patient Informatisé Journée Plateforme d’Indexation 2.0. Nov. 2016.

Cabot, C., Soualmia, L. F., Grosjean, J., Lelong, R., Darmoni, S. J., Integrating and retrieving clinical and omic data in electronic health records 15 ans du Master de Bioinformatique de l’Université de Rouen Normandie. Mai 2015.

Cabot, C. GC- VC/DGE : a user-friendly web application for Going over Concordance across results from NGS bioinformatics analytic pipelines 3ème Journée Scientifique de l’IRIB. Caugé, France, 2014.

Mémoires

Cabot, C. Recherche d’information clinomique dans le Dossier Patient Informatisé : modélisation, implantation et évaluation. Université de Rouen Normandie, 2017.

Thèse soutenue le 21 décembre 2017 devant un jury composé de :

  • M. Stéfan Darmoni, PUPH, Université Rouen Normandie, Directeur de thèse
  • Mme Lorraine Goeuriot, MCF, Université Grenoble Alpes, Examinateur
  • Mme Marie-Christine Jaulent, DR, LIMICS Inserm U1142, Rapporteur
  • Mme Lina Soualmia, MCF, HDR, Université Rouen Normandie, Codirectrice de thèse
  • M. Laurent Vercouter, PU, INSA Rouen Normandie, Examinateur
  • M. Pierre Zweigenbaum, DR, LIMSI CNRS UPR3251, Rapporteur