Pattern mining and CRF for symptoms recognition in biomedical texts Fouille de motifs et CRF pour la reconnaissance de symptômes dans les textes biomédicaux En Fr

Fiche du document

Date

4 juillet 2016

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess




Citer ce document

Pierre Holat et al., « Fouille de motifs et CRF pour la reconnaissance de symptômes dans les textes biomédicaux », HAL-SHS : linguistique, ID : 10670/1.9f2u7h


Métriques


Partage / Export

Résumé En Fr

Pattern mining and CRF for symptoms recognition in biomedical texts. In this paper, we tackle the issue of symptoms recognition in biomedical texts. There is not much attention to this problem in the literature and it does not exist to our knowledge an annotated dataset to train a model. We propose two weakly-supervised approaches to extract these entities. The first is based on pattern mining and introduces a new constraint based on semantic similarity. The second represents the task as sequence labeling using CRF (Conditional Random Fields). We describe our experiments which show that the two approaches are complementary in terms of quantification (recall and precision). We further show that their combination significantly improves the results.

Dans cet article, nous nous intéressons à l'extraction d'entités médicales de type symptôme dans les textes biomédicaux. Cette tâche est peu explorée dans la littérature et il n'existe pas à notre connaissance de corpus annoté pour entraîner un modèle d'apprentissage. Nous proposons deux approches faiblement supervisées pour extraire ces entités. Une première est fondée sur la fouille de motifs et introduit une nouvelle contrainte de similarité sémantique. La seconde formule la tache comme une tache d'étiquetage de séquences en utilisant les CRF (champs conditionnels aléatoires). Nous décrivons les expérimentations menées qui montrent que les deux approches sont complémentaires en termes d'évaluation quantitative (rappel et précision). Nous montrons en outre que leur combinaison améliore sensiblement les résultats.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en