Apprentissage automatique d'un chunker pour le français

Fiche du document

Date

4 juin 2012

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess




Citer ce document

Isabelle Tellier et al., « Apprentissage automatique d'un chunker pour le français », HAL-SHS : linguistique, ID : 10670/1.jesvdq


Métriques


Partage / Export

Résumé Fr

Nous décrivons dans cet article comment nous avons procédé pour apprendre automatiquement un chunker à partir du French Treebank, en utilisant les CRF (Conditional Random Fields). Nous avons réalisé diverses expériences, pour reconnaître soit l'ensemble de tous les chunks possibles, soit les seuls groupes nominaux. Nous évaluons le chunker obtenu aussi bien de manière interne (sur le French Treebank lui-même) qu'externe (sur un corpus distinct transcrit de l'oral), afin de mesurer sa robustesse. ABSTRACT Machine Learning of a chunker for French We describe in this paper how to automatically learn a chunker for French, from the French Treebank and CRFs (Conditional Random Fields). We did several experiments, either to recognize every possible kind of chunks, or to focus on nominal phrases only. We evaluate the obtained chunker on internal data (i.e. also extracted from the French Treebank) as well as on external (i.e from a distinct corpus) ones, to measure its robustness.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en