Construction d’un grand corpus annoté pour la langue amazighe

Fiche du document

Date

2014

Discipline
Type de document
Périmètre
Langue
Identifiant
Collection

Cairn.info

Organisation

Cairn

Licence

Cairn




Citer ce document

Mohamed Outahajala et al., « Construction d’un grand corpus annoté pour la langue amazighe », Études et Documents Berbères, ID : 10670/1.vs28vm


Métriques


Partage / Export

Résumé 0

Comme la plupart des langues qui n’ont que récemment commencé la recherche en TAL (Traitement automatique des langues), la langue amazighe souffre encore de la pénurie d’outils et de ressources pour son traitement automatique, en particulier de corpus annotés. Ces derniers sont plus difficiles à construire et à finaliser que les corpus bruts qui nécessitent pourtant des prétraitements dans la majorité des cas. L’objectif de cet article est de présenter notre démarche de construction pour la langue amazighe d’un grand corpus annoté, morphologiquement, syntaxiquement et sémantiquement. Dans le même sens, nous présentons un premier travail d’annotation morphosyntaxique d’un corpus amazighe d’environ vingt mille mots. Nous montrerons également comment il peut être étendu afin de réaliser le corpus annoté cible.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en