Morphology in the Corsican Language Database (BDLC) : assessment and perspectives La morphologie dans la Banque de Données Langue Corse : bilan et perspectives En Fr

Fiche du document

Date

2 mars 2022

Discipline
Type de document
Périmètre
Langue
Identifiants
Relations

Ce document est lié à :
info:eu-repo/semantics/altIdentifier/doi/10.4000/corpus.7115

Collection

Archives ouvertes



Sujets proches Fr

Forme

Citer ce document

Stella Retali Medori et al., « La morphologie dans la Banque de Données Langue Corse : bilan et perspectives », HAL-SHS : linguistique, ID : 10.4000/corpus.7115


Métriques


Partage / Export

Résumé En Fr

Since the late 1970s, the NALC-BDLC programme has been collecting dialectal data from native speakers throughout Corsica and northern Sardinia. Ethnolinguistic field surveys are conducted in the form of semi-directed interviews with the help of thematic questionnaires. This long-term undertaking has made it possible to gather a rich linguistic material, but has also undergone various methodological and technological evolutions, making the current version partial. Before describing the analysis carried out to fill these gaps, the possibilities offered today are outlined and put into perspective in relation to those of the historical version. However, our approach goes beyond the "simple restoration" of the system and is planned in two directions: on the one hand, the implementation of a research project that will strengthen the morphological and syntactic dimensions of the database, and on the other hand, the application of Natural Language Processing (NLP) techniques for the development of the programme.

Depuis la fin des années 1970, le programme NALC-BDLC collecte des données dialectales auprès de locuteurs natifs dans l’ensemble de la Corse et dans le nord de la Sardaigne. Les enquêtes ethnolinguistiques de terrain sont menées sous la forme d’entretiens semi-dirigés avec l’aide de questionnaires thématiques. Cette entreprise au long cours a permis de rassembler un matériel linguistique riche, mais a parallèlement connu diverses évolutions – méthodologiques et technologiques – rendant la version actuelle partielle. Avant de décrire l’analyse menée pour combler ces déficits, les possibilités offertes aujourd’hui sont exposées et mises en perspectives par rapport à celles de la version historique. Notre démarche dépasse cependant la « simple restauration » du système et s’envisage en deux directions : d’une part la mise en œuvre d’un projet de recherches qui renforcera les dimensions morphologie et syntaxe de la base, d’autre part l’application des techniques du Traitement Automatique du Langage (TAL) pour le développement du programme.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en