Transforming a Corpus into a Lexical Resource The Berlin Idiom Project

Fiche du document

Date

2005

Discipline
Type de document
Périmètre
Langue
Identifiant
Collection

Cairn.info

Organisation

Cairn

Licence

Cairn



Citer ce document

Christiane Fellbaum et al., « Transforming a Corpus into a Lexical Resource The Berlin Idiom Project », Revue française de linguistique appliquée, ID : 10670/1.p93kem


Métriques


Partage / Export

Résumé En Fr

We discuss the goals and methods of the lexicographic project “Collocations and Idioms in the German Language” at the Berlin-Brandenburg Academy of Sciences. A very large corpus is tagged and parsed to enable flexible searches for target structures, German verb phrase idioms. On the basis of relevant tokens, an extensive linguistic-lexicographic analysis is performed and recorded on a set of structured forms, which comprise a kind of digital dictionary entry for the target structure. For transparency and future research, each recorded linguistic-lexicographic phenomenon is linked with appropriate corpus tokens. The resulting resource, which combines an exhaustive description of the idioms’ properties with corpus tokens, allows for multiple search types.

Nous décrivons les buts et les méthodes du projet lexicographique « Collocations et expressions idiomatiques dans la langue allemande » mené à l’Académie des Sciences de Berlin-Brandenburg. Un très gros corpus est étiqueté et analysé automatiquement afin de permettre de rechercher de façons multiples les structures ciblées, à savoir les expressions idiomatiques verbales allemandes. Sur la base des tokens pertinents, une analyse détaillée linguistico-lexicographique est effectuée et consignée sur un ensemble de formulaires structurés qui forment une sorte d’entrée d’un dictionnaire électronique pour la structure cible. Afin de faciliter la transparence ainsi que les futures recherches, chaque phénomène linguistico-lexicographique retenu est apparié aux éléments appropriés du corpus. La ressource qui en résulte, qui combine une description exhaustive des propriétés des expressions idiomatiques et les éléments du corpus, permet d’effectuer des types de recherches multiples.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en