2005
Cairn
Christiane Fellbaum et al., « Transforming a Corpus into a Lexical Resource The Berlin Idiom Project », Revue française de linguistique appliquée, ID : 10670/1.p93kem
Nous décrivons les buts et les méthodes du projet lexicographique « Collocations et expressions idiomatiques dans la langue allemande » mené à l’Académie des Sciences de Berlin-Brandenburg. Un très gros corpus est étiqueté et analysé automatiquement afin de permettre de rechercher de façons multiples les structures ciblées, à savoir les expressions idiomatiques verbales allemandes. Sur la base des tokens pertinents, une analyse détaillée linguistico-lexicographique est effectuée et consignée sur un ensemble de formulaires structurés qui forment une sorte d’entrée d’un dictionnaire électronique pour la structure cible. Afin de faciliter la transparence ainsi que les futures recherches, chaque phénomène linguistico-lexicographique retenu est apparié aux éléments appropriés du corpus. La ressource qui en résulte, qui combine une description exhaustive des propriétés des expressions idiomatiques et les éléments du corpus, permet d’effectuer des types de recherches multiples.