Vers une lexicographie mandingue sur la base de grands corpus annotés

Résumé En Fr Ru

Availability of big electronic annotated corpora for Maninka and Bamana languages lets us think about development of corpus-driven dictionaries, i.e. dictionaries of a new generation. In a corpus-driven dictionary, elaboration of the polysemy, collocations, syntactic valencies, stylistic, regional and dialectal characteristics of each lexeme (and of each sense of a lexeme) will be based on the analysis of a concordance extracted from the corpus. Henceforth, it becomes possible to evaluate statistically each feature. Two sample examples of lexicographic analysis of Bambara lexemes, bánban and jàhadi, are given.

La disponibilité des corpus électroniques annotés comptant des millions de mots pour les langues maninka et bambara permet de penser des dictionnaires de nouvelle génération. Dans un tel dictionnaire, l'élaboration de la polysémie, combinabilité, valences syntaxiques, caractéristiques stylistiques, régionales et dialectales pour chaque lexème (et pour chaque sens du lexème) sera basée sur l'analyse du concordancier dérivé du corpus. Désormais, il devient possible d'évaluer statistiquement chaque trait caractéristique du lexème. Une analyse lexicographique, sur la base des concordanciers, est présenté sur l'exemple des lexèmes bambara bánban et jàhadi.

Создание миллионных электронных аннотированных корпусов для языков манинка и бамана ставит вопрос о разработке « корпусных словарей », т.е. словарей нового поколения. В таком словаре разработка полисемии, сочетаемости, синтаксических валентностей, стилистических и регионально-диалектных характеристик каждой лексемы (и каждого значения лексемы) должно базироваться на анализе корпусного конкорданса. Становится возможным не только выявление различных характеристик, но и их статистическая оценка. В статье даётся, в качестве примера, лексикографический анализ баманских лексем bánban и jàhadi на основе корпусных данных.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en