13 mai 2020
Ce document est lié à :
info:eu-repo/semantics/reference/issn/0752-5443
Ce document est lié à :
info:eu-repo/semantics/reference/issn/2104-371X
https://creativecommons.org/licenses/by-nc-sa/4.0/ , info:eu-repo/semantics/openAccess
Kirill Maslinsky, « Positional skipgrams for Bambara: a resource for corpus-based studies », Mandenkan, ID : 10.4000/mandenkan.2119
L’article présente un nouveau paquet de données linguistiques de fréquences de n‑grams pour le bambara, basé sur le sous-corpus désambiguïsé du Corpus bambara de référence. Les n‑grams sont des skipgrams positionnels qui capturent l’information sur la co-occurrence des lexèmes avec des catégories grammaticales à des positions différentes. Ces n‑grams ont été conçus pour tirer profit de ce type d’informations disponibles dans le corpus bambara morphologiquement annoté, vu le volume limité des données textuelles. La discussion de la méthodologie et les données utilisées pour la construction des n‑grams pour le bambara est suivie par quelques illustrations d’utilisation des skipgrams positionnels dans des recherches linguistiques basées sur un corpus.