Positional skipgrams for Bambara: a resource for corpus-based studies

L’article présente un nouveau paquet de données linguistiques de fréquences de n‑grams pour le bambara, basé sur le sous-corpus désambiguïsé du Corpus bambara de référence. Les n‑grams sont des skipgrams positionnels qui capturent l’information sur la co-occurrence des lexèmes avec des catégories grammaticales à des positions différentes. Ces n‑grams ont été conçus pour tirer profit de ce type d’informations disponibles dans le corpus bambara morphologiquement annoté, vu le volume limité des données textuelles. La discussion de la méthodologie et les données utilisées pour la construction des n‑grams pour le bambara est suivie par quelques illustrations d’utilisation des skipgrams positionnels dans des recherches linguistiques basées sur un corpus.

Positional skipgrams for Bambara: a resource for corpus-based studies

Fiche du document

Mots-clés En Fr Ru

Sujets proches En

Citer ce document

Métriques

Partage / Export

Résumé En Fr Ru

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en