DILA Word Segmented CBETA Corpus and Auto Segmentation Tool

Régulateurs automatiques Automatique Contrôle automatique Régulateurs industriels Régulation industrielle Conduite automatique Commande automatique, Systèmes de outillage

Citer ce document

« DILA Word Segmented CBETA Corpus and Auto Segmentation Tool », DISTAM, ID : 10.58079/np8y

Partage / Export

Résumé 0

Dharma Drum Institute of Liberal Arts (DILA, Taïwan) a publié un outil de segmentation automatique dédié aux textes littéraires bouddhiques. Cet outil s’appuie sur un modèle de langue (CRF, Conditional Random Filed model) entraîné à la base d’un corpus annoté manuellement par les spécialistes. Il contient un corpus, qui est le résultat de segmentation automatique pour l’ensemble des collections de CBETA (Chinese Buddhist Electronic Text Association, online e-texts en accès libre).

DILA Word Segmented CBETA Corpus and Auto Segmentation Tool

Fiche du document

Sujets proches En Fr

Citer ce document

Métriques

Partage / Export

Résumé 0

Sur les mêmes sujets

Sur les mêmes disciplines