Perspectives de l’architecture Trame/Cadre pour les alignements multilingues

Fiche du document

Date

2015

Discipline
Type de document
Périmètre
Langue
Identifiant
Relations

Ce document est lié à :
Nouvelles perspectives en sciences sociales : Revue internationale de systémique complexe et d'études relationnelles ; vol. 11 no. 1 (2015)

Collection

Erudit

Organisation

Consortium Érudit

Licence

Tous droits réservés © Prise de parole, 2015



Sujets proches Fr

Traitement

Citer ce document

Maria Zimina et al., « Perspectives de l’architecture Trame/Cadre pour les alignements multilingues », Nouvelles perspectives en sciences sociales: Revue internationale de systémique complexe et d'études relationnelles, ID : 10.7202/1035940ar


Métriques


Partage / Export

Résumé Fr En

L’informatisation des alignements textuels est confrontée à la complexité de l’organisation textuelle et discursive. L’architecture modulaire Trame/Cadre issue des recherches menées en textométrie facilite la navigation dans l’espace textuel multilingue. Le flux textuel est représenté par un système de coordonnées sur le texte (la Trame). Le calcul d’une Trame permet une identification précise des objets (contenants et contenus) nécessaires aux repérages contextuels (le Cadre). La construction d’un Cadre permet de stocker non seulement les découpages du texte mais aussi les annotations produites par différentes procédures informatiques (y compris les alignements) et, éventuellement, de les faire passer d’une procédure de traitement à l’autre. Ces états successifs de traitement induisent la notion de ressource textuelle incrémentale qui conserve la trace de séquences de traitement apportées à la ressource textuelle initiale, avec apport de méthodes quantitatives. Cette approche est implémentée au sein du logiciel Le Trameur qui permet d’explorer les corpus multilingues richement annotés (treebanks).

Multilingual text alignment is challenging due to the complexity of text and discourse organisation. Multilingual textual space can be explored using a textometric data model (Thread/Frame). A Thread is a textual flow represented as a system of items with position identifiers. A Frame is used to locate different textual objects (containers and contents) and their contexts. Following these principles, all text parts and annotations (including alignments) are stored and exchanged through different computerised procedures. Incremental textual resources trace all processing steps (from the initial segmentation to subsequent explorations and quantitative analyses). The software implementation of this model in Le Trameur allows exploring richly annotated multilingual text corpora (treebanks).

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en