Le corpus Babeliris : d’une méthodologie de constitution aux principales caractéristiques linguistiques

Fiche du document

Date

2013

Discipline
Type de document
Périmètre
Langue
Identifiant
Source

Equivalences

Collection

Persée

Organisation

MESR

Licence

Copyright PERSEE 2003-2023. Works reproduced on the PERSEE website are protected by the general rules of the Code of Intellectual Property. For strictly private, scientific or teaching purposes excluding all commercial use, reproduction and communication to the public of this document is permitted on condition that its origin and copyright are clearly mentionned.




Citer ce document

Ward Van de Velde, « Le corpus Babeliris : d’une méthodologie de constitution aux principales caractéristiques linguistiques », Equivalences, ID : 10.3406/equiv.2013.1386


Métriques


Partage / Export

Résumé Fr

Cet article décrit le processus d’encodage du corpus Babeliris, réunissant des textes médico-administratifs du réseau hospitalier IRIS. Concrètement et sans revenir sur les modalités de collecte des textes, il présente les balises TEI-P5 qui ont servi à encadrer les données textuelles variables, à partir desquelles peuvent naître des sous-corpus. Dans ce cadre, il explique le fonctionnement de l’interface créée à cet effet. Par ailleurs, il soulève la problématique du choix d’un aligneur multilingue ad hoc et, partant, d’un gestionnaire de mémoire de traduction, en exposant les avantages et les inconvénients de trois logiciels testés. Enfin, il décrit les principales caractéristiques linguistiques du pan français du corpus, dans le but de pouvoir juger de la représentativité de celui-ci dans le vaste monde des corpus de langue spécialisée et de langue générale.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en