Des enregistrements aux corpus : transcription et extraction de données d’interprétation en milieu médical

Fiche du document

Date

2018

Discipline
Type de document
Périmètre
Langue
Identifiant
Relations

Ce document est lié à :
Meta : Journal des traducteurs ; vol. 63 no. 3 (2018)

Collection

Erudit

Organisation

Consortium Érudit

Licence

Tous droits réservés © Les Presses de l’Université de Montréal, 2018


Résumé Fr En Es

Dans le domaine de l’interprétation de dialogue (ID), l’utilisation et l’utilité des corpus sont autant de sujets controversés. D’une part, la recherche est de plus en plus orientée vers l’étude de l’interaction authentique, ce qui entraîne une augmentation des données enregistrées et transcrites pouvant être explorées comme corpus ; de l’autre, l’intérêt de l’ID envers l’« interaction » plutôt que le « texte » diminue l’attrait des méthodes traditionnelles de la linguistique de corpus pour l’étude des données d’interprétation. Dans cet article, nous présenterons une collection de données d’ID assez importante (corpus AIM), que nous cherchons à outiller. Nous avons jusqu’à présent testé les logiciels EXMARaLDA et ELAN sur un sous-ensemble de 65 rencontres, dont la transcription est alignée avec l’audio, et nous avons entamé deux pistes de recherche que nous allons illustrer : (a) l’exploration d’éléments lexicaux potentiellement intéressants pour l’analyse des structures de l’interaction ; (b) l’extraction de segments alignés à l’audio que l’on puisse entre autres utiliser dans des activités d’enseignement et d’apprentissage. Nous souhaitons montrer ainsi tant l’utilisation que l’utilité d’un corpus d’ID en milieu médical.

In the field of dialogue interpreting (DI), both the use and usefulness of corpora is controversial. While on the one hand, DI research is increasingly orienting to the study of naturally-occurring interaction with a consequent increase in recorded and transcribed materials which might well be explored as corpora, on the other, DI interest in “interaction” rather than “text” has made the traditional methods of corpus linguistics less attractive for DI studies. In this paper, we report on our experience with a rather large DI collection of data (the AIM corpus), which we are implementing for corpus use. In particular, we have experimented the EXMARaLDA and ELAN software on a sub-set of 65 encounters whose transcripts are aligned with audio. So far, our experiments have taken two directions: (a) exploring potentially interesting lexical items for the analysis of structures of interaction; (b) extracting audio-aligned segments for use in e.g. specific training or learning activities. The paper thereby aims to show the use and utility of a DI corpus in the healthcare environment.

En el ámbito de la interpretación bilateral (IB), tanto el uso como la utilidad de los corpus son temas controvertidos. Mientras, por un lado, la investigación en IB se está orientando cada vez más hacia el estudio de la interacción natural, con un consiguiente incremento de materiales grabados y transcritos que podrían explorarse como corpus, por otro lado, el interés de la IB hacia la «interacción» más que hacia el «texto» ha hecho que los métodos tradicionales de la lingüística de corpus no fueran tan atractivos para los estudios de interpretación bilateral. En el presente estudio presentamos nuestra experiencia con una amplia colección de datos de IB (el corpus AIM), que estamos implementando para el uso de corpus. En particular, hemos experimentado los softwares EXMARaLDA y ELAN en un subconjunto de 65 encuentros, cuya transcripción se ha alineado con el audio. Hasta ahora, nuestros experimentos han seguido dos direcciones principales, que ilustraremos: (a) explorar términos de búsqueda potencialmente interesantes para el análisis de las estructuras de la interacción; (b) extraer segmentos alineados con el audio para su uso en actividades específicas de formación o aprendizaje. El objetivo de este trabajo es el de demostrar el uso y la utilidad de un corpus de IB de ámbito sanitario.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en