De l’analyse statistique à l’apprentissage automatique : le langage R au service de la terminologie

Fiche du document

Date

2023

Discipline
Type de document
Périmètre
Langue
Identifiant
Collection

Cairn.info

Organisation

Cairn

Licence

Cairn



Citer ce document

Nicolás González Granado et al., « De l’analyse statistique à l’apprentissage automatique : le langage R au service de la terminologie », Éla. Études de linguistique appliquée, ID : 10670/1.9271xx


Métriques


Partage / Export

Résumé 0

Les possibilités grandissantes pour la recherche en langues de spécialité confrontent les terminologues à des données de plus en plus vastes et hétérogènes, un contexte où les outils prêts à l'emploi s’avèrent insuffisants. Ce travail examine le potentiel de R, un langage de programmation populaire, pour analyser des corpus spécialisés complexes. Dans cet article, nous montrons comment identifier des indices de variation diastratique, phénomène compris ici comme la coexistence de différents usages linguistiques parmi des communautés d’experts d’un même domaine. Puisque l’un des points forts de R est sa capacité de s’adapter tant aux techniques des statistiques qu’à celles de l’apprentissage automatique, chacune de ces deux sphères fait l’objet d’une série de tests : l’une plonge dans la technique de l’analyse factorielle des correspondances, alors que l’autre s’appuie sur la sémantique distributionnelle. Nos exemples permettent d’alimenter la réflexion sur les possibilités offertes par différents outils gratuits et courants pour l’analyse terminologique. Notre démarche fait en particulier ressortir un besoin de formation des terminologues aux méthodes statistiques ou de collaboration étroite avec d’autres spécialistes de ces approches.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en