Extraction terminologique avec INTEX

Fiche du document

Date

29 janvier 2024

Discipline
Périmètre
Langue
Identifiants
Collection

OpenEdition Books

Organisation

OpenEdition

Licences

info:eu-repo/semantics/openAccess , https://www.openedition.org/12554




Citer ce document

Ibekwe-SanJuan Fidelia, « Extraction terminologique avec INTEX », Presses universitaires de Franche-Comté, ID : 10.4000/books.pufc.30022


Métriques


Partage / Export

Résumé 0

L’extraction terminologique constitue une étape dans une méthodologie de recherche de tendances thématiques que nous avons élaborée. Notre objectif est d’automatiser autant que faire se peut cette étape d’extraction des termes qui ne l’était pas auparavant, à l’aide du logiciel INTEX. L’extraction de séquences susceptibles de contenir des termes se fait à l’aide de transducteurs de complexité décroissante qui nous permettent d’extraire successivement les syntagmes nominaux, du plus complexe au plus atomique. Nous appliquons donc, de façon itérative, les automates construits dans INTEX sur un même corpus. Les candidats termes sont ensuite soumis à une validation manuelle effectuée en collaboration avec un spécialiste du domaine. Le résultat de cette validation - les termes candidats - constitueront les entrées à la méthode de classification automatique précédemment citée. Dans ce papier, il sera question uniquement de l’étape d’extraction terminologique.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en