29 janvier 2024
info:eu-repo/semantics/openAccess , https://www.openedition.org/12554
Ibekwe-SanJuan Fidelia, « Extraction terminologique avec INTEX », Presses universitaires de Franche-Comté, ID : 10.4000/books.pufc.30022
L’extraction terminologique constitue une étape dans une méthodologie de recherche de tendances thématiques que nous avons élaborée. Notre objectif est d’automatiser autant que faire se peut cette étape d’extraction des termes qui ne l’était pas auparavant, à l’aide du logiciel INTEX. L’extraction de séquences susceptibles de contenir des termes se fait à l’aide de transducteurs de complexité décroissante qui nous permettent d’extraire successivement les syntagmes nominaux, du plus complexe au plus atomique. Nous appliquons donc, de façon itérative, les automates construits dans INTEX sur un même corpus. Les candidats termes sont ensuite soumis à une validation manuelle effectuée en collaboration avec un spécialiste du domaine. Le résultat de cette validation - les termes candidats - constitueront les entrées à la méthode de classification automatique précédemment citée. Dans ce papier, il sera question uniquement de l’étape d’extraction terminologique.