Analyse automatique de corpus avec INTEX

Fiche du document

Date

1996

Discipline
Type de document
Périmètre
Langue
Identifiant
Source

LINX

Collection

Persée

Organisation

MESR

Licence

Copyright PERSEE 2003-2023. Works reproduced on the PERSEE website are protected by the general rules of the Code of Intellectual Property. For strictly private, scientific or teaching purposes excluding all commercial use, reproduction and communication to the public of this document is permitted on condition that its origin and copyright are clearly mentionned.



Citer ce document

Max Silberztein, « Analyse automatique de corpus avec INTEX », LINX, ID : 10.3406/linx.1996.1435


Métriques


Partage / Export

Résumé En Fr

INTEX is an integrated corpus processor based on the use of large coverage lexicons. It can be used to analyse texts of several megabytes. It includes several built-in dictionaries and grammars represented by finite state graphs ; the user may add his/her own dictionaries and grammars. These tools are applied to texts in order to locate lexical and syntactic patterns, remove ambiguities, and tag simple words as well as complex utterances. INTEX builds lemmatized concordances and indices of texts with respect to all types of patterns ; it is used by linguists to analyse corpora, but can also be viewed as an information retrieval system.

INTEX est un logiciel de traitement de corpus fondé sur l'utilisation de dictionnaires électroniques à large couverture. INTEX peut être utilisé pour analyser des textes de plusieurs dizaines de millions de mots. INTEX contient plusieurs dictionnaires et grammaires représentées par des graphes à états finis ; l'utilisateur peut ajouter ses propres dictionnaires et grammaires. Ces outils linguistiques sont appliqués à des textes pour retrouver des structures morpho-syntaxiques, lever des ambiguïtés, étiqueter des mots simples ainsi que des expressions figées. INTEX permet de construire des concordances et des index lemmatisés pour des structures syntaxiques diverses ; il est utilisé par des linguistes pour analyser des corpus, mais peut être vu aussi comme un logiciel de documentation automatique.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en