Extraction d’informations de corpus composés de textes techniques

Fiche du document

Date

1997

Discipline
Type de document
Périmètre
Langue
Identifiant
Collection

Cairn.info

Organisation

Cairn

Licence

Cairn



Citer ce document

Jean Desclès, « Extraction d’informations de corpus composés de textes techniques », Revue française de linguistique appliquée, ID : 10670/1.105d43...


Métriques


Partage / Export

Résumé En Fr

Technical texts present interesting and so far poorly researched linguistic characteristics. In this article, a research project is described, carried out by a multidisciplinary group of linguists and computer scientists, which aims at devising and realising prototypes of computer programmes for extracting information from technical texts. This research, as is illustrated by concrete examples, has led to computer programmes that have the form either of networks between concepts or of phrases taken from the analysed texts, and that are, if necessary, accompanied by automatically assigned semantic information.

Les textes techniques présentent des particularités linguistiques intéressantes et encore mal étudiées. Sont ici décrites les recherches menées par une équipe pluridisciplinaire de linguistes et d’informaticiens ayant entrepris de concevoir, puis réaliser des prototypes de logiciels pour l’extraction d’informations construites à partir de textes techniques. Ces travaux, illustrés par des exemples précis, ont abouti à des programmes informatiques sous la forme soit de réseaux entre concepts, soit de phrases extraites des textes analysés, et éventuellement accompagnées d’informations sémantiques assignées automatiquement.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines