Exploitation de reformulations pour l'acquisition d'un vocabulaire expert/non expert

Fiche du document

Date

4 juillet 2016

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess




Citer ce document

Edwide Antoine et al., « Exploitation de reformulations pour l'acquisition d'un vocabulaire expert/non expert », HAL-SHS : linguistique, ID : 10670/1.pr5rml


Métriques


Partage / Export

Résumé En Fr

Exploitation of reformulations for the acquisition of expert/non-expert vocabulary. Notions from technical areas, such as medicine, often present understanding difficulties for non-expert people. A vocabulary which associates technical terms with expressions used by lay people can help in making the technical texts easier to understand. The purpose of this work is to build such vocabulary. We propose to exploit the notion of reformulation through three methods : extraction of abbreviations, exploitation of reformulation markers, and of parentheses. The segments associated with these methods are then aligned with medical terminologies. Our results cover a large number of medical terms and show between 0.68 and 0.98 extraction precision. On the whole, several dozens of thousands of pairs are proposed. These results are analyzed and compared with the existing work. MOTS-CLÉS : Reformulation, extraction d'information, terminologie médicale, langage profane.

Les notions de domaines techniques, comme les notions médicales, présentent souvent des difficultés de compréhension par les non experts. Un vocabulaire qui associe les termes techniques aux expressions grand public peut aider à rendre les textes techniques mieux compréhensibles. L'objectif de notre travail est de construire un tel vocabulaire. Nous proposons d'exploiter la notion de reformulation grâce à trois méthodes : extraction d'abréviations, exploitation de marqueurs de reformulation et de parenthèses. Les segments associés grâce à ces méthodes sont alignés avec les terminologies médicales. Nos résultats permettent de couvrir un grand nombre de termes médicaux et montrent une précision d'extraction entre 0,68 et 0,98. Au total, plusieurs dizaines de milliers de paires sont proposés. Ces résultats sont analysés et comparés avec les travaux existants.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en