Déconstruction et reconstruction de corpus... À la recherche de la pertinence et du contexte

Fiche du document

Date

2018

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

info:eu-repo/semantics/OpenAccess




Citer ce document

Lucie Loubère, « Déconstruction et reconstruction de corpus... À la recherche de la pertinence et du contexte », HAL SHS (Sciences de l’Homme et de la Société), ID : 10670/1.2e0e27...


Métriques


Partage / Export

Résumé En Fr

Faced with corpora of large sets of texts, we propose a method of selection, based on the identification of segments of texts relevant to a topic by successive classification, then recomposition of the corpus with all the texts having at least one relevant segment. This approach makes it possible to preserve the contextualizations and narrative discourses surrounding a theme while excluding off-topic texts. Résumé Face aux corpus constitués de grands ensembles de textes, nous proposons une méthode de sélection, basée sur l'identification de segments de textes pertinents à une thématique par classification successive, puis recomposition du corpus avec l'intégralité des textes ayant au moins un segment pertinent. Cette démarche permet ainsi de conserver les contextualisations et discours narratifs entourant une thématique tout en excluant les textes hors-sujet.

Face aux corpus constitués de grands ensembles de textes, nous proposons une méthode de sélection, basée sur l’identification de segments de textes pertinents à une thématique par classification successive, puis recomposition du corpus avec l’intégralité des textes ayant au moins un segment pertinent. Cette démarche permet ainsi de conserver les contextualisations et discours narratifs entourant une thématique tout en excluant les textes hors-sujet.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines