2018
info:eu-repo/semantics/OpenAccess
Lucie Loubère, « Déconstruction et reconstruction de corpus... À la recherche de la pertinence et du contexte », HAL SHS (Sciences de l’Homme et de la Société), ID : 10670/1.2e0e27...
Face aux corpus constitués de grands ensembles de textes, nous proposons une méthode de sélection, basée sur l’identification de segments de textes pertinents à une thématique par classification successive, puis recomposition du corpus avec l’intégralité des textes ayant au moins un segment pertinent. Cette démarche permet ainsi de conserver les contextualisations et discours narratifs entourant une thématique tout en excluant les textes hors-sujet.