10 juin 2014
Véronique Montémont, « Présentation et exploitation d'un corpus numérisé : journaux personnels de femmes sous l'Occupation », HAL-SHS : linguistique, ID : 10670/1.3qfstw
Cette présentation revient sur la constitution d'un corpus informatisé de journaux de femmes tenus sous l'Occupation allemande. Celui-ci a été constitué à partir d'un répertoire bibliographique élaboré par Philippe Lejeune. La communication commence par expliquer quelle méthodologie d'échantillonnage et quels critères ont été pris en compte pour sélectionner les vingt-cinq textes concernés. Elle explique ensuite comment l'outil LGeRM, conçu pour des états anciens de la langue, a pu être appliqué avec succès sur ce corpus moderne, pour la détection de formes néologiques, certaines propres à la période historique considérée.