Tagset adaptation to language changing over time. The case of the masculine personal category in the Electronic Corpus of 17th and 18th century Polish Texts

Fiche du document

Date

31 janvier 2024

Discipline
Type de document
Périmètre
Identifiant
Source

Corpus

Relations

Ce document est lié à :
info:eu-repo/semantics/reference/issn/1765-3126

Ce document est lié à :
info:eu-repo/semantics/reference/issn/1638-9808

Organisation

OpenEdition

Licences

info:eu-repo/semantics/openAccess , All rights reserved



Sujets proches En

Article

Citer ce document

Aleksandra Wieczorek, « Tagset adaptation to language changing over time. The case of the masculine personal category in the Electronic Corpus of 17th and 18th century Polish Texts », Corpus, ID : 10.4000/corpus.8418


Métriques


Partage / Export

Résumé Fr En

Cet article présente les solutions utilisées pour le Corpus électronique des textes polonais des 17e et 18e siècles afin d’adapter son jeu de balises grammaticales à l’évolution du système morphologique qui a eu lieu au cours de la période. Les 17e et 18e siècles ont été marqués en effet par la formation d’une nouvelle catégorie grammaticale, appelée « masculine-personality » (Pl. *męskoosobowość*). Cette époque marque une transition de l’état ancien à l’état moderne et se caractérise par une variation significative des terminaisons des formes plurielles N, A et V des noms masculins animés à cette époque. Par conséquent, le jeu de balises utilisé pour annoter le corpus, qui a été créé à l’origine pour le polonais moderne, a dû être légèrement modifié à cet égard. La deuxième partie de l’article décrit les recherches menées à l’aide de ce système d’annotation, qui ont montré que la différenciation des terminaisons flexionnelles des noms masculins personnels et impersonnels en polonais était déjà avancée au 17e siècle et presque achevée à la fin du 18e siècle.

The article presents the solutions used in the Electronic Corpus of the 17th- and 18th-century Polish Texts in order to adapt its tagset to the evolution of the grammatical system that took place in the period covered by the corpus. The 17th and 18th centuries were the time when a new grammatical category was formed, called “masculine-personality” (Pl. *męskoosobowość*). We observe a transition from old state to the modern state and a significant variation in endings of N, A and V plural forms of animate masculine nouns at that time. Therefore, the tagset used to annotate the corpus, which was originally created for modern Polish, had to be slightly changed in this regard. The second part of the article describes research conducted using this annotation system, which showed that the differentiation of inflection endings of personal and impersonal masculine nouns in Polish was already advanced in the 17th century and was almost completed by the end of the 18th century.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en