Description and analysis of a Portuguese blend corpus

Fiche du document

Date

2 mars 2022

Discipline
Type de document
Périmètre
Langue
Identifiant
Source

Corpus

Relations

Ce document est lié à :
info:eu-repo/semantics/reference/issn/1638-9808

Ce document est lié à :
info:eu-repo/semantics/reference/issn/1765-3126

Organisation

OpenEdition

Licences

All rights reserved , info:eu-repo/semantics/openAccess




Citer ce document

Alina Villalva et al., « Description and analysis of a Portuguese blend corpus », Corpus, ID : 10.4000/corpus.6436


Métriques


Partage / Export

Résumé En Fr

Multi-word formation processes in Portuguese comprise root-compounding (e.g., toxicodependente ‘drug addict’, agridoce ‘sour sweet’), word-compounding (e.g., barco-casa ‘houseboat’, guarda-roupa ‘wardrobe’, cantora-atriz ‘singer/actress’), and blending (e.g., cartomente ‘lying fortune teller’ < cartomante ‘fortune teller’ + mente ‘he/she lies’, tristemunho ‘sad testimony’ < triste ‘sad’ + testemunho ‘testimony’, cantautor ‘singer and composer’ < cantor singer + autor ‘composer’). Compound structures have been quite thoroughly described by several authors (e.g., Villalva & Gonçalves 2015), whereas blending has garnered some controversial and even contradictory analyses. Some authors claim that blends and compounds have similar structures, while others consider that they have completely different structures (e.g., Gries 2004b, Minussi & Nóbrega 2014). This paper focuses on the description and analysis of an annotated corpus of Portuguese blends, and on the presentation of experimental evidence that aims to assess the knowledge of these words by native young adult European and Brazilian Portuguese speakers.The first section is devoted to the presentation of Portuguese blends, namely regarding the status of their constituents and their linear relationships, grammatical structure, and the phonetic/prosodic relationship that holds between the blends and their base words. The second section focuses on the description of the Portuguese blend corpus. Although new coinages make this a never-ending work in progress, it is presently formed by (circa) 300 blends, collected in a variety of sources, from literary texts to political and social commenting, advertising, or even individual ad hoc instances. The information gathered in the corpus comprehends all the features considered in the analysis of the blends, presented in section 1, and it also provides data on attestation and frequency. The third section presents an analysis of a sub-corpus (184 forms), related to their linear structure, grammatical and prosodic relationships, and a cross-analysis that suggests that there is a strong link between headedness and cliphood. Finally, the fourth section offers a brief presentation of experimental work that suggests that clips facilitate the processing of blends, since the clipped word is more frequently used in replies to a familiarity test, and the same happens with reaction time values obtained in a lexical decision test.

La formation de mots qui contiennent plus d’un lexème, en portugais, comprend la composition morphologique (p. ex., toxicodependente ‘toxicomane’, agridoce ‘aigre-doux’), la composition morphosyntaxique (p. ex., barco-casa ‘péniche’, guarda-roupa ‘garde-robe’, cantora-atriz ‘chanteuse et actrice’), et la formation de mots-valises (p. ex., cartomente ‘diseuse de bonne aventure qui ment’ < cartomante ‘diseuse de bonne aventure’ + mente ‘il/elle ment’, tristemunho ‘triste témoignage’ < triste ‘triste’ + testemunho ‘témoignage’, cantautor ‘chanteur et compositeur’ < cantor ‘chanteur’ + autor ‘compositeur’). Les structures composées du portugais sont décrites en détail par plusieurs auteurs (p. ex., Villalva et Gonçalves 2015), tandis que la formation de mots-valises a reçu des analyses controversées et même contradictoires : certains auteurs affirment que la structure des mots-valises et des composés est similaire, tandis que d’autres considèrent qu’elles sont très différentes (p. ex., Gries 2004b, Minussi et Nóbrega 2014). Cet article se concentre sur la description et l’analyse d’un corpus annoté de mots-valises, en portugais, et la présentation de quelques preuves expérimentales qui visent à évaluer la connaissance de ces mots par les jeunes adultes natifs lusophones, portugais et brésiliens. La première section est consacrée à la présentation des mots-valises du portugais, notamment en ce qui concerne le statut de leurs constituants et leurs relations linéaires, leur structure grammaticale et la relation phonétique/prosodique entre les mots-valises et les mots-base. La deuxième section se concentre sur la description du corpus de mots-valises du portugais. Bien qu’il s’agisse d’un travail sans fin, le corpus est, à présent, formé de (environ) 300 mots-valises, recueillis dans une variété de sources, des textes littéraires aux commentaires politiques et sociaux, à la publicité ou même aux contributions individuelles ad hoc. Les informations recueillies dans le corpus comprennent toutes les propriétés prises en compte dans l’analyse présentée à la section 1 et fournissent également des données sur attestations et fréquence. La troisième section présente une analyse d’un sous-groupe du corpus (184 formes), qui considère la structure linéaire et les relations grammaticales et prosodiques. Une analyse croisée suggère qu’il y a un fort lien entre la tête du mot-valise et le constituant-fragment. Enfin, la quatrième section offre une brève présentation de travaux expérimentaux antérieurs, qui suggèrent que les mots tronqués facilitent la compréhension des mots-valises, puisque le mot tronqué est plus fréquemment utilisé dans les réponses à un test de familiarité. Il en va de même avec les valeurs de temps de réaction obtenues dans un test de décision lexicale.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en