Lexicon and Discourse: HDR thesis Lexique et discours: Thèse d'HDR En Fr

Fiche du document

Date

17 février 2023

Discipline
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licences

http://hal.archives-ouvertes.fr/licences/copyright/ , info:eu-repo/semantics/OpenAccess




Citer ce document

Mathilde Dargnat, « Lexique et discours: Thèse d'HDR », HAL-SHS : linguistique, ID : 10670/1.uw5xhp


Métriques


Partage / Export

Résumé En Fr

In this document, I have summarized and put into perspective three research orientations I have been developing in the past fifteen years (2006-2022).The first one concerns the way spoken language is adapted in literary works, a technique used by a number of famous writers (Dickens, Molière, and many others). I was interested in the specific strategy of the French-Canadian author Michel Tremblay, who used phonetic, syntactic and lexical features of spoken French-Canadian language not only as a means of mirroring social differences within the French Quebec community but also as a source of genuine literary effects involving in particular metarepresentational ones. I studied five plays by Tremblay over a thirty year period (1968-1998), extracting the idiolectal statistical contrasts between socially symbolic characters and discussing them in the context of textual structure.My second field of research concerns discourse relations. In order to show that they are more than just a long list of terms for labeling relations between discourse segments, I chose three illustrative examples. (I) So-called paratactic constructions, where there is no lexical marking of discourse articulation, exhibit in some cases (pseudo-declaratives and pseudo-imperatives) interesting properties, such as non-compositionality or special prosodic patterns. (ii) I examine critically a particular symbolic/statistical treatment of argumentative relations in NLP, aiming at measuring the (non-)alignment of discourse and argumentative relations between discourse segments in short normalized texts. I point out that the results delivered by the algorithms are difficult to interpret and misrepresent the real geometry of argumentation in the texts. (iii) Finally I present some aspects of the evolution of comparative discourse markers over a period of six centuries, tracing back their path of change from comparative to causal and concessive values.My last area of interest concerns the semantic status of discourse markers. My general goal was to bring closer the large literature on such markers and the more general literature on information layering, most notably the approaches on presuppositions, implicatures and side issues in the sense of Gutzmann and Turgay (2019). I show that the broad category of discourse markers (DM) gathers those indexicals which are relevant to discourse interpretation, either with respect to its organization (structuring DM) or to the monitoring of the speaker’s “stance”, i.e. her emotional, attentional or belief state, her perception of events in the discourse situation and her interaction with other participants. As a result, I divided DM into two subcategories: connectives and hic and nunc particles (HNP). Connectives convey discourse relations between the semantic objects they refer, such as illocutionary acts, states of affairs, belief states, etc. They correspond to well-known cases like but, because or therefore. Certain connectives behave as presupposition triggers. HNP refer to external or internal (psychological) events, to other participants or to the speaker's speech itself (hesitations, corrections). They are partly analogous to expressives, in the sense of Potts (2005, 2007), but include non-expressive terms and are anchored to the utterance situation even more strongly than expressives. I also consider the combinations of DM, reporting on recent work using association measures and work in progress addressing jointly their semantic, prosodic and statistical properties. This kind of approach is developped in the CODIM project framework (Compositionality and Discourse Markers). This project, which I coordinate, is funded by the ANR (https://www.codim-project.org/).

Ce document synthétise et met en perspective les trois orientations des recherches que j’ai développées entre 2006 et 2022 et leurs impacts sur mes recherches actuelles.La première orientation concerne la manière dont la parole authentique est représentée en littérature, à l’instar de pratiques d’auteurs célèbres comme Dickens, Molière et beaucoup d’autres. Je me suis intéressée à une « stratégie » spécifique, celle de l’auteur québécois Michel Tremblay, qui a emprunté des traits phonétiques, syntaxiques et lexicaux au français populaire parlé à Montréal dans les années 1960, non seulement pour rendre compte de différences sociales entre ses personnages mais aussi pour structurer ses textes et produire des effets méta-représentationnels. L’étude repose sur une comparaison d’extraits des corpus Sankoff-Cedergren et Montréal 84 et sur cinq pièces de théâtre couvrant la période 1968-1998. Elle met en évidence des différences statistiques plus ou moins significatives entre les personnages, sur la base de traits jugés pertinents et représentatifs de la variété étudiée ; différences qui sont ensuite discutées en fonction de la structure des textes et de leur contexte social, idéologique et culturel de production.Le second champ de recherche concerne les relations de discours. Afin de montrer que l’étude de ces relations va au-delà d’une liste d’étiquettes indiquant la dépendance sémantique entre des segments de discours, j’ai choisi d’illustrer et de détailler trois cas. (1) D’abord, les constructions juxtaposées, c’est-à-dire les constructions ne présentant aucune marque lexicale de connexion entre les deux propositions. Je pointe en particulier la question des constructions pseudo-déclaratives et pseudo-impératives, en m’intéressant à certaines de leurs propriétés, telles que la non-compositionnalité et leur réalisation prosodique sous forme de patrons spécifiques. (2) Je rends compte et discute ensuite des travaux traitant de certaines relations argumentatives dans la perspective du TAL, en cherchant à mesurer l’alignement ou le non-alignement des relations de discours et des relations argumentatives dans des textes courts et comparables. Il en ressort que les résultats obtenus par les algorithmes utilisés sont parfois difficiles à interpréter en l’état et ne rendent pas forcément bien compte de la dimension et de l’organisation argumentatives effectives des textes. (3) Enfin, j’ai présenté quelques aspects de l’évolution diachronique longue de marqueurs discursifs à l’origine comparatifs, en montrant les différentes étapes du changement vers des valeurs causales et concessives.Le troisième et dernier domaine d’intérêt exposé concerne le statut sémantique des marqueurs discursifs (MD). L’objectif principal est de rapprocher un ensemble toujours grandissant d’études dans le domaine et de travaux plus généraux sur la stratification sémantique de l’information, en particulier sur la question des présuppositions, des implicatures et du contenu périphérique (side issues) dans le sens de Gutzmann & Turgay (2019). Je montre que la catégorie des MD, appréhendée dans un sens large, rassemble les expressions indexicales pertinentes pour l’interprétation du discours, que ce soit au niveau de son organisation logico-temporelle ou de la gestion des positions (stance) du locuteur (son état émotionnel, attentionnel ou son état de croyance, sa perception des événements dans la situation et son interaction avec les autres participants). Sur cette base, je distingue deux sous-catégories de MD : les connecteurs et les particules déictiques. Les connecteurs marquent une relation de discours entre des objets sémantiques auxquels ils renvoient (par exemple des actes illocutoires, des états de choses, des états de croyance, etc.) et semblent se comporter, pour certains, comme des déclencheurs de présupposition. Ils correspondent à des cas bien connus comme mais, parce que ou donc. Les particules renvoient à des événements externes ou internes (psychologiques), aux autres participants ou discours du locuteur lui-même (hésitations, corrections, reformulations, etc.). Ces particules se rapprochent des expressifs, dans le sens de Potts (2005, 2007), mais incluent aussi des éléments non expressifs. Elles sont avant tout fortement et obligatoirement ancrées dans la situation d’énonciation. Une partie récente de mes travaux porte sur les combinaisons de MD, dans une perspective cherchant à articuler leurs propriétés sémantiques, prosodiques et statistiques. J’en présente quelques résultats, notamment ceux qui utilisent les mesures d’association. Ce type d’approche est le centre du projet CODIM (Compositionality and Discourse Markers) par l’ANR et que je coordonne (https://www.codim-project.org/).

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en