Segmentation devices in tweets: punctuation marks, connectives, emoticons and emojis De la segmentation dans les tweets : signes de ponctuation, connecteurs, émoticônes et émojis En Fr

Résumé En Fr

In this paper, relying on a corpus of 3,444,075 tweets corresponding to 44 107 210 tokens (words, signs of punctuation, emojis, emoticons, etc.) collected in December 2016, we focus on segmentation processes at work in tweets. After mentioning some characteristics of these particular writings, we review the general segmentation processes in writing, punctuation and connectors. We then look at how these processes operate in tweets. Finally, we show that emoticons and emojis are specific processes allowing users to diversify their segmentation strategies (and other digital writings, such as SMS and email).

Dans cet article, nous appuyant sur un corpus de 3 444 075 tweets correspondant à 44 107 210 tokens (mots, signes de ponctuation, émojis, émoticônes, etc.) recueillis en décembre 2016, nous nous intéressons aux procédés de segmentation à l'oeuvre dans les tweets. Après avoir évoqué certaines caractéristiques de ces écrits particuliers, nous rappelons les procédés généraux de segmentation à l'écrit : les signes de ponctuation et les connecteurs. Nous nous penchons ensuite sur la segmentation opérée dans les tweets par ces deux procédés généraux. Enfin, nous montrons que les émoticônes et les émojis constituent des procédés spécifiques permettant de diversifier les stratégies de segmentation des utilisateurs de tweets (et d'autres écrits numériques, tels les SMS et les courriels).

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en