A French text-message corpus: 88milSMS. Synthesis and usage Un corpus de SMS français : 88milSMS. Synthèse et usages En Fr

Fiche du document

Date

28 janvier 2020

Discipline
Type de document
Périmètre
Langue
Identifiants
Relations

Ce document est lié à :
info:eu-repo/semantics/altIdentifier/doi/10.4000/corpus.4852

Collection

Archives ouvertes

Licence

http://creativecommons.org/licenses/by/


Résumé En Fr

In this article, firstly we briefly summarise the sud4science project and data collection (http://sud4science.org), ensuing processing/analysing stages, and the resulting corpus, 88milSMS (http://88milsms.huma-num.fr), through a synthesis of quotes and references to previous articles (§ 1). Secondly, we provide a state of the art on some research initiatives that use 88milSMS in various domains and frameworks, which will enable future cross-disciplinary insight (§ 2). Then, we present other usages of the 88milSMS corpus we identified through surveys (§ 3). Finally, we suggest future paths for textual data collection and analysis.

Dans cet article, nous décrivons synthétiquement le projet sud4science et la collecte de données associée (http://sud4science.org), les étapes de traitement/analyse qui en découlent et le corpus en résultant, 88milSMS (http://88milsms.huma-num.fr). Nous donnons d'abord un aperçu des travaux réalisés dans le cadre de ce projet à travers quelques citations et références (§ 1). Ensuite, nous fournissons un état de l'art sur des initiatives de recherche s'appuyant sur 88milSMS qui s'inscrivent dans des domaines et cadres de travail variés, ce qui ouvre la voie à de nouvelles perspectives interdisciplinaires (§ 2). Puis, nous présentons d'autres usages du corpus 88milSMS que nous avons identifiés via un sondage (§ 3). Enfin, nous faisons quelques propositions pour la collecte et l’analyse de données textuelles.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en