28 janvier 2020
Ce document est lié à :
info:eu-repo/semantics/altIdentifier/doi/10.4000/corpus.4852
http://creativecommons.org/licenses/by/
Rachel Panckhurst et al., « Un corpus de SMS français : 88milSMS. Synthèse et usages », HAL-SHS : linguistique, ID : 10.4000/corpus.4852
Dans cet article, nous décrivons synthétiquement le projet sud4science et la collecte de données associée (http://sud4science.org), les étapes de traitement/analyse qui en découlent et le corpus en résultant, 88milSMS (http://88milsms.huma-num.fr). Nous donnons d'abord un aperçu des travaux réalisés dans le cadre de ce projet à travers quelques citations et références (§ 1). Ensuite, nous fournissons un état de l'art sur des initiatives de recherche s'appuyant sur 88milSMS qui s'inscrivent dans des domaines et cadres de travail variés, ce qui ouvre la voie à de nouvelles perspectives interdisciplinaires (§ 2). Puis, nous présentons d'autres usages du corpus 88milSMS que nous avons identifiés via un sondage (§ 3). Enfin, nous faisons quelques propositions pour la collecte et l’analyse de données textuelles.