The development of word frequency distribution in first language acquisition. An analysis on a spoken language corpus of French children Le développement de la distribution de fréquence de mots dans l'acquisition du langage. Une analyse sur un corpus francophone de langage oral En Fr

Fiche du document

Date

8 juillet 2022

Discipline
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licences

http://creativecommons.org/licenses/by/ , info:eu-repo/semantics/OpenAccess




Citer ce document

Andrea Briglia et al., « Le développement de la distribution de fréquence de mots dans l'acquisition du langage. Une analyse sur un corpus francophone de langage oral », HAL-SHS : linguistique, ID : 10670/1.a19trs


Métriques


Partage / Export

Résumé En Fr

In this paper we present a study on the word-frequency distribution development in French speaking children, which aims to evaluate how their lexical output is related to a standard word-frequency distribution: Zipf's law. We adopted a set of spoken language transcripts of French children named CoLaJE: by using Python tools we turned original transcripts into strings that allowed us to estimate the exponential parameter of the word-frequency distribution (alpha) for each child, as well as for parental input. We show how alpha values tend to converge to 1 during later development which is coherent with current literature. We also estimate the exponential parameter for parental input and we found that Spearman's rho shows a fairly positive correlation between child's alpha and parents' alpha in later ages. Finally, we discuss our results in the light of previous studies on the CoLaJE corpus and we compare the obtained values to similar works on children's spoken language transcripts that were sampled in an analogous way, before outlining possible future directions.

Dans cet article, nous présentons une étude sur le développement de la distribution de la fréquence des mots chez les enfants francophones, qui vise à évaluer comment leur production lexicale est liée à une distribution standard de la fréquence des mots : la loi de Zipf. Nous avons adopté un ensemble de transcriptions du langage parlé d'enfants français nommé CoLaJE : en utilisant des outils Python, nous avons transformé les transcriptions originales en chaînes de caractères qui nous ont permis d'estimer le paramètre exponentiel de la distribution de la fréquence des mots (alpha) pour chaque enfant, ainsi que pour le langage des parents. Nous montrons comment les valeurs de alpha tendent à converger vers la valeur de 1 au cours du développement, ce qui est cohérent avec la littérature actuelle. Nous estimons également le paramètre exponentiel du langage des adultes et nous constatons que le rho de Spearman montre une corrélation assez positive entre l'alpha de l'enfant et l'alpha des parents à un âge plus avancé. Enfin, nous discutons nos résultats à la lumière des études précédentes sur le corpus CoLaJE et nous comparons les valeurs obtenues à des travaux similaires sur les transcriptions du langage parlé des enfants qui ont été collectés de manière analogue, pour envisager des orientations futures possibles de notre recherche

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en