8 juillet 2022
http://creativecommons.org/licenses/by/ , info:eu-repo/semantics/OpenAccess
Andrea Briglia et al., « Le développement de la distribution de fréquence de mots dans l'acquisition du langage. Une analyse sur un corpus francophone de langage oral », HAL-SHS : linguistique, ID : 10670/1.a19trs
Dans cet article, nous présentons une étude sur le développement de la distribution de la fréquence des mots chez les enfants francophones, qui vise à évaluer comment leur production lexicale est liée à une distribution standard de la fréquence des mots : la loi de Zipf. Nous avons adopté un ensemble de transcriptions du langage parlé d'enfants français nommé CoLaJE : en utilisant des outils Python, nous avons transformé les transcriptions originales en chaînes de caractères qui nous ont permis d'estimer le paramètre exponentiel de la distribution de la fréquence des mots (alpha) pour chaque enfant, ainsi que pour le langage des parents. Nous montrons comment les valeurs de alpha tendent à converger vers la valeur de 1 au cours du développement, ce qui est cohérent avec la littérature actuelle. Nous estimons également le paramètre exponentiel du langage des adultes et nous constatons que le rho de Spearman montre une corrélation assez positive entre l'alpha de l'enfant et l'alpha des parents à un âge plus avancé. Enfin, nous discutons nos résultats à la lumière des études précédentes sur le corpus CoLaJE et nous comparons les valeurs obtenues à des travaux similaires sur les transcriptions du langage parlé des enfants qui ont été collectés de manière analogue, pour envisager des orientations futures possibles de notre recherche