Représentation comparative : Application au discours électoral en Suisse, France et Etats-Unis

Fiche du document

Date

2010

Discipline
Type de document
Périmètre
Langue
Identifiant
Collection

Cairn.info

Organisation

Cairn

Licence

Cairn




Citer ce document

Jacques Savoy, « Représentation comparative : Application au discours électoral en Suisse, France et Etats-Unis », Document numérique, ID : 10670/1.xr85eu


Métriques


Partage / Export

Résumé Fr En

Dans cet article, nous décrivons et analysons plusieurs méthodes afin d’extraire les mots ou expressions les plus représentatifs d’un corpus en comparaison avec un corpus de référence. L’emploi de la fréquence d’occurrence ou le rang des termes les plus fréquents peut fournir une première synthèse. Une meilleure approche consiste à s’appuyer sur l’hypothèse d’une distribution binomiale des mots et le calcul d’un score normalisé (score Z) mettant en lumière les termes ou expressions comparativement les plus usités dans le corpus. Afin d’illustrer la qualité de la représentation ainsi obtenue, nous avons appliqué notre stratégie sur des discours électoraux suisses, français ou américains.

This paper describes some methods to automatically extract terms or sequences of terms closely reflecting the content of a corpus or a Web site by comparison of a given corpus. The frequency of occurrences or the rank of the most frequent terms may provide a first overview. The suggested method is based on the terms distribution according to a binomial process and we proposed to compute a normalized Z-score to define the most appropriate terms within a comparative perspective. Examples based on Swiss, French and US political speeches show the usefulness of the suggested method.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en