Des méthodes de traitement automatiqueaux linguistiques fondées sur les corpus

Fiche du document

Auteur
Date

2008

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes




Citer ce document

Marcel Cori, « Des méthodes de traitement automatiqueaux linguistiques fondées sur les corpus », HAL-SHS : linguistique, ID : 10670/1.z4eplz


Métriques


Partage / Export

Résumé En Fr

This paper deals with the links between the development of stochastic methods in Natural Language Processing (NLP) and the attempts of refounding a linguistics based on corpora. First, we define robust NLP, in opposition to “theoretical” Computational Linguistics, by specifying its criteria and methods. Stochastic methods can be defined as probabilistic methods using statistics on corpora. Second, we note that the users ofthese methods tend to confuse NLP models and models of language representation, in other words they tend to confuse NLP and research in linguistics. Finally, we show that this stand is close to “instrumentalism”, to which Popper was opposed.

Cet article s'interroge sur les liens entre le développement des méthodes stochastiques en Traitement automatique des langues (TAL) et les tentations de vouloir refonder la linguistique sur la base des corpus. On définit d'abord le TAL robuste, par opposition à un TAL « théorique ». On explicite les critères et les méthodes du TAL robuste, parmi lesquelles les méthodes stochastiques sont des méthodes probabilistes, étalonnées à l'aide de calculs statistiques effectués sur des corpus. On observe ensuite que les praticiens de ces méthodes onttendance à confondre les modèles pour le traitement automatique et les modèles de représentation des langues, autrement dit de confondre traitement automatique et recherche en linguistique. On termine en montrant qu'une telle position est proche de l'« instrumentalisme » auquel s'est opposé Popper.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en