2008
Marcel Cori, « Des méthodes de traitement automatiqueaux linguistiques fondées sur les corpus », HAL-SHS : linguistique, ID : 10670/1.z4eplz
Cet article s'interroge sur les liens entre le développement des méthodes stochastiques en Traitement automatique des langues (TAL) et les tentations de vouloir refonder la linguistique sur la base des corpus. On définit d'abord le TAL robuste, par opposition à un TAL « théorique ». On explicite les critères et les méthodes du TAL robuste, parmi lesquelles les méthodes stochastiques sont des méthodes probabilistes, étalonnées à l'aide de calculs statistiques effectués sur des corpus. On observe ensuite que les praticiens de ces méthodes onttendance à confondre les modèles pour le traitement automatique et les modèles de représentation des langues, autrement dit de confondre traitement automatique et recherche en linguistique. On termine en montrant qu'une telle position est proche de l'« instrumentalisme » auquel s'est opposé Popper.