L’intelligence artificielle et l’intelligence humain dans l’analyse des dictionnaires historiques

Fiche du document

Date

5 novembre 2019

Discipline
Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licence

http://creativecommons.org/licenses/by/


Sujets proches Fr

Lexique Vocabulaire

Citer ce document

Geoffrey Clive Williams, « L’intelligence artificielle et l’intelligence humain dans l’analyse des dictionnaires historiques », HAL-SHS : linguistique, ID : 10670/1.bu9hvx


Métriques


Partage / Export

Résumé Fr

Le projet BasNum (ANR-18-CE38-0003) vise à numériser la version révisée et élargie du Dictionnaire universel de l’Abbé Antoine Furetière publié en 1701. C’est un dictionnaire de très grande importance pour la lexicographie européenne puisque le premier grande ouvrage encyclopédique, le vrai précurseur de l’Encyclopédie de Diderot et Alembert. Le dictionnaire était republié en 1702, 1708 et remanié dans une version à quatre tomes en 1725/27. La version a été plagié entièrement sous la dénomination du Dictionnaire de Trévoux en 1704. Il est donc important pour nous de comparer les versions de 1690, la première édition à 1727, ce qui implique d’avoir des éditions numérisés.Saisir manuellement un dictionnaire en entier sera une tache énorme, et la reconnaissance optique standard a du mal avec les imprimés du dix-septième siècle, donc nous avons utilisé un système avancé de captage. Cependant, un fichier texte ne suffit pas, il nous faut un texte structuré. Pour ce faire, nous adaptons un outil automatique, GROBID Dictionaries afin de transformer le texte. L’étape suivante est de chercher les documents cités, ce qui impose la reconnaissance automatique des entités nommés – personnes, lieux -avec un système basé sur des réseaux neuronales. Donc, partant de nos expériences avec une numérisation assistée par ordinaire nous passons vers l’intelligence artificielle. L’intelligence artificielle est une aide précieuse dans la numérisation et la recherche d’informations, mais heureusement n’écarte pas l’intelligence humain puisqu’il faut former les outils, et puis, l’essentiel est d’interpréter des résultats, et pour ça, il n’y a que le savoir-faire et des connaissances humaines.Lors de cette présentation, je présenterais la chaine de traitement avec ses espoirs et ses difficultés illustré avec des exemples tirés de la version 1701 du Dictionnaire universel.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en