23 janvier 2017
http://creativecommons.org/licenses/by-nc-nd/ , info:eu-repo/semantics/OpenAccess
Benjamin Hervy et al., « Extraction et chaînage supervisés de connaissances d'un corpus d'entretiens en histoire des sciences », HAL-SHS : histoire, philosophie et sociologie des sciences, ID : 10670/1.qtw4ry
À partir d'un corpus d'entretiens en histoire des sciences, nous présentons une méthode supervisée générant un réseau de documents liés par leurs proximités de contenus. Il s'agit d'un graphe multiple flou, basé sur l'extraction de n-grams à taille variable. Un prototype en Python permetd'évaluer la méthode. Dans cet article, nous confrontons, de manière interdisciplinaire, le réseau d'informations construit par la méthode numérique à l'analyse qualitative du corpus historique. Nous essayons d'en dégager, d'une part, des améliorations de la méthode, et, d'autre part, des outils heuristiques pour l'historien.