Analyse lexicométrique "numérique" et "apprentissage" F3abc, Obtenue avec le logiciel Iramuteq (R)Comparaison des 50 thèses les plus proches du texte d'intention TI, Corpus obtenu par la méthode PARHeLiE : Bury P. et Las Vergnas O. (2019, en cours). Méthode PARHeLiE (Production Assistée de Revue Heuristique de Littérature Electronique par les vecteurs de mots) mise au point avec P. Bury. Figures obtenues avec le logiciel Iramuteq (R)

Metadatas

Date

March 7, 2019

Language
Identifiers
Licenses

http://creativecommons.org/licenses/by-nd/ , info:eu-repo/semantics/OpenAccess


Keywords

analyse lexicale digitalisation de la formation apprentissages et numérique bibliométrie vie de la recherche


Cite this document

Olivier Las Vergnas et al., « Analyse lexicométrique "numérique" et "apprentissage" F3abc, Obtenue avec le logiciel Iramuteq (R)Comparaison des 50 thèses les plus proches du texte d'intention TI, Corpus obtenu par la méthode PARHeLiE : Bury P. et Las Vergnas O. (2019, en cours). Méthode PARHeLiE (Production Assistée de Revue Heuristique de Littérature Electronique par les vecteurs de mots) mise au point avec P. Bury. Figures obtenues avec le logiciel Iramuteq (R) », MédiHAL, l'archive ouverte de photographiques et d'images scientifiques, ID : 10670/1.k4hlbw


Metrics


Share / Export

Abstract 0

Production Assistée de Revue Heuristique de Littérature Electronique par les vecteurs de mots. Bury P. et Las Vergnas O. (2019)L'algorithme des "vecteurs de mots" permet de calculer une « proximité sémantique » entre le texte d’intention TI et chacun des résumés de toutes les thèses soutenues en France (toutes disciplines confondues via la base exhaustive des thèses du Sudoc http://sudoc.abes.fr). Celui-ci est appliqué ici dans le cadre de la méthode PARHeLiE (Production Assistée de Revue Heuristique de Littérature Electronique) mise au point par P. Bury et O. Las Vergnas, La méthode word2vec (Quoc, Le et Mikolov, 2014) permet de représenter un mot au sein d’un corpus comme un vecteur, tout en conservant une partie des relations entre les mots (synonymes, analogies, etc..) : deux mots de sens proche ont des vecteurs proches. Son extension, doc2vec (Mikolov et al. 2013) ajoute un identifiant de document au vecteur de mots, permettant de mesurer la distance entre deux documents grâce à leurs vecteurs respectifs. C’est ce qui a été fait ici pour étudier la relation entre "numérique et apprentissage" pour le numéro thématique de la revue "Education Permanente" consacré à ce sujet et dirigé par E. Betton et J. Pondaven (2019). Le principe est que le texte d'appel à contribution (Texte TI) a servi de référence pour chercher dans la base Sudoc Abes les 50 résumés de thèses soutenues les plus proches sémantiquement (la norme de proximité utilisée étant un cosinus) de ce texte d’intention TI, selon la méthode PARHeLiE en cours de développement (Bury et Las Vergnas, 2019).Ensuite une analyse Reinert a été effectuée via le logiciel Iramuteq (Ratinaud, 2009) sur le corpus de 50 résumés de thèses, taggués par disciplines. . Le résultat d'une des classifications obtenues est présenté dans les figures. Un premier point frappant est que parmi les 50 plus proches sémantiquement (proximité > 0.86) seules 9 se révèlent soutenues en sciences de l’éducation, alors que 11 l’ont été en info-communication (SIC), 6 en gestion et 5 en arts et arts appliqués (voir tableau T1). On note aussi que les deux les plus proches du texte TI ne relèvent pas des sciences de l’éducation mais des SIC, même si leurs intitulés pourraient laisser penser le contraire (la plus proche est intitulée « Enjeux de l'enseignement à distance pour l'université française : 1947-2004 » par F. Thibault en 2007 et la deuxième « Analyse de projets utilisant la technologie numérique dans l'enseignement supérieur : approche compréhensive de la complexité » en 2009 par B. Popova-Dimitrova). De plus, la troisième est soutenue en « étude du monde anglophone ».Selon la classification en 4 classes (tableau A3) effectuée sur les résumés de ces 50 thèses, la première et deuxième classes montrent respectivement un lexique « apprenants, langues » et « dispositifs, professionnels, enseignants », tandis que la troisième est orientée « conception » et la quatrième « information, appropriation, grand public ». Sur la paire de figures F3a et F3b, on voit que les sciences de l’éducation et les SIC se confirment très liées aux deux premières classes alors que le génie industriel et la conception le sont à la troisième et les disciplines artistiques à la dernière. Ces résultats éclairent la relation entre les thématiques de recherche sur numérique, pédagogie et apprentissage avec les différentes disciplines, vu sous l’angle des thèses. Ils confirment qu’on observe non seulement un fort recouvrement entre sciences de l’éducation et SIC mais aussi un déploiement des disciplines artistiques et technologiques.Références Bibliographiques Betton, E. et Pondaven, J. (2018). Projet de dossier thématique pour Éducation Permanente : « les technologies numériques en formation, quels nouveaux rapports à la pédagogie et à la formation ? texte communiqué aux auteurs. (intitulé TI dans l’article)Quoc V. Le, Tomas Mikolov, (2014) Distributed Representations of Sentences and Documents, Repéré en ligne (12/3/19) @ https://arxiv.org/abs/1405.4053 Ratinaud P. et Déjean S. (2009). IRaMuTeQ : implémentation de la méthode ALCESTE d'analyse de texte dans un logiciel libre. Modélisation Appliquée aux Sciences Humaines et Sociales (MASHS2009). Toulouse - Le Mirail. Repéré en ligne (12/3/19) @ https://docplayer.fr/10422759-Iramuteq-implementation-de-la-methode-alceste-d-analyse-de-texte-dans-un-logiciel-libre.html Reinert M. (1987). Un logiciel d’analyse lexicale. Cahiers de l’analyse des données, 11-4, 471-484. Repéré en ligne (12/3/19) @ http://www.numdam.org/item/CAD_1986__11_4_471_0 Mikolov T.,et al.(2013) Efficient Estimation of Word Representations in Vector Space, Repéré en ligne (12/3/19) @ https://arxiv.org/abs/1301.3781

From the same authors

On the same subjects

Similar documents