Text mining techniques for applications analysis using R Les techniques de fouille de texte avec R pour l'analyse de candidatures Campus France En Fr

Fiche du document

Date

18 novembre 2020

Type de document
Périmètre
Langue
Identifiants
Collection

Archives ouvertes

Licences

http://hal.archives-ouvertes.fr/licences/copyright/ , info:eu-repo/semantics/OpenAccess




Citer ce document

Phélippé-Guinvarc'H Martial, « Les techniques de fouille de texte avec R pour l'analyse de candidatures Campus France », HAL-SHS : sciences de l'éducation, ID : 10670/1.nxy5pb


Métriques


Partage / Export

Résumé 0

Pour un responsable de diplôme, le recrutement des étudiants constitue un enjeu majeur. Avec l'émergence des dossiers électroniques et la standardisation des mentions, il semble que les candidats répliquent leur candidature sur plus de Masters et le nombre de dossiers reçus augmente. Certaines mentions comme Monnaie, Banque, Finance, Assurance offrent des contenus très différents d'une université à l'autre. En répliquant sa candidature sur plusieurs Masters de même mention, le candidat anticipe peut-être les mêmes contenus et les mêmes prérequis.Ce document de travail utilise R pour analyser les candidatures de Campus France avec des techniques empruntées au text and data mining pour explorer les facteurs déterminants d'acceptation et de refus des candidatures.La première étape est de transformer le dossier pdf reçu en une donnée exploitable.Une première analyse descriptive explore les variables du dossier comme l'avis du Service de Coopération et d’Action Culturelle, le niveau moyen de l'étudiant ou le niveau de langue.Une analyse lexicale de la lettre de motivation révèle de fortes différences entre les avis favorables et défavorables.Enfin, l'analyse du sentiment des avis du Service de Coopération et d’Action Culturelle se révèle peu significative.

document thumbnail

Par les mêmes auteurs

Sur les mêmes sujets

Exporter en