5 juin 2023
free_for_non_commercial_use , Libre sans utilisation commerciale , Free for non commercial use , Ce corpus ne peut être téléchargé que par des membres de structures d'enseignement universitaire et de recherche publiques. En téléchargeant ce corpus, l'utilisateur s'engage sur les points suivants : 1) n'utiliser ce corpus qu'à des fins de recherche scientifiques ou d'enseignement universitaire non commerciaux 2) signaler clairement l'origine du corpus dans toute publication ou utilisation, à l'aide de son identifiant pérenne et des références bibliographiques mentionnées sur la fiche descriptive 3) ne le diffuser qu'à travers la plateforme Ortolang. , This corpus can only be downloaded by members of public university and research structures. By downloading this corpus, the user agrees to the following conditions: 1) to only use this corpus for non-commercial scientific research and teaching 2) to clearly cite the source in every usage and publication, using ID number and reference provided in the corpus description 3) to only redistribute the corpus via the Ortolang platform , Licence Creative Commons Attribution - Pas du2019Utilisation Commerciale 4.0 International
« MEDIAPI-SKEL », ORTOLANG
MEDIAPI-SKEL est un corpus bilingue de Langue des Signes Française (LSF) sous forme de données de pose (coordonnées de points du squelette) et de Français sous forme de sous-titres. Il peut être utilisé pour la recherche académique.Pour constituer ce corpus, nous avons utilisé 368 vidéos correspondant à 27h de LSF produites par Média'Pi!, un média en ligne bilingue qui produit du contenu en LSF ensuite sous-titré en français. Nous ne pouvons pas fournir les vidéos originales qui sont accessibles via un abonnement chez Média'Pi!. Nous fournissons les sous-titres en français alignés avec ces données au format WebVTT, ainsi que deux types de données : openpose et mediapipe holistic (dans la version 2 du dépôt), calculées à partir de chacune des vidéos.Description des données :X correspond au numéro de la vidéo correspondante, de 00001 à 00368.- Sous-titrages : Pour chaque vidéo X, nous fournissons un fichier X.fr.vtt contenant le sous-titrage correspondant en français.- OpenPose : Pour chaque vidéo X, nous fournissons une archive X.zip contenant autant de fichiers json que de frames dans la vidéo, nommées X_Y_keypoints.json, Y étant le numéro de frame. Chaque fichier json contient les coordonnées de 137 points (25 pour le corps, 2x21 pour les mains et 70 pour le visage) .- Mediapipe Holistic : Pour chaque vidéo X, nous fournissons une archive X.zip contenant 5 fichiers csv. X_N contient la taille de l'image (largeur et hauteur), X_left_hand, X_right_hand, X_face et X_body contiennent respectivement les données relatives aux mains, au visage et au corps, à raison de 1 ligne par frame. La 1ère colonne indique le n° de frame, puis pour chaque point du squelette (21 pour chaque main, 468 pour le visage et 33 pour le corps), il y a les informations suivantes : x (en pixel), y (en pixel), z (entre -1 et 0), visibility (0 ou 1 selon que le point est visible ou pas).Répertoires et fichiers :Répertoire data- openpose_zips.zip- mediapipe_zips.zip- subtitles.zipRépertoire information- video_information.csv : contient les informations de résolution, fréquence d'image, durée , nombre de frames de chaque vidéo, ainsi qu'une répartition des vidéos en train/dev/test- example : répertoire qui contient un court extrait