20 mai 2024
Ce document est lié à :
info:eu-repo/grantAgreement//871111/EU/European Holocaust Research Infrastructure/EHRI-3
http://creativecommons.org/licenses/by/ , info:eu-repo/semantics/OpenAccess
Sarah Bénière et al., « TEI Specifications for a Sustainable Management of Digitized Holocaust Testimonies », HAL SHS (Sciences de l’Homme et de la Société), ID : 10670/1.bc57ba...
La modélisation et la standardisation des données sont des préoccupations importantes au sein de la communauté des humanités numériques. Lorsque l'on traite de témoignages de la Shoah, la conservation et l'accessibilité aux documents sur le long-terme sont essentielles. Les éditions en ligne de l'EHRI sont composées de documents d'archives de diverses natures (témoignages, lettres, rapports diplomatiques, etc.) conservés par les institutions partenaires de l'EHRI. Les éditeurs et éditrices du Consortium EHRI sélectionnent les documents, les regroupent autour d'un thème, et les encodent en respectant les recommandations de la TEI. L'homogénéisation de l'encodage est primordiale pour s'assurer de la cohérence des éditions les unes par rapport aux autres. Cette notion d'homogénéisation nous encourage également à une réflexion plus générale sur l'utilisation de standards dans le traitement des données, et sur la standardisation des éditions scientifiques numériques de documents textuels. Dans cet article, nous présentons la travail d'homogénéisation effectué sur les éditions en ligne de l'EHRI, notamment la personnalisation que nous avons faite de la TEI pour s'adapter aux spécificités des documents liés à la Shoah et l'articulation avec un vocabulaire contrôlé. Nous envisageons ces spécifications TEI d'une part comme un outil pour les chercheurs et chercheuses, mais également pour un plus large public qui ne serait pas familier avec la TEI, afin de s'assurer que leur encodage est valide et homogène entre leurs éditions ; et d'autre part comme un mécanisme permettant d'intégrer le travail éditorial au sein d'une chaîne de traitement plus large, allant de la numérisation des documents à leur publication en ligne.