Exploring Data Provenance in Handwritten Text Recognition Infrastructure: Sharing and Reusing Ground Truth Data, Referencing Models, and Acknowledging Contributions. Starting the Conversation on How We Could Get It Done

C. Annemieke Romein et al., « Exploring Data Provenance in Handwritten Text Recognition Infrastructure: Sharing and Reusing Ground Truth Data, Referencing Models, and Acknowledging Contributions. Starting the Conversation on How We Could Get It Done », Episciences.org, ID : 10.46298/jdmdh.10403

Partage / Export

Résumé 0

This paper discusses best practices for sharing and reusing Ground Truth in Handwritten Text Recognition infrastructures, as well as ways to reference and acknowledge contributions to the creation and enrichment of data within these systems. We discuss how one can place Ground Truth data in a repository and, subsequently, inform others through HTR-United. Furthermore, we want to suggest appropriate citation methods for ATR data, models, and contributions made by volunteers. Moreover, when using digitised sources (digital facsimiles), it becomes increasingly important to distinguish between the physical object and the digital collection. These topics all relate to the proper acknowledgement of labour put into digitising, transcribing, and sharing Ground Truth HTR data. This also points to broader issues surrounding the use of machine learning in archival and library contexts, and how the community should begin to acknowledge and record both contributions and data provenance.

{"uri":"10670\/1.lljjij","creators":[{"id":"romein_c_annemieke","lastname":"Romein"},{"id":"hodel_tobias","lastname":"Hodel"},{"id":"gordijn_femke","lastname":"Gordijn"},{"id":"zundert_joris_j_van","lastname":"Zundert"},{"id":"chague_alix","lastname":"Chagu\u00e9"},{"id":"lange_milan_van","lastname":"Lange"},{"id":"jensen_helle_strandgaard","lastname":"Jensen"},{"id":"stauder_andy","lastname":"Stauder"},{"id":"purcell_jake","lastname":"Purcell"},{"id":"terras_melissa_m","lastname":"Terras"},{"id":"heuvel_pauline_van_den","lastname":"Heuvel"},{"id":"keijzer_carlijn","lastname":"Keijzer"},{"id":"rabus_achim","lastname":"Rabus"},{"id":"sitaram_chantal","lastname":"Sitaram"},{"id":"bhatia_aakriti","lastname":"Bhatia"},{"id":"depuydt_katrien","lastname":"Depuydt"},{"id":"afolabi_adeolu_mary_aderonke","lastname":"Afolabi-Adeolu"},{"id":"anikina_anastasiia","lastname":"Anikina"},{"id":"bastianello_elisa","lastname":"Bastianello"},{"id":"benzinger_lukas_vincent","lastname":"Benzinger"},{"id":"bosse_arno","lastname":"Bosse"},{"id":"brown_david","lastname":"Brown"},{"id":"charlton_ash","lastname":"Charlton"},{"id":"dannevig_andre_nilsson","lastname":"Dannevig"},{"id":"gelder_klaas_van","lastname":"Gelder"},{"id":"go_sabine_c_p_j","lastname":"Go"},{"id":"goh_marcus_j_c","lastname":"Goh"},{"id":"gstrein_silvia","lastname":"Gstrein"},{"id":"hasan_sewa","lastname":"Hasan"},{"id":"heide_stefan_von_der","lastname":"Heide"},{"id":"hindermann_maximilian","lastname":"Hindermann"},{"id":"huff_dorothee","lastname":"Huff"},{"id":"huysman_ineke","lastname":"Huysman"},{"id":"idris_ali","lastname":"Idris"},{"id":"keijzer_liesbeth","lastname":"Keijzer"},{"id":"kemper_simon","lastname":"Kemper"},{"id":"koenders_sanne","lastname":"Koenders"},{"id":"kuijpers_erika","lastname":"Kuijpers"},{"id":"r\u00f8nsig_larsen_lisette","lastname":"R\u00f8nsig Larsen"},{"id":"lepa_sven","lastname":"Lepa"},{"id":"link_tommy_o","lastname":"Link"},{"id":"nispen_annelies_van","lastname":"Nispen"},{"id":"nockels_joe","lastname":"Nockels"},{"id":"noort_laura_m_van","lastname":"Noort"},{"id":"oosterhuis_joost_johannes","lastname":"Oosterhuis"},{"id":"popken_vivien","lastname":"Popken"},{"id":"estrella_puertollano_maria","lastname":"Estrella Puertollano"},{"id":"puusaag_joosep_j","lastname":"Puusaag"},{"id":"sheta_ahmed","lastname":"Sheta"},{"id":"stoop_lex","lastname":"Stoop"},{"id":"strutzenbladh_ebba","lastname":"Strutzenbladh"},{"id":"sijs_nicoline_van_der","lastname":"Sijs"},{"id":"spek_jan_paul_van_der","lastname":"Spek"},{"id":"trouw_barry_benaissa","lastname":"Trouw"},{"id":"van_synghel_geertrui","lastname":"Van Synghel"},{"id":"vuckovic_vladimir","lastname":"Vu\u010dkovi\u0107"},{"id":"wilbrink_heleen","lastname":"Wilbrink"},{"id":"weiss_sonia","lastname":"Weiss"},{"id":"wrisley_david_joseph","lastname":"Wrisley"},{"id":"zweistra_riet","lastname":"Zweistra"}]}

Par les mêmes auteurs

{"uri":"10670\/1.lljjij","titles":["Exploring Data Provenance in Handwritten Text Recognition Infrastructure: Sharing and Reusing Ground Truth Data, Referencing Models, and Acknowledging Contributions. Starting the Conversation on How We Could Get It Done"],"disciplines":[{"uri":"http:\/\/aurehal.archives-ouvertes.fr\/subject\/shs.info","label":{"es":"Ciencias de la informaci\u00f3n y de la comunicaci\u00f3n","en":"Communication sciences","fr":"Sciences de l'information et de la communication"}}],"creators":[{"id":"romein_c_annemieke","lastname":"Romein"},{"id":"hodel_tobias","lastname":"Hodel"},{"id":"gordijn_femke","lastname":"Gordijn"},{"id":"zundert_joris_j_van","lastname":"Zundert"},{"id":"chague_alix","lastname":"Chagu\u00e9"},{"id":"lange_milan_van","lastname":"Lange"},{"id":"jensen_helle_strandgaard","lastname":"Jensen"},{"id":"stauder_andy","lastname":"Stauder"},{"id":"purcell_jake","lastname":"Purcell"},{"id":"terras_melissa_m","lastname":"Terras"},{"id":"heuvel_pauline_van_den","lastname":"Heuvel"},{"id":"keijzer_carlijn","lastname":"Keijzer"},{"id":"rabus_achim","lastname":"Rabus"},{"id":"sitaram_chantal","lastname":"Sitaram"},{"id":"bhatia_aakriti","lastname":"Bhatia"},{"id":"depuydt_katrien","lastname":"Depuydt"},{"id":"afolabi_adeolu_mary_aderonke","lastname":"Afolabi-Adeolu"},{"id":"anikina_anastasiia","lastname":"Anikina"},{"id":"bastianello_elisa","lastname":"Bastianello"},{"id":"benzinger_lukas_vincent","lastname":"Benzinger"},{"id":"bosse_arno","lastname":"Bosse"},{"id":"brown_david","lastname":"Brown"},{"id":"charlton_ash","lastname":"Charlton"},{"id":"dannevig_andre_nilsson","lastname":"Dannevig"},{"id":"gelder_klaas_van","lastname":"Gelder"},{"id":"go_sabine_c_p_j","lastname":"Go"},{"id":"goh_marcus_j_c","lastname":"Goh"},{"id":"gstrein_silvia","lastname":"Gstrein"},{"id":"hasan_sewa","lastname":"Hasan"},{"id":"heide_stefan_von_der","lastname":"Heide"},{"id":"hindermann_maximilian","lastname":"Hindermann"},{"id":"huff_dorothee","lastname":"Huff"},{"id":"huysman_ineke","lastname":"Huysman"},{"id":"idris_ali","lastname":"Idris"},{"id":"keijzer_liesbeth","lastname":"Keijzer"},{"id":"kemper_simon","lastname":"Kemper"},{"id":"koenders_sanne","lastname":"Koenders"},{"id":"kuijpers_erika","lastname":"Kuijpers"},{"id":"r\u00f8nsig_larsen_lisette","lastname":"R\u00f8nsig Larsen"},{"id":"lepa_sven","lastname":"Lepa"},{"id":"link_tommy_o","lastname":"Link"},{"id":"nispen_annelies_van","lastname":"Nispen"},{"id":"nockels_joe","lastname":"Nockels"},{"id":"noort_laura_m_van","lastname":"Noort"},{"id":"oosterhuis_joost_johannes","lastname":"Oosterhuis"},{"id":"popken_vivien","lastname":"Popken"},{"id":"estrella_puertollano_maria","lastname":"Estrella Puertollano"},{"id":"puusaag_joosep_j","lastname":"Puusaag"},{"id":"sheta_ahmed","lastname":"Sheta"},{"id":"stoop_lex","lastname":"Stoop"},{"id":"strutzenbladh_ebba","lastname":"Strutzenbladh"},{"id":"sijs_nicoline_van_der","lastname":"Sijs"},{"id":"spek_jan_paul_van_der","lastname":"Spek"},{"id":"trouw_barry_benaissa","lastname":"Trouw"},{"id":"van_synghel_geertrui","lastname":"Van Synghel"},{"id":"vuckovic_vladimir","lastname":"Vu\u010dkovi\u0107"},{"id":"wilbrink_heleen","lastname":"Wilbrink"},{"id":"weiss_sonia","lastname":"Weiss"},{"id":"wrisley_david_joseph","lastname":"Wrisley"},{"id":"zweistra_riet","lastname":"Zweistra"}]}

Exploring Data Provenance in Handwritten Text Recognition Infrastructure: Sharing and Reusing Ground Truth Data, Referencing Models, and Acknowledging Contributions. Starting the Conversation on How We Could Get It Done

Fiche du document

Mots-clés Und

Sujets proches En Fr

Citer ce document

Métriques

Partage / Export

Résumé 0

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines

Exporter en