rmassidda @ DaDoEval: Document Dating Using Sentence Embeddings at EVALITA 2020

Parliamentary government Representation Self-government Political representation Documents Documents, Legal Documents Public documents Official publications Government documents Produce Agricultural products Agricultural commodities Pattern Model Documents Documents Indentures Date Competition (Economics) Economic competition Competitiveness (Economics) Knowledge, Classification of Documents Charters--Law and legislation Documents Manuscript repositories Manuscript depositories Manuscripts--Repositories Manuscripts--Depositories Western architecture (Western countries) Building design Construction Buildings--Design and construction Architecture, Western (Western countries)

Citer ce document

Riccardo Massidda, « rmassidda @ DaDoEval: Document Dating Using Sentence Embeddings at EVALITA 2020 », Accademia University Press

Partage / Export

Résumé 0

This report describes an approach to solve the DaDoEval document dating subtasks for the EVALITA 2020 competition. The dating problem is tackled as a classification problem, where the significant length of the documents in the provided dataset is addressed by using sentence embeddings in a hierarchical architecture. Three different pre-trained models to generate sentence embeddings have been evaluated and compared: USE, LaBSE and SBERT. Other than sentence embeddings the classifier exploits a bag-of-entities representation of the document, generated using a pre-trained named entity recognizer. The final model is able to simultaneously produce the required date for each subtask.

rmassidda @ DaDoEval: Document Dating Using Sentence Embeddings at EVALITA 2020

Fiche du document

Sujets proches En

Citer ce document

Partage / Export

Résumé 0

Par les mêmes auteurs

Sur les mêmes sujets

Sur les mêmes disciplines