Annotation of the Serbian ELTeC Collection
Објеката
- Тип
- Рад у часопису
- Верзија рада
- објављена верзија
- Језик
- енглески
- Креатор
- Ranka Stanković, Cvetana Krstev, Branislava Šandrih Todorović, Mihailo Škorić
- Извор
- Infotheca
- Издавач
- Faculty of Philology, University of Belgrade
- Датум издавања
- 2021
- Сажетак
- Ovaj rad predstavlja takozvano izdanje nivoa 2 kolekcije tekstova SrpELTeC razvijene u okviru aktivnosti Radne grupe 2 – Metode i alati COST akcije CA 16204 (Distant Reading for European Literary History) i njene specifikacije šeme. Izdanje nivoa 2 je nastavak izdanja nivoa 1, koje se koristi kao ulaz za morfosintaksičke i NER anotacije romana. Srpska obrada nivoa-2 je navedena kroz potrebne korake, uključujući metode i alate koji se koriste u tom procesu. Neki statistički podaci iz srpske kolekcije nivoa 2 ELTeC-a daju zanimljiv uvid u sadržaj kolekcije.
- This paper presents the so-called level-2 edition of SrpELTeC collection developed within the activities of Working Group 2 - Methods and Tools of the COST Action CA 16204 (Distant Reading for European Literary History), and its schema specification. The level-2 edition is a follow-up of the level-1 edition, which is used as input for morphosyntactic and NER annotation of novels. The Serbian level-2 pipeline outlines steps required for production of level-2, including methods and tools used in the process. Some statistics drawn from the Serbian ELTeC level-2 sub-collection brings an interesting insight into collection content.
- том
- 21
- Број
- 2
- почетак странице
- 43
- крај странице
- 59
- doi
- 10.18485/infotheca.2021.21.2.3
- issn
- 1450-9687
- Subject
- udaljeno čitanje, literarni korpus, tagiranje, prepoznavanje imenovanih entiteta, lematizacija, ELTeC
- distant reading, literary corpus, tagging, NER, lemmatization, ELTeC
- Шира категорија рада
- M50
- Ужа категорија рада
- М53
- Права
- Отворени приступ
- Лиценца
- Creative Commons – Attribution 4.0 International
- Формат
- Медија
- 229-1-1822-1-10-20220213.pdf
Ranka Stanković, Cvetana Krstev, Branislava Šandrih Todorović, Mihailo Škorić. "Annotation of the Serbian ELTeC Collection" in Infotheca, Faculty of Philology, University of Belgrade (2021). https://doi.org/10.18485/infotheca.2021.21.2.3
This item was submitted on 15. фебруар 2022. by [anonymous user] using the form “Рад у часопису” on the site “Радови”: http://drug.rgf.bg.ac.rs/s/repo
Click here to view the collected data.