OntoLex Publication Made Easy: A Dataset of Verbal Aspectual Pairs for Bosnian, Croatian and Serbian

Објеката

Тип
Рад у зборнику
Верзија рада
објављена
Језик
енглески
Креатор
Ranka Stanković, Maxim Ionov, Medina Bajtarević, Lorena Ninčević
Извор
Proceedings of the 9th Workshop on Linked Data in Linguistics @ LREC-COLING 2024, Turin, 20-25 May 2024
Уредник
Christian Chiarcos, Katerina Gkirtzou, Maxim Ionov, Fahad Khan, John P. McCrae, Elena Montiel Ponsoda, Patricia Martín Chozas
Издавач
ELRA and ICCL
Датум издавања
2024
Сажетак
Ovaj rad predstavlja novi jezički resurs za pretraživanje i istraživanje verbalnih aspektnih parova u BCS (bosanskom, hrvatskom i srpskom), kreiran korišćenjem principa Lingvističkih Povezanih Otvorenih Podataka (LLOD). Pošto ne postoji resurs koji bi pomogao učenicima bosanskog, hrvatskog i srpskog kao stranih jezika da prepoznaju aspekt glagola ili njegove parove, kreirali smo novi resurs koji će korisnicima pružiti informacije o aspektu, kao i link ka aspektnim parovima glagola. Ovaj resurs takođe sadrži spoljne linkove ka monolingvalnim rečnicima, Wordnetu i BabelNetu. Pošto je ovo rad u toku, naš resurs uključuje samo glagole i njihove perfektivne parove koji su izvedeni prefiksima "pro", "od", "ot", "iz", "is" i "na". Cilj ovog projekta je imati kompletan skup podataka svih aspektnih parova u ova tri jezika. Verujemo da će biti koristan za istraživanje u oblasti aspektologije, kao i za mašinsko prevođenje i druge zadatke obrade prirodnog jezika. Koristeći ovaj resurs kao primer, takođe predlažemo održiv pristup objavljivanju malih do umerenih LLOD resursa na Vebu, kako na korisnički prijatan način, tako i prema principima Povezanih Podataka.
This paper introduces a novel language resource for retrieving and researching verbal aspectual pairs in BCS (Bosnian, Croatian, and Serbian) created using Linguistic Linked Open Data (LLOD) principles. As there is no resource to help learners of Bosnian, Croatian, and Serbian as foreign languages to recognize the aspect of a verb or its pairs, we have created a new resource that will provide users with information about the aspect, as well as the link to a verb’s aspectual counterparts. This resource also contains external links to monolingual dictionaries, Wordnet, and BabelNet. As this is a work in progress, our resource only includes verbs and their perfective pairs formed with prefixes “pro”, “od”, “ot”, “iz”, “is” and “na”. The goal of this project is to have a complete dataset of all the aspectual pairs in these three languages. We believe it will be useful for research in the field of aspectology, as well as machine translation and other NLP tasks. Using this resource as an example, we also propose a sustainable approach to publishing small to moderate LLOD resources on the Web, both in a user-friendly way and according to the Linked Data principles.
почетак странице
108
крај странице
114
Subject
aspekt glagola, lingvistički otvoreni podaci, BCS
verbal aspect, Linguistic Linked Open Data, BCS
Шира категорија рада
М30
Ужа категорија рада
М33
Је дио
NexusLinguarum
Права
Отворени приступ
Лиценца
Creative Commons – Attribution-Share Alike 4.0 International
Формат
.pdf
Скупови објеката
Ранка Станковић
Radovi istraživača
Медија
2024.ldl-1.14.pdf

Ranka Stanković, Maxim Ionov, Medina Bajtarević, Lorena Ninčević. "OntoLex Publication Made Easy: A Dataset of Verbal Aspectual Pairs for Bosnian, Croatian and Serbian" in Proceedings of the 9th Workshop on Linked Data in Linguistics @ LREC-COLING 2024, Turin, 20-25 May 2024, ELRA and ICCL (2024)

This item was submitted on 25. мај 2024. by [anonymous user] using the form “Рад у зборнику радова” on the site “Радови”: http://drug.rgf.bg.ac.rs/s/repo

Click here to view the collected data.