Повезивање лексема морфолошких речника коришћењем базе Лексимирка

Објеката

Тип
Рад у зборнику
Верзија рада
објављена
Језик
српски
Креатор
Биљана Рујевић, Ранка Станковић, Михаило Шкорић
Извор
Модерни речници у функцији просечнога корисника: стари проблеми, савремени правци и нови изазови, Лексикографски сусрети, Београд, 27-29. мај 2024.
Уредник
Саша Марјановић
Издавач
Београд : Филолошки факултет
Датум издавања
2024
Сажетак
Рад приказује приступ успостављању повезивања лексема у Морфолошким речницима српског језика. Повезивање, тј. успостављање релација не би било могуће без претходне конверзије речника из облика текстуалних датотека у облик лексичке базе података назване Лексимирка. Методологија за успостављање релација почива на 69 појединачних релација заснованих на 388 правила. Правила за повезивање се дефинишу на основу обележја лексичких записа (врсте речи, маркера, граматичких категорија и подниски). Успостављене релације су крајњем кориснику видљиве путем апликације Лексимирка у форми хипервеза и могу се сврстати у три врсте: варијационе, деривационе и изговорне релације. Варијационим релацијама су повезане лексеме које међусобно представљају варијантне облике (нпр. кафа и кава, евро и еуро). У деривационе релације спадају везе међу лексемама које су повезане деривационим правилима (нпр. колач и колачић, дугме и дугменце). Изговорном релацијом су повезани облици речи екавског и ијекавског изговора (нпр. бијел и бео, сњешко и снешко). Остварено је укупно 103.589 повезивања лексичких записа (кроз 43 варијационе релације остварено 3.401 повезивање, кроз 25 деривационих релација 94.732 повезивања и једну изговорну релацију 5.456 повезивања).
The paper presents an approach to establishing relations between lexemes in Serbian Morphological Dictionaries (SMD). These relations would not be possible without the prior conversion of the SMD dictionaries from text file formats into a lexical database — Leximirka. The methodology consists of 69 relations defined by 388 different rules that are based on lexical entry properties such as part of speech, markers, grammatical features, and substrings. The established relations are visible to the end user through the application of the same name (Leximirka) in the form of hyperlinks and can be categorized into three types: variational, derivational, and pronunciation relations. Variational relations connect lexemes representing variant forms of each other, such as kafa and kava (coffee), euro and evro (euro), etc. Derivational relations include connections between lexemes linked by derivational rules (e.g., kolač (cake) and kolačić (cookie), dugme (button) and dugmence (little button)). Pronunciation relations connect word forms used in the ekavian and ijekavian pronunciations, such as bijel and beo (white) or snješko and sneško (snowman). Using these relations, 103,589 lexical entries pairs are established (3,401 using 43 variational relations, 94,732 using 25 derivational relations and 5,456 using 1 pronunciation relation).
почетак странице
273
крај странице
283
doi
10.18485/lexicog_meet.2024.1.ch23
isbn
978-86-6153-758-5
Subject
морфолошки речници, повезивање лексема, лексичка база података, српски језик
morphological dictionaries, lexeme connection, lexical database, Serbian language
Шира категорија рада
М30
Ужа категорија рада
М33
Је дио
Grant No. 7276, (Text Embeddings - Serbian Language Application – TESLA)
Права
Отворени приступ
Лиценца
Creative Commons – Attribution-Share Alike 4.0 International
Формат
.pdf

Биљана Рујевић, Ранка Станковић, Михаило Шкорић. "Повезивање лексема морфолошких речника коришћењем базе Лексимирка" in Модерни речници у функцији просечнога корисника: стари проблеми, савремени правци и нови изазови, Лексикографски сусрети, Београд, 27-29. мај 2024. , Београд : Филолошки факултет (2024). https://doi.org/10.18485/lexicog_meet.2024.1.ch23 М33

This item was submitted on 29. јануар 2025. by [anonymous user] using the form “Рад у зборнику радова” on the site “Радови”: http://drug.rgf.bg.ac.rs/s/repo

Click here to view the collected data.