Претрага
15 items
-
Multiword Expressions between the Corpus and the Lexicon: Universality, Idiosyncrasy and the Lexicon-Corpus Interface
Verginica Barbu Mititelu, Voula Giouli, Kilian Evang, Daniel Zeman, Petya Osenova, Carole Tiberius, Simon Krek, Stella Markantonatou, Ivelina Stoyanova, Ranka Stankovic, Christian Chiarcos (2024)Predstavljamo trenutne aktivnosti na definisanju interfejsa leksikona i korpusa koji će služiti kao referenca u prikazu polileksemskih jedinica - višečlanih izraza - (različitih tipova - imenskih, glagolskih, itd.) u specijalizovanim leksikonima i povezivanju ovih unosa sa njihovim pojavljivanjima u korpusima. Konačni cilj je korišćenje ovakvih resursa za automatsko identifikovanje višečlanih izraza u tekstu. Uključivanje nekoliko prirodnih jezika ima za cilj univerzalnost rešenja koje nije usredsređeno na određeni jezik, kao i prilagođavanje idiosinkrazijama. Raspravljaju se izazovi u leksikografskom opisu višerečnih ...Verginica Barbu Mititelu, Voula Giouli, Kilian Evang, Daniel Zeman, Petya Osenova, Carole Tiberius, Simon Krek, Stella Markantonatou, Ivelina Stoyanova, Ranka Stankovic, Christian Chiarcos. "Multiword Expressions between the Corpus and the Lexicon: Universality, Idiosyncrasy and the Lexicon-Corpus Interface" in Proceedings of the Joint Workshop on Multiword Expressions and Universal Dependencies (MWE-UD) @ LREC-COLING 2024, Turin, May 25, 2024, ELRA and ICCL (2024)
-
Towards the semantic annotation of SR-ELEXIS corpus: Insights into Multiword Expressions and Named Entities
Овај рад представља активности на развоју корпуса ELEXIS-sr, српском додатку вишејезичном анотираном корпусу ELEXIS-а, који се састоји од семантичких анотација и репозиторија значења речи. ELEXIS је паралелни вишејезични анотирани корпус на десет европских језика, који може да се користи као вишејезички репер за евалуацију европских језика са мање и средње развијеним ресурсима. Фокус овог рада је на вишечланим изразима и именованим ентитетима, њиховом препознавању у скупу реченица ELEXIS-sr и поређењу са анотацијама на другим језицима. Разматрају се први кораци ...Cvetana Krstev, Ranka Stanković, Aleksandra Marković, Teodora Mihajlov. "Towards the semantic annotation of SR-ELEXIS corpus: Insights into Multiword Expressions and Named Entities" in Proceedings of the Joint Workshop on Multiword Expressions and Universal Dependencies (MWE-UD) @ LREC-COLING 2024, Turin, May 25, 2024, ELRA and ICCL (2024)
-
The Dictionary of the Serbian Academy: from the Text to the Lexical Database
In this paper we discuss the project of digitization of the Dictionary of the Serbo-Croatian Standard and Vernacular Language. Scanning and character recognition were a particular challenge, since various non-standard character set encoding was used in the course of the almost 60-year long production of the dictionary. The first aim of the project was to formalize the micro-structure of the dictionary articles in order to parse the digitized text of and transform it into structured data stored in relational lexical database. This approach ...... Ecosystem: The Experience of ILC-CNR. In Proceedings of the LREC 2018 Workshop “Globalex 2018 – Lexicography & WordNets”, Eds: Ilan Kernerman, Simon Krek, Miyazaki, Japan, pp. 52-54. Sabo, O., Vitas, D. (1998). Mogućnost osavremenjivanja izrade rečnika na primeru Rečnika srpskohrvatskog kn- jiževnog ...Ranka Stanković, Rada Stijović, Duško Vitas, Cvetana Krstev, Olga Sabo. "The Dictionary of the Serbian Academy: from the Text to the Lexical Database" in Proceedings of the XVIII EURALEX International Congress: Lexicography in Global Contexts, Ljubljana : Ljubljana University Press, Faculty of Arts (2018)
-
Impact of a failure zone above the underground roadway on rockbolting structure loading
Vladimir Milisavljević, Dragan Zlatanović, Simon Sedmak, Milenko Ljubojev. "Impact of a failure zone above the underground roadway on rockbolting structure loading" in Structural integrity and life/Integritet i vek konstrukcija 15 no. 2, Beograd:Society for Structural Integrity and Life / IMS Institute (2015): 85-94
-
SASA Dictionary as the Gold Standard for Good Dictionary Examples for Serbian
Ranka Stanković, Branislava Šandrih, Rada Stijović, Cvetana Krstev, Duško Vitas, Aleksandra Marković (2019)У овом раду представљамо модел за избор добрих примера за речник српског језика и развој иницијалних компоненти модела. Метода која се користи заснива се на детаљној анализи различитих лексичких и синтактичких карактеристика у корпусу састављених од примера из пет дигитализованих свезака речника САНУ. Почетни скуп функција био је инспирисан сличним приступом и за друге језике. Дистрибуција карактеристика примера из овог корпуса упоређује се са карактеристиком дистрибуције узорака реченица ексцерпираних из корпуса који садрже различите текстове. Анализа је показала да ...Српски, добри примери из речника, аутоматизација израде речника, издвајање својстава, Машинско учење... Congress, EURALEX 2008. Barcelona: Universitat Pompeu Fabra, pp. 425–432. Kosem, I. (2017). Dictionary examples. In V. Gorjanc, P. Gantar, I. Kosem & S. Krek (eds.) Dictionary of Modern Slovene: Problems and Solutions. Ljubljana: University of Ljubljana, Faculty of Arts. Kosem, I., Koppel, K., Zingano ...
... Krstev, C. & Sabo, O. (2018). The Dictionary of the Serbian Academy: from the Text to the Lexical Database. In J. Čibej, V. Gorjanc, I. Kosem & S. Krek (eds.) Proceedings of the XVIII EURALEX International Congress: Lexicography in Global Contexts. Ljubljana, pp. 941–949. Available at: https://euralex ...Ranka Stanković, Branislava Šandrih, Rada Stijović, Cvetana Krstev, Duško Vitas, Aleksandra Marković. "SASA Dictionary as the Gold Standard for Good Dictionary Examples for Serbian" in Electronic lexicography in the 21st century. Proceedings of the eLex 2019 conference , Lexical Computing CZ, s.r.o. (2019)
-
A Multilingual Evaluation Dataset for Monolingual Word Sense Alignment
Sina Ahmadi, John P McCrae, Sanni Nimb, Fahad Khan, Monica Monachini, Bolette S Pedersen, Thierry Declerck, Tanja Wissik, Andrea Bellandi, Irene Pisani, [...] Ranka Stanković and others (2020)Aligning senses across resources and languages is a challenging task with beneficial applications in the field of natural language processing and electronic lexicography. In this paper, we describe our efforts in manually aligning monolingual dictionaries. The alignment is carried out at sense-level for various resources in 15 languages. Moreover, senses are annotated with possible semantic relationships such as broadness, narrowness, relatedness, and equivalence. In comparison to previous datasets for this task, this dataset covers a wide range of languages ...... (Dictionary of the Serbo-Croatian Literary Language). Slovene (JSI) Slovene WordNet (Erjavec and Fiser, 2006) and Slovene Lexical Database (Gantar and Krek, 2011) were used. Slovene (ISJFR) eSSKJ–Dictionary of the Slovenian Standard Language (3rd edition) (Gliha Komac et al., 2016) and the Kostelski ...
... dk/ddo en. Fellbaum, C. (2010). WordNet. In Theory and applica- tions of ontology: computer applications, pages 231– 243. Springer. Gantar, P. and Krek, S. (2011). Slovene lexical database. In Natural language processing, multilinguality, pages 72–80. Gliha Komac, N., Jakop, N., Ježovnik, J., Kern ...
... Monica Monachini3, Bolette S. Pedersen8, Thierry Declerck2,12, Tanja Wissik2, Andrea Bellandi3, Irene Pisani4, Thomas Troelsgård1, Sussi Olsen8, Simon Krek5, Veronika Lipp6, Tamás Váradi6, László Simon6, András Győrffy6, Carole Tiberius9, Tanneke Schoonheim9, Yifat Ben Moshe10, Maya Rudich10 ...Sina Ahmadi, John P McCrae, Sanni Nimb, Fahad Khan, Monica Monachini, Bolette S Pedersen, Thierry Declerck, Tanja Wissik, Andrea Bellandi, Irene Pisani, [...] Ranka Stanković and others . "A Multilingual Evaluation Dataset for Monolingual Word Sense Alignment" in Proceedings of the 12th Conference on Language Resources and Evaluation (LREC 2020), Marseille, European Language Resources Association (ELRA) (2020)
-
A Data Driven Approach for Raw Material Terminology
Olivera Kitanović, Ranka Stanković, Aleksandra Tomašević, Mihailo Škorić, Ivan Babić, Ljiljana Kolonja (2021)The research presented in this paper aims at creating a bilingual (sr-en), easily searchable, hypertext, born-digital, corpus-based terminological database of raw material terminology for dictionary production. The approach is based on linking dictionaries related to the raw material domain, both digitally born and printed, into a lexicon structure, aligning terminology from different dictionaries as much as possible. This paper presents the main features of this approach, data used for compilation of the terminological database, the procedure by which it has ...sirovine, rudarstvo, terminologija, rečnik, terminološka aplikacija, mobilna aplikacija, digitizacija, leksički podaci, korpusi, otvoreni povezani podaci... 2019; Kosem, T., Kuhn, Z., Correia, M., Ferreria, J.P., Jansen, M., Pereira, I., Kallas, J., Jakubíček, M., Krek, S., Tiberius, C., Eds.; Lexical Computing: Brno, Czechia, 2019; pp. 1–3. 5. Krek, S. Natural Language Processing and Automatic Knowledge Extraction for Lexicography. Int. J. Lexicogr. 2019 ...
... International Congress: Lexicography in Global Contexts, Book of Abstracts, Ljubljana, Slovenia, 17–21 July 2018; Cibej, J., Gorjanc, V., Kosem, I., Krek, S., Eds.; Ljubljana University Press: Ljubljana, Slovenia, 2018; pp. 65–67. 10. Koppel, K.; Tavast, A.; Langemets, M.; Kallas, J. Aggregating dictionaries ...Olivera Kitanović, Ranka Stanković, Aleksandra Tomašević, Mihailo Škorić, Ivan Babić, Ljiljana Kolonja. "A Data Driven Approach for Raw Material Terminology" in Applied Sciences, MDPI AG (2021). https://doi.org/10.3390/app11072892
-
Experimental and numerical analysis of fatigue crack growth in integral skin-stringer panels
Sghayer Abulgasem , Grbović Aleksandar, Sedmak Aleksandar, Dinulović Mirko, Grozdanović Ines, Sedmak Simon, Petrovski Blagoj (2017)Sghayer Abulgasem , Grbović Aleksandar, Sedmak Aleksandar, Dinulović Mirko, Grozdanović Ines, Sedmak Simon, Petrovski Blagoj. "Experimental and numerical analysis of fatigue crack growth in integral skin-stringer panels" in Tehnički vjesnik 25 no. 3, Slavonski brod:Strojanski fakultet (2017)
-
Human factor risk management procedures applied in the case of open pit mine
Snežana Kirin, Aleksandar Sedmak, Wei Li, Miodrag Brzaković, Igor Miljanović, Ana Petrović, Simon Sedmak (2021)Risk management aims to provide a controlled work environment to ensure the safe operation of the high-risk systems. It is a dynamic process which work in a continual state of change. The issue of human factor risk and rules and regulations in open pit mine is a main focus of this paper in order to develop predictive models of behavior of workers in relation to compliance with the procedures and rules. Presented survey was conducted in open pit coal ...Snežana Kirin, Aleksandar Sedmak, Wei Li, Miodrag Brzaković, Igor Miljanović, Ana Petrović, Simon Sedmak. "Human factor risk management procedures applied in the case of open pit mine" in Engineering Failure Analysis (2021). https://doi.org/https://doi.org/10.1016/j.engfailanal.2021.105456
-
The Late Cretaceous Klepa basalts in Macedonia (FYROM)—Constraints on the final stage of Tethys closure in the Balkans
Dejan Prelević, Simon Wehrheim, Magnus Reutter, Rolf L. Romer, Blažo Boev, Milica Božović, Paul van den Bogaard, Vladica Cvetković, Stefan M. Schmid (2017)Dejan Prelević, Simon Wehrheim, Magnus Reutter, Rolf L. Romer, Blažo Boev, Milica Božović, Paul van den Bogaard, Vladica Cvetković, Stefan M. Schmid. "The Late Cretaceous Klepa basalts in Macedonia (FYROM)—Constraints on the final stage of Tethys closure in the Balkans" in Terra Nova no. 29 (2017): 145-153. https://doi.org/10.1111/ter.12264
-
Чији је пример? Анализа лексичких обележја на примерима Речника САНУ
У овом раду поставља се питање: да ли се може утврдити ко је аутор неког текста уколико се анализирају искључиво његова лексичка обележја? Како бисмо покушали да добијемо одговор на ово питање, посматрали смо примере у оквиру речничког чланка појединачне лексеме Речника САНУ, који су забележени у пет томова (и то: I, II, XVIII, XIX и XX). Сваки пример је преузет из неког извора на шта упућују скраћенице, наведене у заградама. Од преко 5.000 понуђених извора, определили смо се ...... 425–432. Косем 2017: Iztok Kosem, Dictionary examples, In Dictionary of Modern Slov- ene: Problems and Solutions, V. Gorjanc, P. Gantar, I. Kosem, S. Krek (eds.). Ljubljana: University of Ljubljana, Faculty of Arts. Косем и др. 2018: Iztok Kosem, Kristina Koppel, Tanara Zingano Kuhn, Jan Michelfeit ...Бранислава Б. Шандрих, Ранка М. Станковић, Мирјана С. Гочанин. "Чији је пример? Анализа лексичких обележја на примерима Речника САНУ" in Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch13
-
Towards Automatic Definition Extraction for Serbian
U radu su prikazani preliminarni rezultati automatske ekstrakcije kandidata za definicije rečnika iz nestrukturiranih tekstova na srpskom jeziku u cilju ubrzanja razvoja rečnika. Definicije u rečniku Srpske akademije nauka i umetnosti (SANU) korišćene su za modelovanje različitih tipova definicija (opisnih, gramatičkih, referentnih i sinonimskih) koje imaju različite sintaksičke i leksičke karakteristike. Korpus istraživanja sastoji se od 61.213 definicija imenica, koje su analizirane korišćenjem morfoloških e-rečnika i lokalnih gramatika implementiranih kao pretvarači konačnih stanja u paketu za obradu korpusa otvorenog ...... Congress: Lexicography in Global Contexts, Ljubljana. Ljubljana University Press, Faculty of Arts. Čibej, Jaka, Gorjanc, Vojko, Kosem, Iztok & Krek, Simon (eds.), pp. 941–949. Stanković, R., Šandrih, B., Stijović, R., Krstev, C., Vitas, D. & Marković, A. (2019). SASA Dictionary as the Gold Standard ...Ranka Stanković, Cvetana Krstev, Rada Stijović, Mirjana Gočanin, Mihailo Škorić. "Towards Automatic Definition Extraction for Serbian" in Proceedings of the XIX EURALEX Congress of the European Assocition for Lexicography: Lexicography for Inclusion (Volume 2). 7-9 September (virtual), Democritus University of Thrace (2021)
-
Bridging Computational Lexicography and Corpus Linguistics: A Query Extension for OntoLex-FrAC
OntoLex, dominantni standard zajednice za mašinski čitljive leksičke resurse u kontekstu RDF-a, Linked Data i tehnologija Semantičkog veba, trenutno se proširuje sa posebnim modulom za Frekvencije, Primere i Informacije zasnovane na Korpusu (OntoLex-FrAC). Predlažemo novi komponent za OntoLex-FrAC, koji se bavi inkorporacijom korpusnih upita za (a) povezivanje rečnika sa korpusnim mašinama, (b) omogućavanje RDF baziranih web servisa da dinamički razmenjuju korpusne upite i podatke odgovora, i (c) korišćenje konvencionalnih upitačkih jezika za formalizaciju unutrašnje strukture kolokacija, skica reči i ...standardizacija, digitalna leksikografija, OntoLex, upiti korpusa, povezani podaci, Lingvistički povezani otvoreni podaciChristian Chiarcos, Ranka Stanković, Maxim Ionov, Gilles Sérasset. "Bridging Computational Lexicography and Corpus Linguistics: A Query Extension for OntoLex-FrAC" in Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), Turin, 20-25 May 2024, LREC (2024)
-
FrameNet Lexical Database: Presenting a Few Frames Within the Risk Domain
U radu se daje kratak prikaz teorije semantike okvira, na kojoj je zasnovana leksička baza Frejmnet. Predstavljena je koncepcija ove mreže, kao i mogućnosti njene primene. Predstavljena je i leksička analiza koja se primenjuje u projektu izrade Frejmneta i ukazano na razlike između analize zasnovane na okviru u odnosu na analizu zasnovanu na reči. Zatim je prikazano nekoliko povezanih okvira koje prizivaju reči iz domena rizika. U radu je predstavljena i platforma NLTК pomoću koje se mogu koristiti ...... “FrameNet in action: The case of attaching.” Interna- tional journal of lexicography 16 (3): 297–332. Gantar, Polona, Kristina Štrkalj Despot, Simon Krek, and Nikola Ljubešic. 2018. “Towards semantic role labeling in Slovene and Croatian.” In Pro- ceedings Conference on Language Technologies and Digital ...Aleksandra Marković, Ranka Stanković, Natalija Tomić, Olivera Kitanović. "FrameNet Lexical Database: Presenting a Few Frames Within the Risk Domain" in Infotheca, Faculty of Philology, University of Belgrade (2021). https://doi.org/10.18485/infotheca.2021.21.1.1
-
Ontološki model upravljanja rizikom u rudarstvu
Olivera Kitanović (2021)Rudarska proizvodnja obuhvata kompleksne tehnološke sisteme, što nameće potrebu za uspostavljanjem i unapređivanjem sistema upravljanja rizikom. Heterogenost i obim podataka neophodnih za upravljanje rizikom zahtevaju sistem koji ih na fleksibilan način integriše i omogućava njihovo optimalno korišćenje. Osnovni cilj ove disertacije je razvoj ontologije za domen rudarstva i na njoj zasnovanog modela za upravljanje rizikom. Njegova realizacija podrazumeva i implementaciju algoritama ekstrakcije informacija za popunjavanje ontologije, kao i odgovarajuće softversko rešenje. Razvoj modela obuhvata i značajno proširenje rudarskog korpusa, kao ...rudarstvo, rizik, upravljanje rizikom, procena rizika, ontologija, semantička mreža, ekstrakcija informacija, upravljanje znanjem, računarska lingvistika... the Web of Data: The K Dictionaries Case.” In Proc. of GLOBALEX’16 Workshop at LREC’16, Portoroz, Slovenia, edited by Ilan Kernerman, Iztok Kosem, Simon Krek, and Lars Trap-Jensen, 65–72. European Language Resources Association. http://www.lrec- conf.org/proceedings/lrec2016/workshops/LREC2016Workshop- ...
... Approach to Refine a Big Textual Data: An ESP Case of COVID-19 News Reports.” Applied Sciences 10 (16). https://doi.org/10.3390/app10165505. Cox, Simon JD. 2004. “XMML? A Standards Conformant XML Language for Transfer of Exploration Data.” ASEG Extended Abstracts 2004 (1): 1–4. Crawley, Frank, Malcom ...Olivera Kitanović. Ontološki model upravljanja rizikom u rudarstvu, Beograd : [O. Kitanović], 2021