Претрага
16 items
-
A Mathematical Learning Environment Based on Serbian Language Resources
In recent years, in line with ever growing usage of Information technology, the learning environments are changing. The amount of available learning materials in various forms has increased. These new environments demand comprehensive learning systems, which enable management of the learning corpus with special attention paid to relevant lexical resources. In this paper we present the concept of a Mathematical Learning Environment in Serbian (MLES), which is based on a corpus of mathematical materials and various lexical resources, enabling ...... Ivan, Stanković Ranka, Utvić Miloć, Kaplar Sebastijan Дигитални репозиторијум Рударско-геолошког факултета Универзитета у Београду [ДР РГФ] A Mathematical Learning Environment Based on Serbian Language Resources | Radojičić Marija, Obradović Ivan, Stanković Ranka, Utvić Miloć, Kaplar Sebastijan | ...
... Mathematics Library, pp. 55-67. IT Education and Practice Radojičić et al. 254 [10] Stanković, R., Krstev, C., Obradović, I., Trtovac, A., & Utvić, M. (2012b). A tool for enhanced search of multilingual digital libraries of e-journals. Proceedings of the Eighth International Conference on ...
... and usability in a corpus analysis tool. International Journal of Corpus Linguistics. 17 (3), pp. 380–409. [16] Stanković, R., Obradović, I., Utvić, M., (2014). Developing Termbases for Expert Terminology under the TBX Standard. Natural Language Processing for Serbian - Resources and Applications ...Radojičić Marija, Obradović Ivan, Stanković Ranka, Utvić Miloć, Kaplar Sebastijan. "A Mathematical Learning Environment Based on Serbian Language Resources" in Proceedings of the 7th International Scientific Conference Technics and Informatics in Education, Faculty of Technical Sciences, Čačak (2018)
-
Vebran Web Services for Corpus Query Expansion
Ranka Stanković, Miloš Utvić (2020)U ovom radu se govori o razvoju veb usluga Vebran i njihovoj primeni u poboljšanju pretraživanja korpusa. Veb-servisi Vebran koriste se za konsultovanje spoljnih leksičkih izvora za srpski jezik (uglavnom elektronski morfološki rečnici i srpski Vordnet) i proširivanje korisničkih upita radi dobijanja relevantnijih rezultata iz srpskih korpusa.... Web Services for Corpus Query Expansion Ranka Stanković, Miloš Utvić Дигитални репозиторијум Рударско-геолошког факултета Универзитета у Београду [ДР РГФ] Vebran Web Services for Corpus Query Expansion | Ranka Stanković, Miloš Utvić | Infotheca | 2020 | | 10.18485/infotheca.2019.19.2.5 http://dr ...
... morphologically tagged in the sense that each token is associated with the information about the corresponding part of speech and lemma as described in (Утвић, 2011, 2014). The TreeTagger software tool (Schmid, 1997, 1999) was used for automatic morphological annotation of both corpora. The Tree- Tagger language ...
... library to enable various lin- guistic and terminological research, including extraction of terms and other tasks in the field of knowledge engineering (Утвић et al., 2018). The RudKor contains 344 different texts with a total size of 5.4 million words. Infotheca Vol. 19, No. 2, December 2019 101 Stanković ...Ranka Stanković, Miloš Utvić. "Vebran Web Services for Corpus Query Expansion" in Infotheca, Faculty of Philology, University of Belgrade (2020). https://doi.org/10.18485/infotheca.2019.19.2.5
-
Репозиторијум дигиталних идентификатора објеката – доиФил: изградња, стање и перспективе
Милош Утвић, Михаило Шкорић (2017)Филолошки факултет Универзитета у Београду је крајем јула 2015. године склопио уговор са агенцијом Crossref и тиме стекао право да својим публикацијама додељује дигитални идентификатор објекта (DOI), као и публикацијама других издавача које заступа. Истовремено, у склопу уговора, Филолошки факултет је развио репозиторијум доиФил који за све регистроване публикације чува њихове библиографске метаподатке, хипервезу ка комплетном тексту и сам DOI. После припремних радњи и разраде процеса на којима је заснован рад репозиторијума, у новембру 2016. године је репозиторијум доиФил ...... доиФил: изградња, стање и перспективе Милош Утвић, Михаило Шкорић Дигитални репозиторијум Рударско-геолошког факултета Универзитета у Београду [ДР РГФ] Репозиторијум дигиталних идентификатора објеката – доиФил: изградња, стање и перспективе | Милош Утвић, Михаило Шкорић | Научна конференција Библиоинфо ...
... (приступано 1.3.2019). Утвић, Милош. BibTeX - креирање персоналних библиографија. Панчевачко чита- лиште: научни часопис за теорију и праксу библиотекарства, IX/17, 35–38. 2010. http://www.citaliste.com/casopis/br17/9.pdf (приступано 1.3.2019). 90 BIBLIOINFO Miloš Utvić University of Belgrade Faculty ...
... технологије факултета, Драган Вранешевић, и тадашњи асистенти са Катедре за библиотекарство и информатику, Драгана Грујић, Гордана Ђоковић и Милош Утвић. Том приликом је управа изложила идеју да факултет, у својству издавача, склопи уговор са агенцијом IDF-а која је тада још увек користила старо име ...Милош Утвић, Михаило Шкорић. "Репозиторијум дигиталних идентификатора објеката – доиФил: изградња, стање и перспективе" in Научна конференција Библиоинфо — 55 година од покретања наставе библиотекарства на високошколском нивоу, Београд 18. мај 2017., Филолошки факултет Универзитета у Београду (2017). https://doi.org/10.18485/biblioinfo.2017.ch7
-
Integrisano okruženje za pripremu paralelizovanog korpusa
Razvoj paralelizovanih korpusa zahteva pripremu paralelnih tekstova za njihovu integraciju u paralelizovani korpus. Reč je o jednom kompleksnom zadatku koji se može rešiti na različite načine, i koji mora da se odvija u nekoliko koraka. U ovom radu najpre je iznet postupak pripreme paralelnih tekstova za paralelizovani korpus koji se koristi u Grupi za jezičke tehnologije Univerziteta u Beogradu. Potom je dat kratak pregled programa (XAlign, Concordancier, WS4LR), odnosno softverskih alata koji se pri tome koriste. Nedostatak udobnog okruženja ...... g korpusa Ivan Obradović, Ranka Stanković, Miloš Utvić Дигитални репозиторијум Рударско-геолошког факултета Универзитета у Београду [ДР РГФ] Integrisano okruženje za pripremu paralelizovanog korpusa | Ivan Obradović, Ranka Stanković, Miloš Utvić | Zbornik radova međunarodnog simpozijuma Razlike ...
... open access, as well as the employees' publications. - The Repository is available at: www.dr.rgf.bg.ac.rs Ivan Obradović - Ranka Stanković – Miloš Utvić (Beograd) Integrisano okruženje za pripremu paralelizovanog korpusa Razvoj paralelizovanih korpusa zahteva pripremu paralelnih tekstova za njihovu ...Ivan Obradović, Ranka Stanković, Miloš Utvić. "Integrisano okruženje za pripremu paralelizovanog korpusa" in Zbornik radova međunarodnog simpozijuma Razlike između bosanskog/bošnjačkog, hrvatskog i srpskog jezika, Graz, Austria, April 2007, - (2007)
-
Developing Termbases for Expert Terminology under the TBX Standard
... Standard Ranka Stanković, Ivan Obradović, Miloš Utvić Дигитални репозиторијум Рударско-геолошког факултета Универзитета у Београду [ДР РГФ] Developing Termbases for Expert Terminology under the TBX Standard | Ranka Stanković, Ivan Obradović, Miloš Utvić | Natural Language Processing for Serbian - Resources ...Ranka Stanković, Ivan Obradović, and Miloš Utvić. "Developing Termbases for Expert Terminology under the TBX Standard" in Natural Language Processing for Serbian - Resources and Applications, Belgrade : University of Belgrade, Faculty of Mathematics (2014)
-
Transformer-Based Composite Language Models for Text Evaluation and Classification
Parallel natural language processing systems were previously successfully tested on the tasks of part-of-speech tagging and authorship attribution through mini-language modeling, for which they achieved significantly better results than independent methods in the cases of seven European languages. The aim of this paper is to present the advantages of using composite language models in the processing and evaluation of texts written in arbitrary highly inflective and morphology-rich natural language, particularly Serbian. A perplexity-based dataset, the main asset for the ...Mihailo Škorić, Miloš Utvić, Ranka Stanković. "Transformer-Based Composite Language Models for Text Evaluation and Classification" in Mathematics, MDPI AG (2023). https://doi.org/10.3390/math11224660
-
The Effects of Multi-Word Tagging on Text Disambiguation
Utvić Miloš, Obradović Ivan, Krstev Cvetana, Vitas Duško. "The Effects of Multi-Word Tagging on Text Disambiguation" in Proceedings of the 29th International Conference on Lexis and Grammar, LGC 2010, September 2010, Belgrade, Serbia, D. Vitas and C. Krstev (eds.), Belgrade:Faculty of Mathematics, University of Belgrade (2010): 333-342
-
E-Dictionaries and Finite-State Automata for the Recognition of Named Entities
Krstev Cvetana, Vitas Duško, Obradović Ivan, Utvić Miloš. "E-Dictionaries and Finite-State Automata for the Recognition of Named Entities" in Proceedings of the 9th International Workshop on Finite State Methods and Natural Language Processing, FSMNLP 2011, July 2010, Blois, France, A. Maletti and M. Constant (eds.), :Association for Computational Linguistics (2011): 48-56
-
A System for Named Entity Recognition Based on Local Grammars
Krstev Cvetana, Obradović Ivan, Utvić Miloš, Vitas Duško. "A System for Named Entity Recognition Based on Local Grammars" in Journal of Logic and Computation 24 no. 2, :Oxford University Press (2014): 473-489. https://doi.org/10.1093/logcom/exs079
-
Towards ELTeC-LLOD: European Literary Text Collection Linguistic Linked Open Data
Овај рад описује студију случаја о генерисању повезаних података креираних на основу обечежених текстуалних корпуса коришћењем формата размене података у обради природних језика (NIF). Као основа за ово истраживање послужио је подскуп корпуса ELTeC, који се састоји од 900 романа из периода 1840-1920 за 9 европских језика. Верзија романа са коментарима, у такозваном TEI level-2 формату, трансформисана је у NIF, формат заснован на RDF/OWL који има за циљ постизање интероперабилности између алата за обраду природних језика, језичких ресурса и ...Ranka Stanković, Christian Chiarcos, Miloš Utvić, Olivera Kitanović. "Towards ELTeC-LLOD: European Literary Text Collection Linguistic Linked Open Data" in LDK 2023 – 4th Conference on Language, Data and Knowledge, 12-15 September in Vienna, Austria, Lisabon : NOVA FCSH - CLUNL (2023). https://doi.org/10.34619/srmk-injj
-
Automatic construction of a morphological dictionary of multi-word units
The development of a comprehensive morphological dictionary of multi-word units for Serbian is a very demanding task, due to the complexity of Serbian morphology. Manual production of such a dictionary proved to be extremely time-consuming. In this paper we present a procedure that automatically produces dictionary lemmas for a given list of multi-word units. To accomplish this task the procedure relies on data in e-dictionaries of Serbian simple words, which are already well developed. We also offer an evaluation ...electronic dictionary, Serbian, morphology, inflection, multiwordn units, noun phrases, query expansion... Obradović, Duško Vitas, Miloš Utvić Дигитални репозиторијум Рударско-геолошког факултета Универзитета у Београду [ДР РГФ] Automatic construction of a morphological dictionary of multi-word units | Cvetana Krstev, Ranka Stanković, Ivan Obradović, Duško Vitas, Miloš Utvić | Lecture Notes in Computer ...Cvetana Krstev, Ranka Stanković, Ivan Obradović, Duško Vitas, Miloš Utvić. "Automatic construction of a morphological dictionary of multi-word units" in Lecture Notes in Computer Science 6233, Advances in Natural Language Processing, Proceedings of the 7thInternational Conference on NLP, IceTAL 2010, Reykjavik, Iceland, August 2010, Springer (2010): 226-237. https://doi.org/10.1007/978-3-642-14770-8_26
-
On the compatibility of lexical resources for NooJ
Lexical resources for many languages are provided for the NooJ linguistic development environment. Meta-data descriptions of morphosyntactic and semantic properties of these languages and their resources are a mandatory part of each language module. In this paper we analyze how well the meta-data actually describe resources for a chosen subset of languages and to what extent are they compatible across languages to support multilingual processing. We show that there is place for improvement in both directions.... resources for NooJ Ranka Stanković, Miloš Utvić, Duško Vitas, Cvetana Krstev, Ivan Obradović Дигитални репозиторијум Рударско-геолошког факултета Универзитета у Београду [ДР РГФ] On the compatibility of lexical resources for NooJ | Ranka Stanković, Miloš Utvić, Duško Vitas, Cvetana Krstev, Ivan Obradović ...
... bg.ac.rs Proceedings of the 2011 International NooJ Conference 1 ON THE COMPATIBILITY OF LEXICAL RESOURCES FOR NOOJ RANKA STANKOVIĆ, MILOŠ UTVIĆ, DUŠKO VITAS, CVETANA KRSTEV AND IVAN OBRADOVIĆ Abstract Lexical resources for many languages are provided for the NooJ linguistic development ...
... Morphological Processing of Slavic Languages: EACL 2003, Budapest, Hungary, eds. T. Erjavec and D. Vitas, pp. 25-32 Obradović, I. Stanković, R., Utvić, M. 2008, “Integrisano okruženje za pripremu paralelizovanog korpusa” (An integrated environment for the preparation of aligned corpora), Zbornik ...Ranka Stanković, Miloš Utvić, Duško Vitas, Cvetana Krstev, Ivan Obradović. "On the compatibility of lexical resources for NooJ" in Automatic Processing of Various Levels of Linguistic Phenomena: Selected Papers from the 2011 International Nooj Conference, Cambridge Scholars Publishing (2012): 96-108
-
A Tool for Enhanced Search of Multilingual Digital Libraries of E-journals
This paper outlines the main features of Bibliša, a tool that offers various possibilities of enhancing queries submitted to large collections of TMX documents generated from aligned parallel articles residing in multilingual digital libraries of e-journals. The queries initiated by a simple or multiword keyword, in Serbian or English, can be expanded by Bibliša, both semantically and morphologically, using different supporting monolingual and multilingual resources, such as wordnets and electronic dictionaries. The tool operates within a complex system composed ...... Aleksandra Trtovac, Miloš Utvić Дигитални репозиторијум Рударско-геолошког факултета Универзитета у Београду [ДР РГФ] A Tool for Enhanced Search of Multilingual Digital Libraries of E-journals | Ranka Stanković, Cvetana Krstev, Ivan Obradović, Aleksandra Trtovac, Miloš Utvić | Proceedings of the 8th ...
... tool for enhanced search of multilingual digital libraries of e-journals Ranka Stanković, Cvetana Krstev, Ivan Obradović, Aleksandra Trtovac, Miloš Utvić University of Belgrade, Serbia Studenski trg 1, 11000 Belgrade E-mail: ranka@rgf.bg.ac.rs, cvetana@matf.bg.ac.rs, ivano@rgf.bg.ac.rs, aleksandra@unilib ...
... Serbian – Automata, Texts and Electronic dictionaries. Belgrade: Faculty of Philology, University of Belgrade. Obradović, I., Stanković, R., Utvić, M. (2008). An Integrated Environment for Development of Parallel Corpora (in Serbian). In: Die Unterschiede zwischen dem Bosnischen/Bosniakischen ...Ranka Stanković, Cvetana Krstev, Ivan Obradović, Aleksandra Trtovac, Miloš Utvić. "A Tool for Enhanced Search of Multilingual Digital Libraries of E-journals" in Proceedings of the 8th International Conference on Language Resources and Evaluation, LREC 2012, May 2012, Istanbul, Turkey, Istanbul, Turkey : European Language Resources Association (2012)
-
Machine Learning and Deep Neural Network-Based Lemmatization and Morphosyntactic Tagging for Serbian
The training of new tagger models for Serbian is primarily motivated by the enhancement of the existing tagset with the grammatical category of a gender. The harmonization of resources that were manually annotated within different projects over a long period of time was an important task, enabled by the development of tools that support partial automation. The supporting tools take into account different taggers and tagsets. This paper focuses on TreeTagger and spaCy taggers, and the annotation schema alignment ...... Krstev, Miloš Utvić, Mihailo Škorić Дигитални репозиторијум Рударско-геолошког факултета Универзитета у Београду [ДР РГФ] Machine Learning and Deep Neural Network-Based Lemmatization and Morphosyntactic Tagging for Serbian | Ranka Stanković, Branislava Šandrih, Cvetana Krstev, Miloš Utvić, Mihailo Škorić ...Ranka Stanković, Branislava Šandrih, Cvetana Krstev, Miloš Utvić, Mihailo Škorić. "Machine Learning and Deep Neural Network-Based Lemmatization and Morphosyntactic Tagging for Serbian" in Proceedings of the 12th Language Resources and Evaluation Conference, May Year: 2020, Marseille, France, European Language Resources Association (2020)
-
Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса
У раду се разматра хибридни приступ претрази корпуса, илустрован на примеру алатки OCWB и NoSketch Engine, примењених на специјални корпус из области рударства (РудКор) и Корпус савременог српског језика (СрпКор). Разматрани приступ комбинује постојеће могућности алатки OCWB и NoSketch Engine, које своју претрагу заснивају на лингвистичкој анотацији корпуса, са новим могућностима претраге у виду консултовања екстерних језичких ресурса (морфолошки електронски речници српског језика и лексичка база података Српски ворднет). Хибридни приступ је реализован надоградњом вебсучеља која поменуте алатке користе ...... докторска дисерта- ција, Београд: Универзитет у Београду, Рударско-геолошки факултет). Утвић 2011: Милош Утвић, „Анотација Kорпуса савременог српског јези- ка”, инФотека, 12/2, 39–51. Утвић 2014а: Miloš Utvić, Izgradnja referentnog korpusa savremenog srpskog jezika (neobjavljena doktorska disertacija ...
... https://fedorabg.bg.ac.rs/fedora/get/o:10061/bdef:Con- tent/download. Утвић 2014б: Милош В. Утвић, „Листе учестаности Корпуса савременог ср- пског језика”, научни састанак слависта у вукове дане, 43/3, 241–262. Утвић и др. 2018: Милош В. Утвић, Иван М. Обрадовић, Ранка М. Станковић, Александра Ђ. Томашевић ...
... веб-сервиса Милош Утвић, Ранка Станковић, Александра Томашевић, Михаило Шкорић, Биљана Лазић Дигитални репозиторијум Рударско-геолошког факултета Универзитета у Београду [ДР РГФ] Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса | Милош Утвић, Ранка Станковић, ...Милош Утвић, Ранка Станковић, Александра Томашевић, Михаило Шкорић, Биљана Лазић. "Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса" in Научни састанак слависта у Вукове дане - Vol. 48/3 Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch12
-
Managing mining project documentation using human language technology
Purpose: This paper aims to develop a system, which would enable efficient management and exploitation of documentation in electronic form, related to mining projects, with information retrieval and information extraction (IE) features, using various language resources and natural language processing. Design/methodology/approach: The system is designed to integrate textual, lexical, semantic and terminological resources, enabling advanced document search and extraction of information. These resources are integrated with a set of Web services and applications, for different user profiles and use-cases. Findings: The ...Digital libraries, Information retrieval, Data mining, Human language technologies, Project documentationAleksandra Tomašević, Ranka Stanković, Miloš Utvić, Ivan Obradović, Božo Kolonja . "Managing mining project documentation using human language technology" in The Electronic Library (2018). https://doi.org/10.1108/EL-11-2017-0239