Претрага
1026 items
-
Praktikum za vežbe iz Informatike 1
Ranka Stanković, Ivan Obradović, Olivera Kitanović, Mirjana Banković. Praktikum za vežbe iz Informatike 1, Beograd : Univerzitet u Beogradu, Rudarsko-geološki fakultet, 2014
-
Development and Evaluation of Three Named Entity Recognition Systems for Serbian - The Case of Personal Names
In this paper we present a rule- and lexicon-based system for the recognition of Named Entities (NE) in Serbian news paper texts that was used to prepare a gold standard annotated with personal names. It was further used to prepare training sets for four different levels of annota tion, which were further used to train two Named Entity Recognition (NER) sys tems: Stanford and spaCy. All obtained models, together with a rule- and lexicon based system were evaluated on ...... SRPNER achieved the best precision, in all cases (except one) STANFORD NER achieved the best recall, 1065 SPACY NER SRPNER STANFORD NER model P R F1 P R F1 P R F1 S T U D E N T S PERS_1 0.804 0.827 0.815 0.857 0.847 0.852 0.729 0.887 0.800 PERS_3 0.815 0.807 0.811 0.837 0.827 0.832 0.748 0.873 0.806 ...
... sults, on texts coming from different sources they obtained the following results: for Croatian P = 0.91, R = 0.93 and F1 = 0.92, higher than STANFORD NER for the model PERS_1, and for Slovene P = 0.82, R = 0.87 and F1 = 0.84, comparable with STANFORD NER for the model PERS_1 (Table 6). One should note, however ...
... approximately the same number of personal names as our both sets – around 900. Their results were for STANFORD NER P = 0.72, R = 0.87 and F1 = 0.79, and for SPACY NER P = 0.73, R = 0.73 and F1 = 0.73. Our re- sults are comparable in the sense that they also show that STANFORD NER achieves the best re- ...Branislava Šandrih, Cvetana Krstev, Ranka Stanković. "Development and Evaluation of Three Named Entity Recognition Systems for Serbian - The Case of Personal Names" in Proceedings - Natural Language Processing in a Deep Learning World, Incoma Ltd., Shoumen, Bulgaria (2019). https://doi.org/10.26615/978-954-452-056-4_122
-
Употреба веб платформе Омека за дигиталне библиотеке из домена рударства
У овом раду биће представљена Омека, веб платформа за приказивање дигиталних колекциjа и систем за управљање њиховим садржаjем. Њену примену у области техничких наука, а конкретно у области рударства, приказаћемо на примеру дигиталне библиотеке ROmeka@RGF. За Омеку смо се определили првенствено због чињенице да jе jедноставна за коришћење, има обимну пратећу документациjу и не захтева уско специфичне информатичке вештине што jе чини приступачном за већину корисника, а нарочито за рударске инжењере, коjима jе ова дигитална библиотека првенствено намењена. Документа ...... Conference on Language Resources and Evaluation, LREC, 507–514, 2016. http://www. lrec-conf.org/proceedings/lrec2016/pdf/1033_Paper.pdf Stanković, Ranka М. “Modeli ekspanzije upita nad tekstuelnim resursima”. Doktorska disertacija. Univerzitet u Beogradu, Matematički fakultet, 2009. 50 Инфотека, год. 17 ...Александра Томашевић, Биљана Лазић, Далибор Воркапић, Михаило Шкорић, Љиљана Колоња. "Употреба веб платформе Омека за дигиталне библиотеке из домена рударства" in Инфотека, Филолошки факултет, Универзитет у Београду; Универзитетска библиотека „Светозар Марковић“; Заједница библиотека универзитета у Србији (2017)
-
Extraction of Bilingual Terminology Using Graphs, Dictionaries and GIZA++
Branislava Šandrih, Ranka Stanković (2020)U nauci, industriji i mnogim istraživačkim oblastima, terminologija se brzo razvija. Najčešće, jezik koji je „lingua franca“ za većinu ovih oblasti je engleski. Kao posledica toga, za mnoga polja termini domena su koncipirani na engleskom, a kasnije se prevode na druge jezike. U ovom radu predstavljamo pristup za automatsko izdvajanje dvojezične terminologije za englesko-srpski jezički par koji se oslanja na usaglašeni dvojezični korpus domena, ekstraktor terminologije za ciljni jezik i alat za usklađivanje delova. Ispitujemo performanse metode na domenu ...... from the computer science. In Serbian, this term is either translated as snimak Infotheca Vol. 19, No. 2, December 2019 119 Šandrih B., Stanković R., “Extraction of Bilingual . . . ”, pp. 119–138 ekrana (namely, a photo of a current state of the screen) or as a “skrinšot” (i.e, the word is transcribed) ...
... (Garab́ık and Dimitrova, 2015) and Italian- Arabic (Fawi and Delmonte, 2015). Infotheca Vol. 19, No. 2, December 2019 121 Šandrih B., Stanković R., “Extraction of Bilingual . . . ”, pp. 119–138 In several cases, the bilingual lists of MWTs were compiled in order to im- prove statistical machine ...
... application drawn out from the European project TTC Terminology Extraction 5 TermEx Infotheca Vol. 19, No. 2, December 2019 123 Šandrih B., Stanković R., “Extraction of Bilingual . . . ”, pp. 119–138 This list can be either an external resource from the same domain or obtained from the text. The only ...Branislava Šandrih, Ranka Stanković. "Extraction of Bilingual Terminology Using Graphs, Dictionaries and GIZA++" in Infotheca, Faculty of Philology, University of Belgrade (2020). https://doi.org/10.18485/infotheca.2019.19.2.6
-
Bridging Computational Lexicography and Corpus Linguistics: A Query Extension for OntoLex-FrAC
OntoLex, dominantni standard zajednice za mašinski čitljive leksičke resurse u kontekstu RDF-a, Linked Data i tehnologija Semantičkog veba, trenutno se proširuje sa posebnim modulom za Frekvencije, Primere i Informacije zasnovane na Korpusu (OntoLex-FrAC). Predlažemo novi komponent za OntoLex-FrAC, koji se bavi inkorporacijom korpusnih upita za (a) povezivanje rečnika sa korpusnim mašinama, (b) omogućavanje RDF baziranih web servisa da dinamički razmenjuju korpusne upite i podatke odgovora, i (c) korišćenje konvencionalnih upitačkih jezika za formalizaciju unutrašnje strukture kolokacija, skica reči i ...standardizacija, digitalna leksikografija, OntoLex, upiti korpusa, povezani podaci, Lingvistički povezani otvoreni podaciChristian Chiarcos, Ranka Stanković, Maxim Ionov, Gilles Sérasset. "Bridging Computational Lexicography and Corpus Linguistics: A Query Extension for OntoLex-FrAC" in Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), Turin, 20-25 May 2024, LREC (2024)
-
Developing Termbases for Expert Terminology under the TBX Standard
... ❣❡♦❧♦❣②✮✱ ❛♥❞ r❡❧❛t❡❞ ❝♦♥❝❡♣ts ♣♦❥❛✈❛ ♠✐♥❡r❛❧♥✐❤ s✐r♦✈✐♥❛ ✭♦❝❝✉r❡♥❝❡ ♦❢ ♠✐♥❡r❛❧ r❡s♦✉r❝❡✮✱ r✉❞♥♦ t❡❧♦ ✭♦r❡ ❜♦❞②✮ ✐ r✉❞❛ ✭♦r❡✮✳ ❘❡❧❛t❡❞ ♥❛rr♦✇❡r ❝♦♥✲ ❝❡♣ts ❛r❡ ❛❧s♦ r❡♣r❡s❡♥t❡❞✿ ❧❡➸✐➨t❡ ♠❡t❛❧✐↔♥✐❤ ♠✐♥❡r❛❧♥✐❤ s✐r♦✈✐♥❛✱ ❧❡➸✐➨t❡ ♥❡♠❡✲ t❛❧✐↔♥✐❤ ♠✐♥❡r❛❧♥✐❤ s✐r♦✈✐♥❛✱ ❧❡➸✐➨t❡ ❡♥❡r❣❡ts❦✐❤ ♠✐♥❡r❛❧♥✐❤ s✐r♦✈✐♥❛ ✭❞❡♣♦s✐ts ...
... t❤❡ r❡q✉✐r❡❞ t❡r♠✐♥♦❧♦❣② ❛r❡ t②♣✐✲ ❝❛❧❧② ❧❛r❣❡✳ ❚❤❡r❡❢♦r❡✱ ✐♥t❡❣r❛t✐♥❣ r❡❧❛t❡❞ t❡r♠✐♥♦❧♦❣② ✐♥t♦ ❛ tr❛♥s❧❛t✐♦♥ ♣✐♣❡❧✐♥❡ s❤♦✉❧❞ ❜❡ ❡①♣❧♦r❡❞ ❬✶✼❪✳ ❚❤✐s ❛♣♣r♦❛❝❤ r❡q✉✐r❡s ❛ ♣r♦❝❡ss t❤❛t ✐s ❛s ❛✉t♦♠❛t❡❞ ❛s ♣♦ss✐❜❧❡✳ ❲✐t❤ t❡r♠ ❡①tr❛❝t✐♦♥ ❛s ✐ts ❝♦r♥❡rst♦♥❡✱ ✐t r❡q✉✐r❡s ❛ ♣♦st✲♣r♦❝❡ss✐♥❣ str❛t❡❣② t❤❛t r❡♣✉r♣♦s❡s ...
... ❉❡✈❡❧♦♣✐♥❣ ❚❡r♠❜❛s❡s ✉♥❞❡r t❤❡ ❚❇❳ ❙t❛♥❞❛r❞ ✶✸ ❛r❡ st✐❧❧ ❜♦✉♥❞ t♦ ♠❛✐♥t❛✐♥ t❤❡✐r ✐♠♣♦rt❛♥❝❡ ✐♥ t❤❡ ❝❛s❡ ♦❢ ❡①♣❡rt t❡r♠✐♥♦❧♦❣② ✐♥ ❞♦♠❛✐♥s ✇❤❡r❡ ❛❧✐❣♥❡❞ ❝♦r♣♦r❛ ❛r❡ s♣❛rs❡ ❬✶✵❪✱ s✉❝❤ ❛s✱ ❢♦r ❡①❛♠♣❧❡ ♠✐♥✐♥❣ ❡♥❣✐♥❡❡r✐♥❣ ♦r ❣❡♦❧♦❣②✳ ■♥ ♦r❞❡r t♦ s❡❝✉r❡ t❡r♠✐♥♦❧♦❣✐❝❛❧ ❝♦♥s✐st❡♥❝② ✐♥ ♦♥❡ ♦r ♠♦r❡ t❡r♠❜❛s❡s✱ ❛♥❞ ...Ranka Stanković, Ivan Obradović, and Miloš Utvić. "Developing Termbases for Expert Terminology under the TBX Standard" in Natural Language Processing for Serbian - Resources and Applications, Belgrade : University of Belgrade, Faculty of Mathematics (2014)