Претрага
119 items
-
Electronic Dictionaries - from File System to lemon Based Lexical Database
In this paper we discuss some well-known morphological descriptions used in various projects and applications (most notably MULTEXT-East and Unitex) and illustrate the encountered problems on Serbian. We have spotted four groups of problems: the lack of a value for an existing category, the lack of a category, the interdependence of values and categories lacking some description, and the lack of a support for some types of categories. At the same time, various descriptions often describe exactly the same ...... the maintenance of dictionaries of inflected word forms is very important. For instance, inflected forms of jezik are: jezik, jezika, jeziku, jeziče, jezikom, jezici, jezike, jezicima. In the model presented, the table Forms is used to store all forms that are inflected from a lemma, together ...
... use. For instance, the lexi- cal entry jezik ’language, tongue’ has three different senses (presently recorded in SMD), and their textual representa- tion in DELA format is: jezik,N9+DOM=Ling//communication media jezik,N9+Conc+Body+DOM=Anatomy//body part jezik,N9+Conc+Food+Prod+DOM=Culinary//food ...
... (simplified): maternji jezik +DOM=Ling ‘mother tongue’ jezik za zube +DOM=Anatomy ‘tongue behind teeth (keep mouth shut)’ teleći jezik +DOM=Culinary ‘veal tongue’ The same example in the lemon form is: lex_jezik a ontolex:LexicalEntry; lexinfo:partOfSpeech lexinfo:Noun; jezik ontolex:morphologicalPattern ...Ranka Stanković, Cvetana Krstev, Biljana Lazić, Mihailo Škorić. "Electronic Dictionaries - from File System to lemon Based Lexical Database" in Proceedings of the 11th International Conference on Language Resources and Evaluation - W23 6th Workshop on Linked Data in Linguistics : Towards Linguistic Data Science (LDL-2018), LREC 2018, Miyazaki, Japan, May 7-12, 2018, European Language Resources Association (ELRA) (2018)
-
Towards ELTeC-LLOD: European Literary Text Collection Linguistic Linked Open Data
Овај рад описује студију случаја о генерисању повезаних података креираних на основу обечежених текстуалних корпуса коришћењем формата размене података у обради природних језика (NIF). Као основа за ово истраживање послужио је подскуп корпуса ELTeC, који се састоји од 900 романа из периода 1840-1920 за 9 европских језика. Верзија романа са коментарима, у такозваном TEI level-2 формату, трансформисана је у NIF, формат заснован на RDF/OWL који има за циљ постизање интероперабилности између алата за обраду природних језика, језичких ресурса и ...Ranka Stanković, Christian Chiarcos, Miloš Utvić, Olivera Kitanović. "Towards ELTeC-LLOD: European Literary Text Collection Linguistic Linked Open Data" in LDK 2023 – 4th Conference on Language, Data and Knowledge, 12-15 September in Vienna, Austria, Lisabon : NOVA FCSH - CLUNL (2023). https://doi.org/10.34619/srmk-injj
-
Srbija u OneGeology Europe
Геолошки завод Србије као носилац Пројекта ОneGeologyEurope заједно са Рударско геолошким факултетом и Министарством за природне ресурсе, рударство и просторно планирање су се укључили у међународни Пројекат OneGeology Europe у мају 2013. године у већ поодмаклој фази израде Пројекта. До краја 2013. године испунили су завршене активности које треба да доведу до пуноправног укључења у Пројекат чиме је Република Србија нашла своје место на Геолошкој карти Европе 1:1М. Геолошка карта Србије 1:1М представља компилациону односно поједностављену верзију ОГК 1:500 ...... појма и релације са другим речничким одредницама. Остали језици сваку речничку одредницу преводе на национални језик, при чему се јединствена шифра задржава и има улогу стожера, односно јединственог идентификатора појма на свим језицима базе 1G-E. Његово коришћење је обавеза за све учеснике 1G-E ...
... односно национални добављач података, је добила листу термина на енглеском језику које је преводила на матерњи језик један на један, тако да се интегрисањем свих упарених термина омогућило описивање скупова података на свим језицима учесника пројекта. Кроз раније активности иницијативе 1G-E урађен је геолошки ...
... .sld. Након попуњавања вишејезичне терминолошке база података (листа термина на енглеском језику коју је свака земља учесница преводила на национални језик) имплементиран је интерфејс и на српском језику. То значи да сви заинтересовани корисници уласком на званични сајт оne.geology.org избором српске ...Danka Blagojević, Ranka Stanković, Petar Stejić, Velizar Nikolić. "Srbija u OneGeology Europe" in Zapisnici Srpskog geološkog društva za 2013. godinu, Beograd : Srpsko geološko društvo (2014)
-
Possibilities of retro-digitalized German-Serbian Mining Dictionary
U radu će biti prikazan opis procesa retrodigitalizacije dvojezičnog Nemačko-srpskog rudarskog rečnika iz 1923. godine čiji je autor rudarski inženjer Dragutin Stepanović (Степановић, 1923). Ovaj rečnik je zasnovan na skoro 4 000 leksičkih zapisa koji su prevodilački ekvivalenti ili uputnice. Umesto predgovora autor daje uvid u svoje pismo upućeno “Ministru šuma i rudnika” u kome piše o nameri da zabeleži reči koje se koriste u narodu kako bi izbegao upotrebu nemačkih reči. Iako broj odrednica nije toliko veliki, rečnik ...Biljana Lazić, Olivera Kitanović, Ivan Obradović. "Possibilities of retro-digitalized German-Serbian Mining Dictionary" in E-dictionaries and E-lexicography, Zagreb, 10-11 May 2019, Zagreb : Institut za hrvatski jezik i jezikoslovlje (2019)
-
English for Geology Students. 2
Lidija Beko (2023)... available at: www.dr.rgf.bg.ac.rs Odd ViICl | SANSTILS AO 1049 » HOt TON Lidija Beko ENGLISH FOR GEOLOGY STUDENTS Lidija Beko ENGLESKI JEZIK ZA GEOLOGE Publisher The Faculty of Mining and Geology, Đušina 7, Belgrade www.rgf.bg.ac.rs For the publisher dr Biljana Abolmasov, dean ...Lidija Beko. English for Geology Students. 2, Belgrade : The Faculty of Mining and Geology, 2023
-
English for Geology Students 2 - Dyslexia friendly
Lidija Beko (2023)Lidija Beko. English for Geology Students 2 - Dyslexia friendly, Belgrade : The Faculty of Mining and Geology, 2023
-
Ontološki model upravljanja rizikom u rudarstvu
Olivera Kitanović (2021)Rudarska proizvodnja obuhvata kompleksne tehnološke sisteme, što nameće potrebu za uspostavljanjem i unapređivanjem sistema upravljanja rizikom. Heterogenost i obim podataka neophodnih za upravljanje rizikom zahtevaju sistem koji ih na fleksibilan način integriše i omogućava njihovo optimalno korišćenje. Osnovni cilj ove disertacije je razvoj ontologije za domen rudarstva i na njoj zasnovanog modela za upravljanje rizikom. Njegova realizacija podrazumeva i implementaciju algoritama ekstrakcije informacija za popunjavanje ontologije, kao i odgovarajuće softversko rešenje. Razvoj modela obuhvata i značajno proširenje rudarskog korpusa, kao ...rudarstvo, rizik, upravljanje rizikom, procena rizika, ontologija, semantička mreža, ekstrakcija informacija, upravljanje znanjem, računarska lingvistika... prirodnog jezika (NLP): metoda konačnih automata (Gross 1987) i upitni jezik CQL (eng. Corpus Query Language) zasnovan na podudaranju obrazaca u sistemu za upravljanje velikim količinama tekstualnih podataka CQP (eng. Corpus Query Processor) (Evert 2005). Tehnikama obrade prirodnog jezika su ekstrahovani ...
... zaštitom na radu u rudarstvu (Kolonja 2016). RudOnto sadrži blizu 7.000 termina na srpskom jeziku, oko 1200 prevedenih termina na engleskom jeziku, kao i neznatan broj na francuskom, ruskom i drugim jezicima. Određeni broj termina ima pridružene sinonime, a osim korišćenja za pronalaženje informacija ...
... logika podrazumeva semantičku mrežu i konceptualni graf, kao i jezike za predstavljanje znanja sa formalnom sintaksom i pravilima zaključivanja za izvođenje semantički validnih rezultata. Jezik semantičkih veb pravila (SWRL) je dodatak jeziku OWL, koji se koristi za definisanje pravila i rezonovanje nad ...Olivera Kitanović. Ontološki model upravljanja rizikom u rudarstvu, Beograd : [O. Kitanović], 2021
-
Употреба веб платформе Омека за дигиталне библиотеке из домена рударства
У овом раду биће представљена Омека, веб платформа за приказивање дигиталних колекциjа и систем за управљање њиховим садржаjем. Њену примену у области техничких наука, а конкретно у области рударства, приказаћемо на примеру дигиталне библиотеке ROmeka@RGF. За Омеку смо се определили првенствено због чињенице да jе jедноставна за коришћење, има обимну пратећу документациjу и не захтева уско специфичне информатичке вештине што jе чини приступачном за већину корисника, а нарочито за рударске инжењере, коjима jе ова дигитална библиотека првенствено намењена. Документа ...... текстуелних ресурса се могу класификовати у две категориjе: – општи, коjи не зависе од jезика и – проблеми коjи су специфични за поjедини jезик или групу jезика. Проблем при претраживању текстова на српском jезику представљаjу различите кодне шеме као и постоjање два алфабета (ћириличног и латиничног) ...
... ROmeka@RGF описана jе у одељку 4., а у одељку 5. приказане су могућности претраживања похрањених текстуалних ресурса уз коришћење алата и ресурса за српски jезик. Могућности имплементациjе ТЕI смерница4 дате су у одељку 6., док су у одељку 7. дати закључци и идеjе за даљи развоj. 2. Веб платформа Омека За израду ...
... Омека...“, стр. 27–51 веб (HTTP) сервера Apache, система за управљање базама података MySQL (верзиjа 5.0 или новиjа) и интерпретатора програмског jезика PHP (верзиjа 5.3.2 или новиjа). Дистрибуциjе оперативног система Linux, на коjима Омека стабилно ради, су: Fedora, OpenSuse и Ubuntu. ROmeka@RGF jе ...Александра Томашевић, Биљана Лазић, Далибор Воркапић, Михаило Шкорић, Љиљана Колоња. "Употреба веб платформе Омека за дигиталне библиотеке из домена рударства" in Инфотека, Филолошки факултет, Универзитет у Београду; Универзитетска библиотека „Светозар Марковић“; Заједница библиотека универзитета у Србији (2017)
-
Praktikum iz depozicionih sistema
Dejan Radivojević (2020)Dejan Radivojević. Praktikum iz depozicionih sistema, Beograd : Univerzitet u Beogradu, Rudarsko-geološki fakultet, 2020
-
Parallel Bidirectionally Pretrained Taggers as Feature Generators
In a setting where multiple automatic annotation approaches coexist and advance separately but none completely solve a specific problem, the key might be in their combination and integration. This paper outlines a scalable architecture for Part-of-Speech tagging using multiple standalone annotation systems as feature generators for a stacked classifier. It also explores automatic resource expansion via dataset augmentation and bidirectional training in order to increase the number of taggers and to maximize the impact of the composite system, which ...Ranka Stanković, Mihailo Škorić, Branislava Šandrih Todorović. "Parallel Bidirectionally Pretrained Taggers as Feature Generators" in Applied Sciences, MDPI AG (2022). https://doi.org/10.3390/app12105028
-
Corpus-based bilingual terminology extraction in the power engineering domain
Ovaj rad predstavlja resurse i alate koji se koriste za ekstrkciju i evaluaciju dvojezične, englesko-srpske terminologije u domenu energetike. Resursi se sastoje od postojeće opšte i domenske leksike i domenskog paralelnog korpusa; alati uključuju ekstraktore termina za oba jezika i alat za poravnavanje segmenata koji pripadaju korpusnim rečenicama. Sistem je testiran variranjem funkcije podudaranja koja utvrđuje prisustvo ekstrahovanog termina u poravnatom segmentu (odsečak), u rasponu od veoma labavog do strogog. Procena rezultata je pokazala da je preciznost izdvajanja termina ...Tanja Ivanović, Ranka Stanković, Branislava Šandrih Todorović, Cvetana Krstev. "Corpus-based bilingual terminology extraction in the power engineering domain" in Terminology, John Benjamins Publishing Company (2022). https://doi.org/10.1075/term.20038.iva
-
Football terminology: compilation and transformation into OntoLex-Lemon resource
У овом раду представља се пројекат који је у развоју, креирање првог дигиталног фудбалског речника на српском језику, као и да демонстрација примене модела OntoLex и љегових модула. OntoLex-FrAC модул укључује информације о учесталости и примерима употребе екстрахованих из корпуса. У овом случају, креиран је корпус за специфичан домен под називом СрФудКо, који садржи чланке вести о фудбалу на српском језику. Вишечлани термини аутоматски су екстраховани из српског корпуса, а затим ручно евалуирани и класификовани као спортски или ...Jelena Lazarević, Ranka Stanković, Mihailo Škorić, Biljana Rujević. "Football terminology: compilation and transformation into OntoLex-Lemon resource" in LDK 2023 – 4th Conference on Language, Data and Knowledge, 12-15 September in Vienna, Austria, Lisabon : NOVA FCSH - CLUNL (2023). https://doi.org/10.34619/srmk-injj
-
Развој геолошког информационог система Републике Србије
Геолошки информациони систем Србије (ГеолИСС) је пројектован, првенствено, са намером ефикасног дигиталног архивирања геолошких и њима сродних података. У овом раду је приказана структура базе података као основа за развој геолошки конципираног ГИС-а. Нови, објектно орјентисани (О-О) начин моделирања омогућио је дефинисање самосталних типова објеката, хијерархијски повезаних кроз тополошке и друге релације, чиме је обезбеђена њихова медјусобна интеракција. Објектно оријентисано моделирање извршено је коришћењем унифицираног језика моделирања (UML) и CASE алата, кроз концептуални и логички ниво. Физички модел ће ...... оријентисано моделирање извршено је коришћењем унифицираног језика моделирања (UML) и CASE алата, кроз концептуални и логички ниво. Физички модел ће бити имплементиран на ESRI ArcGIS технологији у Geodatabase формату, а формат размене у XML језику (Exetensible Markup Language). Адекватан методолошки ...
... логички модел, што је у овом случају подразумевало транслацију у објектно-орјентисан репозиториј. Транслација је урађена коришћењем ESRI klasа и UML jезика (Unified Modeling Language; Rumbaugh et al. 1999). Избор објектно-орјентисане технологије издиктиран је потребом грађења архитектуре за архивирање ...Бранислав Благојевић, Бранислав Тривић, Ненад Бањац, Ранка Станковић, Велизар Николић. "Развој геолошког информационог система Републике Србије" in 14. конгрес геолога Србије и Црне Горе са међународним учешћем, Нови Сад, 18-20. октобар 2005, Cpпско геолошко друштво и Caвeз геолошких друштава Србије и Црне Горе (2005)
-
The Dictionary of the Serbian Academy: from the Text to the Lexical Database
In this paper we discuss the project of digitization of the Dictionary of the Serbo-Croatian Standard and Vernacular Language. Scanning and character recognition were a particular challenge, since various non-standard character set encoding was used in the course of the almost 60-year long production of the dictionary. The first aim of the project was to formalize the micro-structure of the dictionary articles in order to parse the digitized text of and transform it into structured data stored in relational lexical database. This approach ...... Sabo, O., Vitas, D. (1998). Mogućnost osavremenjivanja izrade rečnika na primeru Rečnika srpskohrvatskog kn- jiževnog i narodnog jezika SANU i Instituta za srpskohrvatski jezik. In IV međunarodni naučni skup „Računar- ska obrada jezičkih podataka”, Portorož: Institut Jožef Stefan, pp. 375–384. [Possibility ...
... Dictionary) (in Cyrillic)] Stijović, R. (2018). Građa Rečnika SANU – blago koje treba sačuvati (o digitalizaciji listića), In Naš jezik XLVI- II/3–4, Beograd: Institut za srpski jezik SANU, pp. 201–207. [The structure of the Dictionary of the SANU - the goods to be preserved (on the digitization of the leaflets) ...
... microstructure of the SASA Dictionary (in Cyrillic)] Vitas D., Krstev C. (2015) Nacrt za informatizovani rečnik srpskog jezika, In Naučni sastanak slavista u Vukove dane - Srpski jezik i njegovi resursi: teorija, opis i primene, Vol. 44/3, Međunarodni slavistički centar, Beograd, pp. 105-116. [Blueprint ...Ranka Stanković, Rada Stijović, Duško Vitas, Cvetana Krstev, Olga Sabo. "The Dictionary of the Serbian Academy: from the Text to the Lexical Database" in Proceedings of the XVIII EURALEX International Congress: Lexicography in Global Contexts, Ljubljana : Ljubljana University Press, Faculty of Arts (2018)
-
Vebran Web Services for Corpus Query Expansion
Ranka Stanković, Miloš Utvić (2020)U ovom radu se govori o razvoju veb usluga Vebran i njihovoj primeni u poboljšanju pretraživanja korpusa. Veb-servisi Vebran koriste se za konsultovanje spoljnih leksičkih izvora za srpski jezik (uglavnom elektronski morfološki rečnici i srpski Vordnet) i proširivanje korisničkih upita radi dobijanja relevantnijih rezultata iz srpskih korpusa.... “Vebran Web Service . . . ”, pp. 99–118 Утвић, Милош. “Анотациjа Корпуса савременог српског jезика”. Инфотека Vol. XII, no. 2 (2011): 39–51 Utvić, Miloš. “Izgradnja referentnog korpusa savremenog srpskog jezika”. Phdthesis, Univerzitet u Beogradu, Filološki fakultet, Beograd, 2014, accessed August 1 ...
... orabg.bg.ac.rs/fedora/get/o: 10061/bdef:Content/download Утвић, Милош. “Листе учестаности Корпуса савременог српског jезика”. In Научни састанак слависта у Вукове дане. Српски jезик и његови ресурси: теориjа, опис и примене. 3/43. научни састанак слависта у Вукове дане, Београд, 12-15. IX 2013., Милановић ...
... Обрадовић, Ранка М. Станковић, Александра Ђ. Томашевић and Биљана Ђ. Лазић. “Изградња специjалних корпуса савременог српског jезика на примеру корпуса из области рударства”. In Српски jезик и његови ресурси: теориjа, опис и примене. 3/47. научни састанак слависта у Вукове дане, Београд, 2017., Ћорић, Б. and ...Ranka Stanković, Miloš Utvić. "Vebran Web Services for Corpus Query Expansion" in Infotheca, Faculty of Philology, University of Belgrade (2020). https://doi.org/10.18485/infotheca.2019.19.2.5
-
Репозиторијум дигиталних идентификатора објеката – доиФил: изградња, стање и перспективе
Милош Утвић, Михаило Шкорић (2017)Филолошки факултет Универзитета у Београду је крајем јула 2015. године склопио уговор са агенцијом Crossref и тиме стекао право да својим публикацијама додељује дигитални идентификатор објекта (DOI), као и публикацијама других издавача које заступа. Истовремено, у склопу уговора, Филолошки факултет је развио репозиторијум доиФил који за све регистроване публикације чува њихове библиографске метаподатке, хипервезу ка комплетном тексту и сам DOI. После припремних радњи и разраде процеса на којима је заснован рад репозиторијума, у новембру 2016. године је репозиторијум доиФил ...... у часопису (само број без тачке). URL URL комплетног текста (PDF). Language језик на коме је чланак написан. Спецификација за формат BibTeX даје преглед дозвољених вредности за ово поље. Обратите пажњу да се назив језика увек пише малим словом без обзира на енглески правопис. Doi DOI чланка. За Филолошки ...
... формата BibTeX у формат Crossref/ XML је имплементиран у програмском језику C#17, док је софтвер за аутоматско генерисање приступних страница публикације на основу њених метаподатака написан као комбинација различитих програм- ских језика и веб технологија: PHP, HTML, CSS, JavaScript, XML, Xpath и XSLT ...
... фази фокус буде на чланцима часописа чији је издавач факултет. Изабрано 80 BIBLIOINFO је неколико часописа са очигледним разликама у коришћењу језика и писма, нумерацији свезака итд, како би се предупредили евентуални изузеци. Идеја је била да се процес припрема за регистрацију чланака неколико ...Милош Утвић, Михаило Шкорић. "Репозиторијум дигиталних идентификатора објеката – доиФил: изградња, стање и перспективе" in Научна конференција Библиоинфо — 55 година од покретања наставе библиотекарства на високошколском нивоу, Београд 18. мај 2017., Филолошки факултет Универзитета у Београду (2017). https://doi.org/10.18485/biblioinfo.2017.ch7
-
SASA Dictionary as the Gold Standard for Good Dictionary Examples for Serbian
Ranka Stanković, Branislava Šandrih, Rada Stijović, Cvetana Krstev, Duško Vitas, Aleksandra Marković (2019)У овом раду представљамо модел за избор добрих примера за речник српског језика и развој иницијалних компоненти модела. Метода која се користи заснива се на детаљној анализи различитих лексичких и синтактичких карактеристика у корпусу састављених од примера из пет дигитализованих свезака речника САНУ. Почетни скуп функција био је инспирисан сличним приступом и за друге језике. Дистрибуција карактеристика примера из овог корпуса упоређује се са карактеристиком дистрибуције узорака реченица ексцерпираних из корпуса који садрже различите текстове. Анализа је показала да ...Српски, добри примери из речника, аутоматизација израде речника, издвајање својстава, Машинско учење... osavremenjivanja izrade rečnika na primeru 268 Proceedings of eLex 2019 Rečnika srpskohrvatskog književnog i narodnog jezika SANU i Instituta za srpskohrvatski jezik. In IV međunarodni naučni skup „Računarska obrada jezičkih podataka”, Portorož: Institut Jožef Stefan, pp. 375–384 [Possibility ...
... for Serbo-Croatian]. SASA Dictionary: Речник српскохрватског књижевног и народног језика САНУ, I–XX (The Dictionary of the Serbo-Croatian Standard and Vernacular Language) (1959–2017). Београд: Институт за српски језик САНУ и САНУ. Stanković, R., Krstev, C., Vitas, D., Vulović, N. & Kitanović, O. ...
... [Izgradnja referentnog korpusa savremenog srpskog jezika] (Doctoral dissertation, University of Belgrade). Vitas D. & Krstev C. (2015). Blueprint for the computerized dictionary of the Serbian language [Nacrt za informatizovani rečnik srpskog jezika]. Naučni sastanak slavista u Vukove dane, 44(3) ...Ranka Stanković, Branislava Šandrih, Rada Stijović, Cvetana Krstev, Duško Vitas, Aleksandra Marković. "SASA Dictionary as the Gold Standard for Good Dictionary Examples for Serbian" in Electronic lexicography in the 21st century. Proceedings of the eLex 2019 conference , Lexical Computing CZ, s.r.o. (2019)
-
Увођење доменских и семантичких маркера за област рударства у српске електронске речнике
... српске електронске речнике | Иван Обрадовић, Александра Томашевић, Ранка Станковић, Биљана Лазић | Научни састанак слависта у Вукове дане - Српски језик и његови ресурси: теорија, опис и примене | 2017 | | 10.18485/msc.2017.46.3.ch10 http://dr.rgf.bg.ac.rs/s/repo/item/0002015 Дигитални репозиторијум ...
... семантичке класе информација. У овом раду посебна пажња је посвећена текстовима из једног специфичног техничког домена, конкретно рударства. За српски језик је развијен систем за препознавање именованих ентитета (Крстев и др., 2013), заснован на правилима, који ус- пешно препознаје различите типове именованих ...
... м аутомата са сложенијим захтевима. Пример истраживања у коме су коришћени маркери у циљу екстракције глагола из кулинарског до- мена за српски језик дат је у (Крстев/Лазић, 2015). Један други пример употре- бе маркера јесте систем за екстракцију именованих ентитета НЕР осета (нази- ва установа ...Иван Обрадовић, Александра Томашевић, Ранка Станковић, Биљана Лазић. "Увођење доменских и семантичких маркера за област рударства у српске електронске речнике" in Научни састанак слависта у Вукове дане - Српски језик и његови ресурси: теорија, опис и примене, Београд : Међународни славистички центар на Филолошком факултету, Филолошки факултет (2017). https://doi.org/10.18485/msc.2017.46.3.ch10
-
Дигиталне библиотеке у рударству и геологији са посебним освртом на представљање сиве литературе
Имајући у виду потребу за проналажењем информација похрањених у различитим облицима документације која се генерише у областима рударства и геологије на Рударско-геолошком факултету Универзитета у Београду, отпочет је процес развоја дигиталне библиотеке ROmeka@RGF, на платформи за приказивање дигиталних колекција - Омека. Значајан део документације представља такозвана сива литература која је претежно заступљена у виду вишетомне документацијe. Први савладани изазов представљало је повезивање различитих вишетомних делова пројектних извештаја у једну целину која би била лако доступна и претражива.... ROmeka@RGF унапређено је имплементирањем проширених упита. Коришћени су веб сервиси (Станковић и др. 2012) и морфолошки електронски речници за српски језик (Крстев и др. 2008, Станковић 152 BIBLIOINFO и др. 2016) за морфолошко проширење упита (http://hlt.rgf.bg.ac.rs/ vebran/api/delafs/ključna_reč) ...
... изводљивости, концептуална студија, студија утицаја затеченог стања и студија утицаја на животну средину врсте студије. 12 Web Ontology Language – OWL је језик за представљање онтологија. 13 Protege је програм за управљање онтологијама. Више на: https://protege. stanford.edu/ 156 BIBLIOINFO Слика 2 Визуелни ...
... екстракције информација. Резултат екстракције информација засно- ваног на онтологији су подаци издвојених из текста. Ови подаци се могу приказати помоћу језика за креирање онтологије (OWL). Поред тога излаз могу бити и везе са текстуалним документима из којих су подаци издвојени, при чему излаз може садржати ...Биљана Лазић, Александра Томашевић, Михаило Шкорић. "Дигиталне библиотеке у рударству и геологији са посебним освртом на представљање сиве литературе" in Научна конференција Библиоинфо — 55 година од покретања наставе библиотекарства на високошколском нивоу, Београд 18. мај 2017., Филолошки факултет Универзитета у Београду (2019). https://doi.org/10.18485/biblioinfo.2017.ch13
-
Towards Automatic Definition Extraction for Serbian
U radu su prikazani preliminarni rezultati automatske ekstrakcije kandidata za definicije rečnika iz nestrukturiranih tekstova na srpskom jeziku u cilju ubrzanja razvoja rečnika. Definicije u rečniku Srpske akademije nauka i umetnosti (SANU) korišćene su za modelovanje različitih tipova definicija (opisnih, gramatičkih, referentnih i sinonimskih) koje imaju različite sintaksičke i leksičke karakteristike. Korpus istraživanja sastoji se od 61.213 definicija imenica, koje su analizirane korišćenjem morfoloških e-rečnika i lokalnih gramatika implementiranih kao pretvarači konačnih stanja u paketu za obradu korpusa otvorenog ...... 2007, pp. 65–70. SASA Dictionary: Речник српскохрватског књижевног и народног језика САНУ, I–XXI [The Dictionary of the Serbo-Croatian Standard and Vernacular Language] (1959–2020). Београд: Институт за српски језик САНУ и САНУ. Spala, S., Miller, N., Yang, Y., Dernoncourt, F. & Dockhorn, C. (2019) ...
... 9098-9105. Vitas, D. & Кrstev, C. (2015) Nacrt za informatizovani rečnik srpskog jezika. [Blueprint for the computerized dictionary of the Serbian language (in Cyrillic).] In: Naučni sastanak slavista u Vukove dane – Srpski jezik i njegovi resursi: teorija, opis i primene, 44/3, Beograd: Međunarodni slavistički ...
... информације. (A computer network is a set of interconnected computers that communicate and exchange information.) (20) partial 57 45 Програмски језик је скуп правила којима се рачунару… (A programming language is a set of rules that ... to a computer…) (20) Table 2. Examples of definitions recognized ...Ranka Stanković, Cvetana Krstev, Rada Stijović, Mirjana Gočanin, Mihailo Škorić. "Towards Automatic Definition Extraction for Serbian" in Proceedings of the XIX EURALEX Congress of the European Assocition for Lexicography: Lexicography for Inclusion (Volume 2). 7-9 September (virtual), Democritus University of Thrace (2021)