Претрага ⚒ Радови ⚒ Др РГФ - Репозиторијум РГФ

Претрага

Per page

Sort by

133 items

Нове технологије за оживљавање старих текстова

Цветана Крстев, Ранка Станковић, Бранислава Шандрих Тодоровић, Милица Иконић Нешић (2023)

удаљено читање, књижевни корпус, обрада српског језика, анотација врстом речи, лематизација, именовани ентитети

Цветана Крстев, Ранка Станковић, Бранислава Шандрих Тодоровић, Милица Иконић Нешић. "Нове технологије за оживљавање старих текстова" in Зборник радова Међународне научне конференције Дигитална хуманистика и словенско културно наслеђе II, Београд, 28-29 јуни 2021., Београд : Савез славистичких друштава Србије (2023) М14
Integracija heterogenih tekstualnih resursa

Ranka Stanković, Ivan Obradović (2007)

U radu je opisan pristup integraciji heterogenih tekstualnih resursa za srpski jezik uz pomoć jednog kompleksnog softverskog alata, razvijenog specijalno za ove potrebe. Opisani su struktura i osnovne komponente razvijenog sistema. Iznete su i mogućnosti unapređivanja resursa međusobnom razmenom informacija, koje pruža razvijeno integrisano okruženje. Konačno, opisana je i mogućnost primene integrisanih heterogenih resursa za proširenje upita, kao i pretraživanje tekstova uopšte, a naznačeni su i neki od pravaca daljeg razvoja.

Ranka Stanković, Ivan Obradović. "Integracija heterogenih tekstualnih resursa" in Zbornik radova međunarodnog simpozijuma Razlike između bosanskog/bošnjačkog, hrvatskog i srpskog jezika, Graz, Austria, April 2007, - (2007) М33
Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса

Милош Утвић, Ранка Станковић, Александра Томашевић, Михаило Шкорић, Биљана Лазић (2019)

У раду се разматра хибридни приступ претрази корпуса, илустрован на примеру алатки OCWB и NoSketch Engine, примењених на специјални корпус из области рударства (РудКор) и Корпус савременог српског језика (СрпКор). Разматрани приступ комбинује постојеће могућности алатки OCWB и NoSketch Engine, које своју претрагу заснивају на лингвистичкој анотацији корпуса, са новим могућностима претраге у виду консултовања екстерних језичких ресурса (морфолошки електронски речници српског језика и лексичка база података Српски ворднет). Хибридни приступ је реализован надоградњом вебсучеља која поменуте алатке користе ...

корпус, рударство, претраживање информација, проширивање упита, лексички ресурси, лексичке релације

Милош Утвић, Ранка Станковић, Александра Томашевић, Михаило Шкорић, Биљана Лазић. "Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса" in Научни састанак слависта у Вукове дане - Vol. 48/3 Српски језик и његови ресурси, Међународни славистички центар, Филолошки факултет, Универзитет у Београду (2019). https://doi.org/10.18485/msc.2019.48.3.ch12 М51
Веб-алат за управљање грађом Речника САНУ и анотација листића

Рада Стијовић, Ранка Станковић, Михаило Шкорић (2020)

Грађа на основу које се израђује Речник српскохрватског књижевног и народног језика САНУ, а која садржи материјал из преко 4.500 писаних извора и 300 рукописних збирки речи са подручја народних говора штокавског наречја, забележена је на око 5.000.000 листића. Богат лексички материјал, који обухвата књижевни и народни језик у протекла два века и на основу кога треба да се напише још најмање 15 томова Речника, пружа могућност и за разноврсна лингвистичка и ванлингвистичка истраживања. Из тог разлога се приступило ...

лексикографска грађа, листићи, лексикографски алат, дигитализација, анотација

Рада Стијовић, Ранка Станковић, Михаило Шкорић. "Веб-алат за управљање грађом Речника САНУ и анотација листића" in Rasprave Instituta za hrvatski jezik i jezikoslovlje, Institute of Croatian Language and Linguistics (2020). https://doi.org/10.31724/rihjj.46.2.32 М51
Has general english knowledge of serbian freshmen students prepared them for an esp course – a pilot study

Драгослава Н. Мићовић, Лидија В. Беко, Марија М. Ђорђевић (2024)

ниво језичке компетенције, заједнички европски оквир за живе језике (CEFR), енглески за специфичне намене (ESP), општи енглески (GE), тест за одређивање нивоа

Драгослава Н. Мићовић, Лидија В. Беко, Марија М. Ђорђевић. "Has general english knowledge of serbian freshmen students prepared them for an esp course – a pilot study" in Методички видици, Faculty of Philosophy, University of Novi Sad (2024). https://doi.org/10.19090/mv.2024.15.2.117-136 М51
FrameNet Lexical Database: Presenting a Few Frames Within the Risk Domain

Aleksandra Marković, Ranka Stanković, Natalija Tomić, Olivera Kitanović (2021)

U radu se daje kratak prikaz teorije semantike okvira, na kojoj je zasnovana leksička baza Frejmnet. Predstavljena je koncepcija ove mreže, kao i mogućnosti njene primene. Predstavljena je i leksička analiza koja se primenjuje u projektu izrade Frejmneta i ukazano na razlike između analize zasnovane na okviru u odnosu na analizu zasnovanu na reči. Zatim je prikazano nekoliko povezanih okvira koje prizivaju reči iz domena rizika. U radu je predstavljena i platforma NLTК pomoću koje se mogu koristiti ...

Srpski jezik, semantika okvira, FrameNet, scenario rizika, rudarski korpus, obrada prirodnog jezika

Aleksandra Marković, Ranka Stanković, Natalija Tomić, Olivera Kitanović. "FrameNet Lexical Database: Presenting a Few Frames Within the Risk Domain" in Infotheca, Faculty of Philology, University of Belgrade (2021). https://doi.org/10.18485/infotheca.2021.21.1.1 М53
Multi-word Expressions for Abusive Speech Detection in Serbian

Ranka Stanković, Jelena Mitrović, Danka Jokić, Cvetana Krstev (2020)

Ovaj rad predstavlja istraživanja na usavršavanju i unapređenju srpske verzije rečnika Hurtlex, višejezičnog leksikona uvredljivih reči. Posebnu pažnju posvećujemo dodavanju izraza sa više reči (polileksemskih jedinica) koji se mogu smatrati uvredljivim, jer su takvi leksički zapisi veoma važni za postizanje dobrih rezultata u mnoštvu zadataka otkrivanja uvredljivog jezika. Srpski morfološki rečnici se koriste kao osnova za čišćenje podataka i stvaranje rečnika. Istaknuta je veza sa drugim leksičkim i semantičkim resursima na srpskom jeziku i predviđena je izgradnja sistema za ...

uvredljiv govor, govor mržnje, leksički izvori, višejezični leksikon, izrazi sa više reči

Ranka Stanković, Jelena Mitrović, Danka Jokić, Cvetana Krstev. "Multi-word Expressions for Abusive Speech Detection in Serbian" in Proceedings of the Joint Workshop on Multiword Expressions and Electronic Lexicons, Association for Computational Linguistics (2020) М33
Extraction of Bilingual Terminology Using Graphs, Dictionaries and GIZA++

Branislava Šandrih, Ranka Stanković (2020)

U nauci, industriji i mnogim istraživačkim oblastima, terminologija se brzo razvija. Najčešće, jezik koji je „lingua franca“ za većinu ovih oblasti je engleski. Kao posledica toga, za mnoga polja termini domena su koncipirani na engleskom, a kasnije se prevode na druge jezike. U ovom radu predstavljamo pristup za automatsko izdvajanje dvojezične terminologije za englesko-srpski jezički par koji se oslanja na usaglašeni dvojezični korpus domena, ekstraktor terminologije za ciljni jezik i alat za usklađivanje delova. Ispitujemo performanse metode na domenu ...

ekstrakcija terminologije, validacija terminologije, GIZA++, grafovi, Unitex, klasifikacija teksta

Branislava Šandrih, Ranka Stanković. "Extraction of Bilingual Terminology Using Graphs, Dictionaries and GIZA++" in Infotheca, Faculty of Philology, University of Belgrade (2020). https://doi.org/10.18485/infotheca.2019.19.2.6 М53
From DELA Based Dictionary to Leximirka Lexical Database

Biljana Lazić, Mihailo Škorić (2020)

In this paper, we will present an approach in transforming Serbian language Morphological dictionaries from a DELA text format to a lexical database dubbed Leximirka. Considering the benefits of storing data within a database when compared to storing them in textual documents, we will outline some of the functionality that the database has made possible. We will also show how hand-made rules that use category labels lexical entries are marked with can be used to link lexical entries. ...

Morfološki rečnici, jezički resursi, Leksimirka

Biljana Lazić, Mihailo Škorić. "From DELA Based Dictionary to Leximirka Lexical Database" in Infotheca, Faculty of Philology, University of Belgrade (2020). https://doi.org/10.18485/infotheca.2019.19.2.4 М53
Towards ELTeC-LLOD: European Literary Text Collection Linguistic Linked Open Data

Ranka Stanković, Christian Chiarcos, Miloš Utvić, Olivera Kitanović (2023)

Овај рад описује студију случаја о генерисању повезаних података креираних на основу обечежених текстуалних корпуса коришћењем формата размене података у обради природних језика (NIF). Као основа за ово истраживање послужио је подскуп корпуса ELTeC, који се састоји од 900 романа из периода 1840-1920 за 9 европских језика. Верзија романа са коментарима, у такозваном TEI level-2 формату, трансформисана је у NIF, формат заснован на RDF/OWL који има за циљ постизање интероперабилности између алата за обраду природних језика, језичких ресурса и ...

повезани отворени подаци, корпус, SrpELTeC, NIF

Ranka Stanković, Christian Chiarcos, Miloš Utvić, Olivera Kitanović. "Towards ELTeC-LLOD: European Literary Text Collection Linguistic Linked Open Data" in LDK 2023 – 4th Conference on Language, Data and Knowledge, 12-15 September in Vienna, Austria, Lisabon : NOVA FCSH - CLUNL (2023). https://doi.org/10.34619/srmk-injj М33
Тростране флеш картице: настава вокабулара за геологе

Лидија Беко, Драгослава Мићовић (2023)

Лидија Беко, Драгослава Мићовић. "Тростране флеш картице: настава вокабулара за геологе" in Језик, књижевност и индустрија, Алфа БК Универзитет (2023) М33
Contrastive Analysis of Syntax Patterns in Comparable Football Corpora in Spanish and Serbian Languages

Jelena Lazarević, Olivera Kitanović (2024.)

Cilj rada je istraživanje kolokabilnosti kao načina na koji se leksičke jedinice povezuju sa rečima iz različitih kategorija, formirajući veće jedinice. Istraživanje semantičkih i sintaksičkih principa ovih kombinacija u španskom i srpskom jeziku fudbala izvedeno je na komparabilnim fudbalskim korpusima SrFudKo i EsFudko, razvijenim u okviru doktorske disertacije Jelene Lazarević pod nazivom: Jezičke odlike diskursa novih medija o fudbalu: kontrastivna analiza na korpusu srpskog i španskog jezika. Korpus fudbala SrFudKo, kreiran na osnovu tekstova o fudbalu sa pet srpskih veb-portala: ...

fudbal, korpusi, terminologija, kolokacije, srpski, španski

Jelena Lazarević, Olivera Kitanović . "Contrastive Analysis of Syntax Patterns in Comparable Football Corpora in Spanish and Serbian Languages" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024, University of Belgrade - Faculty of Philology (2024.) М64
Језички модели, шта је то?

Михаило Шкорић (2023)

Језички модели

Михаило Шкорић. "Језички модели, шта је то?" in Језик данас, Нови Сад : Матица српска (2023) М53
Frequency and Length of Syllables in Serbian

Marija Radojičić, Biljana Lazić, Sebastijan Kaplar, Ranka Stanković, Ivan Obradović, Ján Mačutek, Lívia Leššová (2019)

Basic analyses of several properties of syllables (the rank-frequency distribution, the distribution of length, and the relation between length and frequency) in Serbian is presented. The syllabification algorithm used combines the maximum onset principle and the sonority hierarchy. Results indicate that syllables behave similarly to words as far as mathematical models are concerned, but values of parameters in models for syllables are quite different from those for words.

frekvencije slogova, dužina slogova, srpski jezik

Marija Radojičić, Biljana Lazić, Sebastijan Kaplar, Ranka Stanković, Ivan Obradović, Ján Mačutek, Lívia Leššová. "Frequency and Length of Syllables in Serbian" in Glottometrics (2019) М24
The Many Faces of SrpKor

Duško Vitas, Ranka Stanković, Cvetana Krstev (2024.)

Акроним СрпКор означава фамилију електронских корпуса савременог српског језика чија је изградња почела крајем седамдесетих година прошлога века, а која је постала шире видљива заинтересованој истраживачкој заједници објављивањем његове прве верзије на вебу 2002. године. У овом дугом периоду, посебно пре појаве корисних текстуелних ресурса на вебу, развој корпуса се састојао у прикупљању и обради грађе као и у развоју метода обраде корпуса. Наиме, електронски корпус није само колекција текстова у дигиталном облику (како се то, на пример, наводи ...

СрпКор, корпуси, српски, лематизација, Лексимирка

Duško Vitas, Ranka Stanković, Cvetana Krstev. "The Many Faces of SrpKor" in South Slavic Languages in the Digital Environment JuDig Book of Abstracts, University of Belgrade - Faculty of Philology, Serbia, November 21-23, 2024, University of Belgrade - Faculty of Philology (2024.) М64
Polimorfne promene materije nastale mlevenjem minerala

Milan Petrov, Ljubiša Andrić, Milena Kostović, Vladimir Jovanović, Dragan Radulović, Dejan Todorović, Branislav Ivošević (2023)

U radu su prikazani rezultati istraživanja iz oblasti usitnjavanja, sakupljani duži niz godina, u Institutu za tehnologiju nuklearnih i drugih mineralnih sirovina. Poznato je da se područja sa frekfencijama preko 3·1011 do 3·1014 Hz nalaze u elektromagnetnom spektru infracrvenog i daleko infracrvenog emitovanog ili apsorbovanog zračenja. U radu su prikazani rezultati kada se materijal i kugle u mlinu nalaze na jednoj od pomenutih frekfencija, što nam omogućava da pomoću Borovog uslova frekfencija pristupimo izračunavanju emitovanih i apsorbovanih molarnih energija ...

Milan Petrov, Ljubiša Andrić, Milena Kostović, Vladimir Jovanović, Dragan Radulović, Dejan Todorović, Branislav Ivošević. "Polimorfne promene materije nastale mlevenjem minerala" in X Kolokvijum o pripremi mineralnih sirovina univerzitet u beogradu, Rudarsko-geološki fakultet, 08.12.2023., Beograd : Univerzitet u Beogradu, Rudarsko-geološki fakultet (2023) М63
Hydrographic and hydrological characterization of the Vodenička and Rosomačka rivers

Vesna Ristić Vakanjac, Marina Čokorilo Ilić, Dušan Polomčić, Dragoljub Bajić, Jelena Ratković (2017)

The Visočica River rises in Bulgaria, on the Berovo Mountain. Its course in Bulgaria is 16.7 km long. It enters Serbia near the village of Donji Krivodol. Up to the village of Pakleštica, or the beginning of Lake Zavoj, its right-bank tributaries are the Krivodolštica, the Vodenička, the Rosomačka and the Dojkinačka. There are no left-bank tributaries. Among the tributaries, water levels and discharges are gauged only on the Dojkinačka River. The Vodenička had also been gauged but only ...

hydrographic characteristics, river discharge, the Vodenička River, the Kamenička River

Vesna Ristić Vakanjac, Marina Čokorilo Ilić, Dušan Polomčić, Dragoljub Bajić, Jelena Ratković. "Hydrographic and hydrological characterization of the Vodenička and Rosomačka rivers" in Pirotski zbornik, Pirot : Narodna biblioteka Pirot (2017). https://doi.org/10.5937/pirotzbor1742001R M53
Parallel Stylometric Document Embeddings with Deep Learning Based Language Models in Literary Authorship Attribution

Mihailo Škorić, Ranka Stanković, Milica Ikonić Nešić, Joanna Byszuk, Maciej Eder (2022)

This paper explores the effectiveness of parallel stylometric document embeddings in solving the authorship attribution task by testing a novel approach on literary texts in 7 different languages, totaling in 7051 unique 10,000-token chunks from 700 PoS and lemma annotated documents. We used these documents to produce four document embedding models using Stylo R package (word-based, lemma-based, PoS-trigrams-based, and PoS-mask-based) and one document embedding model using mBERT for each of the seven languages. We created further derivations of these ...

General Mathematics, Engineering (miscellaneous), Computer Science (miscellaneous)

Mihailo Škorić, Ranka Stanković, Milica Ikonić Nešić, Joanna Byszuk, Maciej Eder. "Parallel Stylometric Document Embeddings with Deep Learning Based Language Models in Literary Authorship Attribution" in Mathematics, MDPI AG (2022). https://doi.org/10.3390/math10050838 М21а
Towards the semantic annotation of SR-ELEXIS corpus: Insights into Multiword Expressions and Named Entities

Cvetana Krstev, Ranka Stanković, Aleksandra Marković, Teodora Mihajlov (2024)

Овај рад представља активности на развоју корпуса ELEXIS-sr, српском додатку вишејезичном анотираном корпусу ELEXIS-а, који се састоји од семантичких анотација и репозиторија значења речи. ELEXIS је паралелни вишејезични анотирани корпус на десет европских језика, који може да се користи као вишејезички репер за евалуацију европских језика са мање и средње развијеним ресурсима. Фокус овог рада је на вишечланим изразима и именованим ентитетима, њиховом препознавању у скупу реченица ELEXIS-sr и поређењу са анотацијама на другим језицима. Разматрају се први кораци ...

полилексемске језинице, именовани ентитет, вишезначност значења речи, складиште смисла, LLOD

Cvetana Krstev, Ranka Stanković, Aleksandra Marković, Teodora Mihajlov. "Towards the semantic annotation of SR-ELEXIS corpus: Insights into Multiword Expressions and Named Entities" in Proceedings of the Joint Workshop on Multiword Expressions and Universal Dependencies (MWE-UD) @ LREC-COLING 2024, Turin, May 25, 2024, ELRA and ICCL (2024) М33
Energetika i održivi razvoj - indikatori održivosti

Dejan Ivezić, Marija Živković (2015)

energetika, održivi razvoj

Dejan Ivezić, Marija Živković. Energetika i održivi razvoj - indikatori održivosti, Beograd : Univerzitet u Beogradu, Rudarsko-geološki fakultet, 2015 Без категорије

Претрага

133 items

Нове технологије за оживљавање старих текстова cite

Integracija heterogenih tekstualnih resursa cite

Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса cite

Веб-алат за управљање грађом Речника САНУ и анотација листића cite

Has general english knowledge of serbian freshmen students prepared them for an esp course – a pilot study cite

FrameNet Lexical Database: Presenting a Few Frames Within the Risk Domain cite

Multi-word Expressions for Abusive Speech Detection in Serbian cite

Extraction of Bilingual Terminology Using Graphs, Dictionaries and GIZA++ cite

From DELA Based Dictionary to Leximirka Lexical Database cite

Towards ELTeC-LLOD: European Literary Text Collection Linguistic Linked Open Data cite

Тростране флеш картице: настава вокабулара за геологе cite

Contrastive Analysis of Syntax Patterns in Comparable Football Corpora in Spanish and Serbian Languages cite

Језички модели, шта је то? cite

Frequency and Length of Syllables in Serbian cite

The Many Faces of SrpKor cite

Polimorfne promene materije nastale mlevenjem minerala cite

Hydrographic and hydrological characterization of the Vodenička and Rosomačka rivers cite

Parallel Stylometric Document Embeddings with Deep Learning Based Language Models in Literary Authorship Attribution cite

Towards the semantic annotation of SR-ELEXIS corpus: Insights into Multiword Expressions and Named Entities cite

Energetika i održivi razvoj - indikatori održivosti cite

Нове технологије за оживљавање старих текстова

Integracija heterogenih tekstualnih resursa

Претрага корпуса заснована на употреби екстерних лексичких ресурса путем веб-сервиса

Веб-алат за управљање грађом Речника САНУ и анотација листића

Has general english knowledge of serbian freshmen students prepared them for an esp course – a pilot study

FrameNet Lexical Database: Presenting a Few Frames Within the Risk Domain

Multi-word Expressions for Abusive Speech Detection in Serbian

Extraction of Bilingual Terminology Using Graphs, Dictionaries and GIZA++

From DELA Based Dictionary to Leximirka Lexical Database

Towards ELTeC-LLOD: European Literary Text Collection Linguistic Linked Open Data

Тростране флеш картице: настава вокабулара за геологе

Contrastive Analysis of Syntax Patterns in Comparable Football Corpora in Spanish and Serbian Languages

Језички модели, шта је то?

Frequency and Length of Syllables in Serbian

The Many Faces of SrpKor

Polimorfne promene materije nastale mlevenjem minerala

Hydrographic and hydrological characterization of the Vodenička and Rosomačka rivers

Parallel Stylometric Document Embeddings with Deep Learning Based Language Models in Literary Authorship Attribution

Towards the semantic annotation of SR-ELEXIS corpus: Insights into Multiword Expressions and Named Entities

Energetika i održivi razvoj - indikatori održivosti