Old or New, We Repair, Adjust and Alter (Texts)

Објеката

Тип
Рад у часопису
Верзија рада
објављена верзија
Језик
енглески
Креатор
Cvetana Krstev, Ranka Stanković
Извор
Infotheca
Издавач
Faculty of Philology, University of Belgrade
Датум издавања
2020
Сажетак
U ovom radu predstavljamo kako se e-rečnici i kaskade transduktora konačnih stanja implementirani u alatu Unitex mogu koristiti za rešavanje tri problema transformacije teksta: ispravljanje tekstova nakon OCR-a, vraćanje dijakritičkih znakova i prebacivanje između različitih jezičkih varijanti.
In this paper we present how e-dictionaries and cascades of finite-state transducers as implemented in Unitex can be used to solve three text transformation problems: correction of texts after OCR, restoration of diacritics and switching between different language variants.
том
19
Број
2
почетак странице
61
крај странице
80
doi
10.18485/infotheca.2019.19.2.3
issn
1450-9687
Subject
ispravka teksta, OCR greške, restauracija dijakritika , jezičke varijante, elektronski rečnik, transduktori konačnih stanja
text correction, OCR errors, diacritic restoration, language variants, electronic dictionary, finite-state transducers
Шира категорија рада
M50
Ужа категорија рада
М53
Права
Отворени приступ
Лиценца
Creative Commons – Attribution-Share Alike 4.0 International
Формат
.pdf
Скупови објеката
Ранка Станковић
Radovi istraživača

Cvetana Krstev, Ranka Stanković. "Old or New, We Repair, Adjust and Alter (Texts)" in Infotheca, Faculty of Philology, University of Belgrade (2020). https://doi.org/10.18485/infotheca.2019.19.2.3

This item was submitted on 23. новембар 2021. by [anonymous user] using the form “Рад у часопису” on the site “Радови”: http://drug.rgf.bg.ac.rs/s/repo

Click here to view the collected data.