U ovom radu predstavljamo kako se e-rečnici i kaskade transduktora konačnih stanja implementirani u alatu Unitex mogu koristiti za rešavanje tri problema transformacije teksta: ispravljanje tekstova nakon OCR-a, vraćanje dijakritičkih znakova i prebacivanje između različitih jezičkih varijanti.
... suggested corrections
KGB mu je ponudio da sarad-
juje s njima, i da ce mu onda
knjige biti objavljivane. Brod-
ski je odbio. I nije mogao da
objavljuje. Posle nekog vre-
mena predlozili su mu da na-
pusti zemlju, i da ce tako biti
najbolje, za njega i za drzavu.
Brodski je seo u avion za Bec.
Poneo je pisacu ...
... generated candidates but avoiding
the circular replacements (e.g. ‘п’ → ‘и’ → ‘н’ → ‘п’). Example: if
ппво occurs in a text as an unknown word, then ‘п’ → ‘и’ is applied
twice which results in a string *ппво*_*ипво*_*пиво*_ииво*, after
that ‘и’ → ‘н’ is applied resulting in *ппво*_*ипво*_*пиво*_*ииво*
_*нпв ...
... nesto
odece, zbirku poezije Dzona
Dona, i flasu votke, poklon za
pesnika Vinstana Odna, koji
ga je docekao na beckom aero-
dromu.
KGB mu je ponudio da *5a(saraduje(25))
*2(i da će) mu onda knjige biti objavlji-
vane. V_*5b(Brodski(2)_brodski(3))
je odbio. I nije mogao da objavljuje.
V_*5b(pošle(1 ...
Cvetana Krstev, Ranka Stanković. "Old or New, We Repair, Adjust and Alter (Texts)" in Infotheca, Faculty of Philology, University of Belgrade (2020). https://doi.org/10.18485/infotheca.2019.19.2.3