Rašysenos atpažinimo revoliucija: naujos galimybės tyrinėti!
Prof. dr. Rehbein ir dr. Werth iš Pasau universiteto pradeda automatinio rašysenos atpažinimo tyrimo projektą (2025–2027).

Rašysenos atpažinimo revoliucija: naujos galimybės tyrinėti!
Pasau universiteto mokslininkai pradėjo naujovišką projektą dėl klaidų metodologijos automatinio rašysenos atpažinimo srityje. Profesoriai Malte Rehbein ir Alexander Werth vadovauja projektui, kuris yra Volkswagen fondo „Pabudimo“ finansavimo linijos dalis. Projekto trukmė – nuo 2025 iki 2027 m. ir vadinasi „Netikslių metodika“.
Pagrindinis šio projekto tikslas – ištirti, kiek neteisingi duomenys gali įgalinti mokslinį darbą. Naudojami automatiškai perrašyti istoriniai rankraščiai iš XVII–XIX amžiaus tarybos protokolų, kurių tikslumas siekia apie 90 proc. Projekto metu šios transkripcijos bus lyginamos su rankiniu būdu perrašytais duomenimis, siekiant 100 % tikslumo.
Mokslo centras „Methodikum“
Projektas yra mokslo centro „Methodikum“, kurį įkūrė daugiakalbės kompiuterinės lingvistikos, kompiuterinių humanitarinių mokslų ir vokiečių kalbotyros katedros, dalis. „Methodikum“ tikslas – humanitarinių mokslų baziniai metodologiniai tyrimai, kompiuterinių ir skaitmeninių metodų palaikymas.
Automatinio rašysenos atpažinimo svarbą taip pat pabrėžia iššūkiai, su kuriais susiduria mašinos. Žmonės gali iššifruoti rašyseną, o mašinoms šis gebėjimas yra daug sudėtingesnis. Tobiasas Hodelis iš Ciuricho valstijos archyvo praneša apie automatinio rašysenos atpažinimo pažangą tokiuose projektuose kaip READ, kurį finansuoja Europos Komisija ir kuriuo siekiama perrašyti didelius kiekius ranka rašytų dokumentų.
Technologinis palaikymas ir išsivystymo lygis
Pagrindinis įrankis šiame kontekste yra nemokama „Transkribus“ programinė įranga, kuri leidžia ne tik automatiškai atpažinti ir transkripuoti, bet ir ieškoti istorinių dokumentų. Ši programinė įranga įsitvirtino kaip vertinga priemonė archyvams, bibliotekoms ir dokumentacijos įstaigoms.
Naudojant „Transkribus“, reikia sukurti mokymo duomenis naudojant rankinę transkripciją, o tai užima daug laiko, tačiau gali žymiai pagerinti atpažinimo kokybę. Dabartiniai rezultatai rodo, kad kai kurie programinės įrangos modeliai gali pasiekti mažesnį nei 1 % simbolių klaidų rodiklį (CER), o tai reiškia puikų konkrečių teksto korpusų tikslumą. „Transkribus“ taip pat siūlo įvairius įrankius savo modeliams kurti, pritaikytus atitinkamiems vartotojo poreikiams.
Tobulėjant technologijoms, pastaraisiais metais žymiai pagerėjo rašysenos atpažinimas. Automatinės transkripcijos kokybė pirmiausia priklauso nuo naudojamo šrifto ir naudojamų rankų skaičiaus. Nepaisant šios pažangos, iššūkis išlieka tai, kad mašinos šiuo metu negali pasiekti 0 % klaidų lygio, o priimtinas žmogaus transkripcijos lygis yra mažesnis nei 10 %.
Apskritai automatinio rašysenos atpažinimo plėtra rodo, kaip žmogaus ir mašinų intelekto derinys gali praturtinti mokslinį darbą ir žymiai pagerinti istorinių fondų skaitmeninimą. Didėjantis transkripcijos efektyvumas, palaikomas HTR technologijos, atveria naujas galimybes istoriniams tyrimams ir vertingos informacijos iš archyvinės medžiagos kūrimui. Mokslininkų bendradarbiavimas su šiuolaikinėmis technologijomis gali pakeisti humanitarinių mokslų tyrimus.
Daugiau informacijos ir įžvalgų apie techninius rašysenos atpažinimo aspektus rasite projekto puslapiuose Pasau universitetas, DHC ir Bop rekomenduojama.