Revolūcija rokraksta atpazīšanā: jaunas iespējas pētniecībai!

Transparenz: Redaktionell erstellt und geprüft.
Veröffentlicht am

Prof. Dr. Rehbein un Dr. Werth no Pasavas universitātes uzsāk pētniecības projektu par automātisko rokraksta atpazīšanu (2025-2027).

Prof. Dr. Rehbein und Dr. Werth der Uni Passau starten ein Forschungsprojekt zur automatischen Handschriftenerkennung (2025-2027).
Prof. Dr. Rehbein un Dr. Werth no Pasavas universitātes uzsāk pētniecības projektu par automātisko rokraksta atpazīšanu (2025-2027).

Revolūcija rokraksta atpazīšanā: jaunas iespējas pētniecībai!

Pasavas universitātes pētnieki ir uzsākuši inovatīvu projektu par kļūdu metodoloģiju automātiskajā rokraksta atpazīšanā. Profesori Malte Rehbein un Aleksandrs Verts vada projektu, kas ir daļa no Volkswagen fonda finansējuma līnijas "Atmoda". Projekta ilgums ir no 2025. gada līdz 2027. gadam, un to sauc par “Neprecīzo metodoloģiju”.

Šī projekta galvenais mērķis ir izpētīt, cik lielā mērā nepareizi dati var veicināt zinātnisku darbu. Tiek izmantoti automātiski pārrakstīti vēsturiskie manuskripti no domes protokoliem no 17. līdz 19. gadsimtam, kuru precizitāte ir ap 90%. Projektā šīs transkripcijas tiks salīdzinātas ar manuāli pārrakstītiem datiem, panākot 100% precizitāti.

Zinātnes centrs "Methodikum"

Projekts ir daļa no zinātnes centra “Methodikum”, kuru dibināja daudzvalodu datorlingvistikas, skaitļošanas humanitāro zinātņu un vācu valodniecības katedras. “Methodikum” mērķis ir humanitāro zinātņu metodoloģiskie pamatpētījumi, kā arī datorizēto un digitālo metožu atbalsts.

Automātiskās rokraksta atpazīšanas nozīmi uzsver arī problēmas, ar kurām saskaras mašīnas. Cilvēki spēj atšifrēt rokrakstu, savukārt mašīnām šī spēja ir daudz sarežģītāka. Tobiass Hodels no Cīrihes Valsts arhīva ziņo par automatizētās rokraksta atpazīšanas progresu tādos projektos kā READ, ko finansē Eiropas Komisija un kura mērķis ir pārrakstīt lielu daudzumu ar roku rakstītu dokumentu.

Tehnoloģiskais nodrošinājums un attīstības līmenis

Šajā kontekstā centrālais rīks ir bezmaksas programmatūra Transkribus, kas nodrošina ne tikai automātisku atpazīšanu un transkripciju, bet arī vēsturisko dokumentu meklēšanu. Šī programmatūra ir pierādījusi sevi kā vērtīgu rīku arhīviem, bibliotēkām un dokumentācijas iestādēm.

Izmantojot Transkribus, ir jāizveido apmācības dati, izmantojot manuālu transkripciju, kas ir laikietilpīga, taču var ievērojami uzlabot atpazīšanas kvalitāti. Pašreizējie rezultāti liecina, ka daži programmatūras modeļi var sasniegt rakstzīmju kļūdu līmeni (CER), kas ir mazāks par 1%, kas ir ievērojama precizitāte konkrētiem teksta korpusiem. Transkribus piedāvā arī dažādus rīkus savu modeļu izveidei, kas pielāgoti attiecīgajām lietotāja vajadzībām.

Tehnoloģijām attīstoties, pēdējos gados ir veikti būtiski uzlabojumi rokraksta atpazīšanas jomā. Automātiskās transkripcijas kvalitāte galvenokārt ir atkarīga no izmantotā fonta un izmantoto roku skaita. Neraugoties uz šiem sasniegumiem, joprojām pastāv problēma, ka mašīnas pašlaik nespēj sasniegt 0% kļūdu līmeni, un pieļaujamais cilvēku transkripcijas līmenis ir zem 10%.

Kopumā automatizētās rokraksta atpazīšanas attīstība parāda, kā cilvēka un mašīnu intelekta apvienojums var bagātināt zinātnisko darbu un būtiski veicināt vēsturisko krājumu digitalizāciju. Pieaugošā transkripcijas efektivitāte, ko atbalsta HTR tehnoloģija, paver jaunas iespējas vēstures pētījumiem un vērtīgas informācijas izstrādei no arhīvu materiāliem. Zinātnieku un moderno tehnoloģiju sadarbībai ir potenciāls revolucionizēt pētniecību humanitārajās zinātnēs.

Papildinformāciju un ieskatu rokraksta atpazīšanas tehniskajos aspektos skatiet projekta lapās Pasavas Universitāte, DHC un Bop ieteicams.